Sunteți pe pagina 1din 39

BIOSTATISTICA

BIOSTATISTICA
A
A
NALIZA DATELOR
NALIZA DATELOR
1
1

Variabilele Variabilele cu care se cu care se lucreaz lucreaz , variabile aleatorii , variabile aleatorii ( (va va), ), iar iar datele datele
nregistrate nregistrate sunt sunt m m sur sur torile torile acestor acestor variabile variabile din e din e antioane antioane. .

dou dou tipuri tipuri principale principale de de va va: : calitative calitative i i cantitative cantitative care care
determin determin dou dou tipuri tipuri de date. de date.

Va Va calitativ calitative e genereaz genereaz r r spunsuri spunsuri de tip de tip categorial categorial ( (dihotomice dihotomice
sau sau cu cu mai mai multe multe alternative) alternative)

Va Va cantitativ cantitative e genereaz genereaz r r spunsuri spunsuri numerice numerice (discrete (discrete sau sau
continue). continue).

Exemple Exemple: : va va calitative calitative: : cele cele dihotomice dihotomice pot pot avea avea dou dou alternative alternative
de tip de tip Da/Nu Da/Nu sau sau Decedat Decedat/In via /In via . . Va Va calitative calitative cu cu mai mai multe multe
alternative pot alternative pot descrie descrie de de exemplu exemplu distribu distribu ia ia bolnavilor bolnavilor dup dup
grupa grupa de s de s nge nge (A, B, AB, O) (A, B, AB, O) sau sau pot pot lua lua urm urm toarele toarele valori valori
pentru pentru ntrebarea ntrebarea C C t de t de bine bine ti ti i i limba limba englez englez ? ? : : deloc deloc , ,
pu pu in in , , suficient suficient , , fluent fluent . .
BIOSTATISTICA
BIOSTATISTICA
A
A
NALIZA DATELOR 2
NALIZA DATELOR 2

va
va
cantitative
cantitative
discrete
discrete
(discontinue)
(discontinue)
:
:
apar
apar
atunci
atunci
c
c

nd
nd
m
m

sur
sur

torile
torile
sunt
sunt
numere
numere

ntregi
ntregi
.
.
Exemple
Exemple
de
de
va
va
cantitative
cantitative
discrete pot
discrete pot
fi
fi
: num
: num

rul
rul
de
de
accidente
accidente
suferite
suferite
de o
de o
persoana
persoana

n
n
decurs
decurs
de 2
de 2
ani
ani
(un num
(un num

r
r
cuprins
cuprins
probabil
probabil

ntre
ntre
0
0

i 8),
i 8),
sau
sau
num
num

rul
rul
de
de

nghe
nghe

ate
ate
consumate
consumate
de o
de o
persoan
persoan

ntr
ntr
-
-
o
o
s
s

pt
pt

m
m

n
n

(
(
cuprins
cuprins
probabil
probabil

ntre
ntre
0
0

i 10),
i 10),
numrul de copii
numrul de copii

ntr
ntr
-
-
o familie, pulsul, scorul APGAR
o familie, pulsul, scorul APGAR

va
va
cantitative
cantitative
continue
continue
:
:
fiecare
fiecare
m
m

sur
sur

toare
toare
se
se

ncadreaz
ncadreaz

ntr
ntr
-
-
o
o
scal
scal

de
de
numere
numere
continue (
continue (
reale
reale
)
)
, pot
, pot

mbrca orice
mbrca orice
valoare numeric
valoare numeric
.
.
Exemple
Exemple
de
de
va
va
cantitative
cantitative
continue
continue
sunt
sunt
:
:
tensiunea
tensiunea
arterial
arterial

,
,

n
n

l
l

ime
ime
,
,
greutate
greutate
,
,
cantitatea
cantitatea

n
n
grame
grame
a
a

nghe
nghe

atei
atei
consumate
consumate
de o
de o
persoan
persoan

ntr
ntr
-
-
o
o
s
s

pt
pt

m
m

n
n

.
.
Reprezentarea datelor

Distribu
Distribu

i
i
a
a
de
de
frecven
frecven

reprezint formatul cel


mai convenabil de sintez i prezentare.
se prezint descrierea calitativ sau cantitativ a
observaiilor (msurtorilor) mpreun cu numrul
de apariii ale msurtorii respective (frecvena
absolut). Se utilizeaz de obicei i frecvena
relativ obinut prin mprirea frecvenei absolute
la numrul total al observaiilor. Aadar, suma
tuturor frecvenelor relative este 1. Dac se
nmulete frecvena relativ cu 100, se obine
frecvena procentual.
Reguli generale de urmat n construirea
intervalelor pentru va cantitative

num
num

rul
rul
de
de
clase
clase
este
este
bine
bine
s
s

fie
fie
mai
mai
mic
mic
de 15;
de 15;

limitele
limitele
fiec
fiec

rei
rei
clase
clase
trebuie
trebuie
s
s

se
se
potriveasc
potriveasc

cu
cu
gradul
gradul
de
de
acurate
acurate

e al
e al
datelor
datelor
m
m

surate
surate
;
;

intervalele
intervalele
de
de
lungime
lungime
egal
egal

sunt
sunt
mai
mai
convenabile
convenabile

i
i
faciliteaz
faciliteaz

proces
proces

rile
rile
ulterioare
ulterioare
;
;

clasele
clasele
trebuie
trebuie
s
s

fie mutual exclusive (s


fie mutual exclusive (s

nu
nu
se
se
suprapun
suprapun

);
);

este
este
bine
bine
s
s

se
se
calculeze
calculeze
mijlocul
mijlocul
fiec
fiec

rei
rei
clase
clase
.
.
Exemple de distribuii de frecven 1:
1. Un student a obinut urmtoarele note la 10 teste:
6 7 6 8 5
7 6 9 10 6
Distrubuia de frecven pentru aceste date este:
Nota Frecvena absolut Frecvena relativ
5 1 0.1
6 4 0.4
7 2 0.2
8 1 0.1
9 1 0.1
10 1 0.1
Total 10 1.0
Exemple de distribuii de frecven 2:
2. 20 cutii cu fructe au urmtoarele greuti nete n hectograme per cutie:
19.7 19.9 20.2 19.9 20.0
20.6 19.3 20.4 19.9 20.3
20.1 19.5 20.9 20.3 20.8
19.9 20.0 20.6 19.9 19.8
Greutate Valoare central Frecvena absolut Frecvena relativ Frecvena
cumulat
19.2-19.4 19.3 1 0.05 1
19.5-19.7 19.6 2 0.10 3
19.8-20.0 19.9 8 0.40 11
20.1-20.3 20.2 4 0.20 15
20.4-20.6 20.5 3 0.15 18
20.7-20.9 20.8 2 0.10 20
Total 20 1.00
Date cantitative: valori caracteristice
Orice serie de date cantitative se poate descrie prin trei
elemente caracteristice:
indicatorii tendinei centrale
mprtiere sau dispersie
Dac aceste elemente sunt obinute dintr-un studiu
populaional, ele se numesc parametri, dac sunt
obinute dintr-un eantion se numesc indicatori
statistici.
INDICATORII TENDINEI CENTRALE
Ace Ace ti ti indicatori indicatori pun pun n n eviden eviden faptul faptul c c toate toate datele datele m m surate surate tind tind s s se se
grupeze grupeze n n jurul jurul unei unei valori valori centrale centrale. . Valoarea Valoarea central central caracterizeaz caracterizeaz
ntregul ntregul domeniu domeniu al al datelor datelor (val.min. (val.min.- -val.max.). val.max.). Dac Dac privim privim ambele ambele
exemple exemple anterioare anterioare, se , se poate poate observa observa c c valorile valorile tind tind s s se se grupeze grupeze n n jurul jurul
unei unei valori valori care are care are cea cea mai mai mare mare frecven frecven de de apari apari i ie. e.
Cele Cele mai mai utilizate utilizate m m sur sur tori tori ale ale tendin tendin ei ei centrale centrale sunt sunt: :
media media aritmetic aritmetic
mediana mediana
modul modul
cuantilele cuantilele
MEDIA ARITMETIC 1
formula de calcul: sau =

=
n
i
X
n
1
i
1
X
unde unde N=num N=num rul rul de de observa observa ii ii popula popula i ionale onale
n=num n=num rul rul de de observa observa ii din e ii din e antion antion
X= X=valoarea valoarea variabilei variabilei aleatoare aleatoare m m surate surate
Defini Defini ie ie: : pentru pentru o o distribu distribu ie ie de de frecven frecven a a a a unor unor date date cantitative cantitative, media , media
aritmetic aritmetic este este valoarea valoarea care, care, dac dac s s- -ar ar substitui substitui fiec fiec rei rei valori valori a a
distribu distribu iei iei, , nu nu ar ar schimba schimba suma suma total total . .
Dac Dac media media aritmetic aritmetic se se calculeaz calculeaz pentru pentru o o popula popula ie ie ( (este este un un
parametru parametru), se ), se noteaz noteaz cu cu caracterul caracterul grecesc grecesc ; ; dac dac se se calculeaz calculeaz pentru pentru
un e un e antion antion (indicator statistic) se (indicator statistic) se noteaz noteaz cu cu simbolul simbolul . .
Media Media aritmetic aritmetic se se calculeaz calculeaz n n dou dou moduri moduri: :
media media aritmetic aritmetic simpl simpl , , pentru pentru distribu distribu iile iile de de frecven frecven cu cu frecven frecven e e
unitare unitare. .
X

=
=
N
i
X
N
1
i
1

MEDIA ARITMETIC 2

media
media
aritmetic
aritmetic

ponderat
ponderat

,
,
pentru
pentru
distribu
distribu

iile
iile
de
de
frecven
frecven

cu
cu
frecven
frecven

e
e
neunitare
neunitare
.
.

formula de
formula de
calcul
calcul
:
:
sau
sau

unde
unde
N=num
N=num

rul
rul
de
de
observa
observa

ii
ii
popula
popula

ionale
ionale

n=num
n=num

rul
rul
de
de
observa
observa

ii din e
ii din e

antion
antion

X
X
i i
=
=
valoarea
valoarea
variabilei
variabilei
aleatoare
aleatoare
m
m

surate
surate
, cu
, cu
frecven
frecven

a
a
f
f
i i

=
=
=
=
N
i
N
i
N fi
Xifi
1
1

=
=
=
=
n
i
n
i
n fi
Xifi
X
1
1
Exemple 1
Exemple 1
a) Fie X
i
o va ntr-o populaie, cu urmtoarele valori:
2 5 1 4 3
Media aritmetic va fi:
= 1/5(2+5+1+4+3) = 15/5 = 3
Dac nlocuim valoarea fiecrei variabile X
i
cu valoarea mediei
aritmetice, obinem: 3+3+3+3+3=15, ceea ce corespunde definiiei
mediei.
b) Dac ne referim la distribuia de frecven din exemplul 1, se
poate calcula media ponderat:
= 1/10[(5x1)+(6x4)+...+(10x1)] = 70/10 = 7
c) Pentru a calcula media ponderat pentru distribuia de frecven
din exemplul 2, se va lua n considerare valoarea central a
fiecrei clase, care reprezint fiecare clas.
= 1/20[(19.3x1)+...+(20.8x2)] = 401.6/20 = 20.08
X
Exemple 2
Exemple 2
Observ Observ nd nd diferen diferen ele ele ( (devia devia iile iile) ) ntre ntre fiecare fiecare valoare valoare observat observat i i medie medie, cu , cu
c c t |X t |X
i i
- - | se | se apropie apropie de 0, cu at de 0, cu at t media se t media se apropie apropie mai mai mult mult de de valorile valorile
observate observate, , deci deci caracterizeaz caracterizeaz bine bine ntreaga ntreaga popula popula ie ie sau sau e e antion antion. .
Dac Dac lu lu m m n n considerare considerare urm urm toarele toarele ex exe emple mple: :
Exemplul Exemplul 1A: 1A:
X
Variabila Observaia Media aritmetic Deviaia
X
1
2.0 2.5 -0.5
X
2
2.5 2.5 0
X
3
1.5 2.5 -1.0
X
4
3.5 2.5 1.0
X
5
4.5 2.5 2.0
X
6
1.0 2.5 -1.5
16.0 16.0 0.0
Exemple 3
Exemple 3

EXEMPLUL 1B EXEMPLUL 1B
n n exemplul exemplul 1A, media 1A, media easte easte foarte foarte apropiat apropiat de de valorile valorile observate observate; ; n n
urm urm torul torul exemplu exemplu valoarea valoarea mediei mediei este este mult mult efectat efectat de a de a treia treia valoare valoare
observat observat i i nu nu mai mai caracterizeaz caracterizeaz bine bine ntregul ntregul e e antion antion. .
Dar, din Dar, din ambele ambele exemple exemple se se poate poate observa observa c c : :
Aceasta Aceasta reprezint reprezint o o caracteristic caracteristic important important a a mediei mediei. .
O alt O alt caracteristic caracteristic important important a a mediei mediei este este c c : :
Variabila Observaia Media aritmetic Deviaia
X
1
2.0 1000.0 -998.0
X
2
3.0 1000.0 -997.0
X
3
2995.0 1000.0 1995.0
3000.0 3000.0 0.0
( ) Xi X
i
=

0
( ) Xi X
i

2
0
M
M
ODUL
ODUL
Defini Defini ie ie: : pentru pentru o o distribu distribu ie ie de de frecven frecven dat dat , , modul modul reprezint reprezint
valoarea valoarea observat observat care care apare apare de de cele cele mai mai multe multe ori ori ( (frecven frecven a de a de
apari apari ie ie maxim maxim ). ).
Pentru Pentru va va discrete, discrete, modul modul poate poate fi fi ob ob inut inut direct din direct din distribu distribu ia ia de de
frecven frecven . .
Pentru Pentru va va continue continue i i reprezentate reprezentate prin prin clase clase, , modul modul poate poate fi fi calculat calculat
din formula: din formula:
unde unde L= L=valoarea valoarea minim minim a a clasei clasei modale modale
d d
1 1
= =diferen diferen a a dintre dintre frecven frecven a a clasei clasei modale modale i i frecven frecven a a clasei clasei
precedente precedente
d d
2 2
= = diferen diferen a a dintre dintre frecven frecven a a clasei clasei modale modale i i frecven frecven a a clasei clasei
urm urm toare toare
c= c=lungimea lungimea claselor claselor
c
d d
d
L
2 1
1
mod
+
=
Exemple
Exemple

pentru datele din exemplul 1:


pentru datele din exemplul 1:
mod=6
mod=6

pentru
pentru
datele
datele
din
din
exemplul
exemplul
2:
2:
Modul
Modul
este
este
mai
mai
pu
pu

in
in
utilizat
utilizat

n
n
prelucr
prelucr

rile
rile
statistice
statistice
dec
dec

t media. Un
t media. Un
dezavantaj
dezavantaj
al
al
modului
modului
este
este
acela
acela
c
c

pentru
pentru
un num
un num

r
r
mic
mic
de
de
observa
observa

ii
ii
s
s
-
-
ar
ar
putea
putea
s
s

nu
nu
existe
existe
mod. Exist
mod. Exist

distribu
distribu

ii bi
ii bi
sau
sau
multi
multi
-
-
modale
modale
.
.
98 . 19 3 . 0 *
4 6
6
* 8 . 19 mod =
+
=
MEDIANA
MEDIANA
Definiie: pentru o distribuie de frecven ordonat (de la cea mai mic
valoare la cea mai mare), media reprezint valoarea de la mijlocul
distribuiei.
Pentru va discrete, media este valoarea de pe locul (N+1)/2.
Pentru date grupate:
unde L=cea mai mic valoare din clasa medianei
N=numr de observaii
F=suma frecvenelor pn la clasa medianei (exclusiv)
f
m
=frecvena clasei mediane
c=lungimea claselor
c
f
F N
L mediana
m

+ =
2 /
Exemple
Exemple

Exemple Exemple: :
pentru pentru datele datele din din exemplul exemplul 1, dup 1, dup ordonarea ordonarea datelor datelor: :
mediana mediana=(6+7)/2=6.5, =(6+7)/2=6.5, pentru pentru c c (10+1)/2=5.5 (10+1)/2=5.5

pentru datele din exemplul 2: pentru datele din exemplul 2:


mediana mediana=19.8+ =19.8+ 0.3=20.06 0.3=20.06

Principalul Principalul avantaj avantaj al al medi medianei anei este este acela acela c c nu nu este este afectat afectat de de
valorile valorile extreme. extreme.

De De i i n n ultima ultima vreme vreme este este din din ce ce n n ce ce mai mai folosit folosit n n prelucr prelucr rile rile
statistice statistice, , totu totu i i este este mai mai pu pu in in utilizat utilizat dec dec t media. t media.
20 2 3
8
/
CUANTILELE
CUANTILELE

Plec
Plec

nd
nd
de la median
de la median

, se
, se
poate
poate
defini
defini
valoarea
valoarea
care
care
este
este
mediana
mediana
valorilor
valorilor
de la
de la
st
st

nga
nga
medianei
medianei
;
;
aceast
aceast

valoare
valoare
reprezint
reprezint

25% (1/4) din


25% (1/4) din
distribu
distribu

ie
ie

i se
i se
nume
nume

te
te
cua
cua
n
n
til
til

.
.

n
n
orice
orice
distribu
distribu

ie
ie
exist
exist

3
3
cua
cua
n
n
tile: prima
tile: prima
relativ
relativ

la 25% din
la 25% din
valori
valori
, a
, a
doua
doua
care
care
este
este
de
de
fapt
fapt
mediana
mediana

i
i
reprezint
reprezint

50% din
50% din
valori
valori
, a
, a
treia
treia
care
care
corespunde
corespunde
la 75% din
la 75% din
valori
valori
.
.

n
n
acela
acela

i mod se pot
i mod se pot
defini
defini
decilele
decilele
ca
ca
valoarea
valoarea
sub care
sub care
sunt
sunt
situate 10% din
situate 10% din
observa
observa

ii.
ii.
DISPERSIA SAU
DISPERSIA SAU

MPR
MPR

TIEREA
TIEREA

C
C

nd
nd
datele
datele
sunt
sunt
foarte
foarte
diferite
diferite
, media
, media
nu
nu
caracterizeaz
caracterizeaz

bine
bine
distribu
distribu

ia
ia
,
,
pentru
pentru
c
c

dou
dou

seturi
seturi
de date pot
de date pot
produce
produce
aceea
aceea

i
i
medie
medie
dar
dar
pot
pot
fi
fi
foarte
foarte
diferite
diferite

n
n
ceea
ceea
ce
ce
prive
prive

te
te
variabilitatea
variabilitatea
.
.

Trebuie
Trebuie
construite
construite
ni
ni

te
te
m
m

sur
sur

tori
tori
care s
care s

arate
arate
c
c

t de
t de
mult
mult
difer
difer

observa
observa

iile
iile
de o
de o
valoare
valoare
de
de
referin
referin

(de
(de
obicei
obicei
media
media
sau
sau
mediana
mediana
).
).

Varian
Varian

a
a

Devia
Devia

ia standard
ia standard

Coeficientul de varia
Coeficientul de varia

ie
ie
Lu
Lu

nd
nd

n
n
considerare
considerare
devia
devia

iile
iile
fa
fa

de
de
medie
medie
,
,
devia
devia

iile
iile
individuale
individuale
arat
arat

dac
dac

observa
observa

iile
iile
sunt
sunt
similare
similare
sau
sau
nu
nu
.
.
varian varian : : media devia media devia iilor la ptrat iilor la ptrat i se i se noteaz noteaz cu cu
2 2
pentru pentru popula popula ie ie (N (N observa observa ii) ii) i cu s i cu s
2 2
pentru pentru e e antioane antioane (n (n observa observa ii). ii).
sau sau
n n practic practic , , varian varian a se a se calculeaz calculeaz prin prin mp mp r r irea irea la (n la (n- -1) 1) n loc de n. n loc de n.
Dac Dac va va este este reprezentat reprezentat ntr ntr- -o o distribu distribu ie ie de de frecven frecven , , cele cele 2 2 formule formule de de mai mai sus sus devin devin: :
sau sau
devia devia ie ie standard standard, , rdcina ptrat a varian rdcina ptrat a varian ei ei i are formula: i are formula:
sau sau
coeficientul coeficientul de de varia varia ie ie, ob , ob inut inut prin prin mp mp r r irea irea devia devia iei iei standard la standard la medie medie: :
V= V= (pentru popula (pentru popula ie) ie) sau sau v= v= (pentru e (pentru e antion) antion)
Calcul Calcul ndu ndu- -se media se media i i varian varian a, se a, se poate poate ti ti dac dac media media este este sau sau nu nu relevant relevant . .

=
N
i X
N
1
2 2
) (
1


=
n
i X X
n
s
1
2 2
) (
1

=
N
i i X f
N
1
2 2
) (
1

=
n
i i X X f
n
s
1
2 2
) (
1

=
N
i i X f
N
1
2
) (
1


=
n
i i X X f
n
s
1
2
) (
1

s
X
Observa
Observa

ii la dispersii
ii la dispersii

DS se msoar cu aceea
DS se msoar cu aceea

i unitate de msur ca
i unitate de msur ca

i
i
variabila studiat
variabila studiat

CV ct la sut din medie este abaterea standard


CV ct la sut din medie este abaterea standard

CV poate compara dispersia mai multor va. cantit.


CV poate compara dispersia mai multor va. cantit.

CV
CV
<10%
<10%
dispersie
dispersie
mica,
mica,
omogenitate
omogenitate
mare
mare

CV 10
CV 10
-
-
20%
20%
disp
disp
.
.
m
m
edie
edie
,
,
omogenitate
omogenitate
acceptabil
acceptabil

CV>20%
CV>20%
disp
disp
.
.
m
m
are, lot
are, lot
neomogen
neomogen
Exemple1
Exemple1
utiliznd datele din exemplul 1:
6 7 6 8 5
xi 7 6 9 10 6
=7, deviaiile i ptratul deviaiilor sunt:
-1 0 -1 1 -2
0 -1 2 3 -1 deviaiile
i
1 0 1 1 4
0 1 4 9 1 ptratul deviaiilor
cu un total de 22, deci:

2
=22/10=2.2 = =1.48
V=1.48/7=0.21 21% fa de medie
22 .
Exemple2
Exemple2
Clasa Valoarea
central
Frecvena
absolut
Media Deviaia
fa de
medie
Ptratul
deviaiei
Frecv. x
ptratul
deviaiei
19.2-
19.4
19.3 1 20.08 -0.78 0.6084 0.6084
19.5-
19.7
19.6 2 20.08 -0.48 0.2304 0.4608
19.8-
20.0
19.9 8 20.08 -0.18 0.0324 0.2592
20.1-
20.3
20.2 4 20.08 0.12 0.0144 0.0576
20.4-
20.6
20.5 3 20.08 0.42 0.1764 0.5292
20.7-
20.9
20.8 2 20.08 0.72 0.5184 1.0368
20 2.9520
deci:
s
2
= 2.9520/19=0.1554
s= = 0.3924
v=0.3924/20.08=0.0196 sau 2%
0 1554 ..
Distribu
Distribu

iile principale:
iile principale:

Teoria probabilit
Teoria probabilit

ilor st la baza metodelor statistice de


ilor st la baza metodelor statistice de
inferen
inferen

Inferen
Inferen

a statistic
a statistic
=generalizarea rezultatelor din
=generalizarea rezultatelor din
e
e

antion la
antion la

ntreaga popula
ntreaga popula

ie
ie

Distribu
Distribu

ia normal
ia normal
-
-
gaussian
gaussian

Distribu
Distribu

ia X
ia X

Distribu
Distribu

ia t
ia t
-
-
Student
Student
DISTRIBU
DISTRIBU

IA NORMAL
IA NORMAL
-
-
GAUSSIAN
GAUSSIAN

Loc central Loc central n inferen n inferen a a


biostatistic biostatistic

Cea mai important Cea mai important i utilizat i utilizat


n statistic n statistic

Multe distribu Multe distribu ii iau forma ii iau forma


clopotului Gauss clopotului Gauss

Este o distribu Este o distribu ie de probabilit ie de probabilit i i


cu ecua cu ecua ia ia

f (X) = N(x; f (X) = N(x;


x x
; ;
2 2
x x
) = ) =

unde unde: :
x x
i i
x x
sunt sunt valorile valorile
a a teptate teptate ale ale mediei mediei i i abaterii abaterii
standard standard pentru pentru va va X. X.
X X este este o o va va continu continu cu cu
valori valori ntre ntre - - X X
1
2
1
2
2

x
x
e
[ ]

Caracteristicile distribuiei (1)

1.
1.
Distribu
Distribu

ia
ia
este
este
unimodal
unimodal

,
,
cu o form
cu o form

de
de
clopot
clopot
,
,

i
i
simetric
simetric

dup
dup

x x
.
.

2.
2.
Principalii
Principalii
parametri
parametri
ai
ai
distribu
distribu

iei
iei
normale
normale
sunt
sunt
: media (
: media (

x x
)
)

i
i
abaterea
abaterea
standard (
standard (

x x
).
).
Schimb
Schimb

nd
nd
valoarea
valoarea
lui
lui

x x
, se
, se
deplaseaz
deplaseaz

ntreaga
ntreaga
distribu
distribu

ie
ie
de
de
-
-
a
a
lungul
lungul
axei
axei
Ox.
Ox.
Modific
Modific

nd
nd
valoarea
valoarea
lui
lui

x x
, se
, se
modific
modific

gradul
gradul
de
de

mpr
mpr

tiere
tiere
al
al
distribu
distribu

iei
iei
.
.
Cu c
Cu c

t
t

x x
este mai mic, cu at
este mai mic, cu at

t curba se str
t curba se str

nge
nge
mai mult
mai mult

n jurul mediei.
n jurul mediei.

x x
furnizeaz
furnizeaz

mai
mai
multe informa
multe informa

ii dec
ii dec

t
t

x x
.
.

3.
3.
C
C
urba
urba
este
este
definit
definit

ntre
ntre
-
-

i +
i +

.
.

4.
4.
C
C
urba
urba
are
are
dou
dou

puncte
puncte
de
de
inflexiune
inflexiune
,
,
corespunz
corespunz

nd
nd
valorilor
valorilor
:
:
x=
x=

2
2

Dac Dac o o va va are o are o distribu distribu ie ie normal normal , , probabilitatea probabilitatea ca x s ca x s
aib aib o o valoare valoare n n intervalul intervalul ( (a,b a,b) ) este este: :

prob prob ( (a a X X= =x x b b) = ) = = =

unde unde f(x f(x) ) este este func func ia ia definit definit pentru pentru distribu distribu ia ia normal normal . .

Din Din fericire fericire, se , se poate poate calcula calcula aceast aceast probabilitate probabilitate destul destul de de
simplu simplu. . Pentru Pentru acest acest scop scop, se define , se define te te distribu distribu ia ia normal normal
standard standard, care are media 0 , care are media 0 i i abaterea abaterea standard 1: standard 1:

f(Z) = f(Z) = = N(Z;0;1) = N(Z;0;1)

Se Se poate poate ob ob ine ine n n orice orice situa situa ie ie distribu distribu ia ia normal normal standard, standard,
utiliz utiliz nd nd urm urm toarea toarea transformare transformare: :

Z= Z=

Pentru distribu Pentru distribu ia normal ia normal standard exist standard exist tabele de calcul al tabele de calcul al
integralei de mai sus. integralei de mai sus. Dac Dac se ob se ob ine ine valoarea valoarea lui lui Z, se Z, se poate poate
calcula calcula apoi apoi valoarea valoarea lui lui X. X.
f x d x
a
b
( )

1
2
1
2
2

e
z
(X

)
Caracteristicile distribuiei (2)
Exemplu
Exemplu

Presupun Presupun nd nd c c media media i i abaterea abaterea standard standard pentru pentru o o distribu distribu ie ie
normal normal sunt sunt i i , s , s se se calculeze calculeze valorile valorile astfel astfel nc nc t t prob prob
(x (x
1 1
X X x x
2 2
)=0.95 )=0.95

Deci Deci, , trebuie trebuie s s g g sim sim valorile valorile lui lui x x
1 1
i x i x
2 2
cunosc cunosc nd nd probabilitatea probabilitatea. .
Deoarece Deoarece distribu distribu ia ia normal normal standard standard este este simetric simetric fa fa de 0, se de 0, se vor vor
lua lua n n considerare considerare doar doar valorile valorile pozitive pozitive; se ; se va va mp mp r r i i deci deci
probabilitatea probabilitatea la 2 (0.95/2=0.475). Din la 2 (0.95/2=0.475). Din tabele tabele se se va va g g si si valoarea valoarea cea cea
mai mai apropiat apropiat sau sau egal egal cu 0.475. cu 0.475. Aceast Aceast valoare valoare este este 1.96 1.96 i i va va
constitui constitui valoarea valoarea din din dreapta dreapta a a intervalului intervalului: :
0 0 Z Z 1.96 1.96

Prin Prin simetrie simetrie, , cel cel lalt lalt cap cap t al t al intervalului intervalului va va avea avea valoarea valoarea - -1.96. 1.96.

Deci Deci: :
prob prob ( (- -1.96 1.96 Z Z 1.96)=0.95 1.96)=0.95

Se Se poate poate ob ob ine ine u u or or valoarea valoarea lui lui X: X:


x x
1 1
= = - -1.96 1.96
x x
2 2
= = +1.96 +1.96
DISTRIBU
DISTRIBU

IA X
IA X

Presupunem
Presupunem
c
c

X
X
1 1
,X
,X
2 2
,......,
,......,
X
X
n n
sunt
sunt
n
n
variabile
variabile
aleatoare
aleatoare
normale
normale

i
i
independente
independente
, cu
, cu
aceea
aceea

i
i
medie
medie

i
i
aceea
aceea

i
i
varian
varian

2 2
.
.
Valorile
Valorile
standard
standard
corespunz
corespunz

toare
toare
sunt
sunt
U
U
1 1
,U
,U
2 2
,......,U
,......,U
n n
. Se
. Se
poate
poate
defini
defini
acum
acum
o
o
nou
nou

variabil
variabil

:
:

Y
Y
n n
=
=

Y
Y
i i
=
=

U
U
i i
2 2
i=1,2,.....,n
i=1,2,.....,n

Aceast
Aceast

variabil
variabil

se
se
nume
nume

te
te
x
x
2 2

i are n grade de
i are n grade de
libertate
libertate
,
,
unde
unde
n
n
este
este
num
num

rul
rul
de
de
variabile
variabile
independente
independente
din formula de
din formula de
mai
mai
sus
sus
.
.

Cu c
Cu c

t n
t n
este
este
mai
mai
mare,
mare,
distribu
distribu

ia
ia
x
x
2 2
tinde
tinde
s
s

se
se
apropie
apropie
de
de
distribu
distribu

ia
ia
normal
normal

.
.
DISTRIBU
DISTRIBU

IA t
IA t
-
-
STUDENT
STUDENT
Este Este o alt o alt distribu distribu ie ie important important care care deriv deriv din din distribu distribu ia ia normal normal i se i se
define define te te ca ca raportul raportul ntre ntre o o variabil variabil standard normal standard normal i r i r d d cina cina p p trat trat
a a unei unei valori valori independente independente X X
2 2
mp mp r r it it la num la num rul rul de grade de de grade de libertate libertate. .
Fiind Fiind dat dat o o variabil variabil normal normal X cu X cu gradele gradele de de libertate libertate N( N( , , ) ) i i variabila variabila
X X
2 2
n n
, , independente independente ntre ntre ele ele, se , se poate poate defini defini variabila variabila t t- -Student Student astfel astfel: :
t = t =
i cu i cu func func ia ia de de densitate densitate asociat asociat . .
Variabila Variabila t t ia ia valori valori ntre ntre - - i + i + . .
Distribu Distribu ia ia t t este este simetric simetric fa fa de 0 de 0 i i este este mai mai mpr mpr tiat tiat dec dec t t distribu distribu ia ia
N(0,1). N(0,1).
Totu Totu i, cu c i, cu c t num t num rul rul de grade de de grade de libertate libertate este este mai mai mare cu at mare cu at t t
distribu distribu ia ia t t tinde tinde c c tre tre distribu distribu ia ia N(0,1). N(0,1). Deci Deci pentru pentru n c n c t t mai mai mare, se pot mare, se pot
utiliza utiliza tabelele tabelele pentru pentru distribu distribu ia ia normal normal standard. standard.
( ) /
/
X
n

2
TESTELE DE COMPARAIE
Demersul Demersul necesar necesar construirii construirii unui unui criteriu criteriu de de semnifica semnifica ie ie porne porne te te de la de la
stabilirea stabilirea ipotezei ipotezei nule nule, H , H
0 0
, care , care postuleaz postuleaz faptul faptul c c nu nu exist exist nici nici o o
diferen diferen semnificativ semnificativ ntre ntre indicatorii indicatorii ob ob inu inu i din e i din e antion antion i i cei cei ai ai
popula popula iei iei. Ace . Ace ti ti indicatori indicatori sunt sunt de de regul regul media ( media (sau sau propor propor ia ia), ), abaterea abaterea
standard standard i i efectivul efectivul. .
Pentru Pentru verificarea verificarea ipotezei ipotezei statistice statistice se se utilizeaz utilizeaz diferite diferite teste teste de de semnifica semnifica ie ie
statistic statistic , const , const nd nd din din calcularea calcularea unei unei statistici statistici (t (t

, u , u

, z, etc). , z, etc). i din i din stabilirea stabilirea
de de reguli reguli precise de precise de acceptare acceptare sau sau de de respingere respingere a a ipotezei ipotezei nule nule, H , H
0 0
, cu o , cu o
anumit anumit probabilitate probabilitate. .
Pentru Pentru un un anumit anumit test statistic, test statistic, valoarea valoarea probabilit probabilit ii sub care se ii sub care se respinge respinge
ipoteza ipoteza nul nul se se nume nume te te prag prag de de semnifica semnifica ie ie i i este este ales de ales de cercet cercet tor tor. La . La
testarea testarea semnifica semnifica iei iei se pot se pot comite comite dou dou tipuri tipuri de de erori erori: :
eroarea eroarea de de spe spe a I a I- -a a sau sau , , adic adic decizia decizia de a de a respinge respinge ipoteza ipoteza nul nul c c nd nd aceasta aceasta
este este adev adev rat rat
eroarea eroarea de de spe spe a a II a a II- -a a sau sau , , adic adic decizia decizia de a de a aceepta aceepta n mod n mod eronat eronat ipoteza ipoteza
nul nul c c nd nd aceasta aceasta este este fals fals
S S- -a a demonstrat demonstrat c c probabilitatea probabilitatea de a de a comite comite o o eroare eroare de de spe spe a II a II- -a a descre descre te te
odat odat cu cu cre cre terea terea m m rimii rimii e e antionului antionului. .
Acceptarea Acceptarea ipotezei ipotezei nule nule presupune presupune c c diferen diferen a a testat testat este este
nesemnificativ nesemnificativ , , iar iar respingerea respingerea ei ei c c diferen diferen a a este este semnificativ semnificativ . .
TESTUL t
TESTUL t
-
-
STUDENT (1)
STUDENT (1)

Se Se utilizeaz utilizeaz pentru pentru compararea compararea mediilor mediilor a a dou dou e e antioane antioane
independente independente. Cu . Cu alte alte cuvinte cuvinte, se , se dore dore te te s s se se aprecieze aprecieze
dac dac diferen diferen a a ntre ntre mediile mediile ob ob inute inute din din dou dou e e antioane antioane este este
semnificativ semnificativ statistic statistic sau sau se se datoreaz datoreaz nt nt mpl mpl rii rii. .

Pentru Pentru folosirea folosirea testului testului Student se Student se impune impune o o restric restric ie ie privind privind
varian varian a a celor celor dou dou e e antioane antioane, , cer cer ndu ndu- -se ca se ca diferen diferen a a dintre dintre
ele ele s s nu nu dep dep easc easc un un anumit anumit raport raport. . n n acest acest scop scop se se
aplic aplic testul testul F F, , prin prin care care raportul raportul dintre dintre valoarea valoarea cea cea mai mai
mare mare i i cea cea mai mai mic mic de la de la cele cele dou dou varian variant te se e se compar compar cu cu
o o valoare valoare F, dependent F, dependent de m de m rimea rimea riscului riscului asumat asumat i de i de
gradele gradele de de libertate libertate din din fiecare fiecare e e antion antion. .

n n cazul cazul e e antioanelor antioanelor cu cu cel cel pu pu in 50 de in 50 de observa observa ii, ii,
compararea compararea valorilor valorilor calculate se face cu un calculate se face cu un parametru parametru
tabelar tabelar u. u.
Condi Condi ii: ii: mediile mediile cunoscute cunoscute, , dispersiile dispersiile cunoscute cunoscute. . Ipoteza Ipoteza nul nul : : . .
Pentru Pentru luarea luarea deciziei deciziei trebuie trebuie testat testat inegalitatea inegalitatea: :
unde unde: : i i - - mediile mediile n n primul primul i i respectiv respectiv al al doilea doilea e e antion antion
s s
1 1
2 2
i s i s
2 2
2 2
- - varian varian ele ele n n primul primul i i respectiv respectiv al al doilea doilea e e antion antion
n n
1 1
i n i n
2 2
- - m m rimea rimea celor celor dou dou e e antioane antioane (num (num r de r de observa observa ii) ii)
u u

- - valoarea valoarea tabelar tabelar , , pentru pentru distribu distribu ia ia normal normal , , corespunz corespunz toare toare unui unui
risc risc
Dac Dac inegalitatea inegalitatea este este adev adev rat rat , , diferen diferen a a ntre ntre medii medii este este semnificativ semnificativ . .
2
1 x x =
| | x x
s
n
s
n
u
1 2
1
2
1
2
2
2 1 1

>
TESTUL t
TESTUL t
-
-
STUDENT (2)
STUDENT (2)
x1 x2
Exemplu
Exemplu
Se Se testeaz testeaz diferen diferen a a constatat constatat ntre ntre greutatea greutatea la la na na tere tere pe pe
dou dou e e antioane antioane de 101 de 101 copii copii, , unul unul de b de b ie ie i i i i unul unul de fete de fete
(3000g (3000g i i respectiv respectiv 2950g, o 2950g, o varian varian de 10000 g de 10000 g
2 2
). ). Aplic Aplic nd nd
formula de formula de mai mai sus sus, se ob , se ob ine ine: :
Se Se constat constat c c valoarea valoarea calculat calculat (3.536) (3.536) este este mai mai mare mare dec dec t t
valoarea valoarea teoretic teoretic din din tabel tabel u u
=0.05 =0.05
=1.96, =1.96, deci deci se se poate poate afirma afirma
c c diferen diferen a a este este semnificativ semnificativ statistic statistic. . Rezult Rezult c c , , pentru pentru o o
probabilitate probabilitate de 95% ( de 95% ( n 95 de n 95 de cazuri cazuri din 100), b din 100), b ie ie ii ii sunt sunt mai mai
grei grei la la na na tere tere dec dec t t fetele fetele, , nu nu numai numai n n cazul cazul celor celor dou dou
e e antioane antioane ci ci n general n general n n popula popula ia ia din care din care provin provin loturile loturile. .
| |
.
3000 2950
10000
100
10000
100
3536

+
=
T
T
ESTUL
ESTUL
X
X
2 2

Acest
Acest
test se
test se
utilizeaz
utilizeaz

pentru
pentru
compararea
compararea
caracteristicilor
caracteristicilor
calitative
calitative
. Se
. Se
poate
poate
astfel
astfel
determina
determina
dac
dac

dou
dou

caracteristici
caracteristici
sunt
sunt
realmente
realmente
asociate
asociate

ntr
ntr
-
-
o
o
popula
popula

ie
ie
sau
sau
dac
dac

rela
rela

ia
ia
observat
observat

este
este
doar
doar
rolul
rolul
hazardului
hazardului
.
.

Acest
Acest
test se
test se
aplic
aplic

n
n
dou
dou

situa
situa

ii
ii
diferite
diferite
:
:
pentru
pentru
tabele
tabele
de
de
contingen
contingen

de tip 2x2
de tip 2x2

i
i
pentru
pentru
tabele
tabele
de
de
contingen
contingen

cu
cu
mai
mai
mult
mult
de
de
dou
dou

r
r

nduri
nduri
sau
sau
dou
dou

coloane
coloane
.
.
1.
1.
Compararea
Compararea
unor
unor
reparti
reparti

ii
ii
observate
observate

i
i

ncadrate
ncadrate

n
n
tabele
tabele
2x2
2x2
Forma general Forma general a a unui unui tabel tabel de de contingen contingen 2x2 2x2 este este: :
n n acest acest caz caz, , valoarea valoarea lui lui X X
2 2
poate poate fi fi calculat calculat cu formula: cu formula:
X X
2 2
= =
Dac Dac valoarea valoarea calculat calculat a a lui lui X X
2 2
> > X X
2 2
, ,v v
( (tabelat tabelat , , unde unde de de obicei obicei este este 0.05, 0.05, iar iar
v v reprezint reprezint num num rul rul de grade de de grade de libertate libertate i i n n acest acest caz caz v v=1), =1), atunci atunci diferen diferen a a
este este semnificativ semnificativ , , resping resping ndu ndu- -se se ipoteza ipoteza nul nul . . Ipoteza Ipoteza nul nul compar compar varianta varianta I I
1 1
cu cu varianta varianta I I
2 2
n n ceea ceea ce ce prive prive te te rezultatele rezultatele ob ob inute inute, m , m surate surate prin prin atributul atributul 2. 2.
Atribut 2
Atribut I Varianta I I
1
Varianta I I
2
Total
Varianta I
1
a b a+b
Varianta I
2
c d c+d
Total a+c b+d n
n ad bc
a b c d a c b d
( )
( )( )( )( )

+ + + +
2
Exemplu
Exemplu
Se Se dore dore te te s s se se demonstreze demonstreze c c obezitatea obezitatea este este un factor de un factor de risc risc n n apari apari ia ia
diabetului diabetului. S . S- -au ob au ob inut inut urm urm toarele toarele rezultate rezultate: :
Aplic Aplic nd nd formula de formula de mai mai sus sus, , rezult rezult valoarea valoarea calculat calculat a a lui lui X X
2 2
: :
X X
2 2
= = = 0.79 = 0.79
X X
2 2
=0.05, =0.05,v v=1 =1
=3.841 =3.841
Deci Deci pentru pentru c c 0.79<3.841, 0.79<3.841, rezult rezult c c apari apari ia ia diabetului diabetului nu nu este este influen influen at at
de de obezitate obezitate, cu o , cu o probabilitate probabilitate de 95%. de 95%.
Diabet
Obezitate Prezent Absent Total
Prezent 40 30 70
Absent 20 10 30
Total 60 40 100
100 40 10 30 20
70 30 60 40
2
( ) x x
x x x

2.
2.
Compararea
Compararea
unor
unor
reparti
reparti
i
i
observate
observate

i
i

ncadrate
ncadrate

n
n
tabele
tabele
r x c
r x c
Principiul Principiul de de testare testare const const n n compararea compararea frecven frecven elor elor observate observate de de apari apari ie ie ( (o o
i i
) )
cu cu frecven frecven ele ele calculate ( calculate (c c
i i
), ), n n conformitate conformitate cu cu aplicarea aplicarea ipotezei ipotezei nule nule adic adic a a
lipsei lipsei oric oric rei rei deosebiri deosebiri. Formula de . Formula de calcul calcul n n acest acest caz caz este este: :
x x2 2
c c
= =
unde unde: : o o
i i
- - frecven frecven a a observat observat de de apari apari ie ie
c c
i i
- - frecven frecven a a calculat calculat
x x
2 2
, ,v v
- - valoarea valoarea teoretic teoretic , , tabelat tabelat , , pentru pentru un un risc risc i i v v grade de grade de libertate libertate, ,
calculate dup calculate dup formula: formula: v v = (nr.r = (nr.r nduri nduri- -1)x(nr.coloane 1)x(nr.coloane- -1) 1)
Dac Dac inegalitatea inegalitatea este este adev adev rat rat , , diferen diferen a a este este semnificativ semnificativ . .
Aplicarea Aplicarea testului testului x x
2 2
cere cere ndeplinirea ndeplinirea urm urm toarelor toarelor condi condi ii: ii:
a. a. E E antionul antionul s s fie fie construit construit aleator aleator. .
b. b. Observa Observa iile iile s s fie fie independente independente. .
c. E c. E antionul antionul s s fie fie mai mai mare de 50 de mare de 50 de observa observa ii ii i s i s cuprind cuprind mai mai mult mult de 5 de 5
observa observa ii ii n n fiecare fiecare clas clas a a tabelului tabelului de de contingen contingen . .
d. d. Valoarea Valoarea calculat calculat se ob se ob ine ine utiliz utiliz ndu ndu- -se se valori valori absolute, absolute, nu nu procente procente. .
( )
,
o c
c
i i
i

>

2
2

Exemplu
Exemplu
S S- -au administrat trei tratamente diferite la trei loturi de bolnav au administrat trei tratamente diferite la trei loturi de bolnavi. S i. S- -au au nregistrat nregistrat
valorile din tabelul de mai jos. valorile din tabelul de mai jos. Rezultatul Rezultatul celor celor trei trei tratamente tratamente difer difer
semnificativ semnificativ? ?
x x
2 2
c c
= (20 = (20- -20) 20)
2 2
/20+(30 /20+(30- -24) 24)
2 2
/24+(30 /24+(30- -36) 36)
2 2
/36+(20 /36+(20- -22.5) 22.5)
2 2
/22.5+(25 /22.5+(25- -27) 27)
2 2
/27+(45 /27+(45- -
40.5) 40.5)
2 2
/40.5+(10 /40.5+(10- -7.5) 7.5)
2 2
/7.5+(5 /7.5+(5- -9) 9)
2 2
/9+(15 /9+(15- -13.5) 13.5)
2 2
/13.5 = 6.20 /13.5 = 6.20

x x
2 2
c c
= 6.20 < = 6.20 < x x
2 2
t t
= 9.488 = 9.488 pentru pentru =0.05 ( =0.05 (probabilitate probabilitate de 95%) de 95%) i i v v=(3 =(3- -1)x(3 1)x(3- -1)=4. 1)=4.
Concluzia Concluzia este este c c diferen diferen a a ntre ntre cele cele trei trei tratamente tratamente este este nesemnificativ nesemnificativ n n
ceea ceea ce ce prive prive te te rezultatul rezultatul ob ob inut inut. .
Starea bolnavului
Tratament Vindecai Ameliorai Staionari Total
Trat A o
i
c
i
20
(80/200)x50=20
20
(90/200)x50=22.5
10
(30/200)x50=7.5
50
Trat B o
i
c
i
30
(80/200)x60=24
25
(90/200)x60=27
5
(30/200)x60=9
60
Trat C o
i
c
i
30
(80/200)x90=36
45
(90/200)x90=40.5
15
(30/200)x90=13.5
90
Total 80 90 30 200

S-ar putea să vă placă și