Sunteți pe pagina 1din 74

Matematică și Biostatistică

Primitiva

e
1RĠLXQHD GH SULPLWLYă D UHLH‫܈‬LW GLQ DSOLFDĠLLOH PDWHPDWLFLL vQ VLWXDĠLL FRQFUHWH
care constau în determinarea modelului matematic al unui proces atunci când

i
VHGăYLWH]DGHYDULDĠLHDDFHVWXLD

ac
Curs 2 x Problema SULPLWLYHL VH IRUPXOHD]ă DVWIHO ILLQG GDWă IXQFĠLD GHULYDWă
F f ' : I Ž R o R VH FHUH Vă VH GHWHUPLQH IXQFĠLLOH f : I o R . Problema
primitivelor este deci inv ersa problemei fundamentale a calcul ului
GLIHUHQĠLDOFDUHFRQVWăvQGHWHUPLQDUHDGHULYDWHLXQHLIXQFĠLLGDWH
Primitiva Ɣŝintegrala Riemann

rm
x 'HULYDUHD HVWH XQ RSHUDWRU FDUH DVRFLD]ă XQHL IXQFĠLL GDWH f : I o R
derivata sa f ':I oR, în timp ce d eterminarea primitivelor
(primitivizarea DGLFăLQYHUVDRSHUDĠLHLXQDUHGHGHULYDUHHVWHRIXQFĠLH
PXOWLYRFă FDUH DVRFLD]ă XQHL IXQFĠLL GDWH F : I o R, ( F f ' ) PXOĠLPHD

Fa
IXQFĠLLORUf cu proprietatea f F FDUHHVWHLQILQLWă
'

1 2

de
Primitiva
Primitiva
'HILQLĠLH
1] Fie I Ž R interval, f : I o R6HQXPHúWHSULPLWLYăDIXQFĠLHLI
pe IRULFHIXQFĠLHF : I o R GHULYDELOăSHI úLFXSURSULHWDWHDF '=f pe a 7HRUHPă(2SHUDĠLLDOJHEULFHFXSULPLWLYH)
te
I, (F '(x) = f (x), x  I). Fie I Ž R LQWHUYDO úL I  J  , o R cu f , g  P(I), atunci au loc
@2SHUDĠLDGHGHWHUPLQDUHDXQHLSULPLWLYHF a lui f pe intervalul I SURSULHWăĠLOH
VHQXPHúWHRSHUDĠLHGHLQWHJUDUHQRWDWăSULQVLPEROXO ³ f x dx . (p1) ³ d Of O ³ df Of  C , O  R, C  R
@)XQFĠLDf : I o R FDUHDGPLWHFHOSXĠLQRSULPLWLYăSHI VHQXPHúWH (p2) ³ d f r g ³ df r ³ dg f r g C ; C R
lta

IXQFĠLHFXSULPLWLYHSH, úLPXOĠLPHDDFHVWRUIXQFĠLLVHYDQRWDSULQ (p3) ³ d fg ³ gdf  fdg ³ gdf  ³ fdg


P(I)
&RQVHFLQĠă
Teoremă 3URSULHWăĠLgenerale ale primitivelor)
Fie f, g  C1(I) din (p3 VHREĠLQHIRUPXODGHLQWHJUDUHSULQSăUĠL, care
Fie I Ž R LQWHUYDOúLI,o RDWXQFLDXORFDILUPDĠLLOH
cu

este o metRGăGHFDOFXOSHQWUXSULPLWLYH
(p1 'DFă)HVWHRSULPLWLYăDOXLISH,DWXQFLSHQWUXC  RIXQFĠLD (4) ³ f ˜ g dx f ˜ g  ³ f ˜ g dx
' '

)&HVWHRSULPLWLYăDOXLISH,
(p2  'RXă SULPLWLYH RDUHFDUH ) úL * D OXL I SH , GLIHUă printr-o &RQVHFLQĠă
FRQVWDQWă 'DFăf : I o R, f  P(I) FX)RSULPLWLYăRDUHFDUHDVDúL x u t , t  J este
(p3) 3ULPLWLYD JHQHUDOă sau LQWHJUDOD QHGHILQLWă sau antiderivata
Fa

RVFKLPEDUHGHYDULDELOăFXX C1 - DWXQFLGLQIRUPXODGHGLIHUHQĠLHUH
XQHLIXQFĠLLIHVWHGDWăSULQ DIXQFĠLLORUFRPSXVHDYHP
not
1 ³ f x dxăDOXL
^F  C | F : I o R primitiv
 f C  R` F x  C x  I 5 ³ f x dx ³ f ª¬u t º¼ du t ³ f ª¬u t º¼ u ' t dt F ª¬u t º¼  C , C  R .
(p4 ,QWHJUDODQHGHILQLWăHVWHLQYHUVDDSOLFDĠLHLGHGLIHUHQĠLHUH
2 ³ dF x F x  C 3 3 d ª¬ ³ f x dx º¼ f x dx . 4

.
Matematică și Biostatistică

Primitiva Primitiva

e
2EVHUYDĠLL

i
1. 3HQWUXDWHVWDGDFăF : I o R HVWHRSULPLWLYăDIXQFĠLHLf : I o R

ac
Metodele de calcul pentru primitive sunt:
pe IVHYHULILFăHJDOLWDWHDF '(x) = f (x), x  I.

2. 3UREOHPDH[LVWHQĠHLSULPLWLYHORUvQVHDPQăGHIDSWSHQWUX
x 7DEHOXOSULPLWLYHORULPHGLDWHDOHXQRUIXQFĠLLHOHPHQWDUH
f : I Ž Ro R GHWHUPLQDUHD IDPLOLHL GH IXQFĠLL P(I). 5ăVSXQVXO x 0HWRGDWUDQVIRUPăULORUDOJHEULFHúLWULJRQRPHWULFH

rm
FRPSOHW OD DFHDVWă SUREOHPă QX D IRVW GDW vQFă 6H FXQRVF
UăVSXQVXULSDUĠLDOH x 0HWRGDLQWHJUăULLSULQSăUĠL

(i) &RQGLĠLDQHFHVDUăGHH[LVWHQĠăDSULPLWLYHORUOXLf : I o R x 0HWRGDLQWHJUăULLSULQIRUPXOHGHUHFXUHQĠăGXSăQ N


este ca f VăSRVHGHproprietatea Darboux, deoarece în
acest caz f HVWHRGHULYDWăSHI (f = F ' pe I). x Metoda VXEVWLWXĠLHL

Fa
(ii) Orice IXQFĠLH FRQWLQXă f : I o R SRVHGă SULPLWLYH SH I,
FRQGLĠLHVXILFLHQWă 
(iii) ([LVWăIXQFĠLLGLVFRQWLQXH care au primitive.

5 6

de
ĞĨŝŶŝԑŝĂŝŶƚĞŐƌĂůĞŝZŝĞŵĂŶŶ͘ůĂƐĞĚĞĨƵŶĐԑŝŝ
Integrala Riemann
integrabile
a Fie a, b R cu a < b úLf : [a, b]o R.
x O divizare a intervalului [a, b@QRWDWă'HVWHRPXOĠLPHILQLWăGHSXQFWH'={a = x0
te
x 1RĠLXQHDGHLQWHJUDOăDDSăUXWGLQQHYRLDSUDFWLFăGHDGHWHUPLQD < x1 < ...< xi-1< <xi <… < xn= b} unde xi[a, b] se numesc punctele diviziunii '
DULL úL YROXPH DOH XQRU ILJXUL GLQ SODQ úL FRUSXUL GLQ VSDĠLX FkW úL úL>xi-1, xi] [a, b], i = 1,…n se numesc LQWHUYDOHOHSDUĠLDOHDOHOXL '.
pentru multe alte FRQVLGHUDĠLLGLQIL]LFă
lta
x Avem lungimea l([xi-1, xi]) = xi - xi-1 Gxi !úLQRWăPSULQ__'|| P(') = max{ xi -
not not

x ÌQWHRULDJHQHUDOăDLQWHJUDOHLVHSXQe astfel problema: xi-1 | i = 1, .., n} QRUPDGLYL]ăULL '; evident Gxi d ||'||,  i{1, …, n}.

6H GHILQHúWH R DQXPLWă ³VFKHPă´ 6 XQ procedeu S), prin care x Divizarea ' HVWHHFKLGLVWDQWă GDFă
SXWHPDVRFLDXQRUDQXPLWHIXQFĠLLGDWHXQQXPăUUHDOvQJHQHUDO ba i
a b  a
cu

xi  xi 1 , i  {1,..., n} x
bine determinat. “A integra´ R IXQFĠLH f : [a, b]o R (a, b  R, n úLDWXQFL i n .
a < b  UHODWLY OD VFKHPD 6 vQVHDPQă D GHWHUPLQD QXPăUXO real x 1RWăP prin D([a, b]) sau D (când nu este pericol de confuzie) PXOĠLPHDWXWXURU
GLYL]ăULORUOXL [a, b].
S(f) asociat lui f, cu ajutorul schemei precizate S.
x Pentru o divizare ' D([a, b]) cu '={a = x0 < x1 <...< xi-1< xi <…< xn= b} se
Fa

QXPHúWH PXOĠLPH GH SXQFWH LQWHUPHGLDUH, QRWDWă [', [' ={ [i |  [i [xi-1, xi]};
pentru ' D([a, b@  GDWă H[LVWă R PXOĠLPH LQILQLWă GH IDPLOLL GH SXQFWH
7 intermediare ['.
8
Matematică și Biostatistică

ĞĨŝŶŝԑŝĂŝŶƚĞŐƌĂůĞŝZŝĞŵĂŶŶ͘ůĂƐĞĚĞĨƵŶĐԑŝŝ ĞĨŝŶŝԑŝĂŝŶƚĞŐƌĂůĞŝZŝĞŵĂŶŶ͘ůĂƐĞĚĞĨƵŶĐԑŝŝ
integrabile integrabile

e
Teoremă GHFDUDFWHUL]DUHDLQWHJUDELOLWăĠLLSH5
Fie f : [a, b]o R,  '  D([a, b@  úL RULFH VLVWHP GH SXQFWH LQWHUPHGLDUH
Fie f : [a, b]o R (a, b RDE )XQFĠLDIHVWHLQWHJUDELOă 5LHPDQQGDFăúL

i
[' ={ [i |  [i [xi-1, xi@`QXPăUXO
QXPDLGDFăH[LVWă,R  R cu proprietatea:

ac
n n not

(1) ¦ f [ x  x ¦ f [ Gx
i i i 1 i i V' f , [' ­ ' n nt1  D > a, b @ un
úLUGHGLYL]LXQLFXúLUXOQRUPHORU ' n  R
o 0 úL[ 'n 
i 1 i 1 °
°
se QXPHúWH VXPă LQWHJUDOă 5LHPDQQ DVRFLDWă IXQFĠLHL f, diviziunii ' úL ®
(4)úLUXOVXPHORULQWHJUDOH5LHPDQQ V ' f [ 'HVW
e convergent în R cu limita
° I R
sistemului de puncte ['. °̄ R

rm
&RQVHFLQĠă
'HILQLĠLH Fie f : [a, b] o R RIXQFĠLH5– LQWHJUDELOăDWXQFLDUHORFDILUPDĠLD
> a, b@ , n t 1 cu 'n  V' f [ ' 
b
@)XQFĠLDf : [a, b]o R, este LQWHJUDELOă5LHPDQQSH[a, b@GDFăH[LVWă I R  R (5)' n  DúL R
o0 [ ' n Ÿ R
o ³ f x dx IR
a
cu proprietatea:
° ! 0, KH ! 0 a.î. '  D > a, b @ cu
­H 7HRUHPD &RQGLĠLHQHFHVDUăSHQWUXLQWHJUDELOLWDWH 

Fa
(2) ® œ (2 ') I R lim V' f , [ ' , [ ' 'DFă I >DE@o R HVWH R IXQFĠLH 5 – LQWHJUDELOă DWXQFL I HVWH PăUJLQLWă SH
°̄ '  K Ÿ V' f , ['  I R  H, ['
' o0

[a, b].
@1XPăUXOUHDOIR VHQXPHúWH integrala Riemann sau LQWHJUDODGHILQLWă din f
pe [a, b@QRWDWă
b b b
&RQVHFLQĠă
(3) I R ³a
f ( x )dx sau I R ³ a
fdx sau I R ³a
f sau I R ³ f 'DFăI[a, b]o R HVWHRIXQFĠLHQHPăUJLQLWăSH>DE@DWXQFLIQXHVWH5–
9
[ a ,b ] LQWHJUDELOă FRQGLĠLHVXILFLHQWă  10

de
WƌŽƉƌŝĞƚĉԑŝĂůĞŝŶƚĞŐƌĂůĞŝƔŝĂůĞĨƵŶĐԑŝŝůŽƌ WƌŽƉƌŝĞƚĉԑŝĂůĞŝŶƚĞŐƌĂůĞŝƔŝĂůĞĨƵŶĐԑŝŝůŽƌ
integrabile integrabile
2SHUDĠLLDOJHEULFHFXIXQFĠLLLQWHJUDELOH
x DDFăIJ>DE@o R VXQWIXQFĠLLLQWHJUDELOHDWXQFLIXQFĠLLOH a x Fie f : [a, b]o R cu f 5>DE@úLP0PDUJLQLOHOXLf (m d f(x) d M,
 x[a, b]), atunci avem:
te
1
( f ( x) z 0, x  > a, b @), f ( f ( x) t 0, x  > a, b @) sunt integrabile 5 m d b 1 a ³
b
Of (O  R ), f r g , fg ,
$
fdx d M .
a
f
úLDXORFIRUPXOHOHGHFDOFXO: x 'DFăI>DE@o R HVWHRIXQFĠLHFRQWLQXăDWXQFLH[LVWă[[a, b] a. î.
6 ³
b
$
f ([)(b  a )
lta
b b
(1 ) ³ (Of )dx
$
O ³ fdx a
fdx
a a
b b b
(2$ ) ³ ( f r g )dx ³ fdx r ³ gdx
a a a Majorarea modulului integralei

Proprietatea de aditivitate în raport cu intervalul x 'DFăI>DE@o R HVWHLQWHJUDELOăDWXQFL_I_ 5>DE@úLDYHP


cu

a, b  R; a  b
b b
x )XQFĠLDI>DE@o R este integrabilăSH>DE@GDFăúLQXPDLGDFăc(a,b) (7$ ) ³
a
fdx d ³ | f | dx d (b  a ) f
a f
,
IXQFĠLLOH f1 f [a, cúL
] f 2 >f  c@b VXQWLQWHJUDELOHúLDUHORFIRUPXOD

3 ³ Teorema I de medie
b c b
³ fdx  ³ fdx .
$
fdx
a a c

x Fie f : [a, b]o R cu f 5>DE@úLJ [ t DWXQFLH[LVWăJ [m, M]


Fa

§ ·
sup f ( x) ¸ a.î. 8$ ³ f ( x) g ( x)dx
b b
Proprietatea de monotonie a integralei ¨m inf f ( x), M J ³ g ( x) dx .
x> a ,b @
x Fie f , g: [a, b]o R cu f , g  R[a, b@úLf (x) t g(x)  x[a, b], atunci avem © x> a ,b @ ¹ a a

ÌQSDUWLFXODUGDFăJ [   x  [a, b], avem:


4 ³
b b
$
fdx t ³ gdx .
8 ' ³
b
a 11
a $
f ( x)dx12 J (b  a ) (a  b) .
a
Matematică și Biostatistică

WƌŽƉƌŝĞƚĉԑŝĂůĞŝŶƚĞŐƌĂůĞŝƔŝĂůĞĨƵŶĐԑŝŝůŽƌ DĞƚŽĚĞĚĞĐĂůĐƵůĂůĞŝŶƚĞŐƌĂůĞŝZŝĞŵĂŶŶ
integrabile

e
Formula Leibniz – Newton
x Fie I Ž R LQWHUYDOúLI,oR ORFDOLQWHJUDELOăSH,'DFăD I este un punct x 'DFă I:[a, b]o R eVWH R IXQFĠLH LQWHJUDELOă úL I admite primitive pe [a, b]
IL[DWúLVHFRQVLGHUăIXQFĠLD DWXQFL SHQWUX RULFH SULPLWLYă ) D OXL I  SH >D E@ DUH ORF IRUPXOD /HLEQL]-

i
b Newton:
³

ac
(9q) F(x) = a f (t )dt ,  x ,DWXQFL)DUHSURSULHWăĠLOH b
³ F (b)  F (a) .
b
(10q) f ( x)dx F ( x) a
I. )HVWHFRQWLQXăSH, a

II. )HVWHGHULYDELOăvQ x0I în care f este FRQWLQXăFX)¶ [0)= f (x0). )RUPXODGHLQWHJUDUHSULQSăUĠL


x Fie f , g : [a, b]o R cu f , g  C1([a, b]), atunci are loc formula de integrare
x Fie I Ž R LQWHUYDOúLI,oR. SULQSăUĠL:

rm
I. 'DFăIHVWHRIXQFĠLHFRQWLQXăSH,DWXQFLSHQWUX a,IL[DWIXQFĠLD b b
³ fg a  ³ f ' gdx .
b
x (11q) fg ' dx
(9q) F ( x) ³a f (t )dt , x  I HVWH GHULYDELOă úL DYHP )¶ [  I [ ), xI,
a a

GHFLIDGPLWHSULPLWLYHSH,úL)HVWHRSULPLWLYăDIXQFĠLHLISH, )RUPXODVFKLPEăULLGHYDULDELOă ,
II. Pentru a, b,úLIFRQWLQXăSH,DYHP x Fie f : [a, b]o R RIXQFĠLHFRQWLQXăDWXQFLSHQWUXRULFH M : [D, E]o [a, b] cu
b MC1([a, b]) are loc IRUPXODVFKLPEăULLGHYDULDELOă , :
(10q) ³a f ( x)dx F ( x) a F (b)  F (a) ,
b

Fa
³ f >M(t )@ ˜ M '(t )dt .
b b

XQGH)HVWHRSULPLWLYăRDUHFDUHDOXLISH,
(12q) ³ a
f ( x)dx
a

FormuODVFKLPEăULLGHYDULDELOă ,,
Formula (10q) este formula Leibniz – Newton FDUHHVWH RPHWRGăGHFDOFXOD x 'DFăI>DE@o R HVWHFRQWLQXăSHQWUXRULFHM : [D, E]o >DE@ELMHFWLYăúLFX
integralei Riemann. M -1  C1([a, b]) are loc IRUPXODVFKLPEăULLGHYDULDELOă ,, :
E M (E )
³ f >M(t )@ ˜ M '(t )dt ³
b

13
(13q) ³ a
f ( x)dx
D 14 M( D )
[ f $ (M1 ) ']( x)dx .

de
Integrarea ŶƵŵĞƌŝĐĉ Integrarea ŶƵŵĞƌŝĐĉ

a
Există QXPHURDVH VLWXD‫܊‬LL SUDFWLFH FkQG HYDOXDUHD XQHL LQWHJUDOH GHILQLWH FX
metode analitice cunoscute este extrem de complicat ă sau chiar imposibil de
HIHFWXDW$VWIHOGHVLWXD‫܊‬LLDSDUDWXQFLFkQG
Este de preferat utilizarea unor polinoame de grad mic (unu, doi sau
te
• IXQF‫܊‬LD GH LQWHJUDW DUH R H[SUHVLH IRDUWH FRPSOLFDWă pentru care nu se trei) pe subintervale, ceea ce revine de fapt la integrarea unor IXQF‫܊‬LL
FXQRD‫܈‬WHQLFLRSULPLWLYă; spline, racordate în noduri numai prin valorile IXQF‫܊‬LHL, nu ‫܈‬L prin
• IXQF‫܊‬LD GH LQWHJUDW VH SUH]LQWă VXE IRUPD XQHL VHULL GH YDORUL QXPHULFH derivate.
WDEHODWHH[SUHVLDVDDQDOLWLFDILLQGQHFXQRVFXWă
Integrala I a aproximantei se evalueaza numeric pe fiecare subinterval
lta
• IXQF‫܊‬LD GH LQWHJUDW UHSUH]LQWă XQ SURGXV PDWULFHDO VDX WHQVRULDO JUHX GH
evaluat analitic, a‫܈‬DFXPVHLQWDPSOăvQPRGHODUHDFXHOHPHQWHILQLWH al diviziunii: b n
n b
­
I = g(x) dx = ¦ ak­gk(x) = ¦akIk
În DFHVWHVLWXD‫܊‬LLVHDSHOHD]ă la metodele numerice. Schema generală pentru a ¿a k =1 ¿ k =1 a
ob‫܊‬ine o formulă de integrare numerică este urmatoarea:
x se introduce o diviziune a intervalului de ca lcul [a,b] prin punctele xi (i = 1, b
cu

în care Ik = ­ gk(x) dx
2,…, n); ¿a
x VHVFULHIXQF‫܊‬LDGHLQWHJUDWI [ SXQându-VHvQHYLGHQWDDSUR[LPDQWDJ [ ‫܈‬L
restul R(x), adica:
f(x) = g(x) + R(x) Eroarea de integrare H este:
x se integreaza relatia de mai sus termen cu termen.
Fa

b
H =­ R(x) dx ‫܈‬L se caută o minimizare a erorii.
Daca aproximarea lui g(x) se face prin interpolare, în mod uzual aproximanta se ¿a
alege de forma g(x) =akgk(x) cu k = 1,2,…,n
15 16
Matematică și Biostatistică

Modul de aproximare al unei IXQF‫܊‬LL f(x) de catre polinomul g(x) care reproduce a) DĞƚŽĚĞůĞ Newton-Côtes
exact valoarea IXQF‫܊‬LHL date în punctele de interpolare.
Se consideră ca aproximant g(x) - un polinom de interpolare Lagrange,
f(x)
scris sub forma:

e
g(x) Valoarea adevarată a integralei este aria
R(x n
)
de sub curba f(x), delimitată de verticalele g(x) = ¦ yk·Lk(x)
duse prin punctele extreme x1 ‫܈‬L x5 ale

i
k =1
intervalului de integrare.

ac
iar intervalul [a,b] este împăr‫܊‬it în (n-1) subintervale egale prin punctele x1 = a,
x1 x2 x3 x4 x5 x2, …, xn = b.
b-a
Pasul diviziunii va fi: h =xk+1 – xk = n-1
Metode folosite pentru integrarea numerică: b n b n
­g(x)dx = ¦ [ y ­ L (x) dx I] ==¦ y ·A

rm
a) Metodele Newton-Côtes, dezvoltate pentru o baza de puncte ¿a k =1
k
¿a
k
k =1
k k

echidistante. Aceste metode se folosesc pentru intervale [a,b] împar‫܊‬ite în n-1


subintervale egale, punctele de integrare fiind echidistante (pas de (-1)n-k·h ­ q(n)
Ak = dq
integrare constant). Dintre cele mai folosite metode din aceasta categorie (k-1)!(n-k)! ¿0 q – (k-1) de unde rezultă că: Ak = (b-a)·Hk
fac parte metoda trapezului, metoda Simpson, metoda Romberg. 1 (-1)n-k ­ q(n)
n-1 în care Hk se numesc coeficien‫܊‬ii lui Cotes.

Fa
Hk = dq
b) Metodele Gauss-Legendre, dezvoltate pentru o bază de puncte n-1 (k-1)!(n-k)! ¿0 q – (k-1)
neechidistante. Pozi‫܊‬ia punctelor de evaluare a IXQF‫܊‬LLORU de integrat
decurge dintr-un proces de optimizare, în sensul realizarii integrării astfel integrala aproximantei g(x) se poate scrie în forma generală:
numerice cu un număr minim de puncte pentru aceea‫܈‬i eroare dată de b n n
calcul. Din această categorie fac parte metoda Gauss cu polinoame I = ­ g(x) dx = (b-a) ¦ yk·Hk(x) , k = 1, 2,…, n cu proprietatile: ¦ Hk = 1 ‫܈‬L Hk = Hn-k+1
Legendre, met. Cebisev. 17
¿a k =1 18 k =1

de
a1) DĞƚŽĚĂ trapezelor b n
ƉůŝĐĂƜie
Se particularizează formula de integrare numerică I = ­ g(x) dx = (b-a) ¦ ykHk Valorile IXQF‫܊‬LHL f(x) = ‫ ݔ‬sunt date tabelar, pe intervalul [1, 1.3], cu pasul h = 0.05.
¿a k =1

Aproximanta g(x) devine o dreaptă care trece prin punctele M1 (x1, y1) ‫܈‬L M2 (x2, y2).
a
pentru n = 2., deci pentru un interval de integrare cu două puncte de interpolare (k = 1 ‫܈‬L k = 2). x
f(x)
1.00
1.00
1.05
1.02470
1.10
1.04881
1.15
1.07238
1.20
1.09544
1.25
1.11803
1.30
1.14017
te
f(x) 1
y2 H2 =­ q dq = 0.5 ­
1.3
¿0
y1 g(x) Sa se calculeze
¿1f(x) dx ‫܈‬L sa se estimeze eroarea.
Se obtine formula trapezului:
lta
x2
­ g(x) h
dx = (y1 + y2)
¿x 2 Formula trapezelor generalizată
x1 x2 1

h b n
b I = ­ g(x) dx = h (0.5 y1 + y2 + y3 + … + yn-1 + 0.5 yn) = 0.5 h (y1 + yn) + h ¦ yk
Pentru a calcula ­ g(x) dx se divide domeniul de integrare [a, b] în (n-1) domenii egale ¿a
cu

k =1
¿a
[x1, x2], [x2, x3],…, [xn-1, xn], se aplica formula trapezelor pentru fiecare 1.3
subdomeniu în parte ‫܈‬L apoi se insumează rezultatele par‫܊‬iale. I =­ g(x) dx = 0.05 (0.5·1 + 1.02470 + 1.04881 + 1.07238 + 1.09544 + 1.11803 + 0.5· 1.14017) =
Tinând cont de faptul ca extremele domeniului de integrare y1 ‫܈‬L yn se iau o singur ă dată în ¿1
= 0.32147 (eroare prin lipsa H = 1.536·10 )
-5
calcul, în timp ce valorile IXQF‫܊‬LLORU pentru celelalte pozi‫܊‬ii se iau în c alcul de doua o ri se ob‫܊‬ine
Fa

formula trapezelor generalizată.


b n Valoarea exacta a integralei este: 0.3214853
I = ­ g(x) dx = h (0.5 y1 + y2 + y3 + … + yn-1 + 0.5 yn) = 0.5 h (y1 + yn) + h ¦ yk
¿a k =1
b-a
în care, h = xk+1 – xk = n-1 19 20
Matematică și Biostatistică

a2) DĞƚŽĚĂ Simpson ƉůŝĐĂƜie


b n
Se aplică formula de integare numerică I = ­ g(x) dx = (b-a) ¦ ykHk , particularizată pt. n = 3,
1
Sa se calculeze numeric integrala ­ (4x + 3x + 2x +5) dx folosind:
3 2
¿a k =1 ¿0

e
deci pentru un interval de interpolare cu trei puncte (k =1, 2, 3). Aproximanta g(x) reprezintă o a) Calculul analitic;
parabola care trece prin punctele A(x1, y1), B(x2, y2), C(x3, y3).
b) Formula trapezelor cu 9 puncte;

i
n-1
1 (-1)n-k ­ q(n)
Aplicând formula: Hk = dq c) Formula Simpson cu 9 puncte;

ac
n-1 (k-1)!(n-k)! ¿0 q – (k-1)
x3
.
Rezultă: I = ­ g(x) dx = (x3 – x1) (H1y1 + H2y2 + H3y3), în care: 1 1
¿x Rezolvare a) ­ (4x3 + 3x2 + 2x +5) dx = (x4 + x3 +x2 + 5x) =8
1
2
¿0 0
1 1 1 1-0
H1 = · ­(q-1)(q-2) dq = b,c) Pasul de d iscretizare este: h = = 0.125. Punctele x k ‫܈‬L valorile IXQF‫܊‬LHL f(xk) sunt

rm
2 2¿ 6 9-1
0 prezentate în tabelul de mai jos:
1 1 2 2
H2 = - · ­ (q-1)(q-2) dq = k 1 2 3 4 5 6 7 8 9
2 1¿ 3 care se inlocuiesc în integrala de mai sus.
0
xk 0 0.125 0.25 0.375 0.5 0.625 0.75 0.875 1
1 2 1
H3 = · 1­ q (q-1) dq = yk 5 5.3046 5.75 6.3828 7.25 8.3984 9.875 11.7265 14
2 2¿ 6

Fa
0
Valorile lui H1, H2, H3 se introduc în calculul integralei I, obtinandu-se formula lui Simpson: Itrapez = 0.125 (2.5 + 5.3046 + 5.75 + 6.3828 + 7.25 + 8.3984 + 9,875 + 11.7265 + 7) = 8.0234
x3
­ g(x) dx = h (y + 4y + y ) , unde 2h = x – x 0.125
¿x 3 1 2 3 3 1 ISimpson = [(5 + 14) + 4·(5.3046 + 6.3828 + 8.3984 + 11.7625) + 2·(5.75 + 7.25 + 9.8750] =
1
3
= 7.9999
b
Generalizând, I = ­ g(x) dx = h [(y1 + y2n+121
) + 4 (y2 + y4 +…+y2n) + 2 (y3 + y5 +…+ y2n-1)] Eroarea de calcul cea mai mare (H = 0.2875%) 22este în cazul folosirii metodei trapezelor.

de
¿ 3
a

b) DĞƚŽĚĞ Gauss->ĞŐĞŶĚƌĞ
Aceste metode reduc eroarea de integrare printr-o alegere o ptimizată a pun ctelor de
diviziune. În aceste condi‫܊‬ii, pasul nu mai poate fi considerat constant iar valorile IXQF‫܊‬LHL la Formula lui Gauss-Legendre:

a
capetele intervalului nu mai sunt folosite. Se pune deci problema aleger ii unor noduri astfel
încat eroarea de integrare sa fie cât mai mica. Acest lucru se poate realiza printr-o
interpolare cu un polinom de grad mai mare, fără a mări însă numărul de noduri. Astfel, se b
I = ­ f(x) dx =
b-a n 1
te
aleg ca puncte de diviziune r ădăcinile unor polinoame o rtogonale: Legendre, Cebisev, ¿a 2 ¦Ak·F(zk) + H în care: Ak = ­ Lk(z) dz se numesc ponderi,
k =1 ¿-1
Hermite.
iar F(zk) = f ( b-a zk + b+a )
b1) DĞƚŽĚĂ 'ĂƵƐƐĐƵpolinoame >ĞŐĞŶĚƌĞ 2 2
lta

Se numesc polinoame Legendre expresii de forma: In care zk sunt radacinile polinoamelor Legendre de grad n iar eroarea H este data
1 dn [(x2 – 1)n] de:
Pn(x) = n n =0,1,2,… (b-a)2n+1 (n!)4 f(2n)([)
2 ·n! dxn H= [  (a,b)
3 [(2n)!] (2n+1)
Aceste polinoame au urmatoarele proprietati:
cu

1) Pn(1) = 1 ‫܈‬L Pn(-1) = (-1)n.


1
2) Satisfac conditiile de ortogonalitate: ­ Pn(x)·Qm(x) = 0 unde Qm(x) este orice polinom de
grad m <n ¿-1
3) Polinomul Legendre Pn(x) are n radacini reale ‫܈‬L distincte în intervalul (-1,1).
Fa

Primele cinci polinoame Legendre au expresiile:

3x2 - 1 5x3 – 3x 1
P0(x) = 1; P1(x) = x; P2(x) = , P3(x) = 23 , P4(x) = (35x4 – 30x2 +3)
2 2 8 24
Matematică și Biostatistică

ƉůŝĐĂԑŝŝĂůĞĐĂůĐƵůƵůƵŝintegral ƉůŝĐĂԑŝŝĂůĞĐĂůĐƵůƵůƵŝintegral

e
x 2ULFH PăULPH JHRPHWULFă IL]LFă HFRQRPLFă HWF FDUH DUH SURSULHWDWHD GH /XQJLPHDXQXLDUFGHFXUEă
“DGLWLYLWDWHIDĠăGHPXOĠLPH LQWHUYDO ” se poate exprima printr-R LQWHJUDOă 6H QXPHúWH FXUEă SODQă R PXOĠLPH * R2 FX SURSULHWDWHD Fă H[LVWă R IXQFĠLH
GHILQLWă FRQWLQXăf : [a, b]o RQRWDWăy = f (x), x [a, b@úL*f = * R2 (graficul lui f din

i
x $VWIHO QRĠLXQLOH GH ³arie´ úL ³volum´ SHQWUX ILJXUL JHRPHWULFH GLQ SODQ úL plan este * 'DFăf DUHGHULYDWăFRQWLQXă VDXQXPDLIXQFĠLHLQWHJUDELOă SH

ac
FRUSXUL GLQ VSDĠLX se pot defini în mod riguros din punct de v edere [a, b], lungime a curbei * VHFDOFXOHD]ăGXSăIRUPXOD
matematic. b
l (* ) ³ a
1  f '2 ( x)dx .
Aria unui domeniu din plan
1. $ULDPXOĠLPLL din plan D R2 PăUJLQLWăGHGUHSWHOHx = a, x = b, y úL 9ROXPXOXQXLFRUSGHURWDĠLH

rm
JUDILFXOIXQFĠLHLf : [a, b]o R SR]LWLYăúLFRQWLQXăVHFDOFXOHD]ăSULQIRUPXOD Fie f : [a, b]o R RIXQFĠLHFRQWLQXăDWXQFLFRUSXO.GLQVSDĠLXREĠLQXWSULQURWLUHD
graficului lui f , Gf, în jurul axei Ox, are volumul calculat prin formula:
A D
b
³ f ( x)dx
V K
b
S³ f 2 ( x)dx .
a
a

2. În cazul f : [a, b]o R FRQWLQXăúLGHVHPQRDUHFDUHDYHP

Fa
6XSUDIDĠDXQXLFRUSGHURWDĠLH
A D
b
³
a
| f ( x) | dx
Fie f : [a, b]o R R IXQFĠLH GHULYDELOă SH >a, b@ úL FX f¶ FRQWLQXă f  C1([a, b])),
DWXQFLVXSUDIDĠD6DFRUSXlXL.REĠLQXWSULQURWLUHDJUDILFXOXLOXLf în jurul axei Ox
3. $ULD PXOĠLPLL GLQ SODQ PăUJLQLWă GH GUHSWHOH x = a, x = b úL JUDILFHOH VHFDOFXOHD]ăSULQIRUPXOD
IXQFĠLLORUf , g : [a, b]o R continue eVWHFDOFXODWăSULQIRUPXOD S K 2S ³
b
1  f '2 ( x)dx .
A D
b a
³a
| g ( x)  f ( x) | dx .
25 26

de
Ce este statistica?
a
te
Statistica HVWHúWLLQĠDFDUHFXOHJHVLQWHWL]HD]ă
BIOSTATISTICA
y
GHVFULHLQWHUSUHWHD]ăGDWHOHUHIHULWRDUHODIHQRPHQH
lta
generale (DEX ’98)
1. ,QWURGXFHUHvQVWDWLVWLFă
y Obiectul statisticii moderne îl constituie colectarea,
2. Statistica descriptivă
RUJDQL]DUHDDQDOL]DúLLQWHUSUHWDUHDGDWHORUvQ
cu

YHGHUHDDGRSWăULLGHFL]LLORU
Fa

27 28
Matematică și Biostatistică

Ce este statistica? Ce este statistica?

i e
Clasificare: y 6WDWLVWLFDPDWHPDWLFă HVWHRUDPXUăDPDWHPDWLFLL

ac
y 6WDWLVWLFDPDWHPDWLFă FDUHHODERUHD]ăQRĠLXQLOHúLPHWRGHOHIRORVLWHvQ
y 6WDWLVWLFDHFRQRPLFă VWDWLVWLFă
y 6WDWLVWLFDLQGXVWULDOă y 6WDWLVWLFDHFRQRPLFă (sau Statistica pentru afaceri =

rm
y 6WDWLVWLFDVRFLDOă Business Statistics) este ramura statisticii care
y 6WDWLVWLFDPHGLFDOă ELRVWDWLVWLFD VWXGLD]ăIHQRPHQHOHúLSURFHVHOHHFRQRPLFHFX
DSOLFDĠLLvQDVLJXUăULILQDQĠHPDUNHWLQJPDQDJHPHQW

Fa
úD

29 30

de
Biostatistica – statistică DSOLFDWă în medicină
Ce este statistica?
a Obiectivele biostatisticii:
1. Starea VăQăWăĠLL SRSXODĠLHL:
te
- Reproducerea úL mortalitatea SRSXODĠLHL;
y 6WDWLVWLFDLQGXVWULDOă vQHQJOH]ăEngineering - Morbiditatea úL invaliditatea;
Statistics sau Industrial Statistics VWXGLD]ă - Parametrii GH]YROWăULL fizice.
IHQRPHQHOHúLSURFHVHOHGLQLQJLQHULHúLLQGXVWULHFX 2. /HJăWXUD dintre LQIOXHQĠD mediului ambiant úL factorilor sociali asupra
lta

DSOLFDĠLLvQSURLHFWDUHDH[SHULPHQWHORUFRQWUROXO VăQăWăĠLL SRSXODĠLHL.


VWDWLVWLFDOFDOLWăĠLLILDELOLWDWHHWF
3. Acumularea úL analiza datelor referitor la activitatea LQVWLWXĠLLORU úL
y 6WDWLVWLFDVRFLDOă VWXGLD]ăIHQRPHQHOHVRFLDOHFX cadrelor medicale.
cu

DSOLFDĠLLvQGHPRJUDILHUHFHQVăPLQWHDQDOL]HSROLWLFH
4. Evaluarea HILFDFLWăĠLL metodelor de profilaxie úL tratament.
etc.
5. Planificarea, economia úL ILQDQĠDUHD ocrotirii VăQăWăĠLL.
y 6WDWLVWLFDPHGLFDOă (biostatistica DSOLFDĠLLvQ
PHGLFLQăIDUPDFLHúLúWLLQĠHELRORJLFH Pornind de la obiective, deosebim XUPăWRDUHOH compartimente ale
Fa

biostatisticii:
- Statistica VăQăWăĠLL SRSXODĠLHL;
- Statistica ocrotirii VăQăWăĠLL;
31 32
- Statistica managementului de profilaxie, tratament úL altor DFWLYLWăĠL în PHGLFLQă.
Matematică și Biostatistică

Scopul statisticii Biostatistica – scopuri

e
Descriptiv (statistica GHVFULSWLYă : HYLGHQ‫܊‬LHUHD caracteristicilor
Scopul statisticii poate fi dedus din clasificarea acesteia:

i
importante ale unui set de date medicale.
- statistica GHVFULSWLYă

ac
Metode:
- statistica DQDOLWLFă. • Organizarea
• Sumarizarea
• Caracterizarea unui set de date
Statistica GHVFULSWLYă se RFXSă de prezentarea, clasificarea úL

rm
Instrumente:
sintetizarea datelor din REVHUYDĠLL. Aceasta prezintă LQIRUPDĠLD H[LVWHQWă
în datele respective cu ajutorul indicatorilor statistici - numere ce • Grafice:
H[SULPă caracteristici sau WHQGLQĠH ale fenomenului studiat. – 'LVWULEXĠLDGHIUHFYHQĠH KLVWRJUDPD
– 'LVWULEXĠLDGHIUHFYHQĠH KLVWRJUDPDGLIHUHQĠHORUSHQWUXGDWH

Fa
perechi)
Statistica DQDOLWLFă (inferen‫܊‬ială) IRORVHúWH teoria SUREDELOLWăĠLORU – &RPSDUDUHDJUDILFăDGLVWULEXĠLLORUGDWHORU
pentru extragerea úL prelucrarea LQIRUPDĠLHL statistice; în multe cazuri – ,GHQWLILFDUHDUHODĠLLORUOLQLDUH
aceste metode pun în HYLGHQĠă OHJLWăĠL statistice. – &RPSDUDUHDUHODĠLLORUOLQLDUH
33 34

de
Metode de colectare a datelor
Biostatistica – scopuri
a y Principalele metode de colectare sau de culegere a
te
datelor sunt:
InferenĠial VWDWLVWLFDLQIHUHQĠLDOă 
Cum úL când) JHQHUDOL]ăP rezultatele REĠLQXWH
lta
de la un HúDQWLRQ la SRSXODĠLD JHQHUDOă
WŽƉƵůĂԑŝĂ
SURSE DE DATE
STATISTICE
cu

EXPERIMEN-
OBSERVARE SONDAJ SIMULARE
Fa

TARE
ƔĂŶƚŝŽŶƵů

35 /ŶĨĞƌĞŶƚĂƐƚĂƚŝƐƚŝĐĂ 36
Matematică și Biostatistică

Metode de colectare a datelor Metode de colectare a datelor

i e
y 2EVHUYDUHDGLUHFWă HVWHFHDPDLVLPSOăPHWRGăGHREĠLQHUH 7HKQLFLOHGHVRQGDMXWLOL]HD]ă

ac
DGDWHORUVWDWLVWLFHúLFRQVWăGLQREVHUYDUHDúLvQUHJLVWUDUHD y interviuri (directe, telefonice)
GLUHFWă QHPLMORFLWă DGDWHORUGLQWU-XQDQXPLWHúDQWLRQVDX y chestionare GLUHFWHSULQSRúWăH-mail, internet)
SRSXODĠLHVWDWLVWLFă

rm
y Experimentele UHSUH]LQWăRPHWRGăGHDREĠLQHGDWH y 3HQWUXDQDOL]DGDWHORUVWDWLVWLFHúLSHQWUXGHFL]LHVH
VWDWLVWLFHSULQSURLHFWDUHDúLSODQLILFDUHDPRGDOLWăĠLLGH XWLOL]HD]ăúLGDWHREĠLQXWHSULQPHWRGHGHsimulare
REĠLQHUHDGDWHORUVWDWLVWLFHUHVSHFWLYH

Fa
Indiferent de metoda de colectare a datelor, pentru
y Sondajele statistice UHSUH]LQWăRPHWRGăGHFXOHJHUHD
LQIHUHQĠDVWDWLVWLFăHVWHLPSRUWDQWăHúDQWLRQDUHDGDWHORU
GDWHORUVWDWLVWLFHFHFRQVWăvQREĠLQHUHDGHLQIRUPDĠLLGHOD
GLIHULWHFDWHJRULLGHSRSXODĠLL
37 38

de
3RSXODĠLHVWDWLVWLFăúLHúDQWLRQ 3RSXODĠLHVWDWLVWLFăúLHúDQWLRQ
statistic statistic
'HILQLĠLH O SRSXODĠLHVWDWLVWLFă HVWHRPXOĠLPHVDXR a
te
FROHFĠLHGHRELHFWHGHVSUHFDUHREVHUYăPúL 'HILQLĠLH0ăVXULOHQXPHULFHFHFDUDFWHUL]HD]ăR
vQUHJLVWUăPGDWHvQVFRSXOXQHLDQDOL]HVWDWLVWLFH SRSXODĠLHVWDWLVWLFăVHQXPHVFparametri statistici.
lta

'HRELFHLSULQSRSXODĠLHVWDWLVWLFăvQPRGHPSLULFvQĠHOHJHPR
PXOĠLPHGHSHUVRDQHXPDQH
SHUVRDQHOHGLQ-XGHĠXO&RQVWDQ‫܊‬D FDUHVXIHUăGHhipertensiunea | 3DUDPHWULLXQHLSRSXODĠLLVHQRWHD]ăFXOLWHUH
cu

DUWHULDOăHVHQĠLDOă (HTA) JUHFHúWL


SHUVRDQHOHGLQMXGHĠXO&RQVWDQ‫܊‬D GHVH[IHPLQLQFDUHVXIHUăGH
HTA | 'HH[HPSOXPHGLDXQHLSRSXODĠLLVH
SHUVRDQHOHGLQ5RPkQLDFDUHVXIHUăGHRDIHF‫܊‬LXQHúLFDUHDXIRVW
operate, etc.
QRWHD]ăFXP, iar abaterea standard cu V.
Fa

39 40
Matematică și Biostatistică

3RSXODĠLHVWDWLVWLFăúLHúDQWLRQ 3RSXODĠLHVWDWLVWLFăúLHúDQWLRQ
statistic

e
statistic

i
'HILQLĠLH Un HúDQWLRQVWDWLVWLF HVWHRVXEPXOĠLPHGH (ù$17,21$5(

ac
obiecte extrase dintr-RSRSXODĠLHVWDWLVWLFă 3238/$ğ,(
b b b b b bb b
bbbbbbbb
'HILQLĠLH0ăVXULOHQXPHULFHFHFDUDFWHUL]HD]ăXQ

rm
bb b b b b b b
HúDQWLRQVWDWLVWLFVHQXPHVFstatistici sau indicatori (ù$17,21
bbbbbbbb
statistici. bbb
bbb

Fa
'HH[HPSOXPHGLDXQXLHúDQWLRQVH bbb
| ,1)(5(1ğĂ
QRWHD]ăFXLDUDEDWHUHDVWDQGDUGFX
x s.
3RSXODĠLHúLHúDQWLRQ
41 42

de
0HWRGHGHHúDQWLRQDUH 0HWRGHGHHúDQWLRQDUH
a
te
(ù$17,21$5(
y Metodele de HúDQWLRQDUH sunt de GRXă tipuri:
y aleatoare (sau probabiliste)
lta
NEALEATOARE ALEATOARE
y nealeatoare (sau deterministe)

5$ğ,21$0(17 6,03/Ă
y (úDQWLRQDUHDDOHDWRDUH VHED]HD]ăSHWHKQLFD
cu

QXPHUHORUDOHDWRDUH vQWkPSOăWRDUH úLSHWHRULD


&27Ă3$57( 6,67(0$7,&Ă
SUREDELOLWăĠLORU
Fa

675$7,),&$7Ă
y (úDQWLRQDUHDQHDOHDWRDUH VHED]HD]ăvQJHQHUDOSH
UDĠLRQDPHQWúLSHPRGXOvQFDUHGDWHOHVXQWGLVSRQLELOH
PE GRUPURI
43 44
Matematică și Biostatistică

Un HúDQWLRQDOHDWRUVLPSOX de efectiv n este un Un HúDQWLRQDOHDWRUVLVWHPDWLF de efectiv k VHREĠLQH


HúDQWLRQVHOHFWDWvQWkPSOăWRUGLQWU-RSRSXODĠLHDVWIHOvQFkW SULQGLYL]DUHDSRSXODĠLHLFXHIHFWLYXON în k

e
RULFHHúDQWLRQGLIHULWVăDLEăDFHHDúLSUREDELOLWDWHGH HúDQWLRDQHFXHIHFWLYXOn úLDSRLH[WUDJHUHD
prelevare sau de extragere. HOHPHQWXOXLGHDFHODúLUDQJ DOHVvQWkPSOăWRU GLQ

i
ac
ILHFDUHHúDQWLRQIRUPDW

b b b b b bb b b

rm
b b b b b bb b bb
bbbbbbbb b
bbbbbbbb
bbbbbbbb b
bbbbbbbb bb
bbbbbbbb b
bbbbbbbb

Fa
bbbbbbbb b
bbbbbbbb bb
b b b b b bb b b
b b b b b bb b

45 46

de
Un HúDQWLRQDOHDWRUVWUDWLILFDW de efectiv n VHREĠLQH Un HúDQWLRQDOHDWRUSHJUXSXUL SHFOXVWHUH de
SULQVHSDUDUHDSRSXODĠLHLFXHIHFWLYXON în n efectiv n VHREĠLQHSULQVHSDUDUHDSRSXODĠLHLFX

a
VXESRSXODĠLLsau straturi úLDSRLH[WUDJHUHDGH
HúDQWLRDQHDOHDWRDUHVLPSOHGLQILHFDUHVWUDW
efectivul N în n grupuri sau clustere úLDSRL
extragerea aleatoare a unui anumit grup.
te
lta

b b b b b bb b b b b b b b b bb b
bbbbbbbb b bbbbbbbb b
bbbbbbbb b
cu

bbbbbbbb b
bbbbbbbb b bbbbbbbb b
bbbbbbbb b bbbbbbbb b
b b b b b bb b b
Fa

b b b b b bb b b

47 48
Matematică și Biostatistică

Tipuri de date statistice Tipuri de date statistice

e
y Unitatea statistică reprezintă elementul component al unei Datele VWDWLVWLFHSRWILFODVLILFDWHGXSă:

i
colectivitаăi statistice (de ex. în cazul popula‫܊‬iei unei ‫܊‬ări, Modul de exprimare:

ac
unită‫܊‬ile statistice sunt indivizii). Unită‫܊‬ile statistice sunt
elementele de observare, măsurare úLvQUHJLVWUDUHSULQHOHVH
observă, măsoară úLînregistrează o popula‫܊‬ie.
A. CALITATIVE
y O YDULDELOăVWDWLVWLFăHVWHRDQXPLWăFDUDFWHULVWLFă vQUHJLVWUDWăOD

rm
QLYHOXOXQLWă‫܊‬LORUVWDWLVWLFH ale XQHLSRSXODĠLLVDXale unui HúDQWLRQ 1. nominale - exprimate în cuvinte: profesie, FXORDUHDSăUXOXL
culoarea tegumentelor, starea la externare a unui bolnav,
y Valorile XQHLYDULDELOHVWDWLVWLFHVXQWYDORULOHREVHUYDWHúLSRVLELOH
ale variabilei respective grupa de ac‫܊‬iune farmacologică (antiinflamator, antipiretic,
antireumatic), etc.;

Fa
y Datele statistice VXQWYDORULOHREVHUYDWHúLvQUHJLVWUDWHDOHXQHL 2. ordinale - sunt date calitative nominale, în care
variabile statistice caracteristicile sau categoriile sunt ordonate: Graduarea unei
afectiuni (Incipient, Moderat, Sever, Stare critică)
y ,QIRUPDĠLLOHVWDWLVWLFH UH]XOWăGLQSUHOXFUDUHDúLDQDOL]DGDWHORU
statistice
49 50

de
9DULDELODFDOLWDWLYă
Tipuri de date statistice
Tip Valori / UM
| Clasificarea 2UGLQDOă *, **, ***, ****, *****

B. CANTITATIVE (numerice), exprimate în cifre: a hotelurilor


| 6DWLVIDFĠLDFOLHQWXOXL 1RPLQDOă )RDUWHUHGXVă5HGXVă
te
6DWLVIăFăWRDUH%XQă
(calitatea produsului)
vQăOĠLPHJUHXWDWHWHQVLXQH DUWHULDOăSXOV )RDUWHEXQă
&ODVLILFDUHDIXQFĠLLORU 1RPLQDOă Preparator, Asistent,
WHPSHUDWXUăHWF |
didactice /HFWRU&RQIHUHQĠLDU
lta

1. continue (PăVXUDELOH); pot lua orice valoare din scara lor Profesor

de YDULDĠLHJUHXWDWHD XQHLSHUVRDQHvQăOĠLPHD
9DULDELODFDQWLWDWLYă Tip Valori / UM
temperatura, etc.;
| )DĠDDSăUXWăOD 'LVFUHWă 1, 2, 3, 4, 5, 6
cu

2. discrete (numărabile); pot lua numai valori întregi:


QXPăUXOGHFRSLL, QXPăUGHYL]LWH flux de pacien‫܊‬i / zi aruncare unui zar
într-o farmacie, etc; | 1RWDREĠLQXWăODXQ 'LVFUHWă 4, 5, ..., 9, 10
examen
Fa

0RGXOGHREĠLQHUH | ÌQăOĠLPHD &RQWLQXă cm


- primare, REĠLQXWH în etapa de colectare a datelor;
- derivateREĠLQXWHvQSURFHVXOSUHOXFUăULLGDWHORUstatistice | Greutatea &RQWLQXă kg
51 52
Matematică și Biostatistică
ŝƐƚƌŝďƵԑŝĂĚĂƚĞůŽƌŠŶĐŽůĞĐƚŝǀŝƚĂƚĞĂƐĞůĞĐƚŝǀĉ

Poate fi: • Asimetricĉ (pe stânga)


Sistematizarea datelor statistice

e
• Alternativĉ
y *UXSDUHDVWDWLVWLFă UHSUH]LQWăRRSHUDĠLHGHVLVWHPDWL]DUHDGDWHORU

i
SULPDUHSULQFDUHSHQWUXFDUDFWHULVWLFLOHvQUHJLVWUDWHHYLGHQĠLD]ă

ac
• Simetricĉ WLSXULOHFDOLWDWLYHH[LVWHQWHvQFDGUXOSRSXODĠLHLFHUFHWDWH
Prin grupare se RPRJHQL]HD]ă XQLWăĠLOH FROHFWLYLWăĠLL din punct de vedere
al YDULDĠLHL uneia sau mai multor caracteristici.
*UXSăULOH pot fi clasificate astfel:

rm
• Asimetricĉ (bimodalĉ) 1. GXSă obiectivul XUPăULW:
- JUXSăUL destinate SUH]HQWăULL sistematice a datelor culese;
• Asimetrica (pe dreapta)
- JUXSăUL destinate analizei statistice.

Fa
2. GXSă forma de exprimare a caracteristicilor:
- JUXSăUL GXSă caracteristici numerice sau cantitative;
- JUXSăUL GXSă caracteristici nenumerice sau calitative.

53 54

de
Prezentarea datelor statistice
*UXSDUHDVWDWLVWLFă

a
3. GXSă QXPăUXO de caracteristici în IXQFĠLH de care se face gruparea: Tabele statistice
te
- JUXSăUL simple – IăFXWH GXSă o VLQJXUă FDUDFWHULVWLFă;
Un tabel statistic trebuie să cuprindă următoarele elemente:
- JUXSăULFRPELQDWH– IăFXWHGXSăGRXăVDXPDLPXOWH
caracteristici.
WLWOXOJHQHUDODOWDEHOXOXLúLWLWOXULOHLQWHULRDUHXQLWDWHDGH
lta

4. GXSă FRQĠLQXWXO caracteristicilor:


măsură utilizată, notele explicative, sursa datelor.
- JUXSăUL GXSă caracteristici de VSDĠLX; Tabelele pot fi:
- JUXSăUL GXSă caracteristici de timp; - simple (ce nu cuprind grupări)
cu

- JUXSăUL GXSă caracteristice atributive. - de grupare (o singură caracteristică de grupare)


5. GXSă PăULPHD intervalelor de grupare: - combinate (grupări dupădouă caracteristici)
- JUXSăUL cu intervale egale;
- de corelaаie (grupări după două sau mai multe caracteristici,
- JUXSăUL cu intervale neegale (inegale).
Fa

legate între ele cauzal)

55 56
Matematică și Biostatistică

Prezentarea datelor statistice

Distribu‫܊‬ii statistice unidimensionale


Prezentarea datelor statistice

e
Grafice Tabele de frecven‫܊‬ă

i
Serii unidimensionale cu variabila exprimată numeric (cantitativ)

ac
y Elementele specifice ale unui grafic sunt următoarele: axele
de coordonate, scara, re‫܊‬eaua graficului, legenda.
Considerăm o colectivitate P pentru care definim o variabilă
statistică X ale cărei valori (variante) sunt:
{x1, ... ,xn}

rm
Aceste valori pot fi grupate:
- pe variante xi, cărora asociem frecven‫܊‬a de apari‫܊‬ie
corespunzătoare ni, unde i=1,k în cazul unei variabile
5HSUH]HQWDUHDvQFRRUGRQDWHUHFWDQJXODUH ,,, úL discrete

Fa
coordonate polare (III) - pe intervale Ji=(xi-1, xi), la care asociem frecven‫܊‬a de
y Scările utilizate în reprezentările grafice pot fi scări apari‫܊‬ie corespunzătoare ni, unde i=1,k în cazul unei
uniforme (scara aritmetică în care diviziunile sunt variabile continue
echidistante) sau scări neuniforme (de tipul gaussiană,
respectiv logaritmică). 57 58

de
Prezentarea datelor statistice

Distribu‫܊‬ii statistice unidimensionale Realizarea tabelelor de frecven‫܊‬ă utilizând


programul Excel
Serii unidimensionale cu variabila exprimată numeric (cantitativ)
Variabile discrete
a Aplica‫܊‬ie: Considerăm o colectivitate statistică (P) formata din 19 pacienti (nou
te
7DEHOXOGHIUHFYHQ‫܊‬H– variabile discrete nascu‫܊‬i) pentru care definim si urmărim experimental variabila scor apgar:
VSA = Variabila scor Apgar = {1,2,...,10}
)UHFYHQĠD )UHFYHQĠD )UHFYHQĠD )UHFYHQĠD
lta
Varianta
)XQF‫܊‬LDCOUNTIF(Range, Criteria)
DEVROXWă UHODWLYă DEVROXWăFXPXODWă UHODWLYăFXPXODWă
x1 n1 N1= n1 F 1= f 1

x2 n2 N2= N1 + n2 F2=F 1 + f2
cu

... ... ... ...


xi ni Ni= Ni-1 + ni Fi=Fi-1 + fi

... ... ... ...


Fa

xk nk Nk= Nk-1 + nk= n Fk= Fk-1 + fk= 1

Total n 1
59
- - 60
Matematică și Biostatistică

Prezentarea datelor statistice Prezentarea datelor statistice

Distribu‫܊‬ii statistice unidimensionale Distribu‫܊‬ii statistice unidimensionale

e
Serii unidimensionale cu variabila exprimată numeric (cantitativ) Serii unidimensionale cu variabila exprimată numeric (cantitativ)
*UDILF&RORDQă
Variabile discrete Variabile continue

i
7
5HSUH]HQWăULJUDILFHIRORVLQG([FHO 6 6

ac
6
5
7DEHOXOGHIUHFYHQ‫܊‬H– variabile continue
7 5

6 6 6 4

5 5 3 Intervale )UHFYHQĠD )UHFYHQĠD )UHFYHQĠD )UHFYHQĠD


4 Poligonul 2 DEVROXWă UHODWLYă DEVROXWăFXPXODWă UHODWLYăFXPXODWă
1 1
)UHFYHQ‫܊‬HORU

rm
1
3
0 0000
(x0-x1] n1 N1= n1 F 1= f 1
2 0
1 2 3 4 5 6 7 8 9 10
1 1 1 Scor (x1-x2] n2 N2= N1 + n2 F2=F 1 + f2
0 0 0000
1 2 3 4 5 6 7 8 9 10
... ... ... ...
0.00%

Fa
10 5
9 6 Grafic Pie 5.26% (xi-1-xi] ni Ni= Ni-1 + ni Fi=Fi-1 + fi
26.32%
8 6 5.26%
7 1
6 1 31.58% ... ... ... ...
31.58%
Grafic 5
4
0
0
Bar 3 0 (xk-1-xk] nk Nk= Nk-1 + nk= n Fk= Fk-1 + fk= 1
2 0

-
1 0
0 2 4 6
61
8 1 2 3 4 5 6 7 8 9 10
Total n 1
62
-

de
Scor

Prezentarea datelor statistice


Realizarea tabelelor de frecven‫܊‬ă utilizând
Distribu‫܊‬ii statistice unidimensionale programul Excel
Serii unidimensionale cu variabila exprimată numeric (cantitativ)

Variabile continue
a Aplica‫܊‬ie: Considerăm o colectivitate statistică (P) formata din 19 pacienti (nou
te
nascu‫܊‬i) pentru care definim si urmărim experimental variabila greutate:
y VG = Variabila greutate (Kg)

)XQF‫܊‬LDFREQUENCY(data_array, bins_array)
lta
cu
Fa

63 64
Matematică și Biostatistică

Prezentarea datelor statistice Prezentarea datelor statistice

Distribu‫܊‬ii statistice unidimensionale Distribu‫܊‬ii statistice unidimensionale

e
Serii unidimensionale cu variabila exprimată numeric (cantitativ) Serii unidimensionale cu variabila exprimată numeric (cantitativ)

Variabile continue Variabile continue


Histograma permite săse

i
5HSUH]HQWăULJUDILFHIRORVLQG([FHO cunoască ]RQHOHGHFRQFHQWUDUHúL Gruparea pe intervale neegale JUXSDUHDWLSRORJLFă - se poate realiza fie

ac
de dispersie a distribu‫܊‬iei, precum SRUQLQGGHODLQWHUYDOHOHHJDOHVWDELOLWHDQWHULRUúLUHJUXSDUHDDFHVWRUDSHQWUX
úLFRPSDUDUHDHIHFWLYHORUXQHL DGLPLQXDIOXFWXDĠLDH[FHVLYăDIUHFYHQĠHORUGHODRJUXSăODDOWDVDXSHQWUX
,ŝƐƚŽŐƌĂŵĉ grupe cu alta. 7 a acoperi XQDVDXPDLPXOWHJUXSHYLGH IăUăXQLWăĠL ILHSHED]DSDUWLFXODUL-
6
7
6
120.00% 6
5
WăĠLORUFDUDFWHULVWLFLLFHUFHWDWHVDXDQHFHVLWăĠLORUDQDOL]HL
100.00% 4 4

rm
5 4
80.00%
&ƌĞƋƵĞŶĐLJ

4 3
60.00% 2 2
3 2
1
40.00% Frequency 1
2
20.00% Cumulative % 0
1
(3,3- (3,7- (4,1- (4,5- (4,9- (5,3-
0 0.00% 3,7] 4,1] 4,5] 4,9] 5,3] 5,7]

Fa
ŝŶ
+LVWRJUDPD‫܈‬L3ROLJRQXO 5% 10%
(3,3-3,7]

11% (3,7-4,1]
)UHFYHQ‫܊‬HORU 21% 21% (4,1-4,5]
(4,5-4,9]

32% (4,9-5,3] ki = coeficientul de reducere a frecven‫܊‬elor


(5,3-5,7] Grafic Pie ni = efectivul corespunzător intervalului Ji=(xi-1, xi)
65 Li, Lmin = mărimea intervalului Ji, Jmin 66

de
Prezentarea datelor statistice Prezentarea datelor statistice

Distribu‫܊‬ii statistice unidimensionale Distribu‫܊‬ii statistice unidimensionale


Serii unidimensionale cu variabila exprimată numeric (cantitativ)

Variabile continue
a Serii unidimensionale cu variabila exprimată calitativ (nenumeric)

*UXSDUHDvQIXQFĠLHGHR
te
FDUDFWHULVWLFăQRPLQDWLYă
FDOLWDWLYăVDXQHQXPHULFă
Intervale *UXSHGHFDELQHWHGXSă 1XPăUXOILUPHORU 0ăULPHD Coeficientul de )UHFYHQĠD VHDPăQăFXJUXSDUHD
cifra de afaceri (mii RON) (ni) intervalului (Li) reducere (k i) UHGXVă Ki) XQLWăĠLORUFROHFWLYLWăĠLL
lta
(10-30] 10 30 4 20 2 2 FHUFHWDWHGXSăYDORULOH
(30-40] 30 40 6 10 1 6 (variantele) distincte ale unei
(40-60] 40 60 10 20 2 5
Total 20
caracteristici numerice
(variabile discrete).
'HDVWăGDWăVHvQFHSHFX
cu

6
6
OLVWDUHDVWăULORUFDOLWDWLYH
5
5
distincte ale caracteristicii de
4
grupare care pot fi identificate
hi
vQFROHFWLYLWDWHDFHUFHWDWă &HOHPDLX]XDOHPHWRGHGHGHVFULHUHúL
3
$FHVWHVWăULFDOLtative UHSUH]HQWDUHJUDILFăDPXOĠLPLORUGHGDWHFDOLWDWLYH
Fa

2
2
GLVWLQFWHVHPDLQXPHVFúL sunt:
1
atribute (variante calitative). JUDILFXO GLDJUDPD FXEDUH FRORDQăEDU
0
(10-30] (30-40] (40-60] graficul circular (pie)
67
Cifra de afaceri
JUDILFXOOLQLDU SROLJRQXOIUHFYHQ‫܊‬HORU
68
Matematică și Biostatistică

i e
ac
Biostatistică

rm
• Serii cronologice
• 6HULLGHVSD‫܊‬LX
• 'LVWULEX‫܊‬LLELGLPHQVLRQDOH

Fa
69
Curs 4 70

de
Reprezentarea grafică seriilor de
Serii de timp (Serii cronologice) timp (seriilor cronologice)
a 5HSUH]HQWDUHDJUDILFăDVHULLORUGHWLPS FURQRORJLFH VH
te
Variabila Numărul unLWă‫܊‬ilor
timp ti yi
Seria cronologicăSUH]LQWăYDULD‫܊‬LDunei caracteristici UHDOL]HD]ăcu ajutorul cronogramei si a diagramelor polare.
t1 y1
în IXQF‫܊‬LHde timp (yt = f(t)), unde: y Cronograma se foloseste pentru a desprinde tendin‫܊‬a de
yt = YDULD‫܊‬LDcaracteristicii studiate; dezvoltare a fenomenelor SHILHFDUHHWDSăDQDOL]DWă6H
lta
t2 y2
… ... ti = YDULD‫܊‬LDde timp.
construieste în cadranul I; pe axa absciselor (OX) se
tk yk 'XSăWLPSXOODFDUHVHUHIHUăSRWIL
o Serii cronologice de fluxuri (intervale) sunt construieste scara timpului, iar pe axa ordonatelor (OY),
Total ෍ yk scara valorilor seriei cronologice.
acele serii în care valorile caracteristicii studiate se
cu

vQUHJLVWUHD]ăSHOXQLWULPHVWUHDQLHWF9DORDUHD y La VWDELOLUHDVFăULLWLPSXOXLVLnivelurilor trebuie VăVH


Macheta tabelului cronologic FHQWUDOL]DWăVHSRDWHRE‫܊‬LQHprin cumularea XQLWă‫܊‬LORU
respecte propor‫܊‬ionalitateaSHQWUXFăUDSRUWXOGLQWUHVFăUL
înregistrate.
o Serii cronologice de stocuri sau de momente sunt are o importan‫܊‬ămare asupra formei curbei si poate da o
Fa

valorile FDUDFWHULVWLFLLRE‫܊‬LQXWHla diferite momente de imagine GHQDWXUDWă asupra GH]YROWăULLIHQRPHQXOXL


timp

71 72
Matematică și Biostatistică

Cronogramele – prin benzi, coloane úLliniare Reprezentarea grafică seriilor de


timp (seriilor cronologice)

e
y Diagrama polară(radială) DMXWăODLQWHUSUHWDUHDJUDGXOXL

i
úLformei GHYDULD‫܊‬LHVH]RQLHUăÌQVWDWLVWLFDVRFLDO-

ac
HFRQRPLFăVHvQWkOQHVFIUHFYHQWIHQRPHQHFDUHSUH]LQWă
YDULD‫܊‬LLVH]RQLHUHVăSWăPkQDOHWULPHVWULDOHHWFFDGH
exemplu, consumul antibiotice, FRQVXPXOGHEHUHúLEăXWXUL
UăFRULWRDUHúD)HQRPHQHOHFXFDUDFWHUVH]RQLHUVXQW
specifice îndeosebi DFWLYLWă‫܊‬LORUdin turism, FRPHU‫܊‬úL

rm
DJULFXOWXUă
y /DFRQVWUXLUHDJUDILFXOXLVHIRORVHúWHRUH‫܊‬HDde cercuri
concentrice, iar raza este SURSRU‫܊‬LRQDOăcu nivelul mediu al
indicatorilor; cercul se împarte în atâtea SăU‫܊‬LFk‫܊‬Lindicatori

Fa
VXQW'UHSWDEVFLVăVHUYHúWHFLUFXPIHULQ‫܊‬Dcercului pe care
VHQRWHD]ăWLPSXOLDUFDRUGRQDWăUD]DVDXSR]L‫܊‬LDrazei, pe
FDUHVHQRWHD]ăFDQWLWă‫܊‬LOH.

73 74

de
ProducƜŝĂƚƌŝŵĞƐƚƌŝĂůĉĂĨĂďƌŝĐŝŝͣy͘͟
Trimestrul I II III IV Media
trimestrială Serii de VSD‫܊‬LX
Produc‫܊‬ia (nr. cutii) 250 350 700 300 400

a 8QLWă‫܊‬L
te
Valoarea
teritoriale caracteristicii
yi Seria teritorialăSUH]LQWăYDULD‫܊‬LDWHULWRULDOăD
A yA caracteristicii analizate.
lta

În DFHVWHVHULLYDORULOHFDUDFWHULVWLFLLVHUHIHUăOD
B yB
XQLWă‫܊‬LOH teritoriale din care fac parte.
… ... Aceste serii se RE‫܊‬LQGXSăFULWHULLDGPLQLVWUDWLY-
T yT
WHULWRULDOHFHHDFHvQVHDPQăFăVSD‫܊‬LXOHVWH variabil,
cu

Total ෍ yT timpul ‫܈‬i VWUXFWXUDRUJDQL]DWRULFăILLQGFRQVLGHUDWH


constante.
Macheta tabelului cronologic
Fa

75 76
Matematică și Biostatistică

Reprezentări grafice pentru seriile Reprezentări grafice pentru seriile


de spa‫܊‬iu de spa‫܊‬iu

e
Seriile de VSD‫܊‬LX(teritoriale) se pot reprezenta grafic prin y Cartodiagramele UHSUH]LQWăXQWLSVSHFLDOGHFDUWRJUDPăFDUH

i
cartograme ‫܈‬i cartodiagrame. FRQVWă dintr-RFRPELQD‫܊‬LHDFDUWRJUDPHLFXGLDJUDPHOH FHUF

ac
SăWUDWFRORDQHHWF FDUHVHDSOLFăSHFDUWRJUDPă3HKDUWăVHYRU
y Cartograma SUH]LQWăGLVWULEX‫܊‬LDîn VSD‫܊‬LXa LQWHQVLWă‫܊‬LLde
construi figurile geometrice amintite mai sus, pentru a reda
manifestare a unui fenomen. Construirea graficului YROXPXOVDXVWUXFWXUDGLIHUL‫܊‬LORULQGLFDWRUL GLVWULEXL‫܊‬LGLQSXQFWGH
presupune: YHGHUHWHULWRULDO/DvQWRFPLUHDJUDILFXOXLVHYD‫܊‬LQH seama de

rm
y JUXSDUHDXQLWă‫܊‬LORUWHULWRULDOHGXSăRYDULDELOăFRQVLGHUDWă RELHFWLYXOXUPăULW.
y construirea unei KăU‫܊‬LvQFDUHVHGHOLPLWHD]ăXQLWă‫܊‬LOHteritoriale;
y ha‫܈‬XUDUHDVXSUDIH‫܊‬HORUXQLWă‫܊‬LORUteritoriale în IXQF‫܊‬LHde
/DUHSUH]HQWDUHDJUDILFăDGLVWULEX‫܊‬LLORU
intensitatea de manifestare a fenomenului studiat.

Fa
WHULWRULDOHDOHGLIHUL‫܊‬LORU indicatori se mai
pot folosi si figuri naturale sau simbolice,
care sunt SURSRU‫܊‬LRQDOH cu valoarea
indicatorilor de reprezentat.

77 78

de
'LVWULEX‫܊‬LLORU statistice bidimensionale 'LVWULEX‫܊‬LLORU statistice bidimensionale
O distribu‫܊‬ie ELGLPHQVLRQDOă SUH]LQWăYDULD‫܊‬LDXQLWă‫܊‬LORU a
te
unei FROHFWLYLWă‫܊‬L simultan GXSă GRXă caracteristici de y În IXQF‫܊‬LH de modul de exprimare a variabilelor x, y se
grupare. pot trata XUPăWRDUHOHtipuri de GLVWULEX‫܊‬LLbidimensionale:
lta

y GLVWULEX‫܊‬LLcu ambele variabile exprimate numeric;


Considerăm o colectivitate C cu n elemente la nivelul căreia definim
două variabile: y GLVWULEX‫܊‬LLFXRYDULDELOăH[SULPDWănumeric ‫܈‬i o YDULDELOă
- X cu valorile xi, i=1, … , ݉
cu

- Y cu valorile yj, j=1,...,p H[SULPDWănenumeric;


Dacă notăm cu nij elementele colectivită‫܊‬ii care au simultan valoarea
y GLVWULEX‫܊‬LL cu ambele variabile exprimate nenumeric.
xi úLYDORDUHDyj, atunci o distribu‫܊‬ie bidimensională este definită prin
Fa

ansamblul de triplete:
(xi, yj, nij)

79 80
Matematică și Biostatistică

'LVWULEX‫܊‬LLORU statistice bidimensionale 'LVWULEX‫܊‬LLORU statistice bidimensionale


A. GLVWULEX‫܊‬LLcu ambele variabile exprimate numeric A. 'LVWULEX‫܊‬LLFXambele variabile exprimate numeric

e
Prezentarea tabelară a unei distribu‫܊‬ii bidimensionale (grupare pe variante)
7DEHOGHFRQWLQJHQ‫܊‬ă

i
ac
Y y1 y2 ... yj ... yp ni•
X

x1 n11 n12 ... n1j ... n1p n1•


x2 n21 n22 ... n2j ... n2p n2•

rm
... ... ... ... ... ... ... ...
xi ni1 ni2 ... nij ... nip ni•
... ... ... ... ... ... ...
xm nm1 nm2 ... nmj ... nmp nm•

Fa
n•j n•1 n•2 ... n•j ... n•p n=σ௜ σ௝ ݊௜௝ = σ௜ ݊௜ή = σ௝ ݊‫ڄ‬௝

ÌQFDGUXOXQHLGLVWULEX‫܊‬LLELGLPHQVLRQDOHVHGLVWLQJ GRXăGLVWULEX‫܊‬LL
marginale, în X, respectiv în Y ‫܈‬i PS GLVWULEX‫܊‬LL FRQGL‫܊‬LRQDWH.

81 82

de
Exemplu: &RQVLGHUăP un HúDQWLRQ format din 30 de UHSUH]HQWDQĠL medicali ai 'LVWULEX‫܊‬LLORU statistice bidimensionale
unei firme de medicamente, pe care î l DQDOL]ăP din punct de vedere al
QXPăUXOXL produselor vândute (variabila X), respectiv al salariului REĠLQXW de A. 'LVWULEX‫܊‬LLFXambele variabile exprimate numeric
5HSUH]HQWDUHJUDILFă
fiecare în parte (variabila Y) timp de o luna.
X Y
Produse Salariu (EUR)
a Corelograma (Diagrama nor de puncte)
te
22
27
260
270
X \Y
7DEHOGHIUHFYHQWHSURGXVHYkQGXWH ; VDODULXREĠLQXW <
(200-400] (400-600] (600-800] (800-1000] (1000-1200]
• 5HSUH]HQWDUHDJUDILFăVHUHDOL]HD]ăFXFRUHORJUDPDFXQRVFXWăsub
31 280
ni•
34 400 (20-30] 2 0 0 0 0 2 denumirea „diagrama nor de puncte”. Se construieste în cadranul I al
35 460 (30-40] 2 5 1 0 0 8 sistemului de axe rectangulare. Pe axa OX (axa absciselor) se ia o
45 466 (40-50] 0 2 7 2 0 11
lta
50 470 (50-60] 0 0 1 2 0 3 VFDUăa valorilor caracteristicii factoriale (x), iar pe OY (axa
37 600
(60-70] 0 0 2 2 2
37 600
4 7 11 6 2
6
30
ordonatelor) valorile caracteristicii UH]XOWDWLYH3HILHFDUHD[ăVHYD
37 600 n•j
38 600 face întrerupere în origine cu GRXăOLQLX‫܊‬HSDUDOHOHSHQWUXFDFHOHGRXă
43 620
44 620 /HJăWXUDdintre produsele vândute úL salariul lunar – diagrama VFăULGHUHSUH]HQWDUHVăvQFHDSă cu valorile cele mai apropiate de
50 625
limitele inferioare înregistrate pentru cele GRXăcaracteristici.
cu

44 640 nor de puncte.


62
39
670
730
'LVWULEXĠLDHúDQWLRQXOXL de UHSUH]HQWDQĠL medicali în IXQFĠLH de 1200
44 800 produsele vândute úL salariul lunar – diagrama 1000
45 800
46 800 paralelipipedelor.
800
54
63
800
800
'LVWULEXĠLDHúDQWLRQXOXL de UHSUH]HQWDQĠL medicali în IXQFĠLH de
Fa

66 850 produsele vândute úL salariul lunar – VXSUDIDĠă SROLHGUDOă. 600


47 860
400
49 870
65 870
200
57 880
57 1000
0
68 1070 83 84
0 20 40 60 80
68 1070
Matematică și Biostatistică

y Fiecare unitate SXUWăWRDUHDFHORUGRXăFDUDFWHULVWLFL


/HJăWXUDGLUHFWăvQWUHFHOHGRXăYDULDELOHSRDWHIL‫܈‬i

e
(xi, yj VHUHSUH]LQWăSHJUDILFprintr-un punct. Acest
tip de grafic stabileste H[LVWHQ‫܊‬D, GLUHF‫܊‬LDOHJăWXULL ‫܈‬L QHOLQLDUăvQacest cazSHJUDILFDSăUkQGROLQLHFXUEă

i
forma de OHJăWXUăGLQWUHFHOHGRXăYDULDELOH

ac
y Pentru LQWHUSUHWDUHDOHJăWXULLputem folosi XUPăWRDUHOH
YDULDQWHGHJUDILFHFDUHVHUHIHUăODIXQF‫܊‬LLOHliniare:

rm
Hiperbolă Parabolă )XQFаLHH[SRQHQ‫܊‬ială

OBSERVA‫܉‬IE: Graficul SUH]LQWăDYDQWDMXOFăSHED]DOXLVHSRDWH


constata nu numai H[LVWHQ‫܊‬DOHJăWXULL‫܈‬i sensul ei, dar mai ales forma

Fa
FăWUH care WLQGHVăVHUHDOL]H]HGHFLVHSRDWHHODERUDRLSRWH]ă
VWDWLVWLFăFDUHVă fie XWLOL]DWăODDSOLFDUHDPHWRGHORUDQDOLWLFHGH
Legăturăliniarădirectă Legăturăliniarăinversă Lipsăde legătură FRUHOD‫܊‬LH.

85 86

de
'LVWULEX‫܊‬LLORU statistice bidimensionale 'LVWULEX‫܊‬LLORU statistice bidimensionale
A. 'LVWULEX‫܊‬LLFXambele variabile exprimate numeric A. 'LVWULEX‫܊‬LLFXambele variabile exprimate numeric
5HSUH]HQWDUHJUDILFă 5HSUH]HQWDUHJUDILFă
Diagrama paralelipipedelor a Suprafa‫܊‬a poliedrală
te
y Reprezintă o transpunere a
y Reprezintă o transpunere a histogramei într-un spa‫܊‬iu cu trei 7
poligonului sau curbei frecven‫܊‬elor 7
dimensiuni; această diagramă se trasează ridicând pe într-un spa‫܊‬iu cu trei dimensiuni; 6
lta
5
fiecare suprafa‫܊‬ă luată ca bază, un paralelipiped acesta se FRQVWUXLHúWH astfel: se 5

nij
4
propor‫܊‬ional cu frecven‫܊‬a nij corespunzătoare fiecărei ridică din centrul fiecărei suprafe‫܊‬e 3 2 2 2
2
perechi de valori (xi, yi). luate ca bază, o linie verticală de 2 2 2 01
2 2
0 0 01 0
lungime propor‫܊‬ională cu frecven‫܊‬a 1
0
0
0 (1000-…
(800-1000]
cu

7 (600-800]
nij, apoi se unesc capetele acestor 0 0 0 0
0 0 (400-600]
(200-400]
Y
(20-30](30-40]
6
verticale (pentru fiecare grupă úL (40-50](50-60]
(60-70]
5
subgrupă) fie printr-o linie frântă X
4
nij

(varianta poligonului frecvenаelor),


3
Fa

fie printr-o curbă(varianta curbei


2

1 (1000-1200]
frecvenаelor)
(800-1000]
(600-800]
0 (400-600] Y
(20-30](30-40] (200-400]
87 (40-50](50-60] 88
X (60-70]
Matematică și Biostatistică

'LVWULEX‫܊‬LLORU statistice bidimensionale 'LVWULEX‫܊‬LLORU statistice bidimensionale


B. Serii cu ambele caracteristici exprimate atributiv B. Serii cu ambele caracteristici exprimate atributiv
5HSUH]HQWDUHJUDILFă 5HSUH]HQWDUHJUDILFă

e
Pentru acest tip de distribu‫܊‬ie datele sunt prezentate într-un tabel de .

i
contingen‫܊‬ă úL sunt reprezentate grafic prin diagrame de structură construite X\Y Masculin Feminin Total

ac
în DFHODúL plan. Rural 200 1950 2150
Pentru un tabel de contingen‫܊‬ă , xi reprezintă categorii ale variabilei X de Urban 800 2500 3300
grupare, yi reprezintă categorii ale variabilei Y de grupare, iar nij reprezintă Situa‫܊‬ia vaccinării pe sexe din mediul rural úL urban
efectivul care posedă simultan categoria „i” úL „j” ale celor două variabile.

rm
2VLWXDĠLHDSDUWHRvQWkOQLPvQFD]XOYDULDELOHORUDOWHUQDWLYHcând 3500 100%
90%
datele se pot prezenta într-un tabel de asociere de forma 3000
80%

2500 70%
60% 76%
91%
2000 2500

Fa
50% Feminin
1500 Feminin 40%
1950 30% Masculin
1000 Masculin 20%
500 10%
9% 24%
200 800 0%
0
Rural
Rural Urban
Urban

89 90

de
'LVWULEX‫܊‬LLORU statistice bidimensionale
C. Serii cu o caracteristică exprimată atributiv úL una numeric
5HSUH]HQWDUHJUDILFă
Reprezentarea grafică a distribu‫܊‬iilor bidimensionale cu o a
te
variabilă exprimată cantitativ úL una atributiv se face prin
diagrame de tip piramida vârstelor. Construirea acestui tip de
diagramă constă în ridicarea vQDFHODúLSODQDdouă histograme
lta

răsturnate.
cu
Fa

Reprezentarea grafică a distribu‫܊‬iei unei popula‫܊‬ii după vârstă, corelată


cu distribu‫܊‬ia după sex, utilizând 91diagrama de tip piramida vârstelor 92
Matematică și Biostatistică

Metode numerice pentru descrierea


datelor statistice

e
y Indicatorii numerici descriptivi sunt valori numerice

i
ac
calculate dintr-RPXOĠLPHGHGDWHFDUHQHSHUPLWVă
Biostatistică ne facem o LPDJLQHPHQWDOă DVXSUDGLVWULEXĠLHL
datelor.

rm
METODE NUMERICE PENTRU
y Anterior, metodele grafice pentru descrierea datelor
DESCRIEREA DATELOR STATISTICE ne-au furnizat o UHSUH]HQWDUHYL]XDOă asupra
INDICATORI AI TENDIN‫܉‬EI GLVWULEXĠLHLGDWHORU

Fa
CENTRALE, 9$5,$‫܉‬,(I ‫܇‬,
FORMEI

Curs 5 93 94

de
INDICATORI 67$7,67,&,35,0$5,ù, ,QGLFDWRULLWHQGLQĠHLFHQWUDOH
'(5,9$ğ, O clasificare a indicatorilor WHQGLQĠHL centrale se poate face, în IXQFĠLH de

a
'(),1,ğ,(Indicatorul statistic — în sens larg — UHSUH]HQWăexpresia
modul de determinare a lor, în:
y indicatori PăULPL PHGLLGHFDOFXOPHGLDDULWPHWLFăDUPRQLFă
te
QXPHULFăDXQRUIHQRPHQHúLSURFHVHVRFLDO-economice, definite în timp, SăWUDWLFăJHRPHWULFăHWF
VSDĠLXúLVWUXFWXUăRUJDQL]DWRULFă y indicatori PHGLLGHSR]LĠLH: modul, mediana.

&HOHPDLIUHFYHQWXWLOL]DWHPăVXULDOHWHQGLQĠHLFHQWUDOHVXQW
lta
Indicatorii statistici pot fi primari úLGHULYDĠL.
y PHGLDDULWPHWLFă
y Indicatorii primari se REĠLQde UHJXOăîn etapa de y mediana
sistematizare a datelor statistice, prin centralizarea úL y modul.
agregarea acestora.
y ÌQGHILQLĠLLOHúLUHODĠLLOHFHXUPHD]ăYRPQRWDFHOHn valori ale
cu

y ,QGLFDWRULLGHULYDĠLVHREĠLQSULQSUHOXFUDUHDPăULPLORU HúDQWLRQXOXLGHGDWHQHJUXSDWHFX:
absolute ale indicatorilor primari.
x1 , x2 ,, xn
&HOHWUHLSURSULHWăĠLPDMRUHDOHVHULLORUGHGDWHQXPHULFHSHFDUHle y Valorile ordonate ale eúantionului le vom nota cu:
Fa

putem analiza folosind indicatorii statistici sunt cele privitoare la


WHQGLQĠD FHQWUDOă, la variabilitatea úLODIRUPDGLVWULEXĠLLORU x 1 d x 2 d  d x n sau x 1 , x 2 ,  , x n

95 96
Matematică și Biostatistică

,QGLFDWRULLWHQGLQĠHLFHQWUDOH ,QGLFDWRULLWHQGLQĠHLFHQWUDOH
0HGLDDULWPHWLFă 0HGLDDULWPHWLFă

e
A. Variabile numerice negrupate B. Variabile numerice grupate pe variante (discrete)

i
0HGLDDULWPHWLFă DXQXLHúDQWLRQîn care datele au

ac
'HILQLĠLH 0HGLDDULWPHWLFă DXQXLHúDQWLRQFXXQHIHFWLYGHn valori
fost sistematizate într-o serie de GLVWULEXĠLH unde
x1 , x2 ,, xn este SULQGHILQLĠLH
n valorile (xi ,i = 1, m) apar cu IUHFYHQĠHOH ni este
¦x i
i 1 m

rm
x
¦ x i ni
m
n
i 1
n ¦n i
0HGLDDULWPHWLFăDXQei populaĠii statistice cu un efectiv x , i 1
n
de N YDORULHVWHSULQGHILQLĠLH
x1 , x2 ,  , x N m m

¦ xi f i , ¦f

Fa
N x 1
¦ xi
i
i 1 i 1
P i 1

N
0HGLDDULWPHWLFăDXQHLSRSXODĠLLVWDWLVWLFH =AVERAGE(range) 6HQXPH‫܈‬WH úLmedie DULWPHWLFă SRQGHUDWă
se QRWHD]ăSULQVLPEROXOP. 97 Exemplu: =AVERAGE(A2:A20) 98

de
,QGLFDWRULLWHQGLQĠHLFHQWUDOH ,QGLFDWRULLWHQGLQĠHLFHQWUDOH
0HGLDDULWPHWLFă 0HGLDDULWPHWLFă
B. Variabile numerice grupate pe variante
a C. Variabile numerice grupate pe intervale (continue)
te
Aplicatie: Considerăm o colectivitate statistică formată din 40 de 0HGLDDULWPHWLFă DXQXLHúDQWLRQîn care datele sunt
hematii pentru care definim variabila statistică diametru Vd (microni).
Datele au fost sistematizate în WDEHOXOGHIUHFYHQ‫܊‬ă prezentate pe intervale de tipul Ji=(xi-1,xi), la care
asociem frecvenаa de apariаie corespunzătoare ni, cu
lta
[L ȝP ni xi*ni
6.7 1 6.7 i=1,m atunci media este:
6.8 2 13.6 m
6.9 4 27.6
¦ x 'n i i m

¦n
7.1 5 35.5
i 1
7.2 7 50.4 x , n
cu

i
7.3 5 36.5 n i 1
7.4 5 37
7.5 4 30 ௫೔ ା௫೔షభ
7.6 3 22.8 unde ‫ݔ‬௜ ᇱ = este mijlocul intervalului Ji

7.7 2 15.4
Fa

7.8 1 7.8
7.9 1 7.9
Total 40 291.2
6HQXPH‫܈‬WH úLmedie DULWPHWLFă SRQGHUDWă
Media
7.28
DULWPHWLFă
99 100
Matematică și Biostatistică

,QGLFDWRULLWHQGLQĠHLFHQWUDOH ,QGLFDWRULLWHQGLQĠHLFHQWUDOH
0HGLDDULWPHWLFă 0HGLDDULWPHWLFă

e
C. Variabile numerice grupate pe intervale D. Variabile nenumerice alternative

i
Aplicatie: Consideram o colectivitate statistică formată din 19

ac
de nou născu‫܊‬i pentru care definim variabila statistică Greutate
(Kg).

rm
Ji Xi-1 Xi ni Xi' ni*Xi'
(3,3-3,7] 3.3 3.7 2 3.5 7
(3,7-4,1] 3.7 4.1 4 3.9 15.6
(4,1-4,5] 4.1 4.5 6 4.3 25.8
(4,5-4,9] 4.5 4.9 4 4.7 18.8
(4,9-5,3] 4.9 5.3 2 5.1 10.2

Fa
(5,3-5,7] 5.3 5.7 1 5.5 5.5
19 Suma 82.9
Media
4.363158
DULWPHWLFă

101 102

de
,QGLFDWRULLWHQGLQĠHLFHQWUDOH ,QGLFDWRULLWHQGLQĠHLFHQWUDOH
0HGLDDULWPHWLFă 1.2 Modul

a A. Variabile numerice negrupate


te
y 0HGLDDULWPHWLFăHVWHFHDPDLX]XDOăPăVXUăD 'HILQLĠLH Modul (sau dominanta XQXLHúDQWLRQRUGRQDW
WHQGLQĠHLFHQWUDOHXWLOL]DWăSHQWUXORFDOL]DUHD FUHVFăWRUFXXQHIHFWLYGHn valori
x 1 d x 2 d  d x n HVWHSULQGHILQLĠLHYDORDUHD
lta

³FHQWUXOXL´XQHLGLVWULEXĠLLVWDWLVWLFH
sau YDORULOHFXFHDPDLPDUHIUHFYHQĠăGHDSDULĠLH

y 0HGLDDULWPHWLFăHVWHLQIOXHQĠDWăGHSUH]HQ‫܊‬D
cu

YDORULORUH[WUHPH GHQXPLWHúL³YDORULDEHUDQWH´ = =MODE(Range)

din punct de vede statistic) Exemplu: =MODE(A2:A20)


Fa

103 104
Matematică și Biostatistică

,QGLFDWRULLWHQGLQĠHLFHQWUDOH ,QGLFDWRULLWHQGLQĠHLFHQWUDOH
1.2 Modul 1.2 Modul

e
B. Variabile numerice grupate pe variante (discrete) C. Variabile numerice grupate pe intervale (continue)
y Dacă variabila este continuă , iar datele sunt grupate pe

i
Dacă variabila este discretă, pentru determinarea intervale de variaаie, pentru determinarea modului se găVHúWH

ac
modului se găVHúWH mai întâi frecven‫܊‬a maximă a seriei mai întâi frecvenаa maxim nmax, iar apoi se FLWHúWH intervalul
modal (xi-1, xi).
(ni = nmax) úL apoi se FLWHúWH valoarea xi corespunzătoare y Modul se poate obаine (prin interpolare în intervalul modal) cu
care este egalăpractic cu modul (Mo = xi). relaаia:

rm
[L ȝP d1
xi 1  d ˜
ni
6.7 1 Mo
Modul 6.8 2 d1  d 2
unde
6.9 4
7.1 5 d = xi - xi-1 reprezintă mărimea intervalului modal
7.2 7 d1 = ni - ni-1 reprezintă diferen‫܊‬a dintre frecven‫܊‬a intervalului modal (ni úLfrecven‫܊‬a

Fa
7.3 5 intervalului anterior celui modal (ni-1)
7.4 5
7.5 4 d2 = ni – ni+1 reprezintă diferen‫܊‬a dintre frecven‫܊‬a intervalului modal (ni úLfrecven‫܊‬a
7.6 3 intervalului următor celui modal (ni+1)
7.7 2 xi-1 reprezintă limita inferioară a intervalului modal
7.8 1
7.9 1
Total 105 40 106

de
,QGLFDWRULLWHQGLQĠHLFHQWUDOH ,QGLFDWRULLWHQGLQĠHLFHQWUDOH
1.2 Modul 1.2 Modul

a
C. Variabile numerice grupate pe intervale (continue) y Pentru intervale inegale, modul se determină asemănător, fie prin
interpolare în intervalul modal, fie pe cale grafică, după ce în prealabil
te
0RGXOVHSRDWHDSUR[LPDJUDILFFXDMXWRUXOKLVWRJUDPHLIUHFYHQĠHL
s-au făcut corec‫܊‬iile necesare conform metodei descrise la construc‫܊‬ia
UHODWLYHFRERUkQGRSHUSHQGLFXODUăSHDEVFLVăGLQSXQFWXOvQ
histogramei pe intervale inegale.
FDUHVHLQWHUVHFWHD]ăGUHSWHOHWUDVDWH.
y 2GLVWULEXĠLHFXXQVLQJXUPRGVHQXPHúWHXQLPRGDOă; RGLVWULEXĠLH
lta

este ELPRGDOăGDFăDUHGRXăYDORULGRPLQDQWH PRGXUL úL


PXOWLPRGDOăGDFăDUHPDLPXOWGHGRXăPRGXUL
cu
Fa

'LVWULEXĠLHGHIUHFYHQĠHD XQLPRGDOăE ELPRGDOăF PXOWLPRGDOă


107 108
Matematică și Biostatistică

,QGLFDWRULLWHQGLQĠHLFHQWUDOH 1. Indicatorii tendinţei centrale


1.3 Mediana 1.3 Mediana

e
A. Variabile numerice negrupate A. Variabile numerice negrupate

i
'HILQLĠLH Mediana XQXLHúDQWLRQRUGRQDWFUHVFăWRUFX Exemplu: Se consideră eşantionul ordonat cu n = 11 valori:

ac
un efectiv de n valori x 1 d x 2 d  d x n
8,6 8,7 9,2 9,7 9,9 10,1 10,3 10,6 10,7 10,8 11,0
HVWHSULQGHILQLĠLH acea valoarea care imparte
datele vQGRXăJUXSHHJDOH : xmed x§ 111 · x§ 12 · x 6 10,1

rm
¨ ¸ ¨ ¸
© 2 ¹ © 2 ¹
­ x§ n 1 · , n impar
°° ¨© 2 ¸¹ Exemplul: Să se calculeze mediana pentru eşantionul
Me ®x  x n 2 1
° n 2

Fa
, n par 3,9 4,4 4,5 4,8 4,9 5,1 5,5 5,6 5,6 5,9
°¯ 2 Deoarece n = 10 par avem:
=MEDIAN(Range) x§ 10 ·  x§ 10 ·
¨ ¸
© 2 ¹
¨ ¸1
© 2 ¹
x 5  x 6 4,9  5,1 10,0
Exemplu: =MEDIAN(A2:A20) xmed 5,0
109 2 2 2 2

de
,QGLFDWRULLWHQGLQĠHLFHQWUDOH ,QGLFDWRULLWHQGLQĠHLFHQWUDOH
1.3 Mediana 1.3 Mediana

a
B. Variabile numerice grupate pe variante (discrete) C. Variabile numerice grupate pe intervale (continue)
te
y aflarea frecven‫܊‬elor cumulate absolute (Ni)
• aflarea frecven‫܊‬elor cumulate absolute (Ni) y calcularea unită‫܊‬ii mediane (m)
௡ y localizarea lui m în úLUXO frecven‫܊‬elor cumulate (cu condi‫܊‬ia ca Ni •P
• calcularea unită‫܊‬ii mediane (m), m=

lta

y determinarea LQWHUYDOXOXLPHGLDQ ,0  vQDFHHDúLcondi‫܊‬ie)


• localizarea acesteia în úLUXO frecven‫܊‬elor cumulate (cu
y calcularea medianei utilizând rela‫܊‬ia:
condi‫܊‬ia ca Ni •P)
[L ȝP ni Ni m  N i 1
6.7 1 1 Me xi 1  d
6.8 2 3 ni
cu

6.9 4 7
7.1 5 12
unde
Valoarea xi ce 7.2 7 19 d – reprezintămărimea IM
corespunde lui Ni 7.3 5 24
reprezintă mediana 7.4 5 29
xi-1 - reprezintă limita inferioarăa IM
7.5 4 33 m - unitatea mediană
Fa

7.6 3 36
7.7 2 38
Ni-1 – frecven‫܊‬a cumulată anterior IM
7.8 1 39 ni – frecven‫܊‬a IM
7.9 1 40
Total 40
111 112
Matematică și Biostatistică

,QGLFDWRULLWHQGLQĠHLFHQWUDOH
2. Indicatorii variaĠiei
1.4 Rela‫܊‬ii între valorile tendin‫܊‬ei centrale
y În analiza unei serii statistice de date cantitative ne LQWHUHVHD]ă,

e
pe OkQJăLQGLFDWRULLWHQGLQĠHLFHQWUDOHúLindicatorii vPSUăúWLHULL
y Pentru o distribu‫܊‬ie unimodală simetrică , valorile centrale, valorilor$VWIHOGRXăVHULLVWDWLVWLFHSRWGLIHULSULQWHQGLQĠD

i
FHQWUDOăprin vPSUăúWLHUHDGDWHORUsau prin DPkQGRXă.
medie, mod, mediană, ocupă DFHODúL loc, iar între acestea

ac
există o rela‫܊‬ie de egalitate.
y Pentru o distribu‫܊‬ie unimodală asimetrică, cele trei valori
centrale ocupă locuri diferite după cum urmează:

rm
D 'LVWULEXĠLLFXWHQGLQĠăFHQWUDOăGLIHULWăE 'LVWULEXĠLLFXvariabilitate GLIHULWăF 'LVWULEXĠLLFXWHQGLQĠă
FHQWUDOăúLYDULDELOLWDWHGLIHULWH

Fa
y Cele mai frecvent utilizate PăVXULDOHYDULDĠLHL sunt:
y amplitudinea
D GLVWULEXĠLHVLPHWULFăE GLVWULEXĠLHFXDVLPHWULHSR]LWLYă c GLVWULEXĠLHFXDVLPHWULHQHJDWLYă y YDULDQ‫܊‬DVDXGLVSHUVLD
y DEDWHUHDVWDQGDUGVDXGHYLD‫܊‬LDVWDQGDUG
y FRHILFLHQWXOGHYDULDĠLH
113 114

de
,QGLFDWRULLYDULD‫܊‬LHL ,QGLFDWRULLYDULD‫܊‬LHL
2.1 Amplitudinea 9DULDQ‫܊‬DVDXGLVSHUVLD
'HILQLĠLHAmplitudinea XQXLHúDQWLRQFXXQHIHFWLYGHn valorix1 , x2 ,, xn
a A. Variabile numerice negrupate
te
HVWHSULQGHILQLĠLHGLIHUHQĠDGLQWUHFHDPDLPDUHúLFHDPDLPLFă
YDORDUHDHúDQWLRQXOXLDGLFă 'HILQLĠLHDispersia XQXLHúDQWLRQFXXQHIHFWLYGHn
A x max  x min x1 , x2 ,, xn
YDORULHVWHSULQGHILQLĠLH
lta
unde: n
max^xi ` ¦ x  x
2
x min min^xi ` x max
1di d n i
1di d n

s2 i 1
• Avantajul amplitudinii este reprezentat de simplitatea calculului n
cu

acesteia XQGHHVWHPHGLDDULWPHWLFăDHúDQWLRQXOXL
x
• 6LPSOLWDWHDHVWHvQVăúLXQGH]DYDQWDMGHRDUHFHDPSOLWXGLQHDVH
GHWHUPLQăQXPDLGLQGRXăYDORULDOHHúDQWLRQXOXL PD[LPăúL
=VAR (Range)
Fa

PLQLPă IăUăDĠLQHVHDPDGHFHOHODOWHYDORUL

• $PSOLWXGLQHDHVWHRPăVXUăUHODWLYLQVHQVLELOăODYDULDĠLDGDWHORU 'LVSHUVLDVDXYDULDQĠDXQHLSRSXODĠLLVWDWLVWLFHVH
XQXLHúDQWLRQHDILLQGXWLOL]DWăvQSUDFWLFăSHQWUXHúDQWLRDQHFX QRWHD]ăFXV2
efective reduse
115 116
Matematică și Biostatistică

,QGLFDWRULLYDULD‫܊‬LHL ,QGLFDWRULLYDULD‫܊‬LHL
9DULDQ‫܊‬DVDXGLVSHUVLD 2.3 Abaterea standard

e
B. Variabile numerice grupate pe variante (discrete) A. Variabile numerice negrupate

i
Dispersia XQXLHúDQWLRQFXXQHIHFWLYGHn valori x1 , x2 ,, xn în care
'HILQLĠLHAbaterea standard a XQXLHúDQWLRQFXXQ

ac
valorile (xi ,i = 1, m) apar cu IUHFYHQĠHOH ni este
m efectiv de n valori x1 , x2 ,, xn este prin
¦ x  x ni
2

s2 i 1
i
GHILQLĠLH
n

¦ x  x
n 2

rm
i
s s2 i 1
C. Variabile numerice grupate pe intervale (continue) n
'LVSHUVLDXQXLHúDQWLRQFXXQHIHFWLYGHn valori x1 , x2 ,, xn în care XQGHHVWHPHGLDDULWPHWLFăDHúDQWLRQXOXL
x

Fa
datele sunt prezentate pe intervale de tipul Ji=(xi-1,xi), este
m

¦ x ' x
2
i ni =STDEV(Range)
2 i 1
s
n
ᇱ ௫೔ ା௫೔షభ $EDWHUHDVWDQGDUGDXQHLSRSXODĠLL
unde ‫ݔ‬௜ = este mijlocul intervalului Ji
ଶ VWDWLVWLFHVHQRWHD]ăFXV
117 118

de
,QGLFDWRULLYDULD‫܊‬LHL ,QGLFDWRULLYDULD‫܊‬LHL
2.3 Abaterea standard 2.3 Abaterea standard
B. Variabile numerice grupate pe variante (discrete)
a 11 k 2
5HJXODOXL&HEvúHYPentru k •1FHOSXĠLQYDORULDOHXQXL
HúDQWLRQFXXQHIHFWLYGHn YDORULDSDUĠLQ
x1 , x2 ,  , xn
te
Abaterea standard a XQXLHúDQWLRQFXXQHIHFWLYGHn valori x1 , x2 ,, xn
în care valorile (xi ,i = 1, m) apar cu IUHFYHQĠHOH ni este intervalului x  ks, x  ks
x
uQGHHVWHPHGLDDULWPHWLFăLDU s este abaterea standard a
¦ > x @
m
 x ˜ ni HúDQWLRQXOXL
lta
2
i
j 1
s s2
n 5HJXODOXL&HEvúHYIXUQL]HD]ăROHJăWXUăGHQDWXUăDOJHEULFăvQWUHPHGLD
DULWPHWLFăúLDEDWHUHDVWDQGDUGDOHXQXLHúDQWLRQGHGDWH
C. Variabile numerice grupate pe intervale (continue) 5HJXODHPSLULFă: 'DFăPXOĠLPHDGHGDWHDUHGLVWULEXĠLD
cu

IUHFYHQĠHLUHODWLYHVXEIRUPăGHFORSRWDWXQFL
$EDWHUHDVWDQGDUGDXQXLHúDQWLRQFXXQHIHFWLYGHn valori x1 , x2 ,, xn XUPăWRDUHOHUHJXOLHPSLULFHSRWILXWLOL]DWHSHQWUXD
GHVFULHPXOĠLPHDGHGDWH
în care datele sunt prezentate pe intervale de tipul Ji=(xi-1,xi), este
[1] Aproximativ 68% GLQYDORULYRUDSDUĠLQHLQWHUYDOXOXL x  s, x  s
¦ > x ' x @
m
Fa

˜ ni
2

s s2
j 1
i
x  2 s, x  2 s
[2] Aproximativ 95% GLQYDORULYRUDSDUĠLQHLQWHUYDOXOXL
௫೔ ି௫೔షభ n [3] Aproape toate valorile (99,7% GLQYDORUL YRUDSDUĠLQH
unde ‫ݔ‬௜ ᇱ =

este mijlocul intervalului Ji intervalului x  3s, x  3s .
119 120
Matematică și Biostatistică

,QGLFDWRULLYDULD‫܊‬LHL ,QGLFDWRULLYDULD‫܊‬LHL
&RHILFLHQWXOGHYDULD‫܊‬LH &RHILFLHQWXOGHYDULD‫܊‬LH

e
&RHILFLHQWXOGHYDULDĠLHal XQXLHúDQWLRQ x1 , x2 ,, xn cu un efectiv

i
ac
de n YDORULHVWHSULQGHILQLĠLHUDSRUWXOGLQWUHDEDWHUHDVWDQGDUGúL
PHGLDHúDQWLRQXOXLUHVSHFWLY
s
v 100
x

rm
&RHILFLHQWXOGHYDULDĠLHal XQHLSRSXODаLLFXXQHIHFWLYGHN valori este
SULQGHILQLĠLHUDSRUWXOGLQWUHDEDWHUHDVWDQGDUGúLPHGLDSRSXODаLHL

Fa
respectiv
V
V 100
P

121 122

de
,QGLFDWRULLYDULD‫܊‬LHL 3. Indicatorii formei
Variabile nenumerice alternative

Varian‫܊‬a - este egală cu produsul dintre a )RUPDXQHLGLVWULEXĠLLGHIUHFYHQĠHVHDQDOL]HD]ă


te
ponderea unită‫܊‬ilor care poartă comparativ cu GLVWULEXĠLDLGHDOăQRUPDOăSULQ
caracteristica S úLSRQGHUHDFHORUFDUH
nu o poartă (q):
• Coeficientul de asimetrie (Skewness)
lta

ଶ (1  p ) ˜ N  (0  p ) ˜ M • Coeficientul de aplatizare (Kurtosis)


2 2

ߪ ௣= pq p (1  p )
N M

o &RHILFLHQWXOGHDVLPHWULHQHLQGLFăVLPHWULD
cu

VDXDVLPHWULDGLVWULEXĠLHLIUHFYHQ‫܊‬ei relative
o &RHILFLHQWXOGHDSODWL]DUHQHLQGLFăIRUPDPDL
³EROWLWă´VDXPDL³DVFXĠLWă´UHVSHFWLYPDL
Fa

³SODWă´VDXPDL³WXUWLWă´DGLVWULEXĠLHLIUHFYHQĠHL
relative
123 124
Matematică și Biostatistică

3. Indicatorii formei 3. Indicatorii formei


3.1 Coeficientul de asimetrie 3.1 Coeficientul de asimetrie

e
Asimetria – reprezintă devia‫܊‬ia de la forma simetrică de distribu‫܊‬ie Coeficientul de asimetrie Pearson (ߚଵ ) – se calculează pe baza

i
PRPHQWHORUFHQWUDWHȝ2 úLȝ3 de ordin doi, respectiv trei:

ac
P 32
Cas E1
P 23
unde

rm
Interpretare
¦ xi  x ni
2

P2 V 2
Interpretare: (+) asimetrie dreapta; (-) asimetrie stanga ¦n i

(momentul centrat de ordin 2)

Fa
Pentru variabile negrupate
¦ x  x n
3

=SKEW(Rage) P3 i i

¦n i

(momentul centrat de ordin 3)


125 126

de
3. Indicatorii formei 3. Indicatorii formei
3.2 Coeficientul de boltire 3.2 Coeficientul de boltire
Boltirea (aplatizarea)
a
te
• curba mezocurtică (coincide cu modelul; curb normală ) Coeficientul lui Pearson Coeficientul lui Fischer
• curba platicurtică (prezintă o varia‫܊‬ie puternică a variabilei X
P4
înso‫܊‬ită de varia‫܊‬ia slabă a frecven‫܊‬ei fi) E2
P 22
• curba leptocurtică (prezintă o varia‫܊‬ie slabă a variabilei X J2 E2  3
lta

înso‫܊‬ită de o varia‫܊‬ie puternică a frecven‫܊‬ei fi) unde

¦ x  x n
4

P4 i i

Pentru variabile negrupate ¦n i


cu

=KURT(Rage)
Interpretare:
Interpretare:
J 2 =0 (repartiĠLHPH]RFXUWLFă
ȕ2=3 (repartiĠLHPH]RFXUWLFă
J 2 >0 (repartiĠLHleptRFXUWLFă
ȕ2>3 (repartiĠLHleptRFXUWLFă
J 2 <0 (repartiĠLHplatiFXUWLFă
Fa

Interpretare: (+) distributie ascutita; ȕ2<3 (repartiĠLHplatiFXUWLFă


(-) distributie aplatizata

127 128
Matematică și Biostatistică

Utilizarea func‫܊‬iei Descriptive Statistics


(din Data Analysis)

i e
Biostatistică

ac
rm
ELEMENTE DE TEORIA
352%$%,/,7Ă‫܉‬,/25

Fa
129
Curs 6 130

de
Experimente, spaĠii de HúDQWLRQDUH
Introducere evenimente
a
y În cursurile DQWHULRDUHDPDQDOL]DWPHWRGHOHJUDILFHúL y Un experiment statistic aleator este procesul de
te
numerice pentru descrierea datelor statistice cu ajutorul observare a unui anumit fenomen, care conduce la
FăURUDDP GHWHUPLQDWPRGHOXOHPSLULFDOGLVWULEXĠLHL DSDULĠLDXQXLDVDXDPDLPXOWRUUH]XOWDWHSRVLELOH
IUHFYHQĠHLUHODWLYHSUHFXPúLVWDWLVWLFLOHHúDQWLRQXOXL
lta

După efectuarea experimentului se ob‫܊‬ine un rezultat.


Acesta îl vom numi probă.
y 3HQWUXLQIHUHQĠăUHVSHFWLYSHQWUXWUHFHUHDGHODHúDQWLRQOD
SRSXODĠLHúLGHOD³PRGHOXOHPSLULF´OD³PRGHOXOWHRUHWLF´ Experimentul Rezultate posibile
cu

avem nevoie de SUREDELOLWăĠL | Aruncarea unei | $SDULĠLD³EDQXOXL´ % 


monede sau a “coroanei” (C)
| Aruncarea unui zar | $SDULĠLDIHĠHORU
y Probabilitatea UHSUH]LQWă– în mod intuitiv – posibilitatea
Fa

VDXúDQVDFDXQDQXPLWIHQRPHQVăVHSURGXFă 1,2,3,4,5 sau 6


| Determinarea grupei |Rezultate posibile :A,
sangvine B, AB, 0
131 132
Matematică și Biostatistică

Experimente, spaĠii de HúDQWLRQDUH Experimente, spaĠii de HúDQWLRQDUH


evenimente evenimente

e
y 3ULPDFDUDFWHULVWLFăDXQXLH[SHULPHQWVWDWLVWLFHVWH 6SDĠLXOGHHúDQWLRQDUH (Spa‫܊‬LXOSUREHORU al unui

i
H[SHULPHQWDOHDWRUHVWHPXOĠLPHDWXWXURUUH]XOWDWHORU

ac
caracterul aleator, DGLFăUH]XOWDWHOHVXQWvQWkPSOăWRDUH,
IăUăDILGHWHUPLQDWHGHDQXPLWHFDX]Hspeciale SRVLELOHDOHDFHOXLH[SHULPHQW5H]XOWDWHOHWUHEXLHVăILH
H[KDXVWLYHúLUHFLSURFHH[FOXVLYH
y /LVWDUH]XOWDWHORUXQXLH[SHULPHQWDOHDWRUWUHEXLHVăILH

rm
H[KDXVWLYăDGLFăVăLQFOXGăWRDWHUH]XOWDWHOHFDUHSRWVă
DSDUă Vom nota VSDĠLXOGHHúDQWLRQDUHFX : úL
rezultatele posibile cu R1, R2, ..., RmDGLFă

Fa
y 5H]XOWDWHOHH[SHULPHQWXOXLWUHEXLHVăILHreciproc : = {ܴଵ , ܴଶ , … , ܴ௠ }
exclusiveDGLFăQXSRWVăDSDUăvQDFHODúLWLPSGRXă
rezultate diferite

133 134

de
Experimente, spaĠii de HúDQWLRQDUH Experimente, spaĠii de HúDQWLRQDUH
evenimente evenimente
y 6SDĠLXOGHHúDQWLRQDUHDOXQXLH[SHULPHQWDOHDWRUVHa Un eveniment simplu este un rezultat individual al unui
te
SRDWHUHSUH]HQWDJUDILFSULQDúD-numita GLDJUDPă VSDĠLXGHHúDQWLRQDUH
Venn. 6SDĠLXOGHHúDQWLRQDUHDOXQXLH[SHULPHQWHVWHDOFăWXLWGLQ
lta

y 'LDJUDPD9HQQHVWHRFXUEăvQFKLVăFDUHFRQĠLQH PXOĠLPHDWXWXURUHYHQLPHQWHORUVLPSOHDOHDFHOXLH[SHULPHQW
reprezentate prin puncte, toate rezultatele posibile ale
Exemplu: 6ăVHGHWHUPLQHPXOĠLPHDHYHQLPHQWHORUVLPSOHUHVSHFWLYVSDĠLXOGH
experimentului HúDQWLRQDUHSHQWUXH[SHULPHQWXODUXQFăULLDGRXămonede.
cu

yR1 yR2 Rezolvare:1RWăPcu B DSDULĠLDYDORULLQXPHULFHsau D³EDQXOXL´SHRIDĠăD


PRQHGHLúLFXC DSDULĠLD³FRURDQHL³VDXD³VWHPHL´SHFHDODOWăIDĠăDPRQHGHL
yR3 yR4 yR5 Aruncarea FHORUGRXăPRQHGHYDFRQGXFHODDSDULĠLDXQXLUH]XOWDWGHIRUPDR1, R2,
unde R1 , R2  ^B, C`
De exemplu, rezultatul BC vQVHDPQăFăODSULPDPRQHGăDDSăUXWIDĠDB, iar la a
Fa

yRm-1 yRm GRXDPRQHGăDDSăUXWIDĠDC.


Atunci evenimentele simple ale acestui experiment sunt: BB, BC, CB, CC
iar VSDĠLXOGHHúDQWLRQDUH
135
: : = {BB, BC, CB, CC}
136
'LDJUDPD9HQQDXQXLVSDĠLXGHHúDQWLRQDUH
Matematică și Biostatistică

Experimente, spaĠii de HúDQWLRQDUH Experimente, spaĠii de HúDQWLRQDUH


evenimente evenimente

e
Un eveniment HVWHRPXOĠLPHVDXXQVHWGHHYHQLPHQWH • Vom nota, în continuare:

i
simple într-XQVSDĠLXGHHúDQWLRQDUH - VSD‫܊‬LXOSUREHORUFX:

ac
- mulĠLPHD evenimentelor cu K
Exemplu: ÌQH[SHULPHQWXODUXQFăULLXQXL]DUVăVHGHWHUPLQHHYHQLPHQWHOH - evenimentele cu litere mari (A, B, C etc).
D DSDULĠLDXQXLQXPăUSDU
E DSDULĠLDXQXLQXPăU> 3. • În muOĠLPHD evenimentelor se disting două evenimente cu

rm
Rezolvare: Evenimentele VLPSOHVXQWDSDULĠLDIHĠHORU1, 2, 3, 4, 5 sau 6, iar
caracter special:
VSDĠLXOGHHúDQWLRQDUHHVWH • evenimentul sigur este evenimentul care se produce cu certitudine;
: = {1,2,3,4,5,6} se notează cu :. De exemplu, evenimentul “cap sau SDMXUă´ la
(a) Evenimentul aruncarea unei monede este un eveniment sigur.

Fa
E1={ApariĠia unui număUSDU} • evenimentul imposibil este evenimentul care nu se produce
HVWHDOFăWXLt din evenimentele simple 2, 4, 6 úLDYHP E1={2, 4, 6}. niciodată se notează cu‫ ׎‬. Este evident căHYHQLPHQWXO sigur
(b) Evenimentul este evenimentul contrar evenimentului imposibil úi reciproc.
E2={ApariĠia unui număU> 3} • Se poate astfel spune FăHYHQLPHQWHOH sunt de trei categorii:
este DOFăWXLGLQHYHQLPHQWHOHVLPSOH 4, 5, 6 úLDYHP E2={4, 5, 6}. sigure, imposibile úLDOHDWRULL
137 138

de
Experimente, spaĠii de HúDQWLRQDUH
evenimente Probabilitatea unui eveniment
• Între evenimente se definesc operaĠLL inspirate din a
te
teoria mulĠLPLORU: Egalitatea, NegaĠLD Reuniunea, y În prezentarea úi prelucrarea datelor, PăVXUDWH pe diverse
IntersecĠLD Incluziunea. scale, noĠiunea de frecvenĠă relativă este o noĠiune
lta

A ‫ ׫‬B - evenimentul care constăvn realizarea a cel pu‫܊‬in unuia din


unificatoare: se regăseúte la toate scalele, valorile
cele două evenimente (se realizează A sau B) obĠinute pot fi utilizate pentru comparaĠii etc.
A ‫ ת‬B - evenimentul care constăvn realizarea ambelor evenimente (se
realizează A ‫܈‬L B)
y Practica arată că atunci când o experienĠă este repetată de un
cu

A \ B - evenimentul care constăvn realizarea lui A ‫܈‬i nerealizarea


lui B. QXPăU mare de ori, frecvenĠa relativă a apariĠiei unui fapt tinde
ഥ= CA - evenimentul “contrar “ lui A care constăvn nerealizarea lui
A să se stabilizeze.
A (realizarea lui :\ A)
Fa

• 'RXăHYHQLPHQWH$úL%VHVSXQincompatibile GDFă y Acest fenomen este formalizat în teoria probabilităĠilor


LQWHUVHFĠLDORUeste evenimentul imposibil, A ‫ ת‬B =‫ ׎‬DGLFă prin introducerea noĠiunii de probabilitate.
nu este posibil ca evenimentele A úL B VăVHSURGXFăVLPXOWDQ
139 140
Matematică și Biostatistică

Probabilitatea unui eveniment Probabilitatea unui eveniment

e
'DFăUH]XOWDWHOHVDXHYHQLPHQWHOHVLPSOHDOHXQXLVSDĠLX

i
y Fie K mulĠimea evenimentelor. Se numeúWe probabilitate

ac
GHHúDQWLRQDUHDXDFHHDúL³úDQVă´VDXSUREDELOLWDWHGH
orice funFĠie cu valori reale definită pe mulĠimea DSDULĠLH HYHQLPHQWHOHVXQW³HFKLSUREDELOH´ DWXQFL
evenimentelor,P : K oƒ úi care satisface: SUREDELOLWDWHDGHDSDULĠLHDILHFăUXLHYHQLPHQWVLPSOXYD
y
fi:

rm
y probabilitatea RULFăUXL eveniment este un număU
P R1 P R2 ... P Rm
1
nenegativ: P(A) t0;
y probabilitatea evenimentului sigur este egală cu 1: P(:) =1; m
y probabilitatea RULFăUHL reuniuni de evenimente incompatibile
două câte două este egală cu suma SUREDELOLWăĠLORU

Fa
De H[HPSOXvQH[SHULPHQWXODUXQFăULLXQXL]DUSUREDELOLWDWHDGHDSDULĠLH
evenimentelor: P(A‫׫‬B) = P(A)+P(B) atunci când A ‫܈‬i B sunt DXQHLIHĠHYDIL ĠLQkQGFRQWFăUH]XOWDWHOHGHED]ăUHVSHFWLYXQDGLQ
incompatibile (A ‫ת‬B = ‫)׎‬ IHĠHOHVDXDXDFHHDúLúDQVăGHDSDULĠLH 

P 1 P 2 P 3 P 4 P 5 P 6
1
Se spune că tripleta (:, K,P) defineúte un VSDĠLX de probabilitate. 6
141 142

de
Probabilitatea unui eveniment Formule fundamentale
y &RQVLGHUăPHYHQLPHQWHOHVLPSOHFDUHDOFăWXLHVFXQ 3UREDELOLWDWHDFRQGL‫܊‬LRQDWă
eveniment ca fiind “cazuri favorabile” producerii acelui
HYHQLPHQWLDUHYHQLPHQWHOHVLPSOHFDUHDOFăWXLHVFVSDĠLXO a • $WXQFLFkQGGLVSXQHPGHLQIRUPDĠLLSULYLQGOHJăWXUDvQWUHHYHQLPHQWH
te
GHHúDQWLRQDUHFDILLQG³FD]XULSRVLELOH´SURGXFHULLDFHOXL LQIRUPDĠLLFDUHDUSXWHDFRQGLĠLRQDUH]XOWDWXOXQXLH[SHULPHQWYRP
eveniment. determina SUREDELOLWăĠLFRQGLĠLRQDWH
y Probabilitatea unui eveniment A este:
lta

6HQXPH‫܈‬WHSUREDELOLWDWHDHYHQLPHQWXOXL$, FRQGLаLRQDWă
P A
Numarul cazurilor favorabile de evenimentul B raportul dintre probabilitatea
Numarul cazurilor posibile intersec‫܊‬iei celor douăevenimente ‫܈‬L probabilitatea
evenimentului care condi‫܊‬ionează:
cu

P A úL B P A  B
P A B PB ( A)
denumităúL³IRUPXODFODVLFă´DSUREDELOLWăĠLORU
Exemplul 6ăse determine probabilitatea extragerii unei “figuri” (J, Q, R) dintr-un pachet P B P B
GHGHFăUĠLXWLOL]kQGIRUPXODFODVLFăa SUREDELOLWăĠLORU.
Rezolvare: 1XPăUXOFD]XULORUIDYRUDELOHUHVSHFWLYILJXULOHURúLLúLQHJUH Ɔ Ƈ Ƅ ƅ) este probabilitatea evenimentului B, FRQGLаLRQDWăGH
Fa

1XPăUXOcazurilor posibile este 52HJDOFXQXPăUXOGHFăUĠLGLQSDFKHW$WXQFL evenimentul A


probabilitatea extragerii unei “figuri” este: 3 ˜ 4 12 P A úL B P A  B
P B A PA ( B )
P A
Numarul cazurilor favorabile
143 posibile
Numarul cazurilor
12
52
0,231 P A
144
P A
Matematică și Biostatistică

Formule fundamentale Formule fundamentale


3UREDELOLWDWHDFRQGL‫܊‬LRQDWă 5HJXODPXOWLSOLFDWLYăSHQWUXHYHQLPHQWHLQGHSHQGHQWH

i e
'RXăHYHQLPHQWHA úLB se numesc evenimente y 3UREDELOLWDWHDLQWHUVHFĠLHLDGRXăHYHQLPHQWHLQGHSHQGHQWH

ac
$úL%este
independente GDFă
P A  B P A ˜ P B
P A B P A
5HJXODDGLWLYă

rm
sau
y Probabilitatea UHXQLXQLLDGRXăHYHQLPHQWHA úLB este
P B A P B
P A  B P A  P B  P A  B

Fa
'LQUHODĠLLOHGHPDLVXVUH]XOWăFăGRXăHYHQLPHQWHVXQWLQGHSHQGHQWH 5HJXODDGLWLYăSHQWUXHYHQLPHQWHUHFLSURFH[FOXVLYH
GDFăSUREDELOLWDWHDXQXLHYHQLPHQWQXHVWHDIHFWDWăGHDSDULĠLDFHOXLODOW
eveniment • 3UREDELOLWDWHDUHXQLXQLLDGRXăHYHQLPHQWHUHFLSURF
exclusive A úLB este

145
P A  B P A  P B
146

de
Formule fundamentale Formule fundamentale
Regula lui Bayes Regula lui Bayes
a
te
• 3UREDELOLWăĠLOHFRQGLĠLRQDWHLDXvQconsiderare y Fie dat evenimentul B úLHYHQLPHQWHOHUHFLSURF
LQIRUPDĠLDGHVSUHSUREDELOLWDWHDXQXLHYHQLPHQW exclusive A1 , A2 ,..., Ak pentru care se cunosc valorile
SHQWUXDIDFHSUHGLFĠLDDVXSUDSUREDELOLWăĠLLXQXL
lta
SUREDELOLWăĠLORUDVRFLDWH
alt eveniment.
P A1 , P A2 ,..., P Ak
y 3UREDELOLWăĠLOH
• Conceptul poate fi extins pentru a “revizui” se numesc SUREDELOLWăĠLDQWHULRDUH

cu

SUREDELOLWăĠLOHSHED]DXQRULQIRUPDĠLL y 3UREDELOLWăĠLOH P B A1 , P B A2 ,..., P B Ak


suplimentare, pentru a determina probabilitatea ca se numesc SUREDELOLWăĠLYHURVLPLOH
XQDQXPLWHIHFWVăILHGDWRUDWXQHLFDX]Hspeciale.

y 3UREDELOLWăĠLOH P A1 B , P A2 B ,..., P Ak B
Fa

• $FHDVWăSURFHGXUăHVWHGDWăGHregula sau se numesc SUREDELOLWăĠLSRVWHULRDUH


teorema lui Bayes.
147 148
Matematică și Biostatistică

Formule fundamentale $SOLFD‫܊‬LL


Regula lui Bayes

e
1. Masa, rezisten‫܊‬a ‫܈‬i înăl‫܊‬imea sunt caracteristici independente ale unui
comprimat. Probabilită‫܊‬ile ca un comprimat să nu corespundă din aceste puncte de

i
Regula (teorema) lui Bayes vedere sunt: 0,03; 0,05 si 0,02. Care este probabilitatea ca tableta să corespundă în

ac
raport cu cele trei caracteristici?
Probabilitatea evenimentelor reciproc exclusive 6ROX‫܊‬LH: Fie E1, E2, E3 evenimentele care se realizează când produsul corespunde
în raport cu fiecare dintre caracteristici.
A1 , A2 ,..., Ak FRQGLĠLRQDWHde evenimentul B este

rm
P Ai ˜ P B Ai
P Ai B PB Ai
P A1 ˜ P B A1  P A2 ˜ P B A2  ...  P Ak ˜ P B Ak

Fa
149 150

de
$SOLFD‫܊‬LL $SOLFD‫܊‬LL
a
2. Un produs farmaceutic este prelucrat în două etape A si B. În prima etapă are
loc comprimarea propriu-zisa, iar în a doua etapă are loc ambalarea produsului
3. Se consideră două recipiente cu reactivii B1 si B2. In recipientul B1 se află
pastile de KOH, iar în recipientul B2 pastile de KOH ‫܈‬i de NaOH în număr egal.
te
intermediar ob‫܊‬inut. După etapa A, comprimatele vrac sunt controlate ob‫܊‬inându- O pastilă scoasă la întamplare din unul din recipienti se dovedeste a fi KOH. Care
se un randament de 97%. Comprimatele vrac corespunzătoare vor fi prelucrate în este probabilitatea ca această pastilă să provină din B1?
etapa B ob‫܊‬inându-se un randament de 95%. Care este probabilitatea ca produsul
finit să corespundă?
lta

SoluаLH
P(A)=P(comprimat vrac corespunzător)= 0,97
cu

PA(B)=P( comprimat ambalat corespunzător)=0,95


Fa

151 152
Matematică și Biostatistică

Reguli de număUDUH Reguli de număUDUH

i e
ac
y ÌQDOJRULWPXOSHQWUXFDOFXOXOSUREDELOLWăĠLLXQXL 5HJXODPXOWLSOLFDWLYă Fie k PXOĠLPLFDUHFRQĠLQ
HYHQLPHQWXQXOGLQSDúLLGLILFLOLvOFRQVWLWXLH respectiv n1, n2,..., nk HOHPHQWH1XPăUXOGH
GHWHUPLQDUHDQXPăUXOXLHYHQLPHQWHORUVLPSOHDOH PXOĠLPLFXFkWHk elemente formate prin
VSDĠLXOXLGHHúDQWLRQDUH

rm
alegerea a câte unui singur element din
ILHFDUHPXOĠLPHHVWH
y Pentru rezolvarea acestei probleme vom analiza în
FRQWLQXDUHDúD-numitele UHJXOLGHQXPăUDUH, cunoscute
n1 ˜ n2 ˜ ... ˜ nk

Fa
vQPDWHPDWLFăVXEGHQXPLUHDGHHOHPHQWHGH
FRPELQDWRULFă

153 154

de
Reguli de număUDUH Reguli de număUDUH
a
te
Exemplu 6ăVHGHWHUPLQHQXPăUXOWULSOHWHORUFDUHVHSRW y Se numesc SHUPXWăUL DOHXQHLPXOĠLPLA cu n
IRUPDGLQPXOĠLPLOH elemente toate PXOĠLPLOHRUGRQDWHGHn elemente
A ^a, b` B ^c, d , e` C ^ f , g , h, i`
lta
care se pot forma cu elementele lui A.
OXkQGFkWHXQHOHPHQWGLQILHFDUHPXOĠLPH

Rezolvare: $YHPúLUH]XOWă
n1 2, n2 3, n3 4
5HJXODSHUPXWăULORU 1XPăUXOSHUPXWăULORUDn
cu

n1 ˜ n2 ˜ n3 2 ˜3˜ 4 24 elemente, n  ^1,2,..., n,...


, ` este
2EĠLQHPGLQSULPHOHGRXăPXOĠLPLA úLB perechile
Pn n! 1 ˜ 2 ˜ ... ˜ n
(a,c), (a,d), (a,e), (b,c), (b,d), (b,e) ODFDUHDGăXJăPDO
Fa

WUHLOHDHOHPHQWGLQPXOĠLPHDCDGLFă 3ULQGHILQLĠLH
0! 1 úL 1! 1
(a,c,f), (a,d,f), (a,e,f),..., (b,c,i), (b,d,i), (b,e,i)
155 156
Matematică și Biostatistică

Reguli de număUDUH Reguli de număUDUH

i e
Exemplu 6ăVHGHWHUPLQHQXPăUXOSHUPXWăULORUPXOĠLPLL y 1XPăUXOSHUPXWăULORUFXUHSHWLĠLH a n elemente, în care

ac
A ^a, b, c` ILHFDUHHOHPHQWVHSRDWHUHSHWDSkQăODn ori este:
Rezolvare: Avem n = 3 úL Pn nn

rm
P3 3! 1 ˜ 2 ˜ 3 6 Exemplu 6ăVHGHWHUPLQHQXPăUXOSHUPXWăULORUFXUHSHWLĠLH
DOHPXOĠLPLL
0XOĠLPLOHRUGRQDWHFXFkWHHOHPHQWHYRUIL Rezolvare: Avem n = 3 úL A ^a, b, c`
(a,b,c), (b,c,a), (a,c,b), (c,a,b), (b,a,c), (c,b,a) P3 33 27

Fa
Simbolul n! VHFLWHúWH “n factorial”
0XOĠLPLOHRUGRQDWHFXFkWHHOHPHQWHúLUHSHWLĠLHYRUILGH
forma:
(a,a,a), (a,a,b), ..., (c,c,b), (c,c,c)
157 158

de
Reguli de număUDUH Reguli de număUDUH
a
te
y 1XPăUXOaranjaPHQWHORUFXUHSHWLĠLH a n elemente, luate
y Se numesc aranjamente a n elemente luate câte k, k câte kvQFDUHILHFDUHHOHPHQWVHSRDWHUHSHWDSkQăODk
”Q DOHXQHLPXOĠLPLA cu n elemente, toate ori este:
lta

VXEPXOĠLPLOHRUGRQDWH cu câte k elemente care se pot Ank nk


forma cu elementele lui A.
Exemplu D 6ăVHGHWHUPLQHQXPăUXODUDQMDPHQWHORUD
elemente luate câte 2.
cu

Regula aranjamentelor 1XPăUXOaranjamentelor E 6ăVHGHWHUPLQHQXPăUXODUDQMDPHQWHORUFXUHSHWLĠLHD


3 elemente luate câte 2.
a n elemente, luate câte k, este
Rezolvare: (a)
1˜ 2 ˜ 3
Fa

3!
n ˜ n  1 ˜ ... ˜ n  k  1
n! A32 6
Ak
,n t k 3  2 ! 1
n
n  k ! (b)
159
A32 32160
9
Matematică și Biostatistică

Reguli de număUDUH Reguli de număUDUH

e
y 1XPăUXOFRPELQăULORUFXUHSHWLĠLH a n elemente, luate

i
ac
y Se numesc combinări a n elemente luate câte k, câte kvQFDUHILHFDUHHOHPHQWVHSRDWHUHSHWDSkQăODk
ori este:
k ”Q DOHXQHLPXOĠLPLA cu n elemente, toate
Cnk Cnk k 1
VXEPXOĠLPLOHFXFkWHk elemente care se pot forma

rm
cu elementele lui A. Exemplu D 6ăVHGHWHUPLQHQXPăUXOFRPELQăULORUD
elemente luate câte 2.
E 6ăVHGHWHUPLQHQXPăUXOFRPELQăULORUFXUHSHWLĠLHD
5HJXODFRPELQăULORU 1XPăUXOFRPELQăULORUDn elemente luate câte 2.

Fa
elemente, luate câte k, este Rezolvare: (a) C 2 3! 1˜ 2 ˜ 3
3
2!˜ 3  2 ! 1˜ 2
3
Ank n!
C k
,n t k
k!˜ n  k ! 1˜ 2 ˜ 3 ˜ 4
n
Pk (b) C32 C32 21 C42
4!
6
161 162
2!˜ 4  2 ! 1 ˜ 2 ˜1 ˜ 2

de
Reguli de număUDUH Reguli de număUDUH
a
te
Exemplu La un concurs cu premii se atribuie 12 obiecte
5HJXODSDUWLĠLRQăULORU GLIHULWHSULPLORUWUHLFODVDĠLDVWIHO
y Locul 1: 5 obiecte
Fie o PXOĠLPHFXn elemente distincte.
lta

y Locul 2: 4 obiecte
1XPăUXOSDUWLĠLLORUPXOĠLPLLGDWHvQk
y Locul 3: 3 obiecte
VXEPXOĠLPLILHFDUHFRQĠLQkQGUHVSHFWLYn1,
n2,..., nk elemente este În câte moduri se pot atribui aceste obiecte?
cu

Rezolvare: &RQIRUPUHJXOLLSDUWLĠLRQăULORUDYHPk = 3,
n!
n = 12, n1 = 5, n2 = 4, n3 = 3 úLUH]XOWă
n1!˜n2 !˜... ˜ nk !
Fa

unde n! 12!
n1  n2  ...  nk n n1!˜n2 !˜n3! 5!˜4!˜3!
27.720
163 164
Matematică și Biostatistică

Variabile aleatoare

e
y $WXQFLFkQGHIHFWXăPXQH[SHULPHQWQH

i
LQWHUHVHD]ăHYHQLPHQWHSHFDUHOHFXDQWLILFăP

ac
Biostatistică SULQYDORULQXPHULFHDGLFăUHDOL]ăP
H[SHULPHQWXOúLvQUHJLVWUăPYDORULOHQXPHULFH
ale uneia sau mai multor variabile statistice.

rm
VARIABILE ALEATOARE DISCRETE. y 'DFăUHSHWăPH[SHULPHQWXODOHDWRUGHn ori úL
³QXPăUăP´HYHQLPHQWHOHDSăUXWHSHQWUXR
5(3$57,‫܉‬,,',6&5(7( DQXPLWăYDULDELOăVWDWLVWLFăREĠLQHPRPXOĠLPH
• Reparti‫܊‬LD%LQRPLDOă de date cantitative discrete, iar variabila

Fa
• 5HSDUWL‫܊‬LD3RLVVRQ VWDWLVWLFăYDILRYDULDELOăDOHDWRDUH.

Curs 7 168 169

de
Variabile aleatoare Variabile aleatoare discrete
Fie un spaĠLXGHprobabilitate (:,K,P).
a
te
Se QXPHúWHYDULDELOă aleatoare o IXQFĠLH )LH R YDULDELOă DOHDWRDUH X 6H FRQVLGHUă WRDWH
reală X: :oƒ , care satisface condiĠLD: valorile x1 , x 2 ,..., x n , pe care le poate lua variabila
lta

^Z | X(Z ) d x` K, oricare ar fi x  ƒ. aleatoare X FXSUREDELOLWăĠLOHILHFăUHLYDORUL

Cu alte cuvinte, se cere din considerente P( X x1 ) p1 ; P( X x2 ) p 2 ;...; P( X xn ) pn


cu

teoretice, ca PXOĠLPHDHYHQLPHQWHORU elementare


pentru care v.a. X are valori mai mici sau egale cu 1XPăUXO YDORULORU YDULDELOHL DOHDWRDUH GLVFUHWH
x, oricare ar fi x, săILHWRWXQHYHQLPHQW
SRDWH IL ILQLW QXPăUDELO  X {x1 , x2 ...xn } sau infinit
Variabilele aleatoare pot fi:
Fa

X {x1 , x2 ...xn ...} .


- GLVFUHWHGHILQLWHSHRPXOĠLPHFHOPXOWQXPăUDELOă
- FRQWLQXHGHILQLWHSHRPXOĠLPHPăVXUDELOă
170 171
Matematică și Biostatistică

Variabile aleatoare discrete Variabile aleatoare discrete

e
(QXPHUDUHD WXWXURU YDORULORU YDULDELOHL DOHDWRDUH úL DOH x 5HSUH]HQWDUHD JUDILFă D UHSDUWLĠLHL VH SRDWH IDFH VXE IRUPD XQHL

i
SUREDELOLWăĠLORU UHVSHFWLYH IRUPHD]ă WDEORXO GH UHSDUWLĠLH VDX de

ac
diagrame cu bare sau forma unei diagrame poligonale.
GLVWULEXĠLH úLVHVFULHVXEXQDGLQIRUPHOH p3
p2
xi || x1 | x2 | ... | xn |
, p1

P( X xi ) || p1 | p2 | ... | pn | p0

rm
§ x1 , x2 , ... xn · §x ·
x
0 1 2 3 4
X : ¨¨ ¸¸ , sau X : ¨¨ i ¸¸ , 1 d i d n
xn-1 xn
0 1 2 3 x0

© p1 , p 2 , ... p n ¹ © pi ¹
x Totalitatea valorilor distincte x1 , x2 ... xn IRUPHD]ă XQ VLVWHP
În prima linie sunt trecute toate valorile posibile ale complet de evenimente incompatibile. 3HQWUX PXOĠLPHD GH

Fa
caracteristicii, iar în a doua linie, SUREDELOLWăĠLOHFRUHVSXQ]ăWRDUH perechi ordonate {( xi , pi ), i 1, 2 ... n}  FDUH GHILQHVF UHSDUWLĠLD VH
3UREDELOLWDWHDILHFăUXLHYHQLPHQW xi se poate prezenta sub forma poate scrie:
n
XQHLUHODĠLLDQDOLWLFHFDUHVWDELOHúWHOHJăWXUDGLQWUHYDORULOH
¦ pi 1
aleatoare xi úLSUREDELOLWăĠLOHUHVSHFWLYH 1
172 173

de
Variabile aleatoare discrete
Variabile aleatoare discrete
)XQFĠLDGHUHSDUWLĠLH
x Probabilitatea evenimentului X d x HVWH UHSUH]HQWDWă GH R a )XQFĠLDGHUHSDUWLĠLH
te
IXQFĠLHQXPLWăIXQFĠLHGHUHSDUWLĠLHDYDULDELOHLDOHDWRDUHX:
F ( xi ) P( X d xi )
lta

x În cazul variabilei discrete, DFHDVWDVHUHSUH]LQWăVXEIRUPD


unei diagrame discontinue (în trepte).
cu

x Cunoscând WDEORXO GH UHSDUWL‫܊‬LH a unei variabile aleatoare P^X ! x k ` 1  P^X d x k `


Fa

discrete, pi P ( xi ) IXQFĠLDGHUHSDUWLĠLHYDIL
k k k k
P^X x k ` P^X d x k `  P^X d x k  1 `
F (xk ) P( X d x k )  x ) ¦ P( X
P(
1
i
174 i 1
xi ) ¦ P( x ) ¦ p
i 1
i
i 1
i
175
Matematică și Biostatistică

Variabile aleatoare discrete Variabile aleatoare discrete

e
Exemplu

i
y 'LVWULEXĠLDde probabilitate a unei variabile

ac
Fie următoarea variabilă aleatoare:
aleatoare discrete X IXUQL]HD]ăXQPRGHOSHQWUX
SRSXODĠLDGHYDORULDOXLX úLSHQWUXGLVWULEXĠLD
IUHFYHQĠHLUHODWLYHDSRSXODĠLHLGHVFULVăGH

rm
Să se determine func‫܊‬ia sa de reparti‫܊‬ie. variabila aleatoare X.
Solu‫܊‬ie:

y 9RPSXWHDGHVFULHDWXQFLGLVWULEXĠLDGH
probabilitate a unei variabile aleatoare discrete X

Fa
SULQPăVXULQXPHULFHFXPVXQWPHGLDGLVSHUVLD
sau abaterea standard.

176 177

de
Variabile aleatoare discrete Variabile aleatoare discrete
Caracteristici numerice Caracteristici numerice
y Media a y 'LVSHUVLD VDXYDULDQ‫܊‬D
te
> @ ¦ x  P
6HQXPHúWHvaloare PHGLH VDXVSHUDQĠăPDWHPDWLFă DXQHLYDORUL
aleatoare XQXPăUXO D> X @ V 2 M X  P 2 i
2
˜ p( x i )
E >X @ P ¦ x ˜ p( x )
lta
i
i i
i 5ăGăFLQDSăWUDWăDGLVSHUVLHLıVHQXPHúWHabaterea medie
SăWUDWLFă (sau abaterea standard) a variabilei X
3URSULHWăĠLale valorii medii:
cu

1. E >c @ c
3URSULHWăĠLDOHGLVSHUVLHL

2. E >x  c @ E >x @  c 1. D>c @ 0


2. D>x  c @ D>x @
3. E >cx@ c ˜ E >x @
Fa

3. D>cx@ c 2 ˜ D>x @
178 179
Matematică și Biostatistică

5HSDUWL‫܊‬LD%LQRPLDOă-B(n,p) 5HSDUWL‫܊‬LD%LQRPLDOă-B(n,p)

e
&DUDFWHULVWLFLFHGHILQHVFRYDULDELOăDOHDWRDUHELQRPLDOă
y Multe experimente reale sunt analoge experimentului

i
ac
DUXQFăULLmonedelor. y Experimentul constăvQn vQFHUFăULLGHQWLFH
y Sunt SRVLELOHQXPDLGRXăUH]XOWDWHDOHILHFăUHL
y 6RQGDMHOHRSLQLHLSXEOLFHVDXDOHSUHIHULQĠHORU vQFHUFăUL
y S – succes

rm
consumatorilor, atunci când acestea sunt de tipul DA /
y F - insucces
18VXQWVLPLODUHH[SHULPHQWXOXLDUXQFăULLXQHL
y Probabilitatea lui S este p úLUăPkQHDFHHDúLODILHFDUH
monede. încercare. Probabilitatea lui F este q úLDYHPp + q = 1.
y ÌQFHUFăULOHVXQWLQGHSHQGHQWH

Fa
y $FHVWWLSGHH[SHULPHQWHVXQWSDUWLFXODUL]ăULDOH y Variabila DOHDWRDUHELQRPLDOăX HVWHQXPăUXOGH
variabilelor aleatoare binomiale succese (S) în n vQFHUFăUL

180 181

de
5HSDUWL‫܊‬LD%LQRPLDOă-B(n,p) 5HSDUWL‫܊‬LD%LQRPLDOă-B(n,p)
y Probabilitatea de a avea de k RULVXFFHVvQQvQFHUFăUL
a Caracteristici numerice
te
HVWHGDWăGHIRUPXOD
y Media SHQWUXRYDULDELOăDOHDWRDUHELQRPLDOă;HVWH
p X k C nk k
p q nk
, k 0,1,2,..., n P n˜ p
lta

unde: y Dispersia SHQWUXRYDULDELOăDOHDWRDUHELQRPLDOăX


y p = probabilitatea de succes într-RVLQJXUăvQFHUFDUH este:
y q=1–p V2 n˜ p˜q
cu

y n QXPăUXOGHvQFHUFăUL
y k QXPăUXOGHVXFFHVHS în n vQFHUFăUL
y n! 5HSUH]HQWDUHDJUDILFă a UHSDUWL‫܊‬LHLELQRPLDOHVHUHDOL]HD]ăSULQ
C kn
k!(n  k )! GLDJUDPDvQEDWRDQHúLGHSLQGHGHYDORDUHDSDUDPHWULORUVăLn úLp.
Astfel:
Fa

y 5HSUH]HQWDUHVXEIRUPăPDWULFLDOă
- GLDJUDPDHVWHVLPHWULFăGDFăS T 0.5;
- GLDJUDPDHVWHDVLPHWULFăGDFăS!TVDXSq;
- RGLVWULEXĠLHDVLPHWULFăGHYLQHWRWPDLVLPHWULFăSHPăVXUăFHn
182 183
FUHúWH
Matematică și Biostatistică

5HSDUWL‫܊‬LD%LQRPLDOă-B(n,p) 5HSDUWL‫܊‬LD%LQRPLDOă-B(n,p)

e
Pentru calculul valorilor UHSDUWL‫܊‬LHLELQRPLDOHVHSRDWHIRORVLIXQFĠLD Exemplu

i
Testele pentru calitatea apei potabile într-un anumit -XGHĠau pus în
VWDWLVWLFăGLQ([FHO

ac
HYLGHQĠăIDSWXOFăGLQVXUVHOHLQGLYLGXDOHFRQĠLQRDQXPLWă
VXEVWDQĠă$FDUHQXHVWHEXQăSHQWUXFRQVXP
BINOM.DIST(number_s,trials, probability_s, cumulative) 'DFăsunt alese în mod aleator 5 surse din -XGHĠXOUHVSHFWLYFDUH
y nuber_s (X) (VWHQXPăUXOGHVXFFHVHGLQH[SHULPHQWH
este probabilitatea ca:
D ([DFWVXUVHVăFRQĠLQăVXEVWDQĠD$

rm
y trials(n) (VWHQXPăUXOGHH[SHULPHQWHLQGHSHQGHQWH E &HOSXĠLQVXUVHVăFRQĠLQăVXEVWDQĠD$
F 0DLSXĠLQGHVXUVHVăFRQĠLQăVXEVWDQĠD$
y Probability_s (p) Este probabilitatea de succes la fiecare experiment 6ROX‫܊‬LH: 6ăFRQILUPăPPDLvQWkLFăDYHPXQH[SHULPHQWELQRPLDO
([SHULPHQWXOFRQVWăvQn = 5 vQFHUFăULILHFDUHFRUHVSXQ]ăWRDUH
y Cumulative (VWHRYDORDUHORJLFăFHGHWHUPLQăIRUPDUHSDUWL‫܊‬LHLGH
unei surse alese în mod aleator. 5H]XOWDWHOHILHFăUHLvQFHUFăUL

Fa
SUREDELOLWDWHUHWXUQDWă'DFăFXPXODWLYHVWH758(BINOM.DIST constau dintr-un succes S VXUVDFRQĠLQHVXEVWDQĠD$ VDXGLQWU-un
insucces F VXUVDQXFRQĠLQH$ 
întoarce probabilitatea %LQRPLDOă FXPXODWLYăcă QXPăUXOGH
Deoarece QXPăUXOGHVXUVHGHDSăLQGLYLGXDOHHVWHUHODWLYPDUH
HYHQLPHQWHvQWkPSOăWRDUHFDUHYRUDSăUHD va ILFXSULQVvQWUH‫܈‬L[ SUREDELOLWDWHDDOHJHULLXQHLVXUVHFDUHFRQĠLQHVXEVWDQĠD$R
FRQVLGHUăPHJDOăFX0,3 pentru toate cele 5 surse selectate
inclusiv , P{X ”x} ; în cazul FALSE, va returna probabilitatea Fă aleator.
QXPăUXOGHHYHQLPHQWHDSăUXWHva fi exact x, P{X = x}
184 185

de
5HSDUWL‫܊‬LD%LQRPLDOă-B(n,p) 5HSDUWL‫܊‬LD%LQRPLDOă-B(n,p)
Exemplu
a Exemplu
te
(úDQWLRQDUHDILLQGDOHDWRDUHvQFHUFăULOHVXQWLQGHSHQGHQWH1H (c) Probabilitatea ca PDLSXĠLQGH VXUVHVăFRQĠLQăVXEVWDQĠD$
LQWHUHVHD]ăQXPăUXOX GHVXUVHFDUHFRQĠLQVXEVWDQĠD$GLQWU-un este:
HúDQWLRQGHn = 5.
P^X  3` P^X d 2` p 0  p 1  p 2
lta
6XQWHPGHFLvQFRQGLĠLLOHXQXLH[SHULPHQWELQRPLDOFXn = 5 úLp = 0.3,
q = 1 – 0,3 = 0,7. C 50 p 0 q 50  C 51 p 1 q 51  C 52 p 2 q 5 2
Probabilitatea ca exact VXUVHVăFRQĠLQăVXEVWDQĠD$HVWH
BINOM.DIST(2, 5, 0.3, 1) = 0,83692
P^X 3` p 3
5!
C 53 p 3 q 53
cu

˜ 0,3 3 ˜ 0,7 2 0,1323 DFHDVWăprobabilitate se poate calcula mai XúRUFXDMXWRUXOUHODĠLHLGH


3!˜2!
complementaritate:
P^X  3` 1  P^X t 3` 1  0,16308
=BINOM.DIST(3, 5, 0.3, 0) = 0,1323
0,83692
(b) Probabilitatea ca FHOSXĠLQ VXUVHVăFRQĠLQăVXEVWDQĠD$HVWH
P^X t 3` p 3  p 4  p 5
Fa

53
C 53 3
p q  C 54 p 4 q 5 4  C 55 p 5 q 55
0,13230  0,02835  0,00243 0,16308
186 187
=1-BINOM.DIST(2, 5, 0.3, 1)
Matematică și Biostatistică

5HSDUWL‫܊‬LD3RLVVRQ– P(ߣ) 5HSDUWL‫܊‬LD3RLVVRQ– P(ߣ)

e
&DUDFWHULVWLFLFHGHILQHVFRYDULDELOăDOHDWRDUH3RLVVRQ

i
ac
y 5HSDUWLрLDPoisson RIHUăXQPRGHOSHQWUXIUHFYHQĠD y Experimentul constăvQvQUHJLVWUDUHDQXPăUXOXLx de
UHODWLYăDQXPăUXOXLGH³HYHQLPHQWHUDUH´FDUHDSDU DSDULĠLLDOHXQXLHYHQLPHQWvQWU-RXQLWDWHGDWăGHWLPS
într-o unitate de timp, arie, volum etc. GHYROXPGHDULHGHJUHXWDWHGHGLVWDQĠăVDXRULFH
y 5HSDUWL‫܊‬LD3RLVVRQVHXWLOL]HD]ăPDLDOHVvQ DOWăXQLWDWHGHPăVXUă).

rm
PRGHODUHDIHQRPHQHORUGHDúWHSWDUHGHQXPLWH³FR]L´ y Probabilitatea FDHYHQLPHQWXOVăDSDUăvQWU-o unitate
VDX³úLUXUL´GHDúWHSWDUH ³DúWHSWDUHD´ODFDVHGH GDWăGHWLPS GHYROXPGHDULHHWF HVWHDFHHDúL
PDUFDWODXQVHUYLFHDXWRODXUJHQĠăODVHPDIRUHWF  pentru toate XQLWăĠLOH
y De asemenea, UHSDUWL‫܊‬LD3RLVVRQHVWHIRORVLWăSHQWUX

Fa
y 1XPăUXOGHHYHQLPHQWHFDUHDSDUvQWU-RXQLWDWHGDWă
DDSUR[LPDRGLVWULEXĠLHELQRPLDOăvQFD]XOvQFDUHp de timp (de volum, de arie etc.) este independent de
(sau q DUHRYDORDUHIRDUWHPLFăúLn este mare. QXPăUXOGHHYHQLPHQWHFDUHDSDUvQFHOHODOWHXQLWăĠL

188 189

de
5HSDUWL‫܊‬LD3RLVVRQ– P(ߣ) 5HSDUWL‫܊‬LD3RLVVRQ– P(ߣ)
'LVWULEX‫܊‬LDGHSUREDELOLWDWH a Caracteristici numerice
te
y 'LVWULEXĠLD3RLVVRQHVWHGHWHUPLQDWăGHXQVLQJXUSDUDPHWUX: ߣ y Media SHQWUXRYDULDELOăDOHDWRDUH3RLVVRQX este:
(media variabilei )LHRYDULDELOăX ce ia valori discrete 0, 1, 2,
..., n, într-XQLQWHUYDOFRQWLQXX6HVSXQHFăYDULDELOD;XUPHD]ă
P O
lta

o lege Poisson atunci când probabilitatea pentru care X = k este y Dispersia SHQWUXRYDULDELOăDOHDWRDUH3RLVVRQX este:
GDWăde:
P X k e O
˜
Ok V2 O
k! Aproximarea legii binomiale printr-o lege Poisson:
cu

y O = PHGLDQXPăUXOXLGHHYHQLPHQWHvQWU-RDQXPLWăSHULRDGă y Când p HVWHPLFúLn este mare, legea Poisson


de timp; FRQVWLWXLHREXQăDSUR[LPDUHDOHJLLELQRPLDOH
y e = 2,71828... y ÌQDFHVWFD]VHIRORVHúWHFDSDUDPHWUXDOOHJLL
Fa

y 5HSUH]HQWDUHVXEIRUPăPDWULFLDOă 3RLVVRQVSHUDQĠDPDWHPDWLFăDOHJLLELQRPLDOH
O np
190 191
Matematică și Biostatistică

5HSDUWL‫܊‬LD3RLVVRQ– P(ߣ) 5HSDUWL‫܊‬LD3RLVVRQ– P(ߣ)

e
Pentru FDOFXOXOYDORULORUUHSDUWL‫܊‬LHL3RLVVRQVHSRDWH 5HSDUWL‫܊‬ia Poisson apare în multiple VLWXD‫܊‬Li, ca de

i
IRORVLIXQFĠLDVWDWLVWLFăGLQExcel: exemplu:

ac
POISSON.DIST(X,mean,cumulative)
y dă probabilită‫܊‬ile unui număr specificat de chemări telefonice
y X (VWHQXPăUXOGHevenimente; într-un anumit timp;

rm
y mean (Media) Este YDORDUHDQXPHULFăD‫܈‬WHSWDWă
y dă probabilită‫܊‬ile unui număr specificat de defecte pe o unitate
de lungime a unui fir;
y cumulative Este RYDORDUHORJLFăFHGHWHUPLQăIRUPD
y dă probabilită‫܊‬ile unui număr specificat de defecte pe o unitate
UHSDUWL‫܊‬LHLGHSUREDELOLWDWHUHWXUQDWă'DFăcumulativ este de arie a unei ‫܊‬esături;
TRUE, POISSON.DIST întoarce probabilitatea Poisson

Fa
y dă probabilită‫܊‬ile unui număr specificat de bacterii pe unitatea de
FXPXODWLYăFăQXPăUXOGHHYHQLPHQWHvQWkPSOăWRDUHFDUH volum într-o VROX‫܊‬H;
YRUDSăUHDYDILFXSULQVvQWUH‫܈‬L[inclusiv, P{X ”x}. În
y dă probabilită‫܊‬ile unui număr specificat de accidente pe unitatea
cazul FALSE, va returna probabilitatea Poisson Fă QXPăUXO de timp.
GHHYHQLPHQWHDSăUXWHYDILH[DFWx, P{X = x}
192 193

de
5HSDUWL‫܊‬LD3RLVVRQ– P(ߣ)
Exemplu a
te
8% din recipientele cu materie primă sunt rebutate. Biostatisctică
Care este probabilitatea ca din 20 de recipiente 2
lta

să fie rebutate?
6ROX‫܊‬LH VARIABILE ALEATOARE CONTINUE
p=0.08, n=20. 5(3$57,‫܉‬,,&217,18(
cu

Folosind reparti‫܊‬ia Poisson pentru O np 0.16 • 5HSDUWL‫܊‬LD1RUPDOă


1.6 2 • 5HSDUWL‫܊‬LD)LVKHU-Snedecor
P X 2 e 1.6 ˜ 0.258
2! • 5HSDUWL‫܊‬LD+L-SăWUDW ߯ ଶ )
Fa

=POISSON.DIST(2,1.6,FALSE) • 5HSDUWL‫܊‬LD6WXGHQW

194 Curs 8 195


Matematică și Biostatistică

Variabile aleatoare continue


Variabile aleatoare continue

e
y f(x) reprezintã densitatea de UHSDUWLрLH, care poate fi
y În cazul variabilelor aleatoare continue, definitã ca primã derivatã GDFmH[LVWm DIXQFĠLHLGH

i
FRQVWUXLUHDXQXLWDEORXDOUHSDUWLĠLHLnu este

ac
UHSDUWLĠLHF(x) adicã:
realizabilã deoarece existã o infinitate de valori F ( x  'x)  F ( x)
f ( x) lim F c( x)
posibile. 'xo0 'x
y În aceste cazuri pentru a putea analiza úLUXULOH de

rm
valori se utilizeazã IXQFĠLD de UHSDUWLĠLH.
y &RQVWUXFĠLD ei implicã determinarea SUREDELOLWmĠLL
evenimentului X<x. Expresia ei va fi definitã de

Fa
integrala: Graficul GHQVLWmĠLL de probabilitate Reprezentarea elementului de probabilitate.

x x Mãrimea f(x)dx se QXPHúWHelement de probabilitate úLUHSUH]LQWm


F ( x) P( X  x) ³ f
f ( x)dx ³
f
F c( x)dx probabilitatea ca valoarea variabilei aleatoare sã se gãseascã în
intervalul ds. Aceastã probabilitate este egalã cu aria dreptunghiului
196 elementar cu baza egalã cu ds. 197

de
Variabile aleatoare continue Variabile aleatoare continue
y Expresia P(X<x) se FLWHúWH probabilitatea ca X sã fie cel
mult egal cu x. a 3URSULHWăĠLOHIXQFĠLHLGHUHSDUWLĠLH
y F (f) 0
te
y Dacã GVĺ0, aria dreptunghiului tinde spre zero, cea ce ne f
duce la concluzia FmSUREDELOLWDWHDREĠLQHULLXQHLYDORULx y F (f) ³ f ( x)dx 1
este egalã cu zero, deci ar fi un eveniment imposibil. f
lta

y Deoarece o astfel de concluzie este paradoxalã trebuie, y F ( x1 ) d F ( x2 )


HYLGHQĠLDWmGHILQLĠLDSUREDELOLWmĠLLFDUHQHFRQGXFHODR y Fie intervalul [a, b], probabilitatea ca o valoare x sã DSDUĠLQm acestui interval,
interpretare care HYLGHQĠHD]m faptul cã IUHFYHQĠD unui respectiv P(a”X<b) este
astfel de eveniment este zero úL nu faptul cã un astfel de
cu

eveniment nu poate avea loc ܲ ܽ ൑ ܺ < ܾ = ‫ ܾ ܨ‬െ ‫)ܽ(ܨ‬

y f(x) nu DUHVHPQLILFDĠLDXQHLSUREDELOOLWăĠLDúDFXPVH ௕ ௔ ௕
SUH]LQWăH[SUHVLD P( x i ) , pentru variabila aleatoare ܲ ܽ ൑ ܺ < ܾ = න ݂ ‫ ݔ݀ ݔ‬െ න ݂ ‫ = ݔ݀ ݔ‬න ݂ ‫ݔ݀ ݔ‬
GLVFUHWăÌQFRQVHFLQĠăVHPQXO൑ sau ൒ folosit la variabila ିஶ ିஶ ௔
Fa

DOHDWRDUHGLVFUHWăYDILvQORFXLWvQJHQHUDOSULQ< sau >


Probabilitatea ca o variabilã sã DSDUĠLQm intervalului [a,b] este
pentru YDULDELODDOHDWRDUHFRQWLQXă SUREDELOLWDWHDHJDOLWăĠLL
HJDOmFXDULDWUDSH]XOXLFXUELOLQLXPăUJLQLWGHD[Dx, FXUEDGHQVLWmĠLLGH
ILLQGQXOă UHSDUWL‫܊‬LHf(x) úLGUHSWHOHx=a úLx=b.
198 199
Matematică și Biostatistică

Variabile aleatoare continue


5HSDUWL‫܊‬LD1RUPDOă~N(ߤ, ߪ ଶ )

e
Caracteristici numerice
• 5HSDUWL‫܊‬LD QRUPDOă FXQRVFXWăúLVXEQXPHOHGH

i
y Media 5HSDUWL‫܊‬LD Gauss-Laplace sau popular sub

ac
Valoarea medie (sau YDORDUHDDúWHSWDWă) a lui x este numele de “clopotul lui Gauss”) este una din cele
f PDLUăVSkQGLWHúLutilizate UHSDUWL‫܊‬LL
E >x @ P ³ x ˜ f ( x)dx

rm
f
y 9DULDQрDVDXGLVSHUVLD • Numeroase IHQRPHQHúLSURFHVHQDWXUDOH
economice sau sociale pot fi modelate de
> @ ³ x  P ˜ f ( x)d
 f

D>x @ V 2 M x  P
2 2

reparti‫܊‬LDQRUPDOă

Fa
f

y Abaterea standard
 f • 5HSDUWL‫܊‬LDQRUPDOăHVWHRIXQFĠLHSDUDPHWULFă
V V ³ x  P ˜ f ( x)d VLPHWULFăGHILQLWăSHPXOĠLPHD4
2 2

f
200 201

de
5HSDUWL‫܊‬LD1RUPDOă~N(ߤ, ߪ ଶ ) 5HSDUWL‫܊‬LD1RUPDOă~N(ߤ, ߪ ଶ )
Fie o variabilă X ={x1, ..., xn} care urmează o lege normală ȝ9 ߪ ଶ
a 3URSULHWăĠLDOHGLVWULEXĠLHLQRUPDOH:
te
y RGLVWULEXĠLHQRUPDOăHVWHVLPHWULFăvQUDSRUWFXRUGRQDWD
'HQVLWDWHDGHUHSDUWL‫܊‬LH valorii [ ȝ; de asemenea, ȝ 0H 0R
2
y pentru RGLVWULEXĠLHQRUPDOăFkQG[WLQGHOD±’IXQFĠLDf(x)
1 § xP ·
WLQGHOD]HUR DPSOLWXGLQHDYDULDELOHLHVWHLQILQLWă
lta
¨ ¸
f x
1 2© V ¹
e y f(x) HVWHPD[LPăSHQWUX[ ȝúLVHGLPLQXHD]ăSHPăVXUă
V 2S
FHYDORULOHYDULDELOHLVHGHSăUWHD]ăGHPHGLH
y curba GHQVLWăĠLLGHUHSDUWL‫܊‬LHf(x) are puncte de inflexiune
când [ ȝ± ı.
cu

)XQF‫܊‬LDGHUHSDUWL‫܊‬LH
y o GLVWULEXĠLHQRUPDOăHVWHXQLFGHWHUPLQDWăGHPHGLHúLGH
1 § t P ·
¨ ¸
YDULDQĠă;a1 ȝı2)
F x
1 x
V ¹
P( X  x ) y suma VDXGLIHUHQĠD DGRXăYDULDELOHDOHDWRDUH

³e dt
Media: ߤ V 2S f
independente X1 úL;2 FHXUPHD]ăOHJLQRUPDOH1 ȝ1ı21)
Fa

9DULDQ‫܊‬D:ߪ ଶ úL1 ȝ2ı22), XUPHD]ăWRWROHJHQRUPDOă:


f(xi) se calculeaza cu functia: =NORM.DIST(xi, ȝıFALSE) ;a1 ȝ1±ȝ2ı21ı22)
F(xi) = P(x < xi) se calculeaza cu functia: =NORM.DIST(xi, ȝıTRUE)
202 203

xi se calculeaza cu functia: =NORM.INV(F(xi), ȝı


Matematică și Biostatistică

5HSDUWL‫܊‬LD1RUPDOă6WDQGDUG~N(0, 1) 5HSDUWL‫܊‬LD1RUPDOă6WDQGDUG~N(0, 1)

e
Fie o variabilă Z ={z1, ..., zn} – YDULDELOăFHQWUDWăUHGXVă

i
• O YDULDELOă aleatoare, X, normal UHSDUWL]DWă xi  x

ac
cu media úL GHYLDĠLD standard diferite de 0 zi
V
respectiv 1, poate fi WUDQVIRUPDWă într-o 'HQVLWDWHDGHUHSDUWL‫܊‬LH
UHSDUWL‫܊‬LH QRUPDOă standard, Z, astfel: z2

rm
1 2
f z e
X x 2S
Z
V )XQF‫܊‬LDGHUHSDUWL‫܊‬LH

Fa
t2
5HSDUWLĠLDQRUPDOăVWDQGDUGL]DWă, cu media 0 úL Media: 0 F z
1 z
³e

2 dt
abaterea standard 1. 9DULDQ‫܊‬D:1 2S f

N x; P , V o N z;0,1 f(zi) se calculeaza cu functia: =NORM.S.DIST(zi,FALSE)


204
F(zi) = P(z < zi) se calculeaza cu functia: =NORM.S.DIST(zi, TRUE)
205

de
zi se calculeaza cu functia: =NORM.S.INV(F(zi))

5HSDUWL‫܊‬LD1RUPDOă6WDQGDUG~N(0, 1)
5HSDUWL‫܊‬LD1RUPDOă6WDQGDUG~N(0, 1)
a Utilizând PHWRGD GH WUDQVIRUPDUH D XQHL GLVWULEXĠLL QRUPDOH X
într-R UHSDUWL‫܊‬LH Z Vă SRDWH DIOD QXPăUXO XQLWăĠLORU GLQ FROHFWLYLWDWH
te
dintr-un interval.
lta
cu
Fa

206 207
Matematică și Biostatistică

5HSDUWL‫܊‬LD1RUPDOă6WDQGDUG~N(0, 1)
-
5HSDUWL‫܊‬LD1RUPDOă6WDQGDUG~N(0, 1)

e
y 3HQWUXFDOFXOXOXQRUSUREDELOLWăĠLSHED]DIXQFĠLHLGHUHSDUWLĠLHVH

i
XWLOL]HD]ăIXQFĠLD/DSODFHDOHFăUHLYDORULFDOFXODWHVHSRWREĠLQH

ac
din tabelele Gauss-Laplace.
y )XQFĠLD/DSODFHHVWHGHILQLWăGHUHODĠLD:
t2

) z
1 z
³e 2

rm
dt
2S 0
3URSULHWăĠLOHIXQFĠLHLOXL/DSODFH:
- Ȱ (0) = 0

Fa
- Ȱ(-z) = - Ȱ(z)

- ) z F z  2
1

- zolimr f ) z r 2
1
Densitatea de UHSDUWL‫܊‬LHa variabilei z.

- P(-]”=”]) = 2 Ȱ(z). 208 209

de
5HSDUWL‫܊‬LD hi-SăWUDW(࣑2) 5HSDUWL‫܊‬LD hi-SăWUDW(࣑2)
Caracteristici numerice ale legii Ȥ2(Ȟ):
Fie variabilele independente X1, X2, ..., XȞ, distribuite
GXSă R OHJH QRUPDOă VWDQGDUG vQ DFHVWH FRQGLĠLL YDULDELOD
a media:
YDULDQĠD
E(Ȥ2) = Ȟ
V(Ȥ2  ÂȞ
te
aleatoare:
2EVHUYDĠLH: )RUPDDFHVWHLOHJLGHSLQGHGHQXPăUXOGHJUDGHGH
F2 X 12  X 22  ...  X Q2
libertate astfel:
XUPHD]ă R GLVWULEXĠLH KL-SăWUDW FX Ȟ JUDGH GH OLEHUWDWH QRWDWă - GDFăȞ = 1 sau Ȟ = 2 atunci densitatea de probabilitate este o
lta
prin Ȥ2(Ȟ). fuQFĠLHGHVFUHVFăWRDUH
- GDFăȞ •DWXQFLJUDILFXOHVWHVXEIRUPDXQXLFORSRWPDLPXOW
Densitatea de UHSDUWL‫܊‬LH VDXPDLSXĠLQVLPHWULFvQIXQFĠLHGHPăULPHDOXLȞ (cu cât Ȟ este mai
I5ĺ>@ mare cu atât graficul este mai simetric)
­
cu

Q
- GDFă Ȟ •  DWXQFL JUDILFXO IXQFĠLHL se apropie de cel al
x
1 1 
° Q ˜ x 2 ˜ e 2 pentru x ! 0
° 2 §Q· UHSDUWLĠLHLQRUPDOH
f (x) ® 2 ˜ *¨ ¸
° ©2¹
°0 pentru x d 0
¯
Fa

unde:
f
* a ³x
a 1
˜ e  x dx
; a > 0 este integrala Gamma a lui Euler.
210 211
0
Forme ale legii Ȥ2(Ȟ GXSăGLIHULWHJUDGHGHOLEHUWDWH
Matematică și Biostatistică

5HSDUWL‫܊‬LD hi-SăWUDW(࣑2) 5HSDUWL‫܊‬LD hi-SăWUDW(࣑2)

e
=CHISQ.DIST.RT(x,deg_freedom) =CHISQ.INV(probability, deg_freedom)
sau sau

i
=CHIDIST(x,deg_freedom) =CHIINV(probability, deg_freedom)

ac
5HWXUQHD]ăinversa IXQF‫܊‬LHLGHUHSDUWL‫܊‬LHF DOXQJLWăODGUHDSWD 'DFăS 
CHIDIST(x,...), atunci CHIINV(p,...) = x

rm
Fa
5HWXUQHD]ăprobabilitatea pentru hi-SăWUDW, XQGHRYDORDUHQXPHULFă [ HVWH
RYDORDUHFDOFXODWăDOXL࣑2 pentru care se vor calcula SUREDELOLWă‫܊‬LOH.
212 213

de
5HSDUWL‫܊‬LDhi-SăWUDW(࣑2) 5HSDUWL‫܊‬LDFisher-Snedecor F(ࣇ1, ࣇ2)

Domenii de utilizare a legii Ȥ (Ȟ): 2


a )LH GRXă YDULDELOH DOHDWRDUH LQGHSHQGHQWH ; úL < FDUH XUPHD]ă
UHSDUWL‫܊‬LLOH Ȥ2(Ȟ1), respectiv Ȥ2(Ȟ2); raportul:
te
X
Q1
x FRQVWUXLUHD WHVWHORU GH FRQFRUGDQĠă vQ DMXVWDUHD F
Y
Q2
XQHLGLVWULEXĠLLHPSLULFHSULQXQDWHRUHWLFă
lta

GHILQHúWH YDULDELOD DOHDWRDUH VFRUXO  )LVKHU FX Ȟ1 úL Ȟ2 grade de


x WHVWDUHD VHPQLILFDĠLHL SDUDPHWULORU IXQFĠLHL GH libertate.
'HQVLWDWHDGHUHSDUWL‫܊‬LHI5ĺ>@
regresie; ­ Q1 Q 2
° Q12 ˜ Q 22
Q1
1 Q1  Q 2
˜ Q 2  Q1 ˜ x
cu


° §Q Q ˜x 2 2 pentru x ! 0
·
x WHVWDUHD LQGHSHQGHQĠHL D GRXă FDUDFWHULVWLFL f (x) ® B¨ 1 , 2
° © 2 2
¸
¹
°
¯0 pentru x d 0
calitative;
unde: B a, b 1  x
1
a 1 b 1
³x dx ; a > 0, b > 0 este integrala Beta a lui Euler.
Fa

0
x în construirea intervalelor de încredere pentru
parametrii unui model;
214 215

Densitatea de UHSDUWL‫܊‬LHDGLVWULEXĠLHL)LVKHU
Matematică și Biostatistică

Reparti‫܊‬LDFisher-Snedecor F(ࣇ1, ࣇ2) Reparti‫܊‬LDFisher-Snedecor F(ࣇ1, ࣇ2)

e
=F.DIST(x,deg_freedom1, deg_freedom2)
Caracteristici nummerice ale legii F(Ȟ1, Ȟ2):

i
X Valoarea la care Vă se evalueze IXQF‫܊‬LD

ac
- media:
deg_freedom1 Gradele de libertate pentru QXPăUăWRU
Q2
M (F) , deg_freedom 2 Gradele de libertate pentru numitor
Q 2  2 GDFăȞ2 > 2
- YDULDQĠD

rm
2 ˜ Q 22 ˜ Q1  Q 2  2
V(F)
Q1 ˜ Q 2  2 Q 2  4 GDFăȞ2 > 4
2

Fa
Domenii de utilizare a legii F(Ȟ1, Ȟ2):
- VH XWLOL]HD]ă FHO PDL DGHVHD SHQWUX FRQVWUXLUHD WHVWHORU Densitatea de UHSDUWL‫܊‬LH pentru
diferite valori ale lui ࣇ1, ࣇ2
statistice SHQWUXDQDOL]DYDULDQĠHLúLDFRYDULDQĠHL
216 217

de
Reparti‫܊‬LDFisher-Snedecor F(ࣇ1, ࣇ2)
Reparti‫܊‬LD6WXGHQW– GLVWULEXĠLDW

a )LHGRXăYDULDELOHDOHDWRDUH;úL<'DFă;DUHUHSDUWL‫܊‬LDȤ2(Ȟ)
te
cu Ȟ JUDGH GH OLEHUWDWH LDU < DUH R UHSDUWL‫܊‬LH QRUPDOă VWDQGDUG
atunci variabila aleatoare:
Y
t
lta
X
Q
GHILQHúWHRUHSDUWL‫܊‬LH Student (sau t) cu Ȟ grade de libertate.
'HQVLWDWHDGHUHSDUWL‫܊‬LH
I5ĺ>@
cu

§ Q 1· Q 1
*¨ ¸ 
© 2 ¹ ˜ §¨1  x ·¸ 2
2
f (x)
§Q· ¨ Q ¸¹
Q ˜ S ˜ *¨ ¸ ©
=F.INV(probability,deg_freedom1,deg_freedom2) ©2¹
Fa

probability Probabilitatea DVRFLDWăFXIXQF‫܊‬LDGHUHSDUWL‫܊‬LHF unde:


deg_freedom1 Gradele GHOLEHUWDWHDOHQXPăUăWRUXOXL f
* a ³x
a 1
˜ e  x dx , a > 0 este integrala Gamma a lui Euler.
deg_freedom2 Gradele de libertate ale numitorului. 0

218 219
F.INV(0.05,3,60) Fcr = 2,758
Matematică și Biostatistică

Reparti‫܊‬LD6WXGHQW– GLVWULEXĠLDW Reparti‫܊‬LD6WXGHQW– GLVWULEXĠLDW

e
2EVHUYDĠLH'HQVLWDWHDGHUHSDUWL‫܊‬LH are =TDIST(x,deg_freedom,tails)
graficul sub forma unui clopot simetric. Forma

i
JUDILFXOXLHVWHGHWHUPLQDWăGHQXPăUXOJUDGHORU x este YDORDUHDQXPHULFăODFDUHYDILHYDOXDWăUHSDUWL‫܊‬LD

ac
de libertate. Cu cât Ȟ este mai mic cu atât curba deg_freedom QXPăUXOgradelor de libertate.
HVWHPDLDSODWL]DWă'DFă Q ! , graficul curbei Tails
6WXGHQWWLQGHFăWUHJUDILFXOUHSDUWLĠLHLQRUPDOH.
Caracteristici numerice: y 'DFătails 7',67vQWRDUFHRUHSDUWL‫܊‬LHuniODWHUDOă.
y 'DFătails 7',67vQWRDUFHUHSDUWL‫܊‬LDbiODWHUDOă.

rm
- media: M (t ) 0
Q
- YDULDQĠD V (t)
Q2
GDFăȞ > 2
Definirea legii Student depinde de QXPăUXOJUDGHORUGHOLEHUWDWH, care este:
Q n - 1 XQGHQHVWHQXPăUXOREVHUYDĠLLORU
.

Fa
Domenii de utilizare:
x 5HSDUWL‫܊‬LD6WXGHQWHVWHIRORVLWăvQGHVFULHUHDGLVWULEXĠLLORUGHVHOHFĠLHvQ
FD]XO HúDQWLRDQHORU GH YROXP PLF Q    vQ GHRVHEL SHQWUX
verificarea ipotezelor statistice cu SULYLUH OD PHGLD XQHL SRSXODĠLL
QRUPDOHFkQGSDUDPHWUXOıHVWHQHFXQRVFXW TDIST(x, ࣇ,1) = aria KDúXUDWă TDIST(x, ࣇ,2) = aria KDúXUDWă
220 221

de
Reparti‫܊‬LD6WXGHQW– GLVWULEXĠLDW $SOLFD‫܊‬LL9HULILFDUHDQRUPDOLWă‫܊‬LLXQHLGLVWULEX‫܊‬LL
=T.INV(probability,deg_freedom)
a Dreapta Henry
te
Ä'UHSWD +HQU\´ SHUPLWH YHULILFDUHD QRUPDOLWăĠLL XQHL
O YDORDUHWXQLODWHUDOăSRDWHIL GLVWULEXĠLL úL VH ED]HD]ă SH IDSWXO Fă  UHSUH]HQWDUHD JUDILFă D
vQWRDUVăvQORFXLQGSUREDELOLWDWHDFX x x
2*probabilitate. punctelor de coordonate (xi, zi), unde z i i s HVWHRGUHDSWă
lta

Pentru RSUREDELOLWDWHGH‫܈‬L 9HULILFDUHDQRUPDOLWăĠLLXWLOL]kQG„dreapta Henry” presupune


grade de libertate 10, valoarea XUPăWRDUHOHHWDSH
ELODWHUDOăHVWHFDOFXODWăFX a) calcularea efectivelor cumulate Ni pentru fiecare valoare „i”
T.INV(0,05;10), care întoarce a carDFWHULVWLFLL ; ĠLQkQG FRQW GH IUHFYHQĠHOH DEVROXWH
cu

9DORDUHDXQLODWHUDOăSHQWUX FRUHVSXQ]ăWRDUHQi
DFHHD‫܈‬LSUREDELOLWDWH‫܈‬LJUDGHGH b) calcularea valorile pi SRQGHUHDHIHFWLYHORUFXPXODWHÄSkQă
OLEHUWDWHSRDWHILFDOFXODWăFX N
OD´RDQXPLWăYDORDUH[i vQWRWDOXOSRSXODĠLHL  p i ni IUHFYHQĠHOH
T.INV(2*0,05;10), care întoarce
Fa

reale cumulate, unde n = efectivul total.


1,812462.
c) aflarea valorile zpi FRUHVSXQ]ăWRDUH ILHFăUHL YDORUL pi
utilizând tabelul Gauss
222 223
Matematică și Biostatistică

$SOLFD‫܊‬LL9HULILFDUHDQRUPDOLWă‫܊‬LLXQHLGLVWULEX‫܊‬LL $SOLFD‫܊‬LL9HULILFDUHDQRUPDOLWă‫܊‬LLXQHLGLVWULEX‫܊‬LL

e
Testul Jarque-Bera
d) calcularea pe baza valorilor úLVDOHGLVWULEXĠLHLREVHUYDWHDYDORULORU
x 3HQWUXRGLVWULEXĠLHQRUPDOăFRHILFLHQWXOGHDVLPHWULH Ȗ1) este egal cu 0, iar
x
xi  x
FRHILFLHQWXO GH EROWLUH ȕ2  HVWH HJDO FX  FX DOWH FXYLQWH R GLVWULEXĠLH

i
zi
s
QRUPDOăHVWHVLPHWULFă úLPH]RFXUWLFă.

ac
H  UHSUH]HQWDUHD JUDILFă D SXQFWHORU GH FRRUGRQDWH [i, zi) - „dreapta
x Testul Jarque-Bera FHUH Vă VH YHULILFH GDFă YDORULOH FDOFXODWH DOH
Henry”
FRHILFLHQWXOXL GH DVLPHWULH úL DOH FRHILFLHQWXOXL GH EROWLUH VH DEDW GH OD
I SHDFHODúLJUDILFVHUHSUH]LQWăJUDILFSXQFWHOHGHcoordonate (xi, zpi) valoarea 0, respectiv 3.
2

1.5
6WDWLVWLFDXWLOL]DWăHVWHGHILQLWGHUHODĠLD:

rm
1

0.5
ª J 2 (E  3) 2 º

zi (zpi)
0

-0.5
175 200 225 250 275 JB n˜« 1  2 »
-1 ¬6 24 ¼
-1.5

Statistica JB XUPHD]ăROHJHȤ2 cu GRXăJUDGHGHOLEHUWDWH, JB ~ F Q 2 .


-2 xi
2

Dreapta lui Henry. Regula de decizie:


J VHFRPSDUDUHDGLVWULEXĠLDSXQFWHORU [i, zpi) cu „dreapta Henry”

Fa
- GDFă probabilitatea FRUHVSXQ]ăWRDUH YDORULL FDOFXODWH D VWDWLVWLFLL -% HVWH
Regula de decizie: VXSHULRDUăOXLĮDWXQFLVHDFFHSWăLSRWH]D+0 de normalitate
- FkQG SXQFWHOH VH GHVIăúRDUă vQ MXUXO ÄGUHSWHL +HQU\´  VH DFFHSWă
- GDFăvaloarea FDOFXODWăDVWDWLVWLFLLvQGHSOLQHúWHFRQGLĠLD JB  F Q
2
2 pentru
ipoteza de normalitate
RYDORDUHĮDGPLVăDWXQFLVHDFFHSWăLSRWH]D+0 de
- FkQGSXQFWHOHVHGHSăUWHD]ăGH„dreapta Henry” se respnge ipoteza de normalitate
normalitate
224 225

de
(úDQWLRQDUH . Probleme ale (úDQWLRQăULL

a E‫܇‬ANTIONARE: selec‫܊‬ia unei por‫܊‬iuni din popula‫܊‬ie care e


te
reprezentativă pentru caracteristica de interes a
Biostatistică popula‫܊‬iei.
lta

• Nu se poate investiga întreaga SRSXODĠLH; (nepractic: timp


îndelungat, costuri mari, popula‫܊‬ii care nu pot fi numărate)
Estima‫܊‬LL
Testarea ipotezelor statistice • Se FRQVLGHUă un HúDQWLRQ: se FDOFXOHD]ă media
HúDQWLRQXOXL. Ne DúWHSWăP ca media HúDQWLRQXOXL Vă fie
cu

Teste statistice:Testul Student, Testul ߯ ଶ rezonabil de aproape de media SRSXODĠLHL.

• 5HSDUWL‫܊‬LDGHH‫܈‬DQWLRQDUHne permite Vă HYDOXăP cât de


aproape este valoarea statisticii HúDQWLRQXOXL de valoarea
Fa

parametrului SRSXODĠLHL.

Curs 9 226 227


Matematică și Biostatistică

(úDQWLRQDUH. Probleme ale (úDQWLRQăULL (úDQWLRQDUH . Probleme ale (úDQWLRQăULL

e
y 3RSXODĠLD ĠLQWă - SRSXODĠLD pentru care vrem y E‫܈‬antionarea aleatorie VLPSOă

i
y Un HúDQWLRQ aleatoriu simplu este un HúDQWLRQ în care
Vă facem LQIHUHQĠH

ac
fiecare membru al SRSXODĠLHL este la fel de probabil de a
fi inclus.
y 3RSXODĠLD HúDQWLRQDWă - SRSXODĠLD din care y Metoda presupune identificarea ILHFăUXL membru al
SRSXODĠLHL úL alegerea aleatorie a acestora.
extragem de fapt HúDQWLRDQH

rm
y E‫܈‬antionarea aleatorie VWUDWLILFDWă
y Un HúDQWLRQ aleatoriu stratificat se REĠLQH prin separarea
SRSXODĠLHL în seturi reciproc exclusive (sau straturi) úL
apoi H[WUăJkQG HúDQWLRDQH aleatorii simple din fiecare
Problema HúDQWLRQăULL: set (strat).

Fa
Este SRSXODĠLD ĠLQWă DFHHDúL cu SRSXODĠLD y E‫܈‬antionarea de grupuri
y Un HúDQWLRQ de grupuri este un HúDQWLRQ aleatoriu simplu
HúDQWLRQDWă? a unor grupuri de elemente.
228 229

de
(úDQWLRQDUHD aleatorie VLPSOă in Excel ,QIHUHQ‫܊‬ă6WDWLVWLFă
a
y Pentru extragerea unui întreg situat între a si b: Obiectivul (problema)
te
RANDBETWEEN(bottom, top)
Tipul de date y Descrierea unei singure
y Pentru extragerea unui număr situat în intervalul [0, 1]: SRSXODĠLL
lta

RAND () • cantitative
y Compararea a GRXă
y Pentru extragerea unei serii de N numere din una dintre • calitative SRSXODĠLL
mai multe variante de distribu‫܊‬ii,
cu

• ordinale. y Compararea a GRXă sau


DATA >> DATA ANALYSIS >> Random Number Generation mai multor SRSXODĠLL
y Pentru extragerea unui e‫܈‬antion dintr-o populatie: y Analiza UHODĠLHL între GRXă
Fa

DATA >> DATA ANALYSIS >> Sampling sau mai multor variabile
LA FIECARE RECALCULARE A FOII DE CALCUL, VALORILE
SUNT GENERATE DIN NOU !
230 231
Matematică și Biostatistică

,QIHUHQ‫܊‬ă6WDWLVWLFă5HSDUWL‫܊‬LDGH
,QIHUHQ‫܊‬ă6WDWLVWLFă sondaj a mediei

e
ESANTION POPULA‫܉‬IA STATISTICĂ
y 6HFRQVLGHUăRSRSXODĠLHVWDWLVWLFăúLRFDUDFWHULVWLFăFRQWLQXă X.
(STATISTICĂ) (PARAMETRU)

i
y Fie M(X) = ߤ úL'2(X) = ߪ ଶ . 5HSDUWLĠLDYDULDELOHL;HVWH

ac
n N
QHFXQRVFXWă GHFLQXVXQWFXQRVFXWHߤ,ߪ, IRUPDGLVWULEXĠLHLVDX
MEDIA:
¦x n i i ¦x n i i
numai unele dintre aceste atribute).
X i 1
P i 1
n N y Din SRSXODĠLDUHVSHFWLYăVHH[WUDJHXQHúDQWLRQGHYROXPQILH
acesta x1, x2, …, xnúLVHFDOFXOHD]ăPHGLDDULWPHWLFăx . Este

rm
¦ x
n N

¦ x  P
2
i X
i
2
HYLGHQWFăVHGRUHúWHFDDFHDVWăYDORDUHVăILHXWLOL]DWăGUHSW
DISPERSIA s 2 i 1
V2 i 1 HVWLPDĠLHDPHGLHLSRSXODĠLHLߤ.
n 1
N y 5HSDUWLĠLDde sondaj a mediei HVWHFDUDFWHUL]DWăGH

Fa
ABATEREA
s s2 V V2
STANDARD

COEFICIENTUL s V
cv CV
DE VARIATIE X 232 P 233

de
,QIHUHQ‫܊‬ă6WDWLVWLFă5HSDUWL‫܊‬LDGH
sondaj a mediei ,QIHUHQ‫܊‬ă6WDWLVWLFă
)RUPDUHSDUWLĠLHLGHVRQGDMDPHGLHLHVWH GHWHUPLQDWă a • Estimarea
te
de rezultatele:
¾ Determinarea parametrului unei
y GDFăX HVWHUHSDUWL]DWăQRUPDODWXQFLPHGLDde sondaj popula‫܊‬ii pe baza statisticii unui
lta

HVWHUHSDUWL]DWăGHDVHPHQHDQRUPDOcu parametrii
SUHFL]DĠL mai sus, indiferent de volumul HúDQWLRQXOXL e‫܈‬antion
y GDFăQXVHFXQRDúWHUHSDUWLĠLDOXLX, atunci teorema
OLPLWăFHQWUDOă DILUPăFăUHSDUWLĠLDde sondaj a mediei
GHYLQHQRUPDOăODOLPLWăpentru un volum mare al • Testarea ipotezelor statistice
cu

HúDQWLRQXOXL.
¾ Scop: a determina dacă există
y PracticVHSRDWHDFFHSWDRUHSDUWLĠLHܰ ߤ,
ఙమ suficientă eviden‫܊‬ă statistică pentru a

sus‫܊‬ine o anumită afirma‫܊‬ie făcută
Fa

ƒ pentru Q!GDFăUHSDUWLĠLDOXL;HVWHaproape VLPHWULFă,


sau despre un parametru al popula‫܊‬iei
ƒ pentru Q!vQUHSDUWLĠLLFXDVLPHWULHSURQXQĠDWăsau
QHFXQRVFXWă.
234
statistice 235
Matematică și Biostatistică

(VWLPD‫܊‬LL
,QIHUHQ‫܊‬ă6WDWLVWLFă y Deoarece aprecierea erorilor de estimare posibile, în cazul

e
y Estimare úL estimator HVWLPDĠLLOH punctuale, este suficient de laborioasă s-a încercat

i
dezvoltarea unei metode care să SXQă accentul pe
¾ Estimarea este calcularea unei valori specifice a

ac
estimatorului. SUREDELOLWăĠile de DSDULĠLH ale erorilor. Această metodăJHQHULFă
este metoda GHWHUPLQăULL intervalelor de încredere sau metoda
¾ Exemplu: Media HúDQWLRQXOXL este un estimator al mediei
SRSXODĠLHL. Când FDOFXOăP valoarea mediei HúDQWLRQXOXL, de estimare sub formă de interval.
acea valoare UHSUH]LQWă o estimare a mediei SRSXODĠLHL.

rm
y Estimator punctual - UHDOL]HD]ă LQIHUHQĠH despre o SRSXODĠLH y Fie o populaĠie statistică FDUDFWHUL]DWă de o v.a. continuă X a
prin estimarea valorii unui parametru necunoscut utilizând o FăUHL UHSDUWLĠLH depinde de un parametru G, necunoscut.
VLQJXUă valoare sau un punct. Problema este ca, pornind de la datele de sondaj ale unui
y Estimator al unui interval - UHDOL]HD]ă LQIHUHQĠH despre o HúDQWLRQ de volum n, să se determine două limite între care

Fa
SRSXODĠLH prin estimarea unui interval de YDULDĠLH în care este valoarea parametrului G Vă se afle cu o probabilitate fixată
probabil ca valoarea parametrului Vă se afle.
Adică Vă se determine două statistici, G1 úL G2, astfel încât
P(G 1  G  G 2 ) p
y Numim eroare de estimare YDORDUHDDEVROXWăDGLIHUHQĠHL dintre
HVWLPDĠLDSXQFWXDOăúLYDORDUHDSDUDPHWUXOXL. unde p este o probabilitate independentă de parametrul G.
236 237

de
(VWLPD‫܊‬LL (VWLPD‫܊‬LL
y Prin definiĠLH GDFă se pot determina G1 úL G2 a y Dacă se repetă procedeul pentru eúDQWLRDQH diferite,
atunci 100(1–D)% dintre intervalele determinate vor
te
FRQĠLQH valoarea QHFXQRVFXWă a parametrului G
astfel încât pentru o valoare D prestabilită (evident Fă nu se va úWL care sunt acele intervale).
(0<D< 1) Vă DLEă loc:
y Apare atunci necesitatea ca D săILHFkWPDLPLFGDU o datăFX
P(G 1  G  G 2) 1  D
lta

y miFúorarea lui D se măUeúte lungimea intervalului, deci erorile


atunci intervalul (G1, G2) se numeúWH interval de de estimare sunt mai mari.
încredere pentru parametrul necunoscut G cu y Uzual se alege D = 0,05 sau D = 0,01.
un coeficient (sau nivel) de încredere egal cu y Dacăatât G1 cât úi G2 sunt finite, atunci intervalul de încredere este
cu

D, sau cu o VLJXUDQĠă statistică SD = 1–D. bilateral.


y În cazul când G1 este -f sau G2 este +f, ceea ce revine, în fapt, la
y Valoarea D se numeúWH nivel (sau prag) de determinarea unei singure
g limite, intervalul este unilateral.
Fa

VHPQLILFDĠLH.

238 239
Matematică și Biostatistică

(VWLPD‫܊‬LL (VWLPD‫܊‬LL
Intervale de încredere pentru valoarea medie

e
Intervale de încredere pentru valoarea medie
y Fie o populaĠie statistică caracterizată de o v.a. X repartizată
normal, cu parametrii P úL V2, X ~ N(P , V 2 ).

i
y Presupunem că s-au REĠLQXW dintr-un eúantion de volum n, media

ac
de sondaj ‫ݔ‬ҧ ‫܈‬Ldispersia de sondaj s2.
)L[ăP pragul de semnificatie D.
y Limitele unui interval de încredere depind atât de eúDQWLRQ cât úL
de cunoa‫܈‬terea sau nu, a dispersiei populaĠLHL.

rm
y Dacă dispersia, V2, este cunoscută intervalul de încredere:
ߪ ߪ
‫ݔ‬ҧ െ ‫ݖ‬ఈΤଶ < Ɋ < ‫ݔ‬ҧ + ‫ݖ‬ఈΤଶ
݊ ݊

y Dacă dispersia, V2 nu este cunoscută ‫܈‬Lߥ<30:

Fa
‫ݏ‬ ‫ݏ‬
‫ݔ‬ҧ െ ‫ݐ‬ఈΤଶ,ఔ < Ɋ < ‫ݔ‬ҧ + ‫ݐ‬ఈΤଶ,ఔ
݊ ݊

'DFĉ QXPĉUXO GHJUDGHGHOLEHUWDWH HVWH > 30, DWXQFL t D SRDWH


IL DSUR[LPDW cu z D .
240 241

de
(VWLPD‫܊‬LL (VWLPD‫܊‬LL
y
Intervale de încredere pentru dispersie
Fie RSRSXODĠLH normală sau aproximativ a y Este frecventăVLWXDĠLDvQ care, pornind de la un eúDQWLRQ de
volum n, cercetăWRUXO este interesat de frecvenĠDUHODWLYă
(exprimată eventual procentual) DFD]XULORUFDUHSUH]LQWăR
te
normală, cu parametrii P úi V2 QHFXQRVFXĠL6H anumită caracteristică
demonstrează căLQWHUYDOXOGHvQFUHGHUHELODWHUDO
y 6LWXDĠLD poate fi formalizată prin considerarea unei v.a. X,
pentru dispersia populaĠLHL cu încrederea
statistică de 1–D, este dat de repartizatăELQRPLDO Bi(n; p), pentru care se consideră
lta

³VXFFHV´SUH]HQĠDFDUDFWHULVWLFLL dorite.
y Pentru cazul eúDQWLRDQHORU mari, sau mai precis cazul în care
se poate aproxima repartiĠLD binomială prin repartiĠLD normală
se demonstrează Fă intervalul de încredere cu siguranĠD
cu

VWDWLVWLFă SD = 1–D este dat de


unde n este volumul eúantionului, s2 este dispersia
௙೙ (ଵି௙೙ ) ௙೙ (ଵି௙೙ )
de sondaj, iar F D / 2;Q úi F 1D / 2;Q sunt valorile ݂௡ െ ‫ݖ‬ఈΤଶ

< ‫݂< ݌‬௡ + ‫ݖ‬ఈΤଶ

repartiĠLHLF2 de ordin D/2, respectiv 1–D cu Q =
Fa

n–1 grade de libertate. unde fn este frecvenĠDUHODWLYăD cazurilor “succes” din eúDQWLRQXO de
volum n, iar zD/2 este valoarea criticăa repartiĠLHL normale standard
pentru Dales.
242 243
Matematică și Biostatistică

Testarea ipotezelor statistice Testarea ipotezelor statistice

e
y Testarea ipotezelor statistice este procedeul prin care Erori de testare:

i
VHSRDWHUHVSLQJHVDXDFFHSWDRLSRWH]ăIăFXWă
y Eroarea de tip I - este eroarea care se face când se

ac
asupra unui parametru VDXDVXSUDXQHLGLVWULEXĠLL
ĠLQkQGFRQWGHDQXPLWHUHJXOLGHGHFL]LH decide respingerea ipotezei nule H0 când în realitate
y ,SRWH]DSHFDUHGRULPVăRWHVWăPVHQXPHúWH DFHDVWDHVWHDGHYăUDWă3UREDELOLWDWHDDVRFLDWăHURULL
LSRWH]DQXOă úLHVWHQRWDWă+0. GHWLS,VHQRWHD]ăFXĮ úLHVWHQXPLWăprag de

rm
H0 nu H[LVWăQLFLRGLIHUHQĠăvQWUHYDORULOHFRPSDUDWH. VHPQLILFDĠLH, sau riscul acceptat în luarea deciziei de
respingere a H0 când H0 HVWHDGHYăUDWă
y Ipoteza SHFDUHGRULPVăRWHVWăPvQRSR]LĠLHFX
y Eroarea de tip II - este eroarea care se face când se
LSRWH]DQXOăVHQXPHúWHLSRWH]DDOWHUQDWLYă úLVH
QRWHD]ăFX+1. decide acceptarea ipotezei nule H0 atunci când

Fa
H1: H[LVWăGLIHUHQĠHîntre valorile comparate. DFHVWDHVWHIDOVă3UREDELOLWDWHDDVRFLDWăHURULLGHWLS
,,HVWHQRWDWăFXȕ úLUHSUH]LQWăriscul acceptat în
y Ipoteza DOWHUQDWLYăHVWHLSRWH]DFDUHRDFFHSWăP OXDUHDGHFL]LHLFă+0 HVWHDGHYăUDWăFkQG+0 este
GDFăSULQUHJXODGHGHFL]LHVHUHVSLQJHLSRWH]DQXOă IDOVă
244 245

de
Testarea ipotezelor statistice
y Regiunea de respingere – sau UHJLXQHDFULWLFă este intervalul în Testarea ipotezelor statistice
a
FDUHVHUHVSLQJHLSRWH]DQXOă+0, considerând ipoteza
DOWHUQDWLYă+1 DGHYăUDWă6HGHILQHúWHvQDFHVWFRQWH[WXQprag a) Stabilirea e‫܈‬antionului (e‫܈‬antioanelor) de lucru
te
critic (inferior Li superior Ls GHODFDUHRHVWLPDĠLHWLQGHVă b) Formularea ipotezelor alternative (H0, H1)
confirme ipoteza H1 úLVăUHVSLQJă+0. Regiunii critice i se
DVRFLD]ăRSUREDELOLWDWHĮFXSULQVăvQJHQHUDOvQWUHúL c) Alegerea testului statistic
d) Specificarea pragului de semnifica‫܊‬ie D= 0.01, 0.05 ,
lta

y Regiunea de acceptare – sau intervalul de încredere este un


interval în care, pe baza unui test, nu se respinge ipoteza H0. 0.1
Regiunii de acceptare a ipotezei H0 LVHDVRFLD]ăRSUREDELOLWDWH e) Definirea regiunii critice (RC)
1 – ĮQXPLWăúLcoeficient de încredere.
f) Calcularea valorii statistice a testului (Zcalc, tcalc)
cu

H0ș ș0 H0ș ș0 H0ș ș0 g) Compararea valorii statistice a testului Zcalc sau tcalc,
H1șș0 H1ș> ș0 H1ș< ș0
cu valoarea critică Zcr, respectiv tcr cu (n–1) grade de
libertate pentru pragul de semnifica‫܊‬ie D ales
Fa

h) Luarea deciziei

246 247
Matematică și Biostatistică

Testarea ipotezelor statistice Testarea ipotezelor statistice. Teste parametrice


e) Definirea regiunii critice (RC) f) Calcularea valorii statistice a testului (Zcalc, tcalc)

e
A. Statistica Z (n > 30, D = 0.05) Ipoteza H0 HVWHVWULFWOHJDWăGHXQparametru al SRSXODĠLHLLDU
y Test unilateral dreapta VWDWLVWLFDWHVWXOXLDUHRUHSDUWLĠLHFXQRVFXWă tocmai GLQDFHDVWă

i
LSRWH]ă

ac
zcr=NORM.S.INV(0.95)=1.645, RC=(1.645,+λ)
y Test unilateral stânga
zcr=NORM.S.INV(0.05)= -1.645, RC=(-λ ,-1.645)
y Test bilateral

rm
zcr=NORM.S.INV(0.975)= 1.96, RC = (-’-1.96)U(1.96’

B. Statistica T (n < 30, D = 0.05)- Valorile critice ale

Fa
reparti‫܊‬iei Student cu Q grade de libertate (Q= n-1), n=15
y Test unilateral
tcr=TINV(2*0.05,14)=1.761, RC=(1.761,+λ), RC=(-λ ,-1.761)
y Test bilateral
tcr=TINV(0.05,14)= 2144, RC = (-’-2.144)U(2.144,
248
’ 249

de
Testarea ipotezelor statistice. Teste parametrice Testarea ipotezelor statistice. Teste parametrice
7HVWDUHDLSRWH]HORUSULYLQGFRPSDUDUHDDGRXămedii 7HVWDUHDLSRWH]HORUSULYLQGFRPSDUDUHDDGRXămedii
A. Grupuri independente
a A. Grupuri independente
te
x pentru HúDQWLRDQH GH YROXP PLF (n1 < 30, n 2    VH IRORVHúWH
statistica t FHXUPHD]ăRGLVWULEXĠLHGHSUREDELOLWDWH6WXGHQWFXȞ
H0: NU există diferen‫܊‬e semnificative între valoarea medie a variabilei X din grade de libertate):
x1  x 2
lta
e‫܈‬antionul E1 ‫܈‬i valoarea medie a variabilei X din e‫܈‬antionul E2. (P =P . - când V1 = V 2 , statistica t este: t
2 2
§ 1 1 ·
H1: Există diferen‫܊‬e semnificative între valoarea medie a variabilei X din s 2p ¨¨  ¸¸
© n1 n2 ¹
e‫܈‬antionul E1 ‫܈‬i valoarea medie a variabilei X din e‫܈‬antionul E2. (P  P . (n 1  1)s12  (n 2  1)s 22
unde: s 2p UHSUH]LQWăYDULDQĠDFRPXQă
y pentru HúDQWLRDQHGHYROXPPDUH (n1 •Q2 • VHIRORVHúWH n1  n 2  2
cu

statistica Z FHXUPHD]ăRGLVWULEXĠLHGHSUREDELOLWDWHQRUPDOă  Q n1  n 2  2 UHSUH]LQWăQXPăUXOJUDGHORUGHOLEHUWDWH


x1  x 2
x1  x 2 t
când V1  V 2 , statistica t este:
2 2
- când V 12 V12
úL sunt cunoscute, statistica Z este: Z - s12 s 22
V12 V 22 
 n1 n 2
Fa

n1 n 2
unde: Q >x @ UHSUH]LQWăQXPăUXOJUDGHORUGHOLEHUWDWH >x @ SDUWHDvQWUHDJăDOXL[
- când V 12 úL V12 sunt necunoscute, statistica Z este: Z x1  x 2 s12
1 n1
s12 s 22 x ; r
 r2 1 r2 s12 s 22
250
 251 
n1 n 2 n1  1 n 2  1 n1 n 2
Matematică și Biostatistică

Testarea ipotezelor statistice. Teste parametrice Testarea ipotezelor statistice. Teste parametrice
7HVWDUHDLSRWH]HORUSULYLQGFRPSDUDUHDDGRXă 7HVWDUHDLSRWH]HORUSULYLQGFRPSDUDUHDDGRXămedii

e
medii Luarea deciziei

i
B. Grupuri dependente y dacă valoarea numerică calculată a statisticii (Zcalc sau tcalc) cade

ac
în RC (Zcalc > Zcr sau tcalc>tcr ), respingem ipoteza nuOă H0 în
favoarea ipotezei alternative H1
y dacă valoarea statisticii (Zcalc sau tcalc) NU cade în RC (Zcalc < Zcr
sau tcalc<tcr ), acceptăm ipoteza nulă H0 cu o încredere de 1-D

rm
Observa‫܊‬ie: O serie de programe de prelucrare statisticăfurnizează valoarea
p-value (probabilitatea asociata valorii statistice a testului).
Astfel:
y (1) dacă p < D atunci se poate afirma că există o diferen‫܊‬ă

Fa
semnificativă între valoarea ipotetică a parametrului úL valoarea
ob‫܊‬inută pe baza datelor observate (se respinge H0 ‫܈‬LVHDFFHSWă
H1 ).
y (2) dacă p > D atunci nu se poate spune că există o diferen‫܊‬ă
semnificativă între valoarea ipotetică úL valoarea rezultată din
252
datele observate VHDFFHSWăH0). 253

de
Testarea ipotezelor statistice. Testul Student
Testarea ipotezelor statistice. Testul Student Grupuri independente Grupuri dependente (perechi)

Calcularea probabilitatii (p) asociate valorii statistice a


testului
a
te
=T.TEST(array1,array2,tails,type)

Func‫܊‬ia T.TEST se introduce într-o celulă oarecare specificând în


lta

ordine:
=T.TEST(A3:A12,B3:B12,2,2)
a) zonele care con‫܊‬in datele celor două serii de valori =T.TEST(A3:A14,B3:B14,2,1)
Luarea deciziei
b) valoarea: 1 sau 2 – pentru a indica dacă testul este cu un capăW (1) dacă p < D atunci se repinge ipoteza nulă H0 úL se acceptăipoteza alternativă
(unilateral) sau cu două capete (bilateral)
cu

H1. Prin urmare există o diferen‫܊‬ăsemnificativă între mediile caracteristicii în cele


c) tipul testului: 1, 2 sau 3 două popula‫܊‬ii.
1 - dacă grupurile sunt dependente (2) dacă p > D atunci se acceptă ipoteza nulă H0. Prin urmare nu există o
diferen‫܊‬ă semnificativă între mediile caracteristicii în cele două popula‫܊‬ii.
2 - dacă grupurile sunt independente úL se presupune că popula‫܊‬iile au
DFHHDúL dispersie
Fa

Obs. Dacă testul este cu două capete, atunci în cazul respingerii ipotezei H0 se consider că
3 - dacă grupurile sunt independente úL se presupune că popula‫܊‬iile au există diferen‫܊‬e între mediile celor două caracteristici fără a se specifica care dintre cele
dispersii diferite două medii este mai mare.
Dacă testul este cu un capăt, atunci în cazul respingerii ipotezei H0 este clar care dintre
254
mediile celor două popula‫܊‬ii este mai mare. 255
Matematică și Biostatistică

Testarea ipotezelor statistice. Testul Student Testarea ipotezelor statistice. Teste neparametrice
Grupuri independente Grupuri dependente (perechi) Testul ࣑૛

e
Testul CHI este un test neparametric ce poate compara
două sau mai multe reparti‫܊‬ii de frecven‫܊‬e, dintre care una

i
ac
se consideră lot martor ‫܈‬i alta lot experimental, provenite
din aceeaоi populaрie, dar având o caracteristică diferită, de
exemplu:
- copii vaccinati ‫܈‬i nevaccinati antigripal, îmbolnăvi‫܊‬i sau nu;

rm
- bolnavi trata‫܊‬i sau netrata‫܊‬i cu medicamentul X,
QHYLQGHFD‫܊‬L sau vindecD‫܊‬i;
- copii deceda‫܊‬i sau vindeca‫܊‬i de tuse convulsivă, trata‫܊‬i la

Fa
domiciliu sau la spital; etc.
Testul CHI se aplică numai în acele situa‫܊‬ii când
evenimentele a‫܈‬teptate se exclud unul pe celălalt, în sensul
că nu este posibil să se producădecât unul dintre ele.
256 257

de
Testarea ipotezelor statistice. Teste neparametrice. Testarea ipotezelor statistice. Teste neparametrice
Testul ࣑૛ Testul ࣑૛
Etapele aplicării testului CHI:
1. Culegerea ‫܈‬i înregistrarea datelor studiului: a 6. Calcularea probabilită‫܊‬ii asociate valorii statistice a testului (p)
te
=CHISQ .TEST(actual_range, expected_range) sau
y Subiec‫܊‬ii sunt clasifica‫܊‬i ca bolnavi sau nu, expu‫܈‬i la un anumit =CHITEST(actual_range, expected_range)
factor de risc sau nu, etc.
y se stabile‫܈‬te numărul de subiec‫܊‬i care fac parte din fiecare Valoarea unei celule
lta

clasă din matricea valorilor


HVWLPDWHHVWHHJDOă
2. Formularea ipotezelor alternative (H0, H1) cu produsul dintre
H0: Între cele două caracteristici studiate NU există o asociere suma valorilor de pe
(o legatură).
cu

OLQLD‫܈‬LVXPDYDORULORU
H1: Există o asociere (o legătură) între cele două caracteristici de pe coloana
matricei datelor test,
studiate.
WRWXOvPSăU‫܊‬LWODVXPD
3. Specificarea pragului de semnifica‫܊‬ie D = 0.01, 0.05, 0.1 tuturor
Fa

4. Stabilirea numărului gradelor de libertate (gl) a testului * Luarea deciziei


(1) dacă p < D atunci se respinge ipoteza nulă H0 úL se acceptă
gl = (Nr.Rânduri -1)*(Nr.Coloane -1) ipoteza alternativă H1,
5. Calcularea valorii statistice a testului (࣑૛ calc) *
258
(2) dacă p > D atunci se acceptă ipoteza259
nulă H0,
Matematică și Biostatistică

Testarea ipotezelor statistice. Teste neparametrice Testarea ipotezelor statistice. Teste neparametrice
Testul ࣑૛ Testul ࣑૛

e
* Stabilirea numărului gradelor de libertate (gl) a testului Aplica‫܊‬ie. Mortalitatea postoperatorie la bolnavii de ulcer gastric, în
gl = (Nr.Randuri -1)*(Nr.Coloane -1) Varianta 2 cazul utilizării mai multor tehnici de rezec‫܊‬ie gastrică.

i
ac
* Calcularea valorii statistice a testului (࣑૛ calc)
=CHIINV(probability=p, degrees_freedom) Se poate face o asociere între numărul

* Stabilirea valorii critice a testului (࣑ cr) pentru D considerat persoanelor decedate ‫܈‬i tehnica de
rezec‫܊‬ie utilizată?
1. =CHIINV(probability=D, degrees_freedom)

rm
2. Din tabelul valorilor critice ale testului ࣑૛ cu pragul de
semnifica‫܊‬ie D‫܈‬Lgradele de libertate (gl)

Fa
Luarea deciziei H0: NU există o asociere (o legătură) între mortalitatea postoperatorie
(1) dacă ࣑૛ calc > ࣑૛ cr atunci se repinge ipoteza nulă H0 úL se ‫܈‬i tehnicile chirurgicale utilizate.
acceptăipoteza alternativă H1, H1: Există o asociere (o legătură) între mortalitatea postoperatorie ‫܈‬i
(2) dacă ࣑૛ calc < ࣑૛ cr atunci se acceptă ipoteza nulă H0, tehnicile chirurgicale utilizate.

Deoarece p = 0,47 > 0,05 se acceptă ipoteza nuOă H0. Prin urmare, nu existăo
260 261

de
asociere între numărul de decese ‫܈‬i tehnica chirurgicală folosită.

Context
a y Statistica GLVSXQHGHRVHDPăGHPHWRGHGH
te
studiere a GHSHQGHQĠHORU (legăWXULORU) dintre GRXă
Biostatistică VDXPDLPXOWHYDULDELOH3ULQWUHDFHVWHDVXQWúLFHOH
cuprinse în "DQDOL]DGHUHJUHVLHúLFRUHODĠLH".
În FDGUXODFHVWHLDVHVWXGLD]ăGHSHQGHQĠDGLQWUH
lta

y
RYDULDELOă FDUDFWHULVWLFă UH]XOWDWLYă \ úLXQDVDX
5HJUHVLH‫܈‬LFRUHOD‫܊‬LH mai multe variabile (caracteristici) independente (x).
y Caracteristica UH]XOWDWLYăVHPDLQXPHúWH
caracteristica GHSHQGHQWăHQGRJHQăVDXHIHFWLDU
cu

FDUDFWHULVWLFDLQGHSHQGHQWăVHPDLQXPHúWH
FDUDFWHULVWLFDIDFWRULDOăH[RJHQăVDXFDX]ă
y Regresia QHDUDWăcum FDIRUPăDQDOLWLFă R
YDULDELOăHVWHGHSHQGHQWăGHDOWăYDULDELOă VDXGH
Fa

alte variabile), iar FRUHODĠLD QHDUDWăgradul în care o


YDULDELOăHVWHGHSHQGHQWăGHRDOWăYDULDELOă VDXDOWH
Curs 10 variabile).
262 263
Matematică și Biostatistică

ClasificăUL Introducere

e
D GXSăQXPăUXOFDUDFWHULVWLFLORULQGHSHQGHQWH Metode de regresie úLFRUHOD‫܊‬LHSHQWUXYDULDELOH

i
luate în studiu:

ac
- OHJăWXULVLPSOH cantitative de tip interval
- OHJăWXULPXOWLSOH
E GXSăGLUHFĠLDOHJăWXULORU y Metoda de UHJUHVLHúLFRUHODĠLH se ED]HD]ăSH
- OHJăWXULGLUHFWH
GHWHUPLQDUHDXQHLHFXDĠLLPDWHPDWLFHFHGHVFULH

rm
- OHJăWXULLQYHUVH
F GXSăH[SUHVLDDQDOLWLFăDOHJăWXULORU UHODĠLDGLQWUHYDULDELODFDUHYDILSURJQR]DWăGHQXPLWă
- OHJăWXULOLQLDUH YDULDELOăGHSHQGHQWă QRWDWăFXy úLYDULDELOHOHFDUH
- OHJăWXULQHOLQLDUH FXUELOLQLL  VXQWOHJDWHGHDFHDVWăYDULDELOăGHQXPLWHvariabile
independente (notate cu x1, x2,..., xk).

Fa
d) GXSăPHWRGHOHde abordare:
- metode simple (elementare) y 5HODĠLDIXQFĠLRQDOăHVWH
- metode analitice
y = f (x1, x2,..., xk)

264 265

de
Modelul de regresie Modelul de regresie
a
te
y Modelul de regresie este un model probabilist (sau y Modelul de regresie liniar (de ordinul I) va avea
stohastic) deoarece variabilele modelului sunt forma:
E 0  E1 x  H
lta

variabile aleatoare (sau variabile stohastice). y


unde:
y 3HQWUXDFUHDvQVăXQPRGHOprobabilist trebuie mai
yy YDULDELODGHSHQGHQWă
cu

vQWkLVăFUHăPXQmodel deterministFDUHVă
y x YDULDELODLQGHSHQGHQWă
VWDELOHDVFăFXDMXWRUXOXQHLUHODĠLLIXQFĠLRQDOH
y E LQWHUVHFĠLDFXD[DOy (intercept)
OHJăWXULOHGLQWUHYDULDELOHOHPRGHOXOXL
y E = panta (coeficientul unghiular)
Fa

y H = variabila de eroare

266 267
Matematică și Biostatistică

Modelul de regresie Modelul de regresie

e
y Am menĠionat anterior úLDPDQDOL]DWmodelul de
y 3HQWUXHVWLPDUHDFRHILFLHQĠLORUE úLE ai

i
ac
regresie liniar.
PRGHOXOXLGHUHJUHVLHOLQLDUVHXWLOL]HD]ă
XUPăWRUXODOJRULWP
[1]: 6HH[WUDJHXQHúDQWLRQGHYDORUL(xi, yi) din y ÌQSUDFWLFăH[LVWăQXPHURDVHVLWXDĠLLFkQG
modelul liniar nu este adecvat, utilizându-se

rm
SRSXODĠLDDQDOL]DWă
modele de regresie neliniare.
[2]: 6HFDOFXOHD]ăFRHILFLHQĠLLE úLE
[3]: 6HUHSUH]LQWăGUHDSWDGHregresie.
y $FHVWHDSRWILPRGHODWHILHSULQIXQFĠLLSROLQRPLDOH

Fa
y &RHILFLHQĠLLE úLE ai modelului de regresie
de grad •VDXSULQIXQFĠLLH[SRQHQĠLDOHVDX
OLQLDUVHGHWHUPLQăFXDMXWRUXOmetodei celor
logaritmice.
mai mici SăWUDWH
268 269

de
Metoda celor mai mici SăWUDWH Metoda celor mai mici SăWUDWH

y 0HWRGDFHORUPDLPLFLSăWUDWHGHWHUPLQă a
te
dreapta care PLQLPL]HD]ă suma yn yˆ i Eˆ0  Eˆ1 xi
n

¦ y  yˆ i
lta
2
i y4 ŷ 5 ŷ n
unde: i 1

y yi sunt valorile observate ŷ 3


y2
y ŷi VXQWYDORULOHFDOFXODWHSHED]DHFXDĠLHLGUHSWHL ŷ 4
cu

y5

de regresie
y3
ŷ1
yˆ i Eˆ0  Eˆ1 xi ŷ 2
Fa

y1

270
Metoda FHORUPDLPLFLSăWUDWH
271
Matematică și Biostatistică

Metoda celor mai PLFLSăWUDWH'UHDSWDGH


Metoda celor mai PLFLSăWUDWH regresie

e
&RHILFLHQĠLLE úLE VHGHWHUPLQăFXUHODĠLLOH

i
y

ac
s xy
Eˆ1 2 Eˆ0 y  E1 ˜ x
s x

rm
unde:
n

¦ x  x
n

¦ xi  x ˜ yi  y
2 2
s xy s x i
R2 = coeficient de determinare (ia valori între 0 si 1)

Fa
i 1 i 1
R2 arată cât de apropiate se află punctele de dreapta determinată
41,14% din varia‫܊‬ia (împră‫܈‬tierea) uneia din cele două variabile este
§ n · § n · determinată de varia‫܊‬ia celeilalte variabile
x ¨ ¦ xi ¸ n y ¨ ¦ yi ¸ n sau:
©i1 ¹ 272 ©i1 ¹ cele două variabile au în comun 41,14% din varia‫܊‬ia ce le caracterizează,
273
restul până la 100% din variabilitatea lor 58,86% provine din alte surse

de
0ăVXULOHnumerice ale GHSHQGHQĠHL 0ăVXULOHnumerice ale GHSHQGHQĠHL
liniare liniare
y Am descris anterior în mod grafic, cu ajutorul a
te
GLDJUDPHLGHvPSUăúWLHUHOHJăWXUDsau 'HILQLĠLH &RYDULDQĠD XQHLSRSXODĠLLVWDWLVWLFHHVWH
GHSHQGHQĠDGLQWUHGRXăvariabile. SULQGHILQLĠLH
lta

¦ x  P ˜ y  Py
N

y 'DFăYDORULOHUHSUH]HQWDWHVHVLWXDXDSUR[LPDWLY i x i

vQDSURSLHUHDXQHLGUHSWHFHSXWHDILWUDVDWă cov x, y i 1
N
cu

DYHDPRGHSHQGHQĠăOLQLDUă
&RYDULDQĠD XQXLHúDQWLRQVWDWLVWLFHVWHSULQ
GHILQLĠLH
y 9RPGHWHUPLQDvQFRQWLQXDUHPăVXULOHQXPHULFH n

¦ x  x ˜ y  y
Fa

DOHGHSHQGHQĠHLOLQLDUHúLDQXPH i i

y FRYDULDQĠD cov x, y i 1
n 1
y FRUHODĠLD 274 275
Matematică și Biostatistică

0ăVXULOHnumerice ale GHSHQGHQĠHL 0ăVXULOHnumerice ale GHSHQGHQĠHL


liniare OLQLDUH&RHILFLHQWXOGHFRUHOD‫܊‬LH

e
y 'DFăcov(x,y) > 0, atunci avem o dependenĠă OLQLDUăSR]LWLYă

i
între variabilele analizate y 'HILQLĠLD Coeficientul GHFRUHODĠLH al unei

ac
y 'DFăcov(x,y) < 0, atunci avem o dependenĠă OLQLDUănegaWLYă SRSXODĠLLVWDWLVWLFHHVWHSULQGHILQLĠLH
între variabilele analizate cov x, y
y 'DFăcov(x,y) = 0, atunci nu avem o dependenĠă OLQLDUă între
U x, y
variabilele analizate
V x ˜V y

rm
y y y unde Vx úLVy sunt abaterile standard.
&RHILFLHQWXOGHFRUHODĠLH DOXQXLHúDQWLRQVWDWLVWLF
HVWHSULQGHILQLĠLH
r x, y
cov x, y

Fa
sx ˜ s y
unde sx úLsy sunt abaterile standard.
x x x
a) cov(x,y) > 0 b) cov(x,y) < 0 c) cov(x,y) = 0
276 277

de
0ăVXULOHnumerice ale GHSHQGHQĠHL 0ăVXULOHnumerice ale GHSHQGHQĠHL
liniare. &RHILFLHQWXOGHFRUHOD‫܊‬LH liniare. &RHILFLHQWXOGHFRUHOD‫܊‬LH
a
te
y &RHILFLHQWXOGHFRUHODĠLHDOHúDQWLRQXOXL
(coeficientul Pearson SRDWHILGHWHUPLQDWúLFX
lta

RUHODĠLHGHFDOFXOSUHVFXUWDW

n¦ xi y i  (¦ xi )(¦ y i )
cu

ry / x
>n¦ x 2
i @>
 (¦ xi ) 2 ˜ n¦ y i2  (¦ y i ) 2 @
Fa

278 279
Matematică și Biostatistică

0ăVXULOHQXPHULFHDOHGHSHQGHQĠHLOLQLDUH. Coeficientul de
0ăVXULOHQXPHULFHDOHGHSHQGHQĠHL FRUHOD‫܊‬LH
liniare. &RHILFLHQWXOGHFRUHOD‫܊‬LH

e
Pentru a afla dacă două variabile studiate sunt corelate sau nu,
formulăm următoarele ipoteze statistice:
- ipoteza nulă (H0): cele dou variabile nu sunt corelate

i
ac
y y y - ipoteza alternativă (H1): cele dou variabile sunt corelate

Procedeu de lucru:
• 6HFDOFXOHD]ăFRHILFLHQWXOGHFRUHOD‫܊‬LHU
• Se calculează numărul gradelor de libertate (gl):

rm
gl = nr. perechilor de date – 2
• Se alege un nivel de semnifica‫܊‬ie: 0.10, 0.05, 0.02, 0.01.
• Pentru nivelul ales se FLWHúWH din tabel valoarea critică (rcr)
x x x corespunzătoare numărului de grade de libertate.

Fa
a) r(x,y) ĺ b) r(x,y) ĺ1 c) r(x,y) ĺ0 Interpretare:
• Dacă r > rcr se respinge ipoteza H0 úLVHacceptă ipoteza H1 cu
&RUHODĠLDúLGHSHQGHQĠDOLQLDUă nivelul de semnifica‫܊‬ie respectiv (p < alfa).
280
• Dacă r < rcr atunci cele două variabile sunt considerate necorelate
281

de
úL se acceptă ipoteza H0 (p > alfa).

0ăVXULOHQXPHULFHDOHGHSHQGHQĠHLOLQLDUH. Coeficientul de
FRUHOD‫܊‬LH
Tabelul 1. Valoarea critică a coeficientului de Evaluarea modelului de regresie
corela‫܊‬ie pentru nivele diferite de semnifica‫܊‬ie:
0,10; 0,05; 0,02; 0,01
a y Variabila de eroare H, care apare în modelul de
te
UHJUHVLHWUHEXLHVăVDWLVIDFăXUPăWRDUHOHFRQGLĠLL:
lta

&RHILFLHQWXOGHFRUHOD‫܊‬LHvQ(;&(/ [1] DistribuĠia lui H este QRUPDOă


[2] Valoarea medie a lui H este 0, DGLFă
=CORREL(Array1, Array2)

M[H]=0;
cu

[3] Abaterea standard a lui Hrespectiv VH, este


Interpretare: FRQVWDQWăIDĠăGHYDORULOHOXL x;
D = 0.05 [4] Valoarea lui H DVRFLDWăunei valori y este
gl = 17
Fa

rcr = 0.4555
LQGHSHQGHQWăGHDOWăYDORDUHDOXLy.
r = 0,6414 > rcr
se respinge H0 úLVHacceptă H1.
Cele două variabile
282
studiate sunt corelate. 283
Matematică și Biostatistică

Evaluarea modelului de regresie Evaluarea modelului de regresie

i e
y În modelul de regresie, abaterile valorilor y Estimatorul nedeplasat al dispersiei variabilei

ac
observate de la dreapta de regresie de eroare VH este dat de UHODĠLD
SSE
ei yi  yˆ i sH2
n2

rm
se numesc valori reziduale.
y 5ăGăFLQDSăWUDWăDOXLsH VHQXPHúWHeroarea
y 6XPDSăWUDWHORUDFHVWRUYDORULUH]LGXDOHHVWH
VWDQGDUGDHVWLPăULLDGLFă

Fa
n
§ 2 s xy2 ·
¦ y  yˆ i n  1 ˜ ¨¨ s y  2 ¸
2
SSE i ¸ SSE
i 1 © sx ¹ sH sH2
n2
284 285

de
Evaluarea modelului de regresie Evaluarea modelului de regresie
a y 2DOWăPHWRGăGHHYDOXDUHDPRGHOXOXLGH
te
y Coeficientul de determinare R2 măsoară regresie este analiza UH]LGXDOă
LQWHQVLWDWHDGHSHQGHQĠHLOLQLDUHGLQWUHGRXă
lta

YDULDELOHúLHVWHGDWGHUHODĠLD y 2SULPăDERUGDUHHVWHUHSUH]HQWDUHDJUDILFăFX
SSE DMXWRUXOKLVWRJUDPHLIUHFYHQĠHLUHODWLYHDYDORULORU
R 2
1 n reziduale.
¦ y  y
cu

2
i
i 1
y &HULQĠDHVWHFDKLVWRJUDPDYDORULORUUH]LGXDOHVă
y Coeficientul de determinare HVWHSăWUDWXO SXQăvQHYLGHQĠănormalitateaFHHDFHQHDUDWă
FRHILFLHQWXOXLGHFRUHODĠLHDGLFă
Fa

IDSWXOFăHURDUHDHVWHGLVWULEXLWănormal.
R2
286
r2 287
Matematică și Biostatistică

Evaluarea modelului de regresie Evaluarea modelului de regresie

e
y &HULQĠDFDGLVSHUVLDYDULDELOHLGHHURDUHVH VăILH

i
y 'DFăPRGHOXOGHUHJUHVLHHVWHDGHFYDWSXWHP

ac
FRQVWDQWăVHQXPHúWH homoscedasticitate.
VăvOXWLOL]ăPSHQWUXDIDFHRSURJQR]ă sau o
SUHGLFĠLHasupra valorilor variabilei dependente.
y 1HUHVSHFWDUHDDFHVWHLFHULQĠHSULYLQGFRQVWDQĠD
y Pentru valoarea x0 GDWăvaloarea de SUHGLFĠLH

rm
GLVSHUVLHLVHQXPHúWH heteroscedasticitate. SXQFWXDOă este

y Alte elemente de evaluare ale modelului de yˆ 0 Eˆ0  Eˆ1 x0

Fa
UHJUHVLHVHUHIHUăODLQGHSHQGHQĠDsau
dependenĠDYDULDELOHORUúLODSUH]HQĠDsau nu a REĠLQXWăSULQvQORFXLUHDYDORULLGDWHvQHFXDĠLH
valorilor extreme. de regresie.

288 289

de
Evaluarea modelului de regresie Evaluarea modelului de regresie
a
te
y 3HQWUXSUHGLFĠLDDVXSUDXQHLYDORULLQGLYLGXDOH y Pentru estimarea valorii medii a variabilei
DOHYDULDELOHLGHSHQGHQWHGDWăILLQGRYDORDUH GHSHQGHQWHGDWăILLQGRYDORDUHVSHFLILFDWăx0
VSHFLILFDWăx0 a variabilei independente se DYDULDELOHLLQGHSHQGHQWHVHXWLOL]HD]ă
lta

XWLOL]HD]ăLQWHUYDOXOGHSUHGLFĠLH de forma: intervalul de încredere de forma:

1 x  x 1 x0  x
2 2

yˆ r tD 2,n2 ˜ sH ˜ 
cu

yˆ r tD 2,n2 ˜ sH ˜ 1   0
n n  1 ˜ s x2 n n  1 ˜ s x2
unde: unde:
Fa

yˆ Eˆ0  Eˆ1 ˜ x0
yˆ Eˆ0  Eˆ1 ˜ x0
290 291
Matematică și Biostatistică

Evaluarea modelului de regresie Evaluarea modelului de regresie

i e
Determinarea coeficien‫܊‬ilor dreptei

ac
de regresie utilizând Regression
din modulul Data Analysis.

rm
Fa
y Intervalul de încredere pentru coeficientul lui x
(greutate) din func‫܊‬ia de regresie nu con‫܊‬ine pe 0,
deci se poate afirma ca există o corela‫܊‬ie
292 semnificativă între cele două variabile.
293

de
a
te
lta
cu
Fa
Bibliografie
1. Leahu A., Probabilitati, Ed. Ovidius University Press, Constanta, 2009,
2. Lupu, G., Lupu, E.C., Matematici aplicate şi Biostatistică, Ed. Virom, Constanţa, 2006,
3. L.C. Petcu, C. Lupu, A. Petcu, Analiză statistică cu SPSS - Note de curs, Ovidius
University Press, Constanţa 2011
4. Vernic, R. (2003) – Statistica, Ed. Adicom, Constanța, 2003
5. Constantin Mircioiu, Roxana Colette Sandulovici, Aplicatii numerice de statistica in
farmacie si in studiile clinice, Vol. I – metode manuale, Editura Universitara “Carol
Davila” , Bucuresti, 2010
6. M. Iosifescu, Gh. Mihoc, R. Teodorescu, Teoria probabilitatilor si statistica matematica,
Ed. Tehnica, Bucuresti, 1966
7. Horvat-Marc, A. Analiză Matematică, Editura RISOPRINT, Cluj-Napoca, 2009
8. *** - NIST/SEMATECH e-Handbook of Statistical Methods, 2005, National Institute of
Standards and Technology, http://www.itl.nist.gov/div898/handbook/
9. *** - Farmacopeea Română, ediţia a-X-a, Editura Medicală Bucureşti,1993
10. Marius Măruşteri, Noțiuni fundamentale de biostatistică, Târgu-Mureş : University Press,
2006

S-ar putea să vă placă și