Documente Academic
Documente Profesional
Documente Cultură
ns, putem face abstracie de modul programat de generare ale acestor numere i s considerm c aces-
Matlab pentru generarea de numere aleatoare ce urmeaz repartiia notat generic lege sunt:
legernd(<param>, m, n)
sau, alternativ,
random('lege',
<param>, m, n).
Oricare dintre cele dou comenzi genereaz o matrice aleatoare, cu numere aleatoare ce urmeaz repartiia din Tabelul 1.1. De exemplu,
lege.
n loc de
100, 10);
100 10
componente repartizate
N (5, 0.2).
200 50
componente repartizate
P (0.01).
randtool
putem reprezenta interactiv selecii aleatoare pentru diverse repartiii. generate de parametri Comanda deschide o interfa De exemplu, folosind datele
grac ce reprezint prin histograme seleciile dorite, pentru parametrii dorii (vezi Figura 1.1). Datele
=2
= 0.5
L.
B (n, p) B N (n, p)
P () U (n)
repartiia normal
N (, )
repartiia uniform continu repartiia exponenial repartiia repartiia repartiia repartiia repartiia repartiia repartiia
U (a, b) exp() Gamma (a, ) Beta (m, n) lognormal log N (, ) 2 ( n ) student t(n) Fisher F (m, n) Weibull W bl(k, )
mai simplu de utilizat. Aceasta se datoreaz faptului c ele sunt cele mai des utilizate n simularea de date aleatoare. Dup cum vom vedea mai trziu, putem genera valori aleatoare de o repartiie dat plecnd de la repartiia uniform continu.
Funcia
rand
[0, 1].
De exemplu, comanda
B (1, 0.5).
De asemenea, numrul
B (10, 0.5)
(simularea a
10
rand(m, n)
Comanda
mn
componente repartizate
a + (b a) rand
Folosind comanda
zentnd starea actual a generatorului de numere aleatoare uniform (distribuite). Pentru a schimba starea curent a generatorului sau iniializarea lui, putem folosi comanda
rand(method, s) method este metoda prin care numerele aleatoare sunt generate (aceasta poate 'state', 'seed' sau 'twister'), iar s este un numr natural ntre 0 i 232 1, reprezentnd starea iniialiunde zatorului. De exemplu,
rand('state', 125)
xeaz generatorul la starea
125. (a, b)
nelegem
Observaia 1.1
(a, b),
Matlab:
[2, 3],
produse de comanda
hist(5*rand(1e4,1)-2,100)
Funcia
randn
randn(m, n)
mn
componente repartizate
Pentru a schimba metoda prin care sunt generate numerele aleatoare normale sau starea generatorului, folosim comanda:
randn(method, s)
unde unde sau
method este metoda prin care numerele aleatoare sunt generate (aceasta poate 'state' 'seed'), iar s este un numr natural ntre 0 i 232 1, reprezentnd starea iniializatorului.
m + randn genereaz un numr aleator repartizat normal N (m, ).
De exemplu, codul
Comanda
250
200
150
100
50
10
B (1, 0.5)
sum (rand(30,1)<0.5)
30
aruncri ale unei monede ideale).
B (30, 0.5)
(simularea a
round(rand(30,1))
Pentru a numra cte fee de un anumit tip au aprut, folosim
sum(round(rand(30,1)))
Simularea n
a, b
c,
cu probabilitile de
0.5, 0.2
i, respectiv,
0.3.
X:
Pentru a modela aceast variabil aleatoare n un numr
,
alegem uniform la ntmplare realizat, dac experiment se
x din intervalul [0, 1]. Dac x < 0.5, atunci convenim c rezultatul a s-a 0.5 < x < 0.7, atunci rezultatul b s-a realizat. Altfel, rezultatul v.a. X este c. Dac acest
repet de multe ori, atunci rezultatele pot folosite n estimarea probabilitilor de realizare a variabilei aleatoare. Cu ct vom face mai multe experimente, cu att vom aproxima mai bine valorile teoretice ale probabilitilor, deci putem spune c am aproximat variabila aleatoare n
Matlab, scriem:
X.
syms a b c % declaram a, b si c ca variabile simbolice r = rand; X = a*(r<0.5) + b*(0.5<r & r<0.7) + c*(r>0.7)
5
Folosind aceast metod, putem simula aruncarea unui zar ideal. Avem apariia unei fee cu
1, 2, 3, 4, 5
sau n
6 6
puncte.
convenabil problema. Vom considera c punctele din intervalul posibile i mprim intervalul
[0, 1]
(0,
1 1 2 2 3 3 4 4 5 5 ), ( , ), ( , ), ( , ), ( , ), ( , 1) . 6 6 6 6 6 6 6 6 6 6
corespunztoare, respectiv, celor ase fee, s zicem n ordinea cresctoare a punctelor de pe ele. Vom vedea mai trziu (vezi metoda Monte Carlo) ca alegerea acestor intervale cu capete nchise, deschise sau mixte nu are efect practic asupra calculului probabilitii dorite. Acum, dac dorim s simulm n
Matlab apariia feei cu 3 puncte la aruncarea unui zar ideal, vom alege (comanda rand) un numr "la Matlab
ntmplare" din intervalul
[0, 1]
2 3 (6 , 6 ).
Aadar, comanda
simuleaz aruncarea unui zar ideal. Ca o observaie, deoarece cele aceast comanda i scrie
f (x))
se introduc n
pdf('LEGE', x, <param>)
Funcia de repartiie
F (x)
cdf,
astfel:
cdf('LEGE', x, <param>)
sau
LEGEcdf(x, <param>).
F 1 (y ),
se introduce cu comanda
icdf,
astfel:
icdf('LEGE', y, <param>)
n comenzile de mai sus, iar
sau
LEGEinv(y, <param>).
<param>
LEGE poate oricare dintre legile de repartiie din Tabelul 1.1, x este un scalar sau f (x) sau F (x), y este un scalar sau vector pentru care se calculeaz F 1 (y ),
Observaia 1.2
tiiei. Pentru un
X x R,
Fie
F (x, )
funcia sa de repartiie,
P (X x) = F (x)
o putem scrie astfel n
Matlab:
cdf('numele repartiiei lui X',x,).
6 (1.1)
Matlab a probabilitii P (X < x). Dac repartiia considerat este una continu, atunci corespondentul n Matlab este tot (1.1), deoarece n acest caz
P (X x) = P (X < x) + P (X = x) = P (X < x). X N (5, 2),
atunci
De exemplu, dac
P (X < x) =
unde
P (X [x]) , x nu e ntreg P (X m 1) , x = m Z,
[x]
x.
atunci
De exemplu, dac
X B (10, 0.3),
100
de ori, iar
numrul de fee cu stema aprute. Care este probabilitatea de a obine exact S se calculeze
52
de steme?
Soluie:
(a)
Avem de calculat
B (100, 0.5),
FX
X.
Atunci,
=
k=45
nl
(a) (b)
Exerciiu 1.2
Cineva a nregistrat zilnic timpul ntre dou sosiri succesive ale tramvaiului ntr-o anumit
20 de minute.
7
Dac o persoan a ajuns n staie exact cnd tramvaiul pleca, aai care sunt ansele ca ea s atepte cel puin
15
Soluie:
este:
Notm cu
FT
T exp(),
unde
= 20.
P (T 15),
care
47.24%
anse.
Exerciiu 1.3
sunt femei.
20%
La o tombola organizat pentru spectatori, un computer alege la ntmplare numerele a i se premiaz posesorii. (i) (ii) (iii) Care este probabilitatea ca mcar
7 bilete de intrare
Care este probabilitatea ca nicio femeie s nu ctige la tombol? Dac selecia biletelor ctigtoare ar fost realizat prin alegerea a
n ir, pe un acelai rnd ales la ntmplare, argumentai dac probabilitile gsite la (i) si (ii) rmn aceleai.
Soluie:
(i) n
Fie
spectatori. Atunci
Matlab,
(ii) n
Matlab,
0 p0 (1 p)7 = 0.2097 P (X = 0) = C7
Exerciiu 1.4
(ii)
(i)
n faa unui oponent de acelai calibru la tenis de mas, care eveniment este mai
probabil: s ctigi
partide din
4,
sau s ctigi
partide din
8?
Justicai rspunsul.
Se menine rezultatul anterior dac, n loc de tenis de mas, cei doi s-ar ntrece la ah? Presupunem
X
(i)
Deoarece cei doi oponeni sunt de acelai calibru, probabilitatea unuia de a ctiga mpotriva
celuilalt este
p = 0.5. 8
S notm cu
n care se joac
Probabilitatea ca (ii)
J1
s ctige
iar probabilitatea ca
X B (8, 0.5). 3 0.54 = 0.25, 3 din 4 este P1 = C4 5 0.58 = 0.2187. J1 s ctige 5 din 8 este P2 = C8 3
rezultate posibile).
n acest caz, rezultatul se schimb. Nu mai putem folosi repartiia binomial, deoarece la ah exist
Exerciiu 1.5
42% 40%
200
50%,
l vor vota pe
la preedinie?
S notm cu
p = 0.42
i cu
candidatul
C,
probabilitatea
P (80 X 100)
(deoarece
n = 200 considerat. Este clar c X B (n, p). Se cere 40% din 200 nseamn 80 etc). Deoarece X este o variabil
Matlab:
FX
X.
Exerciiu 1.6
puncte la aruncarea
aruncri?
v.a. variabil aleatoare ale crei valori reprezint numrul de eecuri avute pn
la primul succes. Aceasta urmeaz repartiia geometric necesare obinerii feei pentru prima dat este
G eo(1/6).
Y = X + 1.
eecuri pn
P1 = P (Y 3) = P (X 2) = 0.4213.
Probabilitatea de a obine pentru prima oar faa din exact
aruncri este:
P2 = P (Y = 3) = P (X = 2) = 0.1157.
n
Matlab scriem:
P1 = geocdf(2,1/6); P2 = geopdf(2,1/6);
Exerciiu 1.7
atunci Poisson.
Demonstrai c dac
X P ()
X + Y P ( + ).
Generalizai
Y P () sunt dou variabile aleatoare independente, rezultatul pentru n variabile aleatoare independente repartizate
i
Soluie:
lor,
X1 P (1 ), X1 P (1 ), . . . , X1 P (n ) sunt independente, Y = X1 + X2 + + Xn , urmeaz repartiia Y P (1 + 2 + + n ). Funcia generatoare de momente pentru X1 este MX1 (t) = E(etX1 ) =
k N
etk e1
k 1 = e1 k!
k N
(1 et )k t t = e1 e1 e = e1 (e 1) . k!
MY (t) = MX1 +X2 ++Xn (t) = E(et(X1 +X2 ++Xn ) ) = E(etX1 ) E(etX2 ) E(etXn ) = e1 (e
t 1)
e2 (e
t 1)
en (e
t 1)
t 1)
MY (t) este funcia generatoare de momente pentru o variabil aleatoare Poisson cu parametrul 1 + 2 + + n . Folosind unicitatea funciei generatoare de momente, deducem c
Obinem c
Y P (1 + 2 + + n ).
Exerciiu 1.8 (a) n magazinul de la colul strzii intr n medie 20 de clieni pe or.
ntr-o anumit or s intre n magazin cel puin
tiind c numrul
clienilor pe or este o variabil aleatoare repartizat Poisson, s se determine care este probabilitatea ca
15
clieni?
(b)
10
200
de clieni?
Soluie:
10
10
P2 = P (
k=1
Xk 200) = 1 P (
k=1 10
Xk < 200) = 1 P (
k=1
Xk 199) = 1 F
Xk (199)
= 0.5094.
Am folosit faptul c
Xk P (200),
k=1
Exerciiu 1.9
urmtoarea:
X1
v.a. ce
reprezint numrul de semafoare pe care Maria le prinde pe rou, i presupunem c repartiia lui
X1
este
x p(x)
De asemenea, e (a) (b)
0 0.2
1 0.5
2 0.3
X2
cas. Presupunem c
X1
X2
Determinai repartiia, media i dispersia variabilei aleatoare Care e probabilitatea ca Maria s prind cel puin
X = X1 + X2 .
Soluie:
este:
x p(x)
0 0.04
1 0.2
2 0.37
3 0.3
4 0.09 X1
i
X2 ,
D2 (X ) = D2 (X1 ) + D2 (X2 ) = 2[(0 1.1)2 0.2 + (1 1.1)2 0.5 + (2 1.1)2 0.3] = 0.98.
(b)
(a) Pentru ce valori ale parametrului (S notm cu (b) Calculai (c) Dac
EX i D2 (X ). = 2, calculai P (X 2).
Considerm o v.a.
Exerciiu 1.11
0 x F (x) = 1 + ln 4 1
Calculai: (a) (b) (c)
Exerciiu 1.12
230 litri.
Fie
190 litri
i de
variabila aleatoare care reprezint alegerea unui client ales la ntmplare, ce are tabelul
de repartiie:
x p(x)
(a) (b) (c) (d) Calculai
160 0.2
190 0.5
230 0.3
E(X ), D2 (X ). P = 7X 9.5,
calculai valoarea ateptat a
D2 (P ). X,
capacitatea real a unui congelator este
h(X ) =
0.01X 2 . Care este valoarea medie a capacitii reale pentru un congelator cumprat de urmtorul
clint?
Exerciiu 1.13
(a) (b)
Notm cu
i tabloul su de repartiie.
Exerciiu 1.14
Calculai
T (0 C ) dintr-un anumit proces P (T < 0); P (2.5 < T < 2.5); P (2 T 3).
Temperatura
U (5, 5).
11
Exerciiu 1.15
standard de
Temperatura de topire a unui anumit material este o v.a. cu media de Determinai temperatura medie i deviaia standard n
2 oC .
o F , tiind c
Dac
Z N (0, 1),
calculai:
P (Z 1.35); P (0 Z 1); P (1 Z ); P (|Z | > 1.5). Sn suma numerelor probabilitatea P = P (S2 6).
Notm cu ce apar n
Exerciiu 1.18
a lui
Pentru un
este:
(a) (b)
P (4 X ).
Exerciiu 1.19
Pentru evaluarea rezultatelor obtinute la teza de Matematica de catre elevii unei anumite
35
printre elevii scolii, iar notele lor sunt sumarizate in Tabelul 1.2.
note frecventa
4 3
5 6
6 7
7 8
8 5
9 4
10 2
(i) Sa se scrie si sa se reprezinte grac functia de repartitie pentru aceasta selectie; (ii) Notam cu
aproximeze probabilitatea
P (6 X 8). 200
de ori. Care este probabilitatea s
obinem o sum de
n cel puin
20%
dintre cazuri?
Simulai n
2
1 4
. X.
Calculai
F (x)
a variabilei aleatoare
F(1 2 ).
12
Exerciiu 1.22
(ii)
(i)
exp().
cu
n Folosind funcia generatoare de momente, artai c dac {Xi }i=1 sunt variabile aleatoare indepenn
dente, repartizate
exp(i )
Y =
i=1
Xi
urmeaz repartiia
(n, ),
=
i=1
i .
Exerciiu 1.23
(ii) binomial.
(i)
B (n, p).
Demonstrai c dac
X + Y B (m + n, p).
X B (m, p) i Y B (n, p) sunt dou variabile aleatoare independente, atunci Generalizai rezultatul pentru n variabile aleatoare independente repartizate
13
X 2.
x2 1 fX (x) = e 2 , x R. 2
Notm cu formula
FX 2 (y ) funcia de repartiie pentru X 2 i cu fX 2 (y ) densitatea sa de repartiie. Nu putem folosi 2 de la curs deoarece funcia g (x) = x , x R, nu este bijectiv. Pentru a calcula densitatea lui 0 , P ( y X y ) , y 0; y > 0, y 0; y > 0,
X 2,
FX 2 (y ) = P (X 2 y ) =
de unde
fX 2 (y ) = FX 2 (y ) =
Exerciiu 2.2
N (, ),
atunci i
Artai c dac
atunci variabila
X1 , X2 , . . . , Xn sunt variabile aleatoare independente, identic repartizate n 1 aleatoare H = (Xi )2 urmeaz repartiia 2 (n). 2
i=1
atunci
Dac
Xi N (, ),
sunt
{Yi2 }n i=1
Xi N (0, 1). Deoarece {Xi }n i=1 sunt independente, 2 independente. Dac X N (0, 1), atunci X are densitatea de repartiie 1 e x 2 dx , x > 0. 2x fX 2 (x) = 0 , x 0. Yi = X2
0
este
MX 2 (t) = E(etX ) =
Folosind independena variabilelor
etx
x 1 e 2 dx = (1 2t)1/2 , 2x
t < 1/2. H
este
{Yi2 }n i=1 ,
n
MH (t) =
i=1
t < 1/2,
14
Exerciiu 2.3
X (0, 1))
F : R [0, 1],
iar
F 1
(care
u (0, 1).
F 1 (u2 ),
n
{u1 , u2 , . . . , un } sunt numere aleatoare uniform repartizate n [0, 1], avem c {F 1 (u1 ), . . . , F 1 (un )} formeaz o selecie ntmpltoare de numere repartizate exp(). Figura 2.1, am reprezentat grac o dou selecii de volum 150 de numere aleatoare repartizate exp(5);
Seleciile generate au fost ordonate descresctor. Funcia
una generat prin metoda funciei de repartiie inverse, cealalt generat de funcia
exprnd.
Matlab predenit
prezentat mai jos. Apelarea funciei se face prin tastarea n fereastra de lucru n
function expsel(lambda) % functia expsel.m % generez 150 de numere cu metoda Hincin-Smirnov si le ordonez descrescator Y = sort(-lambda*log(1-rand(150,1)), 'descend'); plot(Y, 'bo'); hold on % desenez selectia si retin figura % generez 150 de numere cu exprnd si le ordonez descrescator Z = sort(exprnd(lambda, 150,1), 'descend'); plot(Z, 'r*') % desenez Z cu rosu legend('metoda functiei inverse','generare cu exprnd')
Exerciiu 2.4
aleatoare
aleatoare repartizat
U (0, 1),
15
Soluie:
este
fU (x) =
Funcia de repartiie a lui
1, 0,
dac dac
x > 0, x 0.
este
FY (y ) = P (Y y ) = P ( ln(U ) y ) =
y P ln(U ) , 0,
dac dac
y > 0, = y 0. Y
1 P U < e , 0,
este
dac dac
y > 0, y 0.
1 FU e , 0,
dac dac
y > 0, y 0.
y f e U fY (y ) = FY (y ) = 0,
Se observ c
1 y e ,
dac dac
y > 0, y 0.
y 1 e , = 0,
dac dac
y > 0, y 0.
Y exp().
S presupunem c
Exerciiu 2.5
o ar. determine
Se tie c
X este o v.a. continu ce reprezint nlimea (n cm) brbailor dintrP (X 170) = 0.1. tiind c X este normal distribuit, cu media m = 175, s se dispersia lui X . Z=
X 175
Soluie:
N (0, 1). =P
Atunci,
0.1 = P (X 170) = P
de unde de unde
,
(norminv(0.1)),
5 este = 3.9.
cuantila de ordin
0.1
pentru
Aceasta este
z0.1 = 1.28
Exerciiu 2.6
Trei ntreprinderi trimit acelai tip de piese ntr-un depozit central, n proporie de
5, 3, 2.
3600 RON.
ntreprinderi?
Soluie:
Notm cu:
Aevenimentul ca o pies aleas la ntmplare din depozitul central s e rebut. Ai evenimentul ca, alegnd la ntmplare o pies din depozitul central, aceasta s aparin rmei i. Pentru a determina cum mprim cei 3600 ntre cele 3 rme, va trebui s determin probabilitile condiionate P (A1 | A), P (A2 | A), P (A2 | A), care reprezint ponderile de rebuturi produse de ecare
rm, condiionate de apariia unui rebut la o alegere la ntmplare din depozit. Dar,
Avem c
P (A) = P (A1 )P (A|A1 ) + P (A2 )P (A|A2 ) + P (A3 )P (A|A3 ) = 0.5 0.01 + 0.3 0.03 + 0.2 0.02 = 0.018.
i (formula lui Bayes)
P (A1 | A) =
P (A1 )P (A|A1 ) 5 P (A2 )P (A|A2 ) 1 P (A3 )P (A|A3 ) 2 = , P ( A2 | A) = = , P (A3 | A) = = . P (A) 18 P (A) 2 P (A) 9
16
5 1 2 3600 = 1000 (rma 1); 3600 = 1800 (rma 2); 3600 = 800 (rma 3). 18 2 9
Exerciiu 2.7
Un anumit restaurant popular servete la cin doar trei tipuri de meniuri cu preuri xe,
i anume: 25, 30 i 45 (incluznd buturile). Pentru un cuplu ales la ntmplare dintre cele ce iau cina n acest restaurant, notm cu
Y p(x, y )
25 25 0.05 0.05 0 i 30 0.05 0.10 0.20 45 .10 .35 .10
30 45
Y; 30
de ecare?
Care este probabilitatea ca preul cinei pentru ambii parteneri s e cel mult
Care este valoarea ateptat a costului total al cinei pentru un cuplu ales la ntmplare? La nalul cinei, ecare cuplu primete din partea casei prjituri cu rva. Dac un cuplu gsete n
rva mesajul Drept curtoazie din partea casei, din preul total al cinei vei primi napoi diferena dintre
cel mai scump i cel mai ieftin dintre meniurile comandate de amndoi, ct se ateapt restaurantul s
returneze pentru un singur cuplu? (6) (7) (8) Determinai coecientul de corelaie dintre Determinai repartiia lui Calculai
Y. (X = 30).
Y condiionat de D2 (Y |X = 30).
Pentru
evenimentul
Soluie:
(1)
p(x, y ).
este:
x = 25,
atunci
Obinem c
x pX (x)
Similar,
25 0.2
atunci
30 0.5
45 0.3
Obinem c
pY (y ) =
x p(x,
25 0.1
30 0.35
45 0.55
(2) (3)
(x, y ).
(4)
De exemplu,
Y nu sunt independende, deoarece p(x, y ) = pX (x) pY (y ) p(25, 25) = 0.05 = 0.2 0.1 = pX (25) pY (25).
i
h(X, Y ) = X + Y
E(h(X, Y )) =
x y
h(x, y )p(x, y ) =
x y
(x + y )p(x, y ) = 71.25.
(5)
Z = |X Y |.
17
Aceasta este:
z p Z (z )
Media lui (6)
0 0.1
5 0.25
15 0.55
20 0. 1
este
Prin deniie,
X,Y =
Dar,
X =
x
E(X Y ) =
x
Obinem c (7)
xy p(x, y ) = 1253.8.
y
X,Y = 0.1722. Y |X = 30
are funcia de probabilitate
Variabila aleatoare
fY |X (y | 30) =
p(30, y ) , pX (30)
ce are tabelul de
repartiie urmtor:
y pY |X (y | 30)
(8)
25 0.1
30 0.2
45 0.7
i
Exerciiu 2.8
O numit companie de ambalat fructe uscate, amestec n acelai pachet trei tipuri de
fructe, mango, ananas i papaya, astfel nct masa net a pachetului este de ecrui fruct la produsul nal este egal cu S notm cu
individuale din ecare fruct uscat pot varia de la un pachet la altul. Deoarece suma ponderilor maselor
1,
dac am avea informaii despre repartiia comun a celorlale dou cantiti de fruct din pachet.
ponderea masei
de ananas din masa net a aceluiai pachet, ales la ntmplare. Presupunem c repartiia comun a celor dou cantiti este
f (x, y ) =
(a) (b) (c) (d) Vericai dac
24xy, 0,
pentru altfel.
0 x 1, 0 y 1, x + y 1,
f (x, y )
de papaya s e mai mare de un sfert de pachet. Determinai densitile de repartiie marginale. Vericai dac
sunt independente.
Y.
18
condiionat de
X = x.
a pachetului.
Y s e cel mult un sfert de pachet, tiind c X este jumtate din masa net P (Y 0.25|X = 0.5)). Calculai media condiionat a lui Y tiind c X = 0.5. (i.e., E(Y |X = 0.5)) 2 Calculai D (Y |X = 0.5).
(a) Se vede c
Soluie:
f (x, y ) 0, x, y .
1 1x
n plus,
f (x, y ) dxdy =
0 0
Not cu
24xy dy
i
dx =
0
24x
y2 2
y =1x y =0
dx =
0
12x(1 x)2 dx = 1.
D = {(x, y ); 0 x 1, 0 y 1 P ((X, Y ) D) =
D
x + y 0.75}.
0.75
0.75x
f (x, y ) dxdy =
0
este:
24xy dy
0
dx = 0.3164.
(b)
fX (x) =
f (x, y ) dy =
12x(1 x)2 , 0,
dac
0 x 1;
altfel.
este:
fY (y ) =
f (x, y ) dx =
12y (1 y )2 , 0,
dac
0 y 1;
altfel.
f (x, y ) = fX (x) fY (y ), x, y ,
Prin deniie,
X,Y =
Dar,
X =
xfX (x) dx =
0 1
yfY (y ) dy =
0 1
12y 2 (1 y )2 dy = 0.4.
2 X = E(X 2 )2 X = 0
E(X Y ) =
Obinem c (e)
24x2 y 2 dxdy =
X,Y
(f )
0.25
0.25
P (Y 0.25|X = 0.5) =
fY |X (y |x) dy =
0
2y 1 dy = . (1 x)2 4
19
(g)
1x
Y |X =x = E(Y |X = x) =
yfY |X (y |x) dy =
0
2y 2 2 dy = (1 x), 0 x 1. (1 x)2 3
X = 0.5,
obinem c
E(Y |X = 0.5) =
1x
1 3.
D2 (Y |X = x) = E(Y 2 |X = x) 2 Y |X = x =
n particular, pentru
2y 3 4 1 dy (1 x)2 = (1 x)2 , 0 x 1. 2 (1 x) 9 18
X = 0.5,
obinem c
Exerciiu 2.9
Dac
variabilei aleatoare
X i Y sunt Z = X/Y .
N (0, 1),
determinai repartiia
Soluie:
sunt
1 2 fX (x) = ex /2 , x R, 2
1 2 fY (y ) = ey /2 , y R. 2 (X, Y )
este:
fX,Y (x) =
(U, V ) = (X/Y, Y ).
Transformarea invers
x = uv, y = v .
(X, Y ) n este J = v .
Densitatea de repartiie marginal a primei componente se obine integrnd n raport cu a doua variabil. Obinem:
Se observ c
u R.
fX/Y
100
f (x) =
5x4 ,
0 x 1.
U ( , ). 2 2 (i) Determinai repartiia variabilei aleatoare Y = tan(X ) (Y se numete variabil aleatoare Cauchy). (ii) Folosind metoda Hincin-Smirnov, generai o familie de 1000 de numere aleatoare repartizate Cauchy C (0, 1). (iii) Calculai P (| tan X | > 3).
Exerciiu 2.11
Fie
20
Exerciiu 2.12
aleatoare
Dac
U (0, 1),
Y =
eX .
Fie
Exerciiu 2.13
toare
B (n, p).
Y = n X.
Erorile a
Exerciiu 2.14
(1) tiia (2)
10
N (0, 1), i = 1, 2, . . . , n.
10
H=
i=1
2 i urmeaz repar-
2 ,
i.e.
Exerciiu 2.15
x 8,
x (0, 4).
Dac
X N (0, 1),
|X |.
X exp(),
Exerciiu 2.18
Fie
R, x 2 + y 2 r 2 })
Exerciiu 2.19
standard este (a) tiind c
Distana
la care sunt aruncate mingile aruncate de o main automat de servit mingi Media distanei este necunoscut, dar deviaia
X E(X ) Z= 1.2
i calculai probabilitatea
Exerciiu 2.20
(1) (2) (3)
Fie
Y =
2 ln U sin(2V ).
aleatoare
N (0, 1)
independente.
Exerciiu 2.21
zate
U (0, 1).
Determinai repartiia raportului a dou variabile aleatoare independente i identic re-
Exerciiu 2.22
partizate
N (0, 1).
21
Exerciiu 2.23
5 2 1
7 3 6
8 4 11
9 15 12
10 16 13
18 17 14
Pentru ecare zar, toate feele au aceeai ans de apariie. Fiecare juctor alege un zar i l pstreaz pentru restul competiiei. Un joc const n aruncarea zarului ales, iar cel care obine un numr mai mare de puncte va ctiga jocul. independente. (a) (b) (c) Pcal, politicos ind, l invit pe Tndal s e primul care i alege zarul. Artai c, orice zar ar La ecare joc, cel care obine un numr mai mare de puncte primete de la cellalt juctor alege Tndal, Pcal are posibilitatea de a alege un zar mai bun dintre cele rmase. Un astfel de joc poate repetat de mai multe ori, n condiii identice i
1 RON.
Determinai ctigul mediu pe care l poate avea Pcal dup Calculai probabilitatea ca, dup
60
de jocuri (aruncri).
60
10 RON.
Exerciiu 2.24
urmtor:
Y p(x, y )
20 10 a 0.1 20 0.1 0.3 30 a 3a repartiie legitim;
X
(a) (b) (c) (d) (e) (f ) Determinai parametrul real
40
a pentru care tabelul reprezint o Calculai P (X 20 i Y 30) i P (X 20 i Y 30). Calculai F (20, 30), F (30, 40) i F (30, 25). Pentru Z = X + Y , calculai probabilitatea P (|Z 45| > 5). 2 Pentru W = 2X 0.5Y + 10, determinai E(W ) i D (W ). Determinai cov (X, Y ) i X,Y .
La o benzinrie exist dou tipuri de staii:
Exerciiu 2.25
Fiecare serviciu are cte dou pompe independente. S notm cu servire asistat care sunt folosite ntr-un anumit moment i cu folosite n acelai moment. Repartiia comun pentru
(X, Y ) Y
este
p(x, y )
0
2 .02 .06 .3
1 2
Calculai
P (X = 1
Y = 1)
probabilitatea acestuia.
sunt independente.
X,Y .
E(Y |X = 0).
22
Exerciiu 2.26
i
O anumit rm primete comenzi la oricare dintre cele dou linii telefonice disponibile.
Pentru ecare linie, timpul de ateptare dintre dou apeluri este repartizat exponenial. Notm prin
cei doi timpi de ateptare. Presupunem c aceti timpi sunt independeni unul de cellalt. Dac
este timpul de ateptare mai mic dintre dou, atunci se poate arta c repartiia comun pentru este
X X X i Y
f (x, y ) =
(a) (b) (c) (d) (e) (f )
2e(x+y) , 0, Y
pentru altfel.
Determinai densitatea de repartiie marginal a lui Determinai densitatea de repartiie a lui Gsii probabilitatea ca Vericai dac
X. X = x. X1
(i.e.,
condiionat de
minute, tiind c
sunt independente.
calculai
E(Y |X = 1)).
Exerciiu 2.27
este
f (x, y ) =
e(x+y) , 0,
pentru altfel.
0 < x, y < .
U =X +Y
V =
X X +Y .
Exerciiu 2.28
(1) (2) (3)
T1 exp(1000h)
Determinai densitatea de repartiie comun celor dou variabile aleatoare. Calculai probabilitatea ca ambele baterii s funcioneze continuu mai mult de tiind c prima baterie a funcionat exact
1200h,
Exerciiu 2.29
Un b de lungime
1m
rupere. S notm cu
X ),
determinai
f (x, y ).
Exerciiu 2.30
(X, Y )
f (x, y ) =
(a) (b) Determinai valoarea lui
key 0,
pentru altfel.
pentru care
f (x, y ) X, Y .
Exerciiu 2.31
Vectorul aleator
(X, Y )
f (x, y ) =
key 0,
pentru altfel.
x > 0, y > x.
23
pentru care
f (x, y )
Exerciiu 2.32
X=x p(x)
(i) (ii)
Y,
5 0.5
10 0.4
20 0.1
Y =y p(y )
1 0.6
10 0.25
i
15 0. 1
30 0.05
m = min{X, Y }
M = max{X, Y }.
Exerciiu 2.33
Vectorul aleator
(X, Y )
f (x, y ) =
(a) (b) (c) Calculai probabilitile Calculai
exy 0,
pentru altfel.
x 0, y 0.
Calculai probabilitile
P (X 1, Y 1), P (X + Y 1), P (X + Y > 2). P (Y 1| X 1), P (X > 1| Y > 1), P (X 2Y ). E(Y | X = 1), E(X | X = 1).
Se arunc o moned ideal n mod repetat, independent de alte aruncri. Notm cu
Exerciiu 2.34
Xk
stema, sau
k (k N). Acesta poate 2 (ctig), dac apare Sn ctigul cumulat din primele n aruncri. Cunoscnd valorile S1 , S2 , . . . , Sn (i.e., istoria ctigurilor pn la rangul n), s se determine valoarea ateptat a ctigului la aruncarea n + 1, i.e., E[Sn+1 | Sn , Sn1 , . . . , S0 ].
ctigul obinut de un juctor la aruncarea de rang
24
binomial i Poisson, atunci cnd numrul de extrageri n schema binomial este un numr mare. Observm c pentru un numr
n p0
e k . k!
(3.1)
=np
0.12
0.1
0.08
0.06
0.04
0.02
10
15
20
25
30
Figura 3.1:
B (n, p)
P (np)
pentru
n = 100, p = 0.15
albastru)
i Poisson (
rou)
n = input('n='); p = input('p='); lambda = n*p; a=fix(lambda-3*sqrt(lambda)); b=fix(lambda+3*sqrt(lambda)); % a si b sunt valorile din problema celor 3 x=a:b; fB=binopdf(x,n,p); fP=poisspdf(x,lambda); bar(x',[fB',fP'])
25
Exerciiu 3.2
X
(a) (b) (c)
100
variabila aleatoare ce reprezint numrul de duble aprute. Care este probabilitatea de a obine exact S se calculeze
20
de duble?
Aproximai probabilitile de la (a) i (b) folosind teorema limit central. (a) Avem de calculat
Soluie:
B (100, 1/6),
P1 =
(b) Notm cu
20 C100
1 6
5 6
80
0.0679. X.
Atunci,
FX
=
k=14
(c) Dac aproximm
k C100
1 6
5 6
100k
0.3994.
P1
folosind formula
P (X = k )
obinem:
1 npq
k np npq
1 5 (k = 20, p = , q = ) 6 6
P1
Dac aproximm
1 100
1 6
5 6
P2
folosind formula
P (X k )
obinem:
k+ 1 np 2 npq
17 +
1 2
1 6
100
100 6
13 +
1 2
1 6
5 6
100
100 6
0.3907.
5 6
P1 P2 P1 P2
Exerciiu 3.3
Timpul de deservire la un anumit ghieu dintr-o banc este o variabil aleatoare repartizat
exponenial, cu media de
36
(prima persoan la rnd abia a fost chemat) i c timpii de servire sunt independeni, s se calculeze probabilitatea de a atepta mai mult de o or la rnd.
26
Soluie:
Atunci
Notm cu
Ti
i (i = 1, 36).
36
Ti
exp(2).
Notm cu
S36 =
i=1
Ti .
exp(2),
media este
= 2
= 2. Sn N (n, n).
60 72 S36 72 12 12
Observaia 3.1
S36 .
Folosind rezultatul
Exerciiu 3.4
este punctul de paii
O de pe axa orizontal i se mic doar pe aceast ax astfel: n ecare unitate de timp, acesta 0.5, ori face un pas n spate, cu probabilitatea 0.5, independent anteriori. Folosind Teorema limit central, estimai probabilitatea ca, dup 100 de pai, acesta
Soluie:
Xi variabila aleatoare ce reprezint pasul pe care ceteanul l face la momentul i (i N). S atribuim X = 1, dac face un pas la stnga, i X = 1, dac face un pas la dreapta. Aadar, X este o variabil aleatoare discret ce poate lua doar dou valori, 1 i 1, ambele cu probabilitatea 0.5. Se 2 calculeaz cu uurin, E(X ) = 0 i D (X ) = 1. Suntem interesai s am ce se ntmpl dup 100 de
Fie
Sn =
i=1 n
Xi .
Atunci,
E(Sn ) =
i=1
deoarece
E(Xi ) = 0
D2 (Sn ) =
i=1
D2 (Xi ) = n,
{Xi }i=1, n
n 30,
Sn N (0,
n).
Pentru
normcdf(2,0,10)-normcdf(-2,0,10).
% % % % %
1D .
Exerciiu 3.5
(a) Calculai (i) (ii)
ce apar n
Soluie:
S2 5
4 36
este:
S2 :
de unde:
2
1 36
3
2 36
4
3 36
6
5 36
7
6 36
8
5 36
9
4 36
10 11 12
3 36 2 36 1 36
10 13 = . 36 18
(i
= 1, n).
n
Sn =
k=1
Obinem c:
Xi ,
E(Sn ) =
k=1 875 6 ),
D (Sn ) =
k=1
D2 (Xi ) =
35 n. 12
S50 N (175,
S100 N (350,
P (Sn x)
Vom avea:
6 875
0.3244.
Matlab,
1-normcdf(5.5*sqrt(6/875))
P2 = P (340 S100 360) = P (S100 360) P (S100 339) 10.5 3 875 10.5 3 875 0.4613.
Matlab,
normcdf(10.5*sqrt(3/875)) - normcdf(-10.5*sqrt(3/875))
Exerciiu 3.6
P
Determinai
prin dou metode: (i) (ii) Folosind inegalitatea lui Cebev; Folosind Teorema limit central.
Soluie:
Aadar,
(i)
n B (n, 0.5),
de unde
E(n ) =
n 2 i
D2 (n ) =
n 4.
E(
Folosim inegalitatea lui Cebev pentru
P
Impunem condiia
1
de unde obinem c (ii) Cutm
25 0.98, n
n 1250
astfel nct
P 0.1
Ne ateptm ca valoarea lui
(3.2)
29
n 0.98 = P 0.1 0.5 0.1 n n 0.5n n n = P 0.1 0.1 0.5 0.5 0.5 n n n = 5 5 n n n = 1 = 2 5 5 5
de unde
1 0.99
pentru repartiia normal
n 5
= 0.99
n 5
(cuantila de ordin n
n = (5*norminv(0.99,0,1))^2
Aadar, pentru ca relaia din enun s aib loc, va trebui ca
n 136
Observm c aceast valoare este mult mai mic dect cea gsit anterior. Metoda a doua (TLC) ne d un rezultat mai bun dect cel obinut cu ajutorul inegalitii lui Cebev. Aici, mai bun se traduce prin faptul c, folosind numr mai mic de simulri ale experimentului, obinem acelai rezultat.
Exerciiu 3.2
puin
25%
companiei. Determinai care ar trebui s e volumul minim de selecie pentru ca, cu o probabilitate de cel valorile
0.97, procentul de alegtori ce intenioneaz s-l voteze pe respectivul candidat se ncadreaz ntre 20% i 30%. Determinai volumul minim folosind cele dou metode menionate n Exerciiul 3.6.
S notm cu
Soluie:
votani (din
P 0.2
echivalent cu
n 0.3 0.97, n
P
(i) Observm c variabila aleatoare
n 4 i
D2 (n ) =
3n 16 . Aadar,
E(
D2 (
n 3 )= . n 16n
Gsim c:
a = 0.05.
P
Impunem condiia
=1
75 . n
1
de unde obinem c (ii) Cutm
75 0.97, n
n 2500
astfel nct
P 0.05
(3.3)
0.97 = P 0.05
n 0.25 0.05 n n n n 0.25n = P 0.05 4 4 0.05 4 3 3 3n n n = 0.2 0.2 3 3 n n n = 0.2 1 0.2 = 2 0.2 3 3 3
i
de unde
0.2
n 3
= 0.985
0.2
n 3
n = 3*(norminv(0.985,0,1)/0.2)^2
Aadar, pentru ca relaia din enun s aib loc, va trebui ca
n 354
Observm, din nou, c aceast valoare este mult mai mic dect cea gsit anterior.
Exerciiu 3.7
20
79 475.5 125.5 75
Determinai amplitudinea, media, mediana, modul, cuartilele i distana intercuartilic pentru aceste date. Care valoare este cea mai reprezentativ?
Soluie:
75 79 89 125.5 130
111.5 475.5
525
525 50 = 475, media lor inferioar este Q1 = 84, cuartila superioar d = Q3 Q1 = 56. 340.5, 475.5, 525,
154.15, mediana este 105.75, modul este 100, cuartila Q3 = 140, Q2 = M e i distana intercuartilic este
Mediana este valoarea cea mai reprezentativ n acest caz, deoarece cele mai mari trei preuri, anume mresc media i o fac mai puin reprezentativ pentru celelalte date. n cazul n care setul de date nu este simetric, valoarea median este cea mai reprezentativ valoare a datelor. n
Matlab,
31
X = [113; 60.5; 340.5; 130; 79; 475.5; 90; 100; 175.5; 100; ... 111.5; 525; 50; 122.5; 125.5; 75; 150; 89; 100; 70 a = range(X); m = mean(X); Me = median(X); Mo = mode(X); Q1 = quantile(X,0.25); Q2 = quantile(X,0.5); Q3 = quantile(X,0.75); d = Q3 - Q1;
nlimea (n cm)
frecvena
[0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30)
Tabela 3.1:
5 13 23 17 10 2
Exerciiu 3.8
Considerm datele din Tabelul 3.1. Determinai amplitudinea, media, mediana, modul,
Soluie:
Amplitudinea este
a = 30.
Media este
x =
Dispersia este:
s2 =
1 ( (x2 f ) n x 2 ) n1 1 = (2.52 5 + 7.52 13 + 12.52 23 + 17.52 17 + 22.52 10 + 27.52 2 70 13.92862 ) 69 = 37.06. [10, 15). 35
Deoarece n clasele anterioare ([0,
5)
[5, 10))
se a deja
5 + 13 = 18
date mai mici dect mediana, pentru a aa nlimea median a plantelor (i.e., acea valoare care este mai mare dect nlimea a de plante i mai mic dect nlimea a alte
35
de plante), va trebui
s determinm acea valoare din clasa median ce este mai mare dect alte Aadar, avem nevoie de a determina o fracie median este
17
M e = 10 +
Clasa modal este cele
17 5 = 13.6957. 23 12.5.
[10, 15),
Calculm acum prima cuartil. mprim setul de date n patru. Prima cuartil este acea valoare dintre
70
18
valori, adic
Q1 = 10.
Implementarea n
Matlab:
x = [2.5; 7.5; 12.5; 17.5; 22.5; 27.5]; % centrele claselor f = [5; 13; 23; 17; 10; 2]; % frecventele n = 70; m = sum(x.*f)/n; s2 = (sum(x.^2.*f) - n*m^2)/(n-1);
32
Exerciiu 3.9
1, 0, 2, 3, 4, 1, 4, 0, 4, 2, 3, 0, 3, 3, 1, 2, 3, 0, 1, 2, 3, 1, 3, 2, 3, 2, 4, 3, 4, 2, 3, 4, 4, 3, 2, 4, 1, 2, 0, 1, 3, 2, 0, 4, 1, 0, 2, 2, 4, 1, 2, 2
(a) Construii un tabel de frecvene care s conin numrul de accidente, frecvenele absolute i relative. (b) Gsii media empiric, mediana i deviaia standard empiric. (c) Reprezentai prin bare rezultatele din tabelul de frecvene. (d) Gsii i reprezentai grac (cdfplot) funcia de repartiie empiric a numrului de accidente. (e) Aproximai probabilitatea ca ntr-o sptmn aleas la ntmplare s avut cel puin dou accidente.
Soluie:
(a) Tabelul de frecvene este Tabelul 3.2.
0 7 0.1346
1 9 0.1731
2 14 0.2692
3 12 0.2308
4 10 0.1923
(b) Avem:
52
x=
i=1
(c) 3.3.
xi = 2.1731,
s=
1 51
52
(xi x )2 = 1.3094,
i=1 (x) Fn
M e = 2.
sunt reprezentate n Figura
0, 7 52 , 16 , 52 Fn (x) = P (X x) = 30 52 , 42 52 , 1,
Probabilitatea cerut la
x < 0; dac x [0, dac x [1, dac x [2, dac x [3, dac x 4.
dac
(e)
este:
P (X 2) = 1 P (X < 2) = 1 P (X 1) 1 Fn (1) = 1
Codul
16 = 0.6923. 52
Y = [zeros(7,1);ones(9,1);2*ones(14,1);3*ones(12,1);4*ones(10,1)]; m = mean(Y); s = std(Y); Me = median(Y); subplot(1,2,1); bar(0:4,[7,9,14,12,10]) % graficul cu bare subplot(1,2,2); cdfplot(Y) % graficul functiei de repartitie empirice
33
Exerciiu 3.10
este
Testm media notelor obinute de studenii din ultimul an al unei universiti. S pre-
x = 7.24
i deviaia standard
s = 0.7.
Media ta
8.45.
Care i este poziia mediei tale, raportat la mediile colegilor ti? (i.e., cte deviaii standard,
s,
Soluie:
Calculm scorul
Z.
z=
Sn
P1 = P (S100 > 57); P2 = P (473 S1000 548); P3 = P (S50 = 25). Care este
P3 ?
Exerciiu 3.12
astfel nct
Fie X1 , X2 , . . . , Xn variabile aleatoare identic repartizate i independente stochastic, P (Xi > 0) = 1, i (i.e., Xi > 0 a.s.). Artai c pentru n sucient de mare, produsul X1 X2 . . . Xn urmeaz repartiia lognormal.
Exerciiu 3.13
(a) (b) (c) exact
Care este numrul mediu de aruncri necesare pentru a obine o dubl? Care este probabilitatea de a obine o dubl pentru prima dat din cel mult
aruncri?
Aplicnd Teorema limit central, determinai numrul minim de aruncri necesare pentru ca, cu o
probabilitate de
0.95,
0.25
0.35.
34
Exerciiu 3.14
aproxima: (a) (b)
48
de ori.
probabilitatea ca suma punctelor obinute s e mai mare dect probabilitatea ca suma punctelor obinute s e ntre
165.
160
175.
Dac
X P (1), determinai cel mai mic numr natural n pentru care P (X < n) 0.99.
o variabil aleatoare cu
Fie
= E(X ) = 1
D2 (X ) = 0.2.
Determinai
P (0.5 X 1.5),
n, 0,
n,
cu probabilitile:
2 P (Xk = 0) = 1 , k
k = 2, 3, 4, . . . .
Exerciiu 3.18
intervalul
Teorema limit central arm c suma unui ir de v.a. independente i identic reparti-
zate are o form normal, indiferent ce tip de repartiie au variabilele din ir. Dorim s dovedim aceasta grac, prin simulri n
S alegem
40
de numere din
[0, 1]
S40 .
n acelai sistem de coordonate, desenm densitatea de repartiie Urmrii ct de bine se potrivesc cele dou grace. (a)
1000 de ori i realizm un grac cu bare (20 de bare) a rezultatelor obinute. N (, ), unde = (S40 ) i = (S40 ).
(b)
f (x) = 2x;
f (x) = 3x2 ; n,
(c)
Exerciiu 3.19
aleatoare n
Ct de mare ar trebui s e
n = 1, 5, 15, 20 n
numere
[0, 1],
(a) (c),
Sn
i repetai experimentul de
1000
cea mai bun potrivire ntre gracul cu bare i gracul densitii de repartiie.
35
Utiliznd funciile
(4.1)
(4.2)
n.
Pentru aceasta, va
m=n
random('norm',100,6, 50,50)
genereaz o matrice ptratic, de dimensiune
50.
coloan a sa corespunde unei variabile aleatoare de selecie de volum valori ale sale obinute la o observaie. n total, avem aleatoare de selecie. Aadar, am generat repartiia
50,
50
de
50
50
50 de 50, ce
variabile urmeaz
N (100, 6).
Presupunem c masa medie a unor batoane de ciocolat produse de o main este o n vederea vericrii parametrilor mainii, dintre batoanele primite
Exerciiu 4.1
caracteristic (i) (ii)
X N (100, 0.65).
1000
de buci.
X. 102
de grame. Calculai
(iii) Un baton este declarat rebut dac masa sa este sub procentul de rebuturi avute.
Soluie:
(i)
urmeaz repartiia
Aadar,
X = 100,
(ii) Probabilitatea
X 0.02.
este
P2 = P {X < 98}
{X > 102}
r = P2 100% 0.2091%,
adic aproximativ
rebuturi la
1000
de batoane.
36
Exerciiu 4.2
500ml
cel de (a) (b) (c) (d) i
amponul marca Fairhair se vinde acum n supermarket n trei mrimi (volume): 250ml, 1 litru. Treizeci la sut dintre cumprtorii acestui produs cumpr aconul de 250ml, 50% pe 500ml, iar restul pe cel de 1 litru. Notm cu X volumul unui acon de Fairhair. Fie X1 i X2
volumele acoanelor cumprate de doi dintre clieni, alei la ntmplare. Determinai repartiia mediei de selecie
2 Calculai D (X ) i comparai-o cu
Calculai probabilitatea
X . Calculai = D2 (X ).
media
E(X )
i comparai-o cu
= E(X ).
P (X 500).
Care ar trebui s e volumul minim de cumprtori pentru ca media de selecie s satisfac relaia
este:
x p(x)
Deoarece
250 0.3
500 0 .5
1000 0.2
X2 sunt variabile aleatoare de selecie, ele X . Avem c = E(X ) = 525 i = D(X ) = 25 109. (a) Media de selecie este X = (X1 + X2 )/2. Repartiia
i
X1
x p(x)
Media este (b) (c) (d)
250 0.09
375 0.3
500 0.25
625 0.12
750 0 .2
1000 0.04
X = E(X ) = E(X ) = = 525. 109 X = = 25 < . 2 2 P (X 500) = 0.25 + 0.12 + 0.2 + 0.04 = 0.61. X N (0, 1) n general, X N , , de unde gsim c n n X
n
Aadar,
500
n
= 1
500
n
= 1
n 109
n 109
< 0.25
de unde
37
Exerciiu 4.3
f (x) =
s-a efectuat o selecie repetat de volum unde
n = 100.
P (X < 0.65),
Soluie:
Se observ cu uurin c
f (x)
msurabil, nenegativ i
f (x) dx =
R 0
Pentru a calcula probabilitatea cerut, avem nevoie de
2 x dx = 1. E(X )
1
i
D2 (X ).
Avem:
E(X ) =
R
x f (x) dx =
0
2 2 x2 dx = , 3 4 1 = . 9 18
x2 f (x) dx
este
XN
1 2 , 3 18 100
Exerciiu 4.4
Notm cu
P1 , P2 , . . . , P9
preurile oferite de
rea unui anumit tablou. Presupunem c acestea sunt variabile aleatoare repartizate uniform obinut pentru acest tablou.
Obiectul se va vinde celui care vine cu oferta cea mai mare. Determinai valoarea ateptat a preului
Deoarece
P U (1000, 2000),
atunci
f (x) =
1 1000 ,
dac dac
0,
F (x) =
0, 1,
x1000 , 1000
M = P(9) = max{P1 , P2 , . . . , P9 } x R.
este
este
x R.
M, x 1000 1000
8
2000
E(Y ) =
dx = 1900.
Exerciiu 4.5
manufacturier
1400
ore,
200 ore, n timp ce timpul mediu de funcionare ale becurilor produse de un B au timpul mediu de funcionare de 1200 ore, cu deviaia standard de 100 ore. Se face o selecie de 125 becuri din ecare tip i se testeaz becurile alese. Pentru seleciile date, care este probabilitatea ca becurile produse de A au un timp mediu de via mai mare cu (a) 160 de ore; (b) 250 de ore; mai mare dect timpul mediu de funcionare ale becurilor produse de B ? (c) Care este probabilitatea ca timpul mediu de funcionare al becurilor selectate din tipul A s e cuprins ntre 1375 de ore i 1425 de ore? (d) Presupunem c timpul mediu de funcionare ale becurilor produse de A este o v.a. normal. Alegem la ntmplare un bec de tipul A. Care este probabilitatea ca timpul s mediu de funcionare s e cuprins ntre 1375 de ore i 1425 de ore?
cu deviaia standard de
Soluie:
Notm cu
T1
T2
T1 = 1400, T1 = 200
Pentru o selecie de volum
T2 = 1200, T2 = 100.
n = 125
este mult mai mic dect numrul becurilor produse de ecare manufacturir), avem c:
200 T1 N (1400, ) 5 5
100 T2 N (1200, ). 5 5
T1 T2 N (200, 20).
(a) Probabilitatea cerut este:
(c)
Exerciiu 4.6
n
t = 0,
6km n faa celui de-al doilea. Presupunem c viteza primului avion (msurat 510 i deviaia standard 10, iar viteza celui de-al doilea avion este normal repartizat, cu media 500 i deviaia standard 10. (a) Care este probabilitatea ca, dup 4 ore de zbor, al doilea avion s nu l ajuns pe primul? (b) Determinai probabilitatea ca, dup 4 ore de zbor, distana dintre cele dou avioane s e de cel mult 5km.
primul avion are un avans de
km/h)
Soluie:
Notm cu
v1
v2
v1 N (510, 10)
Dup
v2 N (500, 10). 4
pentru ecare v.a., anume
{v1i }i , {v2i }i , i =
1, 4),
v1 N (510, 5)
v2 N (500, 5).
v1 v2 N (10, 5 2).
(a) Evenimentul ca, dup
4 {
v1i + 6
i=1 i=1
3 3 3 P ({4v1 4v2 + 6 > 0}) = P ({v1 v2 > }) = 1 P ({v1 v2 }) = 1 Fv1 v2 ( ) 2 2 2 = 1 - normcdf(-3/2,10,5*sqrt(2)) = 0.9481.
(b) Evenimentul ca, dup
5km
este
40
Exerciiu 4.7
proprieti:
2 2 E[d2 (X )] = D (X ), E[d (X )] =
n1 2 D (X ), n N . n
Notm cu
= E(X ).
Avem c:
E(d2 (X )) = E = 1 E n 1 n
1 n
(Xi X )2
i=1 n 2 i=1
1 E n
(Xi + X )2
i=1 n n
(Xi ) 2(X )
i=1 n
(Xi ) +
i=1
( X ) 2
E (Xi )2 2nE (X )2 + nE (X )2
i=1
1 nE (X )2 nE (X )2 = n D 2 (X ) n1 2 = D 2 (X ) = D (X ). n n
Totodat, se observ c
1 nD2 (X ) nD2 (X ) n
2 E[d2 (X )] = D (X ).
10
zile.
Care este probabilitatea ca durata de funcionare continu a unui astfel de component s depeasc zile? (se consider c timpul de funcionare este o v.a. exponenial). De ndat ce se defecteaz, acest component va trebui nlocuit imediat cu unul nou, identic. Care este
10
(b)
numrul minim de componente de acest tip ce trebuie luate la plecarea ntr-o misiune de un an, pentru ca probabilitatea ca satelitul s devin inoperativ din cauza epuizrii tuturor rezervelor funcionabile s e mai mic de
0.02?
Considerm funcia
Exerciiu 4.9
f : R R, f (x) =
dat prin
a ex 0 f (x)
, x > 0; , x 0.
pentru care
X v.a. ce are densitatea de repartitie gasit. Calculai probabilitatea P (X > 1); {X1 , X2 , . . . , X100 } variabilele aleatoare de selecie repetat asupra lui X si e X selecie. Calculai P X > 1 i P X = a .
d2 (X ).
Presupunem c timpul necesar pescuirii unui pete dintr-un anumit iaz este o variabil
aleatoare repartizat
exp(10min).
ctignd cel care l-a prins primul. Care este probabilitatea ca primul pete s e prins n mai puin de Care este probabilitatea ca toi cei
minute?
15
minute?
41
Exerciiu 4.12
(a)
Artai c dac
U U (0, 1),
atunci
X = + tan
(b) Generai n
1 2
C (, ).
Matlab o selecie de 500 de variabile aleatoare ce urmeaz repartiia Cauchy C (100, 10).
Cantitatea de ap consumat de Ana n ecare zi se presupune a o v.a. normal cu
Exerciiu 4.13
media
2l
i deviaia standard
300 ml,
sticle a cte
2.5
litri de ap ecare. Presupunnd c Ana bea doar din apa cumprat azi, care este probabilitatea ca
ea s mai aib ap din acest stoc i dup o sptmn (7 zile, inclusiv cea de azi)?
Exerciiu 4.14
Masa medie a unui bagaj ce trece pe la serviciul de check-in al aeroportului din Iai pentru
21 kg
i deviaia standard
3.5 kg
12 kg
i deviaia standard
4.5 kg
aceste valori sunt ale unor variabile aleatoare independente de la un pasager la altul, indiferent de clas. Dac ntr-o anumit curs se a
16
81
este valoarea ateptat i deviaia standard a masei totale de bagaje ale pasagerilor din acel avion? Care este probabilitatea ca masa total de bagaje ale celor
97
nu depeasc
2000 kg ? 6
pasageri de la clasa economic i a
10
i se cntresc. Care este probabilitatea ca diferena maselor bagajelor dintre cele dou clase s e mai
20 kg ?
Batoanele de ciocolat produse de o anumit rm cntresc ecare
Exerciiu 4.15
standard
50
g, cu deviaia buci.
0.02
Care este probabilitatea ca masele totale ale celor dou loturi s nu difere prin mai mult
100 de de 5 g?
Exerciiu 4.16
U (0, 10)
(a) (b) (c) repartizat
Presupunem c timpul de ateptare a autobuzului n staie este o v.a. Toi timpii sunt independeni ntre ei.
repartizat
pentru orele dimineii, iar timpul de ateptare a autobuzului n staie la orele serii este o v.a.
U (0, 8).
Dac ntr-o anumit sptmn luai autobuzul n ecare zi (5 zile lucrtoare), care este timpul total Care este abaterea standard a timpului total petrecut n staia de autobuz n ntreaga sptmn? Determinai valoarea medie i abaterea standard a diferenei dintre timpul total petrecut dimineaa
Fie
X1 , X2 , . . . , X10
Gsii
Tudor i Maria au hotrt s se ntlneasc ntre orele 1:00p.m. i 2:00p.m. n faa unui
Care este repartiia comun a vectorului Dac primul care ajunge ateapt
(X, Y )?
15
este probabilitatea ca ei s se ntlneasc n faa acelui restaurant? Dac Tudor a ajuns la 1:15 p.m., care este probabilitatea ca Maria s ajuns pn la 1:30p.m.? Determinai probabilitatea ca primul sosit s ajung pn la ora 1:15p.m. Determinai probabilitatea ca amndoi s soseasc pn la ora 1:15p.m.
42
mle.
este parametrul (sau parametrii) (sau vectorul de parametri) ce urmeaz a estimat punctual; este variabila de memorie pentru intervalul (intervalele) de ncredere ce va estimat;
pCI X
este un vector ce conine datele ce urmeaz a analizate; este parte din formatul comenzii iar
distribution
1.1;
lege
nume_i/val_i
alpha
Matlab
= 0.005;
ntrials (utilizat doar pentru repartiia binomial, reprezint numrul de repetiii ale experimentului.
Dac urmrim s estimm parametrii unei caracteristici gaussiene, atunci putem folosi comanda simplicat:
vrsta
[18, 25) [25, 35) [35, 45) [45, 55) [55, 65)
Total
De exemplu, s lum drept obiect de lucru datele din Tabelul 5.1. O estimare a parametrilor metoda verosimilitii maxime este
prin
43
p = 41.9716 pCI =
12.0228
40.7653 43.1779
11.2439 12.9547
% intervale de incredere
unde prima coloan reprezint estimarea punctual i un interval de ncredere pentru estimarea punctual i un interval de ncredere pentru
LEGEfit(X,alpha)
unde, n locul cuvntului i
alpha
LEGE
observaiile
Exerciiu 5.1
parametrului
P (). E(X ) = D2 (X ) = . =
n
Atunci,
Soluie:
Deoarece
X P (), E(X ) =
urmeaz c
1 E n =
Xi
i=1
1 n
E(Xi )
i=1
=
n
1 ( n
) = ,
i=1
D 2 (X ) =
1 2 D n2
Xi
i=1
1 n2
D2 (Xi )
i=1
1 ( n2
) =
i=1
0, n
cnd
n . .
Funcia
Aadar, conform deniiei, media de selecie este un estimator absolut corect pentru parametrul de probabilitate este
f (x, ) = e
de unde
x , x N, x!
ln f (x, ) x = 1 + . ln f (X, ) X X2 + 2
2
In () = n E
= nE 1 2
Se observ c
=n X
12
1 + 2 (2 + )
n .
D2 (X ) In () = 1,
deci estimatorul
pentru
este ecient.
44
Exerciiu 5.2
Fie
Xi B (1, p), i = 1, n
n
= nX =
i=1
S se arate c
Xi ,
numrul de succese n
incercri.
este
p.
Soluie:
L(x1 , x2 , . . . , xn ; p) =
pxi (1 p)1xi
i=1 n n
xi = p i=1
n
i=1
xi
g (x) 1
Exerciiu 5.3
Aruncm o moned despre care nu tim dac este sau nu corect (adic, probabilitatea
0.5).
Fie
apariii ale feei cu stema la aruncarea repetat a unei monede. Notm cu ca la o singur aruncare a monedei apare stema. Realizm valorile (1 nseamn c faa cu stema a aprut iar
probabilitatea evenimentului
80
dac nu a aprut):
0 1 0 0 1 0 1 1 0 1 0 0 1 0 1 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 1 1 0 1 0 1 1 0 1 0 1 0 1 0 0 0 1 1 0 0 1 0 1 1 0 1 1 0 0 0 1 1 0 1 0 1 1 0 1 1 1 0 0 0 1 0 1 0
(1) S se gseasca un estimator absolut corect pentru din
Matlab.
p,
folosind funciile
mle
binofit
Soluie:
este Bernoulli,
B (1, p).
Astfel,
E(X ) = p,
Un estimator absolut corect pentru medie este
X,
deoarece
E(X ) = E(X )
n
Aadar, pentru selecia dat, valoarea (2) Utiliznd funciile
D2 (X ) =
x=
k=1
xk = 0.5125.
Matlab astfel:
[p,pCI] = mle(Y,'distribution','bino','ntrials',1,'alpha',0.05)
45
cu rezultatul:
p = 0.5125
pCI =
0.3981 0.6259
binofit,
[p,pCI] = binofit(sum(Y),length(Y),0.05)
cu rezultatul:
p = 0.5125
Exerciiu 5.4
X = 2*rand(1e6,1) - 1;
Dac presupunem c aceste observaii au fost obinute urmrind valorile unei v.a. atunci estimm parametrii si astfel: normale
N (, ),
U (a, b),
Exerciiu 5.5
1RON
i jocul se ncheie. Altfel, pentru ecare apariie consecutiv a feei cu stema ctig
1RON
i are
46
Notm cu este:
suma (ctigat sau pierdut) la acest joc de noroc i presupunem c funcia sa probabilitate
f (x; ) =
(a) (b) Vericai dac
(1 )2 x
, x = 1; , x = 0, 1, 2, . . . E(X )
(valoarea ateptat a
f (x; )
ctigului).
urmtoarele ind sumele rezultate n ecare caz: pentru a determina o estimare pentru probabili-
Soluie:
(0, 1).
+
x=0
Media variabilei aleatoare
(1 )2 x = + (1 )2
x=0
este:
x = + (1 )2
1 = 1. 1
E(X ) = +
x=0
(1 )2 xx = + (1 )2
x=0
xx = + (1 )2
= 0. (1 )2 ,
deoarece
E(X )
nu depinde de
).
(b) Notm cu
Xi = 1).
nY n nY Y+
Xi
i=1
L() =
i=1
Logaritmnd, obinem:
f (xi ; ) =
Y i=1
(1 )
2 Xi
(1 )2(nY ) .
nY
ln L() = (Y +
i=1
Xi ) ln + 2(n Y ) ln(1 )
ln L() = 0,
de unde gsim c
nY
Y + = 2n Y +
Xi
i=1 nY
. Xi
i=1
Se veric faptul c derivata a doua a acestei funcii n raport cu este de maxim.
47
2+10 202+10
3 7 , ceea
ce nseamn c probabilitatea de a pierde la acest joc este Mai mult, observm c estimaia lui
bazat pe un ir de
este
= 1
nY
(deoarece, n acest caz, pierdante este
Y = n,
i=1
1.
Timpii de deservire la un anumit ghieu pentru 7 clieni sunt (n minute.fraciuni de mi-
Exerciiu 5.6
nut):
3.14, 4.63, 2.71, 4.85, 4.37, 5.12, 3.49 sunt valori ale unei caracteristici uniforme U (0, ). Determinai prin metoda momentelor i prin metoda verosimilitii maxime. Calculai
Soluie:
U (0, )
este
1 f (x; ) = 0
Metoda momentelor:
selecie de ordinul nti
, x (0, ); , n
rest
(1 (X ) = E(X ))
cu momentul de
(1 (X ) = X ),
obinem:
= E(X ) = X, 2
de unde estimatorul obinut prin metoda momentelor este este
1 = 8.0886.
1 = 2X .
1 L(X ; ) = n 0
, Xi (0, ), i = 1, n; ,
n rest
Observm c aceast funcie admite un maxim doar n cazul n care toate variabilele aleatoare de selecie iau valori n n
(0, ),
caz n care
max Xi .
i=1, n
L()
se obine pentru
2 = max Xi .
i=1, n
2 = 5.12.
Observaia 5.1
foarte mare (n
Dei valorile celor doi estimatori sunt diferite, totui, dac numrul de observaii este atunci estimaiile date de i
),
observaii, aceste valori nu sunt neaprat uniform distribuite ntr-un interval, deci nu ne putem atepta la valori egale pentru
2 .
48
= 250g.
250g
de ngheat.
Presupunem c masa coninutului din cup este o variabil aleatoare repartizat normal, cu masa necunoscut i dispersia cunoscut, ntmplare
= 3g. Pentru a verica dac maina este ajustat bine, se aleg la 30 de nghetate i se cntrete coninutul ecreia. Obinem astfel o selecie repetat, x1 , x2 ,
. . . , x30
257 248
249 256
251 247
251 250
252 247
248 248
248 253
251 251
253 247
248 253
245 244
251 253
Se tie c un estimator absolut corect pentru masa medie este media de selecie, Se cere s se gseasc un interval de ncredere pentru
cu nivelul de
Soluie:
(, ) =
Urmtorul cod
, x z1 2 n
x + z1 2 n
n=30; sigma=3; alpha = 0.01; x=[257 249 251 251 252 251 251 249 248 248 251 253 248 245 251 ... 248 256 247 250 247 251 247 252 248 253 251 247 253 244 253]; z = icdf('norm',1-alpha/2,0,1); % cuantila de ordin 1-alpha/2 pentru normala m1 = mean(x)-z*sigma/sqrt(n); m2 = mean(x)+z*sigma/sqrt(n); % capetele intervalului fprintf('(m1,m2)=(%6.3f,%6.3f)\n',m1,m2); % afiseaza intervalul dupa modul dorit
Rulnd codul, obinem intervalul de ncredere pentru
cnd
este cunoscut:
(, ) = (248.659, 251.478).
Observaia 5.3
ncredere cnd
ncredere. A se compara rezultatul din acest exerciiu cu cel din Exemplul 5.4 (estimare a intervalului de
Exemplu 5.4
S se gseasc un interval de ncredere pentru masa medie din Exerciiul 5.2, n cazul n
Soluie:
este:
(, ) =
d (X ) x t1 , ; n1 2 n
49
d (X ) x + t1 ; n1 2 n
Urmtorul cod
n=30; alpha = 0.01; x=[257 249 251 251 252 251 251 249 248 248 251 253 248 245 251 ... 248 256 247 250 247 251 247 252 248 253 251 247 253 244 253]; dev = std(X); % deviatia standard de selectie t = icdf('t',1-alpha/2,n-1); % cuantila de ordin 1-alpha/2 pentru t(n-1) m1 = mean(x)-t*dev/sqrt(n); m2 = mean(x)+t*dev/sqrt(n); % capetele intervalului fprintf('(m1,m2)=(%6.3f,%6.3f)\n',m1,m2); % afiseaza intervalul dupa modul dorit
Rulnd codul, obinem intervalul de ncredere pentru
cnd
este cunoscut:
(, ) = (248.572, 251.561).
Observaia 5.5
predenite).
A se compara rezultatul din acest exemplu cu cel din Exemplul 5.2 (estimare a in-
Matlab
Exemplu 5.6
Suntem, din nou, n cadrul Exerciiului 5.2, cu meniunea c dispersia nu este cunoscut
a priori (vezi Exerciiu 5.4). Dorim s obinem o estimaie printr-un interval de ncredere pentru
nu este cunoscut. Folosind funcia
cnd
normfit
[m,s,mCI,sCI] = normfit(X,0.01)
50
Observm c valorile furnizate pentru intervalul de ncredere pentru obinute n Exerciiu 5.4.
, (mCI),
m = 250.0667
s = 2.9704
sCI =
2.2111 4.4159
Observaia 5.7
= 0.01)
S presupunem c facem
50
30
(adic alegem n
50
de zile
30
50
de intervale.
Dup cum se observ din gur, se poate ntmpla ca un interval de ncredere generat s nu conin valoarea pe care acesta ar trebui s o estimeze. Aceasta nu contrazice teoria, deoarece probabilitatea cu care valoarea estimat este acoperit de intervalul de ncredere este
1%.
Figura 5.2:
50
Exemplu 5.8
nscrii, doar conden de
100
de studeni
67 au terminat studiile, obinnd o diplom. Gsii un interval de ncredere care, cu o 90%, s determine procentul de studeni absolveni dintre toi studenii ce au fost nscrii.
67 = 0.1, n > 30, p = 100 = 0.67, np = 67 > 5 i n(1 p) = 33 > 5. informaie despre N (numrul total de studeni nscrii), putem presupune c
Soluie:
Deoarece nu ni se d vreo
n < 0.05N .
0.67 z0.975
0.67 + z0.975
= (59.27%, 74.73%).
51
Exemplu 5.9
Dintr-o selecie de
200 de elevi ai unei coli cu 1276 de elevi, 65% arm c dein cel puin = 0.05.
gsim c un interval de ncredere
un telefon mobil. S se gseasc un interval de ncredere pentru procentul de copii din respectiva coal ce dein cel puin un telefon mobil, la nivelul de semnicaie
Soluie:
Avem:
la nivelul de semnicaie
Deoarece
n 0.05N ,
0.65 1.96
0.65 + 1.96
= (58.93%, 71.07%).
Observaia 5.10
p
Dac se dorete estimarea volumului seleciei pentru care se obine estimarea proporiei
E,
E = z1 2
Dac am putea ghici proporia populaiei,
p (1 p) n
(5.1)
p,
z1 2 E
, p(1 p)
(5.2)
este maxim
n=
1 4
i
z1 2 E 40%
Exemplu 5.11
35%
mare ar trebui s e volumul unei selecii dintre elevii de liceu pentru a estima procentul real de elevi ce fumeaz, cu o eroare de estimare maxim de
0.5%.
= 0.1. 50%).
Soluie:
p = 0.4
40%,
Cuantila este
z0.95 = 1.28.
n
2
este:
n = 0.4(1 0.4)
1.64 0.005
= 25820.
Exemplu 5.12
100g
35
100.07; 99.88; 100.11; 99.90; 99.97; 100.2; 100.2; 99.7; 100.2; 100.1; 100.04; 99.89; 100.15; 100.5; 99.79; 98.95; 100.23; 99.89;
52
100.12;
98.63;
99.03;
100.3;
98.68.
pentru deviaia standard masei batoanelor produse de res-
= 0.05)
Soluie:
d2 (x).
Avem:
d2 (x) =
Din tabele, sau utiliznd
1 35
35
( 2 , 2 ) = (0.20, 0.51).
Pentru variaia standard, intervalul de ncredere este:
Exemplu 5.13
de nicotin de
= 0.05) pentru deviaia standard a coninutului de 25 de buci are deviaia standard a coninutului
Soluie:
Mai nti,
Matlab, gsim:
2 0.975; 24 = 39.3641;
Intervalul de ncredere pentru dispersie este:
2 0.025; 24 = 12.4012.
( 2 , 2 ) = (1.56, 4.95).
Pentru variaia standard, intervalul de ncredere este:
Exemplu 5.14
Pentru a
estima dac abaterile diametrelor pieselor produse de cele dou maini sunt sensibil egale, s-au luat la ntamplare dou seturi de volume la urmtoarele rezultate:
n1 = 7
n2 = 10
53
Lotul Lotul
1 2
25.06 25.01
24.95 25.09
25.01 25.02
25.05 24.95
24.98 24.97
24.97 25.03
25.02 24.99
24.97
25.03
24.98
S se determine un interval de ncredere pentru raportul dispersiilor diametrelor pieselor produse de cele dou loturi (
= 0.1).
Soluie:
d2 1 =
Cuantilele sunt:
1 6
d2 2 =
1 9
10
f0.05, 6, 9 = 0.2440
Folosind
f0.95, 6, 9 = 3.3738.
Dintr-o selecie de 45 de baiei ai unei coli, 21 au spus c le place Matematica, iar dintr-o 65 de fete ale aceleiai coli, 37 au susinut c le place aceast disciplin. Construii un interval de ncredere la nivelul de semnicaie = 0.02 pentru diferena proporiilor de baiei i fete din respectiva selecie de coal crora le place Matematica.
Exemplu 5.15
Soluie:
Mai nti,
p1 =
21 45
23 45 ,
p2 =
37 65
37 65 i
z0.99 2.33.
21 37 2.33 45 65
24 45 + 45
28 65 , 65
21 37 + 2.33 45 65
21 45
24 45 + 45
37 65
28 65 = (0.1990, 0.0061). 65
Exerciiu 5.16
de volum cu
N = 1000,
n = 25 = 2.
cu media se selecie
x = 50
se ia dintr-o populaie
(a) Dac presupunem c populaia este normal, gsii un interval de ncredere pentru media populaiei,
= 0.05. = 0.05)
n cazul n care populaia nu este
Soluie:
(, ) =
2 50 z0.975 , 25
2 50 + z0.975 25
= (48.4, 51.6).
54
(b) Deoarece populaia nu este normal distribuit i nici volumul populaiei nu este mare (n lui
< 30),
vom
estima intervalul de ncredere bazndu-ne pe inegalitatea lui Cebev. Avem c probabilitatea ca valorile
s e aproximate prin
X =
P ({|X X | < kX }) 1
Lund
1 . k2
1 = 0.95, k2
gsim
k=
20.
(, ) =
x k , x + k n n
2 = D 2 (X ) = X
50
2 20 , 25
50 +
2 20 25
= (46.42, 53.58).
Am folosit faptul c
rior, de aceea inegalitatea lui Cebev este rar folosit pentru a determina intervale de ncredere. Totui, n acest caz nu aveam o alt alternativ de calcul. Dac se dorete o precizie mai bun, ar indicat ca volumul seleciei s e de cel puin
2 . n
Observm c acest interval este mai mare dect cel gsit ante-
N (, )
este
In () = nI1 () =
(deci, cantitatea de informaie crete cu descreterea lui
n . 2
.) 2 = D2 (X ),
iar
Exerciiu 5.9
2 Artai c statistica d (X ) este un estimator absolut corect pentru 2 2 statistica d (X ) este un estimator corect, dar nu absolut corect, pentru D (X ).
Exerciiu 5.10
B (n, p).
al unei caracteristici
Exerciiu 5.11
prin:
al caracteristicii
f : R R+ ,
dat
f (x; ) =
Vericai dac estimatorul gsit este deplasat.
ex 0
, x > 0, , x 0.
Exerciiu 5.12
Fie selecia
871 822 729 794 523 972 768 758 583 893 598 743 761 858 948 598 912 893 697 867 877 649 738 744 798 812 793 688 589 615 731
S se estimeze absolut corect dispersia populaiei din care provine aceast selecie.
55
X N (, ). n efectuate asupra
Dac
{Xi }i=1, n
unei caracteristici
X,
In ()
denit prin
In () = E
este
L(X, )
In () = nI1 ().
Exerciiu 5.15
N (, ).
S se arate c
al repartiiei normale
Gsii
Considerm funcia
f (x)
Exerciiu 5.18
main. Pentru a se realiza acest control s-a efectuat o selecie de ciocolatelor are urmtoarele dimensiuni (n grame):
50
al
Masa Frecvena
99.98 9
99.99 10
100.00 13
100.01 11
100.02 7
S se determine: (a) o estimaie absolut corect pentru masa medie a tabletelor produse; (b) o estimaie corect i una absolut corect pentru dispersia valorilor masei fa de medie.
Fie
Dac
P (X r). n
mare, luat dintr-o caracteristic ce
Fie
X1 , X2 , . . . , Xn
necunoscut i dispersia
4.
99%
putem estima pe
cu o eroare de o zecime.
56
150
de piese,
un interval de ncredere cu
= 0.01
Un angajat la Serviciu Forelor de Munc dorete s fac un sondaj prin care s determine
procentul de persoane dintr-o regiune a rii ce lucreaz la negru. El dorete s e gsit estimeaz procentul real cu o eroare de cel mult de persoane angajate,
2%.
273
(a) Ct de mare ar trebui s e volumul seleciei pentru a realiza estimarea dorit? (b) Dac nu ar avea acces la acel sondajul recent, ct de mare ar trebui s e volumul seleciei pentru a realiza estimarea dorit?
Exerciiu 5.23
risc
120
56
era datorate consumului de alcool. Gsii un interval de ncredere care s estimeze cu o probabilitate de
= 0.05
Exerciiu 5.24
Notm cu
este
f : R R+ ,
f (x; ) =
(a) Pentru ce valori ale parametrului
( + 1) x 0 ,
funcia
, 0 x 1, , altfel. f
( R)
2%,
i o probabilitate de ncredere de
0.95?
Fie
o caracteristic binomial
B (n, p),
cu
p,
la nivelul de
.
n urma aruncrii unei monede de
Exerciiu 5.27
de
4050
2052
= 0.05.
de piese,
Exerciiu 5.28
defect.
150
= 0.01
57
sau testul
t,
datele
testate trebuie s e normal distribuite i independente. De multe ori, chiar i ipoteza ca datele s e normal repartizate trebuie vericat. concordan ntr-o seciune urmtoare. n De aceea, se pune problema realizrii unei legturi ntre funcia de repartiia empiric i cea teoretic (teste de concordan). Vom discuta mai pe larg aceste teste de
normplot(X)
Matlab sunt deja implementate unele funcii ce testeaz dac datele sunt normal repartizate.
reprezint grac datele din vectorul
Funcia
este de a determina grac dac datele din observate sunt normal distribuite. Dac aceste date sunt selectate dintr-o repartiie normal, atunci acest grac va liniar, dac nu, atunci va un grac curbat. De exemplu, s reprezentm cu
normplot
vectorii
Observm c primul grac este aproape liniar, pe cnd al doilea nu este. Putem astfel s concluzionm c datele date de din
sunt normal repartizate (fapt conrmat i de modul cum le-am generat), iar datele
Funcia
chi2gof
2 ,
nivel de semnicaie
= 0.05.
Astfel, comanda
h = chi2gof(x)
58
h = 1.
h = 0, dac nu putem respinge ipoteza c datele (H0 ) este admis). Aplicnd testul pentru X i Y
h = 1,
dac datele nu sunt normal repartizate (i.e., ipoteza alternativ de mai sus, obinem
(H1 )
este
h = 0,
respectiv,
De asemenea, putem verica dac datele statistice ar putea proveni i din alte repartiii dect cea normal. De exemplu, funcia
probplot(distribution,Y)
creaz un grac ce compar repartiia datelor din vectorul
cu repartiia dat de
'weibull'
implicit c
'lognormal'.
distribution = 'normal'.
wblplot(Y)
probplot(weibull,Y).
n continuare, prezentm un exemplu de utilizare a acestor comenzi. Figura 6.2, vericm dac ecare dintre cele dou selecii generate, una exponenial i cealalt normal, ar putea proveni dintr-o repartiie exponenial.
x = exprnd(0.5, 250,1); % selectie exponentiala y = normrnd(3, 1, 250,1); % selectie normala probplot('exponential',[x y]) legend('Selectie exponentiala','Selectie normala','Location','SE')
59
Urmtoarea funcie
Funcia
histfit(X, n, 'tip_repartitie')
reprezint datele din vectorul X printr-o histogram ce are numrul de bare egal cu n. Dac opiunea 'tip_repartitie' apare (valabil doar pentru lucrul cu Statistics Toolbox!), atunci peste histogram se va desena densitatea de repartiie a repartiiei precizate (e.g., exponential, gamma, lognormal etc). n caz n care opiunea nu apare, se consider implicit c repartiia cu care se compar datele este cea normal. Exemplul de mai jos produce gracul din Figura 6.3.
X = binornd(1e3, 0.1, 1e4, 1); histfit(X, 100)
Testul Z n
Matlab
unde:
h este rezultatul testului. Dac h = 1, atunci ipoteza nul se respinge, dac h = 0, atunci ipoteza nul nu
poate respins pe baza observaiilor facute (adic, se admite, pn la un test mai puternic);
nota 2 3 4 5 6 7 8 9 10 Total
frecvena 2 4 8 15 18 17 15 7 4 90
frecvena relativ 2.22% 4.44% 8.89% 16.67% 20.00% 18.89% 16.67% 7.78% 4.44% 100%
zval este valoarea statisticii Z pentru observaia considerat; X este un vector sau o matrice, coninnd observaiile culese. Dac X este matrice, atunci mai multe teste Z sunt efectuate, de-alungul ecrei coloane a lui X; m0 = 0 , valoarea testat; sigma este deviaia standard teoretic a lui X , alpha este nivelul de semnicaie; tail poate unul dintre urmtoarele iruri de caractere:
a priori
cunoscut;
'both', pentru un test bilateral (poate s nu e specicat, se subnelege implicit); 'left', pentru un test unilateral stnga ( < 0 ); 'right', pentru un test unilateral dreapta ( > 0 ); Exemplu 6.1 Spre exemplicare, s presupunem c datele discrete din Tabelul 6.1 sunt obinute n urma unui sondaj care contabilizeaz notele la Matematic obinute de elevii unei anumite coli. Dorim s testm, la nivelul de semnicaie = 0.05, dac media tuturor notelor la Matematic a elevilor colii este = 6.8 sau mai mare. Se tie c deviaia standard este = 2.5.
Soluie:
vs.
(H1 )
> 6.8.
0.9500
5.9332 Inf
Aceasta nseamn faptul c ipoteza nul este admis la acest nivel de semnicaie.
61
Observaia 6.2 (1) Dac ipoteza alternativ este bilateral ((H1 ) : = 6.8), atunci comanda ar :
[h, p, ci, zval] = ztest(X, 6.8, 2.5)
n acest caz, gsim c ipoteza nul este respins (i.e., rezultatul este h = 1). (2) Decizia testului putea luat i pe baza P valorii. Aceasta este: n
(3) Pentru efectuarea testului, nu este neaprat necesar s am toate cele patru variabile din membrul stng. Putem aa, dup preferin, doar trei, dou, sau numai o variabil, dar doar n ordinea precizat. De exemplu, comanda
h = ztest(X, m0, sigma, alpha, tail)
ne va furniza doar rezultatul testului (h = 0 sau h = 1), fr a aa alte variabile. (4) Nu exist o funcie n care s simuleze testul Z pentru dou selecii.
Testul t n
Matlab
Matlab
unde:
h, p, ci, m0, alpha, tail sunt la fel ca n funcia ztest; variabila stats nmagazineaz urmtoarele date:
tstat - este valoarea statisticii T pentru observaia considerat; df - numrul gradelor de libertate ale testului; sd - deviaia standard de selecie; Exemplu 6.3 Dorim s testm dac o anumit moned este corect, adic ansele ecrei fee de a apare la orice aruncare sunt 50% 50%. Aruncm moneda n caza de 100 de ori i obinem faa cu stema de exact 59 de ori. Pe baza acestei experiene, cutm s testm ipoteza nul
(H0 ) :
(H0 ) : (H1 ) :
= 0.5 = 0.5.
Dac ipoteza (H0 ) se admite, atunci este xat, = 0.5 i statistica T t(n 1). Valoarea acestei statistici pentru selecia dat este:
t0 = x
d (X ) n
= 1.8207.
= t0.975; 99 = 1.9842, rezult c |t0 | < t1 , i decidem c ipoteza (H0 ) este admis (nu poate Din t1 2 ; n1 2 ; n1 respins la nivelul de semnicaie ). P valoarea este
Codul
n=100; mu = 0.5; alpha = 0.05; x = [ones(59,1); zeros(41,1)]; t0 = (mean(x) - mu)/(std(x)/sqrt(n)); tc = tinv(1-alpha/2, n-1); % cuantila if (abs(t0) < tc) disp('moneda este corecta') else disp('moneda este masluita') end Pv= 1 - tcdf(t0,n-1) + tcdf(-t0,n-1) % P-valoarea
n loc s folosim codul de mai sus, am putea folosi funcia ttest din
[h, p, ci, stats] = ttest(X,0.5,0.05,'both')
i obinem
h = p = 0.0717 ci = 0.4919 0.6881 stats = tstat: 1.8207 df: 99 sd: 0.4943
63
Observaia 6.4 (1) Deoarece P valoarea este p = 0.0717, deducem c la un prag de semnicaie 0.08, ipoteza nul ar fost respins. (2) Dac dintre cele 100 de observri aveam o apariie n plus a stemei, atunci ipoteza nul ar respins, adic moneda ar fost catalogat a msluit. Testul t pentru dou selecii
Testul t pentru egalitatea a dou medii poate simulat n
unde:
h, p, ci, alpha, stats i tail sunt la fel ca mai sus; X i Y sunt vectori sau o matrice, coninnd observaiile culese. Dac ele sunt matrice, atunci mai multe teste Z sunt efectuate, de-alungul ecrei coloane; vartype ia valoarea equal dac dispersiile teoretice sunt egale sau unequal pentru dispersii inegale.
Exemplu 6.5 Caracteristicile X1 i X2 reprezint notele obinute de studenii de la Master M F 08, respectiv, M F 09 la examenul de Statistic Aplicat. Conducerea universitii recomand ca aceste note s urmeze repartiia normal i examinatorul se conformeaz dorinei de sus. Presupunem c X1 N (1 , 1 ) i X2 N (2 , 2 ), cu 1 = 2 , necunoscute a priori. Pentru a verica modul cum s-au prezentat studenii la acest examen n doi ani consecutivi, selectm aleator notele a 25 de studeni din prima grup i 30 de note din a doua grup. distribuctii
de frecvene ale notelor sunt cele din Tabelul 6.2. (i) Vericai dac ambele seturi de date provin dintr-o repartiie normal; (ii) Gsii un interval de ncredere pentru diferena mediilor, la nivelul de semnicaie = 0.05; (ii) S se testeze (cu = 0.01) ipoteza nul
(H0 ) : 1 = 2 , (n
medie, studenii sunt la fel de buni
Nota obinut
5 6 7 8 9 10
Soluie:
(i)
h = chi2gof(u) k = chi2gof(v)
% %
h = 0, deci u N k = 0, deci v N
(ii)
Matlab
Acesta este:
(-0.7294,
0.6760)
d2 d2 1 + 2 , n1 n2
x1 x2 + t1 2; N
2 d2 d 1 + 2 n1 n2
Codul
Matlab:
n1=25; n2=30; alpha = 0.05; u = [5*ones(3,1);6*ones(4,1);7*ones(9,1);8*ones(7,1);9*ones(2,1)]; v = [5*ones(5,1);6*ones(6,1);7*ones(8,1);8*ones(6,1);9*ones(3,1);10*ones(2,1)]; d1 = var(u); d2 = var(v); N = (d1/n1+d2/n2)^2/((d1/n1)^2/(n1-1)+(d2/n2)^2/(n2-1))-2; t = tinv(1-alpha/2,N); m1 = mean(u)-mean(v)-t*sqrt(d1/n1+d2/n2); m2 = mean(u)-mean(v)+t*sqrt(d1/n1+d2/n2); fprintf('(m1,m2)=(%6.3f,%6.3f)\n',m1,m2);
(iii)
Comanda
Matlab este:
0.4698
Matlab,
t0 = (mean(u)-mean(v))/sqrt(d1/n1+d2/n2);
Pv = tcdf(t0, N-1)
Matlab
10.50 10.55 10.60 10.65 2 3 5 1
65
Exemplu 6.7 Se cerceteaz caracteristica X, ce reprezint diametrul pieselor (n mm) produse de un strung. tim c X urmeaz legea normal N (, ). Alegem o selecie de volum n = 11 i obinem distribuia empiric:
.
2 = 0.003, 2 = 0.003.
Intervalul de ncredere pentru este (0.0012, 0.0055) iar valoarea critic este 2 0 = 7.2727. Deoarece aceasta aparine intervalului de ncredere, concluzionm c ipoteza nul nu poate respins la acest nivel de semnicaie. Aceeai concluzie poate luat n urma inspeciei valorii P , care este mai mare dect nivelul . Avem:
2 2 Pv = P (|2 | > |2 0 |) = P ( > 0 ) = 1 Fn1 (7.2727) = 0.6995.
unde:
h, p, ci, m0, alpha, stats, tail sunt la fel ca n funcia ttest; var este valoarea testat a dispersiei;
Rularea acestuia ne d:
h = 0 p = ci = 0.0012 0.0055 stats = chisqstat: 7.2727 df: 10
0.6011
adic ipoteza nul este acceptat la acest nivel de semnicaie. Folosind , putem calcula P valoarea astfel:
Matlab
c0 = (n-1)/0.003*var(X);
Pv = 1 - chi2cdf(c0,10)
Testul F n
Matlab
Matlab utiliznd comanda
[h, p, ci, stats] = vartest2(X, Y, alpha, tail)
Exemplu 6.8 Revenim la Exerciiul 6.5 i vericm dac cele dou selecii de note (Tabelul 6.2) provin din populaii cu dispersii egale. Aadar, avem de testat (la nivelul de semnicaie = 0.01)
(H0 )
Soluie:
2 2 1 = 2
vs.
(H1 )
2 2 1 = 2 .
(pentru teste unilaterale, folosim 'left' sau 'right' n locul lui 'both'.) Rezultatul comenzii anterioare este:
h = 0 p = CI = 0.2191 1.7426 stats = fstat: 0.6047 df1: 24 df2: 29
0.2119
Deoarece h = 0, decidem c dispersiile teoretice ale celor dou populaii pot considerate a egale la nivelul de semnicaie = 0.01.
Observaia 6.9 Decizia testului poate luat i pe baza inspeciei valorii P , observnd c aceasta este mai mare dect . Aceasta este:
n
f0 = var(u)/var(v); Pv = 1 - fcdf(abs(f0),n1-1,n2-1)
Teste parametrice pentru proporii Exemplu 6.10 ntr-un sondaj naional de opinie, 5000 de persoane au fost rugate s rspund la o ntrebare legat de apartenena religioas. La ntrebarea "Suntei cretini?", rspunsul a fost armativ n 4893 dintre cazuri. Rezultatul acestui sondaj este utilizat n estimarea procentului de cretini din ar. S notm cu p acest procent. La nivelul de semnicaie = 0.05, testai dac p este de 95% sau mai mare.
Soluie:
vs.
4893 5000
= 0.9786, cuantila este z1 = 1.6449 i valoarea statisticii este 0.9786 0.95 0.95 (1 0.95) 5000 = 9.2791 [1.6449, ),
P0 =
aadar ipoteza nul este respins la acest nivel de semnicaie. Admitem c p > 0.95. Aceeai concluzie poate dedus i prin inspecia P valorii. Aceasta este
Pv = P (Z > P0 ) = 1 P (Z P0 ) = 1 (9.2791) 0 < = 0.05.
Exemplu 6.11 Revenim la Exemplul 5.15. S se testeze, la nivelul de semnicaie = 0.02 dac exist diferene semnicative ntre proporiile de baiei i fete din respectiva coal crora le place Matematica.
Soluie:
Avem: p1 =
23 45 ,
p2 = P0 =
37 65 ,
p =
23+37 45+65
6 11
23 45 6 11 (1
6 11 )
37 65 1 45
1 65
deci ipoteza nul nu poate respins la acest nivel de semnicaie. Aceeai concluzie o putem lua dac vericm P valoarea. Aceasta este:
Pv = P (|Z| > |P0 |) = 1 P (Z < |P0 |) + P (Z < |P0 |) = 0.5472 > 0.02 = .
Exerciii suplimentare Exerciiu 6.1 Se arunc o moned de 250 de ori, obinndu-se 138 de apariii ale stemei. La un nivel de semnicaie = 0.05, s se decid dac avem suciente dovezi de a arma c acest moned este fals. Exerciiu 6.2 Caracteristica X reprezint cheltuielile lunare pentru convorbirile telefonice ale unei familii. n urma unui sondaj la care au participat 100 de familii, am obinut datele (repartiia de frecvene):
[50, 75) [75, 100) [100, 125) [125, 150) [150, 175) [175, 200) [200, 250) [250, 300) 6 11 13 18 20 14 11 7
.
(a) S se verice, cu nivelul de semnicaie = 0.02, ipoteza c media acestor cheltuieli lunare pentru o singur familie este de 140 RON , tiind c abaterea standard este 35 RON . (b) S se verice aceeai ipotez, n cazul n care abaterea standard nu este cunoscut a priori.
Exerciiu 6.3 La un examen naional, se contabilizeaz nota x obinut de ecare examinat n parte. Pentru o
200
analiza statistic, se aleg la ntmplare 200 de candidai. S-a gsit c suma notelor alese este
i=1 200
xi = 1345.37 i
x2 i = 10128.65. Se cer:
(a) Gsii un interval de ncredere pentru media a tuturor notelor participanilor la examen, la nivelul de semnicaie = 0.05. (b) Testai ipoteza nul (H0 ) : = 6.75, vs. ipoteza alternativ (H1 ) : = 6.75, la nivelul = 0.05. Argumentai statistica folosit n testare.
Exerciiu 6.4 Pentru o selecie dat, de volum n = 196, am obinut x = 0.25 i s = 4. Nu cunoatem nici valoarea medie i nici dispersia variabilei aleatoare ce caracterizeaz populaia. Vericai la nivelul de semnicaie = 0.05 ipoteza = 0, cu alternativa = 0. Exerciiu 6.5 Un patron susine c rma sa nu face discriminare sexual la angajare (i.e., att brbaii, ct i femeile au aceeai ans de a se angaja n respectiva rm). Se aleg 500 de angajai i se gsesc 267 de brbai. Testai la nivelul de semnicaie 0.05 dac patronul rmei spune adevrul sau nu. Exerciiu 6.6 Dintre toate nregistrrile vitezelor vehiculelor ce trec prin dreptul radarului x aezat n faa universitii, se aleg 10 date la ntmplare. Acestea sunt (n km/h):
68
48
44
55
45
47
41
39
49
55
52
Presupunem c selecia face parte dintr-o populaie normal. (a) Gsii un interval de ncredere cu ncrederea de 98% pentru viteza medie a vehiculelor ce trec prin dreptul radarului. (b) Testai dac viteza medie cu care se circul prin faa acestui radar este de 45km/h sau nu, considerndu-se un nivel de semnicaie = 0.02 ; (c) Estimai probabilitatea ca viteza legal de 50km/h s fost depit, folosind datele seleciei considerate.
Exerciiu 6.7 O selecie de volum n = 50 este folosit pentru a verica urmtoarea ipotez
(H0 ) : = 15
vs.
(H1 ) :
= 15,
la nivelul de semnicaie = 0.05. Determinai: valoarea critic, regiunea critic, valoarea statisticii pentru selecia dat i concluzia testrii, pentru (a) x = 17.5 i s = 4.5 ( este necunoscut); (b) x = 17.5 i = 4.
Exerciiu 6.8 O selecie de volum n = 50 este folosit pentru a verica urmtoarea ipotez
(H0 ) : = 15
vs.
(H1 ) :
= 15,
la nivelul de semnicaie = 0.05. Determinai: valoarea critic, regiunea critic, valoarea statisticii pentru selecia dat i concluzia testrii, pentru (a) x = 17.5 i s = 4.5 ( este necunoscut); (b) x = 17.5 i = 4.
Exerciiu 6.9 ntr-un sondaj de opinie, 5 brbai i 5 femei au fost ntrebate dac urmresc meciuri de fotbal la TV n mod regulat. Toi brbaii i doar dou femei au rspuns armativ, ceilali spunnd c nu. S se testeze la nivelul de semnicaie = 0.05 dac diferena este semnicativ din punct de vedere statistic (i.e., dac femeile se uit la fotbal la TV cot la cot cu brbaii). Exerciiu 6.10 Urmrim preul X al aceluiai articol n 20 de magazine, alese la ntmplare. Acestea sunt:
9.6 9.9 9.9 9.8 10.3 10.1 10.0 10.4 10.5 9.9 9.7 9.9 10.2 10.0 10.4 10.2 10.3 10.1 10.0 9.7
Considerm c preul acestui articol urmeaz o repartiie gaussian. (i) Se poate admite ipoteza E(X ) = 10.0, la nivelul de semnicaie = 0.05? (ii) Se poate admite ipoteza D2 (X ) = 0.2, la nivelul de semnicaie = 0.05?
Exerciiu 6.11 Informaiile din tabelul de mai jos sunt date despre dou selecii independente ce au fost extrase din dou populaii statistice.
Selecia
1 2
Volumul seleciei
50 75
media de selecie
9.75 9.5
Se cer: (a) Estimai punctual i printr-un interval de ncredere ( = 0.01) valoarea 1 2 ; (b) Testai ( = 0.01) ipoteza
(H0 ) : 1 = 2
vs.
69
(H1 ) :
1 = 2
Exerciiu 6.12 O selecie de 700 de salarii pe or din Romnia arat c media salariului pe or este x = 11.42RON i s = 9.3. Putem decide, pe baza acestui sondaj, c media salariului pe or este, de fapt, > 9.78RON, valoare stabilit de guvernul romn? Se va folosi = 0.05.
70
(aplicm testul 2 de concordan, cazul neparametric) Zarul este corect doar dac ecare fa a sa are aceeai ans de a aparea, adic probabilitile ca ecare fa n parte s apar sunt:
Soluie:
(H0 ) :
pi =
1 , 6
(i = 1, 2, . . . , 6).
Altfel, notm cu X variabila aleatoare ce are valori numrul punctelor ce apar la aruncarea zarului. Un zar corect ar nsemna c X urmeaz repartiia uniform discret U (6). Toate cele 60 de rezultate obinute n urma aruncrii zarului pot mprite n ase clase. Aceste clase sunt: Oi = {i}, i {1, 2, . . . , 6}. Ipoteza nul este (H0 ) sau, echivalent,
(H0 ) :
Deoarece 2 0 se a n regiunea critic, ipoteza nul se respinge la nivelul = 0.02, aadar zarul este msluit. Codul :
Matlab
n = 60; k=6; alpha = 0.02; x = 1:6; chi2 = sum((f-n*p).^2)./(n*p)); val = chi2inv(1-alpha,k-1); H = (chi2 > val)
f % % %
= [15,7,4,11,6,17]; p = 1/6*ones(1,6); valoarea 2 0 cuantila 2 0.99; 5 afiseaza 0 daca zarul e corect si 1 daca nu
Observaia 7.2 Dac nivelul de semnicaie este ales = 0.01, atunci 2 0.99; 5 = 15.0863, ceea ce determin acceptarea ipotezei nule (adic zarul este corect) la acest nivel.
71
Exemplu 7.3 n urma unui recensmnt, s-a determinat c proporiile indivizilor din RO ce aparin uneia dintre cele patru grupe sanguine sunt: O : 34%, A : 41%, B : 19%, AB : 6%. S-au testat aleator 450 de persoane din RO, obinndu-se urmtoarele rezultate:
Grupa sanguin Frecvena
O 136 A 201 B 82 AB 31
Dac ipoteza nul ar adevrat, atunci valorile ateptate pentru cele patru grupe sanguine (din 450 de persoane) ar : O : 153.5, A : 184.5, B : 85, AB : 27. Calculez valoarea statisticii 2 pentru observaiile date:
2 0 = = (136 153.5)2 (201 184.5)2 (82 85)2 (31 27)2 + + + 153.5 184.5 85 27 4.1004.
Deoarece 2 0 nu se a n regiunea critic, ipoteza nul nu poate respins la acest nivel de semnicaie.
Teste de concordan n
Matlab
Matlab este:
Am vzut deja c funcia chi2gof(x) testeaz (folosind testul 2 al lui Pearson) dac vectorul x provine dintr-o repartiie normal, cu media i dispersia estimate folosind x. Pentru testul 2 , forma general a funciei
[h,p,stats] = chi2gof(X,name1,val1,name2,val2,...)
h, p sunt la fel ca n exemplele anterioare; perechile namei/valuei sunt opionale. Variabilele namei pot : numrul de clase, 'nbins', un vector de valori centrale ale intervalelor ce denesc clasele, 'ctrs', sau un vector cu capetele claselor, 'edges'. Alte variabile ce pot utilizate: 'cdf', 'expected', 'nparams', 'emin', 'frequency', 'alpha'. variabila de memorie stats aeaz: chi2stat - statistica 2 , df - gradele de libertate, edges - un vector cu capetele intervalelor claselor dup triere, O - numrul de valori observate n ecare clas, E - numrul de valori
unde:
Exemplu 7.4 Spre exemplicare, revenim la Exerciiul 7.1, dar cu valoarea nivelului de ncredere din Observaia 7.2. Codul ce folosete funcia de mai sus este:
Matlab
x = 1:6; f = [15,7,4,11,6,17]; p = 1/6*ones(1,6); e = N*p; alpha = 0.01; [h, p, stats] = chi2gof(x,'ctrs', x,'frequency', f,'expected',e, 'alpha',alpha)
72
0.0184
13.6000 5 [0.5000 1.5000 2.5000 3.5000 4.5000 5.5000 6.5000] [15 7 4 11 6 17] [10 10 10 10 10 10]
Acest rezultat conrm c ipoteza nul (zarul este corect) este acceptat la nivelul = 0.01.
Exemplu 7.5 La campionatul mondial de fotbal din 2006 au fost jucate n total 64 de meciuri, iar repartiia numrului de goluri nscrise ntr-un meci are tabelul de distribuie ca n Tabelul 7.2. Determinai (la nivelul de semnicaie = 0.05) dac numrul de goluri pe meci urmeaz o distribuie Poisson.
Nr. de goluri pe meci
0 1 2 3 4 5 6
Nr. de meciuri
8 13 18 11 10 2 2
2006.
(aplicm testul de concordan 2 parametric) Fie X variabila aleatoare ce reprezint numrul de goluri nscrise ntr-un meci. Teoretic, X poate lua orice valoare din mulimea N. Mulimea observaiilor fcute asupra lui X este {1, 2, 3, 4, 5, 6}, cu frecvenele respective din tabel. n total, au fost inscrise 144 de goluri. = x = 144 = 2.25. Pe baza datelor observate, dorim s Estimm numrul de goluri pe meci prin media lor, adic 64 testm dac X urmeaz o repartiie Poisson. Avem astfel de testat ipoteza nul:
Soluie:
(H0 ) :
) i distribuia valorilor variabilei este dat de Dac admitem ipoteza (H0 ) (adic X P (2.25), atunci pi = pi (
Clasa
0 1 2 3 4 5 6 5
ni 8 13 18 11 10 2 2 4
P (2.25).
Tabelul 7.3. Valoarea pi este P (X = i), adic probabilitatea ca variabila aleatoare X P (2.25) s ia valoarea i
73
(i = 0, 1, 2, 3, 4). Am putea forma 7 clase. Deoarece pentru ultimele dou clase din Tabelul 7.3, anume {X = 5} i {X 6}, numerele ni nu depec valoarea 3, le tergem din tabel i le unim ntr-o singur clas, n care {X 5}, cu ni = 4 > 3. Vom nota prin p5 probabilitatea
4
p5 = P (X 5) = 1 P (X < 5) = 1 P (X 4) = 1
i=0
P (X = i).
Deoarece avem 6 clase i am estimat parametrul , deducem c numrul gradelor de libertate este 6 1 1 = 4. Cu2 2 antila de referin (valoarea critic) este 2 0.95; 4 = 9.4877. Regiunea critic pentru este intervalul (0.95; 4 , +). 2 2 Deoarece 0 < 0.95; 4 , urmeaz c ipoteza nul (H0 ) nu poate respins la nivelul de semnicaie . Aadar, este rezonabil s armm c numrul de goluri marcate urmeaz o repartiie Poisson. Prezentm mai jos un cod ce rezolv aceast problem.
Matlab
X = [0*ones(8,1);1*ones(13,1);2*ones(18,1);3*ones(11,1);4*ones(10,1);... 5*ones(2,1);6*ones(2,1)]; f = [8 13 18 11 10 4]; % vectorul de frecvente absolute n = 64; alpha = 0.05; lambda = mean(X); for i=1:5 % probabilitatile P(X=i), i=0,1,2,3,4 p(i) = poisspdf(i-1,lambda); end p(6)= 1 - poisscdf(4,lambda); % probabilitatea P(X5) H2 = sum((f-n*p).^2./(n*p)); Hstar = chi2inv(1-alpha,4); if (H2 < Hstar) disp('X urmeaza repartitia Poisson'); else disp('X nu urmeaza repartitia Poisson'); end
Observaia 7.6 Dac ipoteza nul este respins, atunci motivul poate acela c unele valori observate au deviat prea mult de la valorile ateptate. n acest caz, este interesant de observat care valori sunt extreme, cauznd respingerea ipotezei nule. Putem deni astfel reziduurile standardizate:
ri = Oi n pi n pi (1 pi ) = Oi Ei Ei (1 pi ) ,
unde prin Oi am notat valorile observate i prin Ei valorile ateptate. Dac ipoteza nul ar adevrat, atunci ri N (0, 1). n general, reziduuri standardizate mai mari ca 2 sunt semne pentru numere observate extreme.
Exemplu 7.7 ntr-o anumit zi de lucru, urmrim timpii de ateptare ntr-o staie de tramvai, pn la ncheierea zilei de lucru (adic, pn trece ultimul tramvai). Fie T caracteristica ce reprezint numrul de minute ateptate n staie, pn sosete tramvaiul. Rezultatele observaiilor sunt sumarizate n Tabelul 7.4. Se cere s se cerceteze ( = 0.05) dac timpii de ateptare sunt repartizai exponenial.
74
Durata
ni
05 39
5 10 35
10 15 14
15 20 7
20 25 5
Soluie:
F ( x) = F0 (x) = 1 e x , x > 0
Deoarece parametrul este necunoscut, va trebui estimat pe baza seleciei date. Pentru aceasta, folosim metoda verosimilitii maxime. Funcia de verosimilitate pentru exp() este
n
L(t1 , t2 , . . . , tn ; ) =
k=1
e ti = n e n t .
Mai sus, am notat prin t1 , t2 , . . . , tn valorile de selecie pentru variabila aleatoare T . Punctele critice pentru L() sunt date de ecuaia
ln L = 0 = n ln n t = 1. = t
Se observ cu uurin c
2 ln L 2 | = n t < 0 , 2 =
este punct de maxim pentru funcia de verosimilitate. de unde concluzionm c Tabelul de distribuie pentru caracteristica T este: 2.5 39 7. 5 35 12.5 14 17.5 7 22.5 5 .
1 = 0.1299. (2.5 39 + 7.5 35 + 12.5 14 + 17.5 7 + 22.4 5) = 7.7, adic Calculm media de selecie, t = 100 Dac variabila T ar urma repartiia exponenial exp(), atunci probabilitile ca T s ia valori n ecare clas sunt, n mod corespunztor:
i = 1, 2, 3, 4, 5.
(de notat c ultima clas este (20, +), deoarece se dorete o concordan a datelor observate cu date repartizate exponenial, iar mulimea valorilor pentru repartiia exponenial este R+ ),
extremitile
frecvenele absolute
probabilitile pi ,
erorile relative
n ecare clas (n pi ),
Numrul gradelor de libertate este k p 1 = 3. Calculm valoarea critic 2 0.95; 3 = 7.8147 i, de asemenea, valoarea
k
H0 =
i=1
(ni n pi )2 = 6.5365. n pi
75
2 Deoarece 2 0 < 0.95; 3 , ipoteza (H0 ) nu poate respins la acest nivel de semnicaie.
Codul
% %
T = sau T = n = a = for
[2.5*ones(39,1);7.5*ones(35,1);12.5*ones(14,1);17.5*ones(7,1);22.5*ones(5,1)]; [5*rand(39,1);5+5*rand(35,1);10+5*rand(14,1);15+5*ones(7,1);20+5*ones(5,1)]; 100; alpha = 0.05; m = mean(T); lambda = 1/m; [0, 5, 10, 15, 20, Inf]; f = [39, 35, 14, 7, 5]; i =1:5 p(i) = expcdf(a(i+1),m)-expcdf(a(i),m);
end H2 = sum((f-n*p).^2./(n*p)); cuant = chi2inv(0.95,3); if (H2 < cuant) disp('Timpii de asteptare sunt exponential repartizati'); else disp('ipoteza (H0) se respinge'); end
Clasa
ai 0 5 10 15 20
ni 39 35 14 7 5 100
76
Corelaie i Regresie
Fie X i Y doi vectori de acelai tip. Urmtoarele funcii din regresiei:
scatter(X,Y) reprezint grac valorile lui Y vs. valorile lui X; R = corrcoef(X,Y) calculeaz coecientul de corelaie ntre X i Y. Rezultatul este aat sub forma: >> ans = 1.0000 1.0000
unde 1.0000 este coecientul de corelaie dintre X i X, respectiv Y i Y, iar este coecientul cutat.
cov(X,Y) pentru matricea de covarian empiric dintre X i Y; b = regress(Y,X) aeaz estimarea coecienilor pentru care Y = b X . Aici, X este o matrice n k i Y un vector coloana n 1. Coloanele vectorului X corespund observaiilor (i.e., variabilelor independente). Dac X este un vector coloan de aceeai dimensiune cu Y, atunci b este doar un scalar. Dac X este matrice, atunci putem folosi aceast comand pentru a estima coecienii de regresie liniar
multipl. Spre exemplu, s presupunem c se dorete estimarea coecienilor de regresie liniar simpl, i.e., 0 i 1 pentru care y = 0 + 1 x, unde pentru ecare dintre x i y avem n observaii. n acest caz, k = 2. Fie X, respectiv, Y vectorii ce conin aceste observaii. Comanda care estimeaz cei doi coecieni este
Matlab
Comanda furnizeaz aproximri pentru parametrii 0 i 1 ce fac urmtoarea aproximare ct mai bun:
y1 y2 . . . yn 1 x1 1 x2 0 . + 1 . . . . . 1 xn .
p = polyfit(X,Y,n) gsete coecienii unui polinom p(x) de grad n ale crui valori p(xi ) se apropie cel mai mult de datele observate yi , n sensul celor mai mici ptrate. va aa n acest caz un vector linie de lungime n + 1, coninnd coecienii polinomiali n ordinea descresctoare a puterilor. Spre exemplu,
Matlab
dac
atunci
Matlab va aa
p(x) = 0 + 1 x + 2 x2 + + n xn , n , . . . , 1 , 0 .
Y = polyval(p,X) aeaz valorile unui polinom p(x) pentru valorile din vectorul X . Polinomul p(x) este dat prin coecienii si, ordonai n ordine descresctoare a puterilor. De exemplu, dac p(x) = 3x2 + 2x + 4 i dorim s evalum acest polinom pentru trei valori, 3, 1 i 5, atunci scriem n :
Matlab
p = [3
2 4];
polyval(p,[-3 1 5]) 37 5 69
obinnd rezultatul:
ans =
Exerciiu 7.8 Dorim s determinm dac exist vreo corelaie ntre notele la examenul de Probabiliti i cele de la Statistic obinute de studenii unui an de studiu. n acest sens, au fost observate notele obinute de 10 studeni
77
la aceste dou discipline i au fost trecute n Tabelul 7.6 de mai jos. Se cere: (a) Stabilii dac exist o legtur puternic ntre aceste note (r i r2 ); (b) Determinai dreapta de regresie a notelor de la Statistic n raport cu notele la Probabiliti i desenai-o n acelai sistem de axe ca i notele obinute (scatter plot). (c) Testai dac exist sau nu vreo corelaie ntre notele de la Statistic i Probabiliti. Student Probabiliti Statistic A
82 84
B
36 42
C
72 50
D
58 64
E
70 68
F
48 54
G
44 46
H
94 80
I
60 60
J
40 32
Soluie:
n codul formula
(a) Calculm r (cu formula lui Person). Funcia Matlab pentru coecientul Pearson este corrcoef. Matlab de mai jos l-am calculat pe r folosind aceast funcie, dar i n dou alte modaliti, folosind
r=
cove (x, y )
sx sy
(b) Coecienii de regresie se pot obine n 3 moduri, e folosind funcia polyfit, care realizeaz tarea datelor cu un polinom, n cazul liniar ind un polinom de forma S (P ) = 0 + 1 P . O alt variant de calcul a coecienilor 0 i 1 este simpla implementare n a formulelor pentru acetia. A treia variant este folosirea funciei regress din . Reprezentarea grac a datelor poate realizat folosind ori funcia plot, ori funcia "scatter", ambele funcii predenite din . Gracul este cel din Figura 7.1.
Matlab
Matlab
Matlab
Matlab
P = [82,36,72,58,70,48,44,94,60,40]; S = [84,42,50,64,68,54,46,80,40,32]; mp = mean(P); ms = mean(S); %%%~~~~~~~~~~~~~~ Calculez coeficientul de corelatie empiric ~~~~~~~~~~~~~~~~~~~~~~~~~~ CC = corrcoef(P,S); r = CC(1,2) %%%~~~~~~~~~~~~~~~~~~~~ Alte variante de calcul pentru r ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ % C = cov(P,S)/(std(P)*std(S)); r = C(1,2); % r = sum((P-mp).*(S-ms))/sqrt(sum((P-mp).^2)*sum((S-ms).^2)); %%%~~~~~~~~~~~~~~~~~~~~~~~~ Calculez coeficientii de regresie ~~~~~~~~~~~~~~~~~~~~~~~ B = polyfit(P,S,1) %%%~~~~~~~~~~~~~~~~~~~~ Alte variante de calcul pentru B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ % b1 = sum((P-mp).*(S-ms))/sum((P-mp).^2); b0 = ms - b1*mp; % B = regress(S',[P;ones(10,1)']'); %%%~~~~~~~~~~~~~~~~ Scatter plot si dreapta de regresie ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ x=0:100; plot(P,S,'*',x,B(2) + B(1)*x,'r-') % scatter(P,S) % varianta pentru scatter plot %%%~~~~~~~~~~~~~~~~~~~~~~~ Testul pentru = 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ alpha = 0.05; n = 10; T0 = r*sqrt((n-2)/(1-r^2)); quant = tinv(1-alpha/2,n-2); if (abs(T0) < quant) disp('P si S nu sunt corelate') else disp('P si S sunt corelate') end
78
Calculm ln y . Obinem:
ln y = 1.2585 1.5107 1.7192 1.8901 2.1126 2.3204 2.4681
Se observ c r = 0.9988 1 (coecientul de corelaie ntre x i ln y ), de unde bnuim c e posibil s avem o regresie liniar ntre variabilele x i ln y . Estimm coecienii de regresie ai lui ln y fa de x i gsim: 0 = 1.1074, 1 = 0.4980. Aceasta poate realizat n prin comanda
Matlab
regress(log(y)',[x',ones(7,1)])
Aadar, ln y = 0.4980 x + 1.1074, de unde y = e1.1074 e0.4980 x 3 ex/2 . n Figura 7.2 am reprezentat grac datele observate i aproximrile lor.
Exerciiu 7.10 Prognoza spune c temperatura ntr-o anumit zon muntoas descrete cu cca. 6 C la ecare 1km ctigat n nlime. Pentru o vericare, au fost msurate simultan temperaturile n 10 localiti diferite din acea zon, acestea ind nregistrate n Tabelul 7.7. Dac temperatura se presupune a o funcie liniar (regresie
hi Ti 500 15 1000 14 1500 11 2000 6 2500 1 3000 2 3500 0 4000 4 4500 8 5000 14
(i) S se estimeze parametrii 0 i 1 ; (ii) S se testeze ( = 0.05) dac prognoza din enun este adevarat (i.e., 1 = 0.006); (iii) S se gseasc un interval de ncredere pentru panta dreptei de regresie, 1 ; (iv) Ct de bun este aproximarea temperaturii cu o funcie liniar de altitudine? (v) Estimai temperatura la altitudinea h = 2544. Gsii, de asemenea, un interval de ncredere pentru aceasta temperatur.
Soluie:
0 = y 1 x,
(7.1)
sau folosind funcia polyfit (vezi codul de mai jos). (ii) Pentru testarea ipotezei nule (H0 ) : 1 = 0.006 utilizm testul pentru coecientul 1 . (iii) Un interval de ncredere pentru 1 se poate calcula folosind formula
1 t1 2 ; n2 , sx 1 + t1 2 ; n2 . sx
Matlab
(7.2)
(iv) Pentru a decide ct de bun este aproximarea, calculm coecientul de determinare, R2 . Acesta este R2 = 94.83, ceea ce nseamn c temperatura real este foarte aproape de cea prognozat. (v) Utilizm formulele y p = 0 + 1 x p . (7.3) i
yp t1 2 ; n2 1+ 1 (xp x)2 + , n s2 x yp + t1 2 ; n2 1+ 1 (xp x)2 + . n s2 x
(7.4)
pentru xp = 2544. (vezi rezultatele generate de codul de mai jos) Codul este urmtorul:
Matlab
h = [500 1000 1500 2000 2500 3000 3500 4000 4500 5000]; T = [15 14 11 6 -1 2 0 -4 -8 -14]; mh = mean(h); mT = mean(T); %%%~~~~~~ Calculez coeficientul de corelatie empiric si coeficientul de determinare ~~~ CC = corrcoef(h,T); r = CC(1,2) R2 = r^2 %%%~~~~~~~~~~~~~~~~~~~ Calculez coeficientii de regresie ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
80
B = polyfit(h,T,1) %%%~~~~~~~~~~~~~~~~~~~~ Alte variante de calcul pentru B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ % B = regress(T',[h;ones(10,1)']'); % b1 = sum((h-mh).*(T-mT))/sum((h-mh).^2); b0 = mT - b1*mh; %%%~~~~~~~~~~~~~~~~~~~~ Scatter plot si dreapta de regresie ~~~~~~~~~~~~~~~~~~~~~~~~~ x=0:5600; plot(h,T,'*',x,B(2) + B(1)*x,'r-') %%%~~~~~~ Testul pentru panta dreptei de regresie, (H0 ) : 1 = 0.006 ~~~~~~~~~~~~~~~~ alpha = 0.05; n = 10; sigmahat = sqrt(sum((T-B(2) - B(1)*h).^2)/(n-2)); sigmax = std(h); T0 = (B(1)+0.006)*sigmax/sigmahat; quant = tinv(1-alpha/2,n-2); if (abs(T0) < quant) disp('ipoteza (H0 ) se accepta') else disp('ipoteza (H0 ) se respinge') end %%%~~~~~~~~~~~~~~~ Interval de incredere pentru 1 ~~~~~~~~~~~~~~~~~~~~~~~ CI = [B(1) - quant*sigmahat/sigmax,\;B(1) + quant*sigmahat/sigmax] hp = 2544; Tp = B(2) + B(1)*hp CI_T = [Tp - quant*sigmahat*sqrt{1 + 1/n + (hp-mh)^2/sigmax^2}, ... Tp + quant*sigmahat*sqrt{1 + 1/n + (hp-mh)^2/sigmax^2}]
CI =
[-0.0096, -0.0026]
3.3610
81
Exerciii suplimentare Exerciiu 7.1 Testai normalitatea datelor din Tabelul 3.1 la nivelul de semnicaie = 0.1. Exerciiu 7.2 Se prezice c repartiia literelor care apar cel mai des n limba englez ar urmtoarea:
Litera Frecvena
O 16 R 17 N 17 T 21 E 29
Aceasta semnic urmtoarea: de ecare dat cnd cele 5 litere apar ntr-un text, n 16% dintre cazuri apare litera O, n 21% dintre cazuri apare litera T etc. S presupunem c un criptologist analizeaz un text i numr apariiile celor 5 litere. Acesta a gsit urmtoarea distribuie: Litera Frecvena
O 18 R 14 N 18 T 19 E 31
Folosind testul 2 de concordan, s se verice dac aceste apariii sunt n not discordant cu predicia iniial.
Exerciiu 7.3 Un student ia cu mprumut o carte de la bibliotec i observ c pagina de interes este rupt pe alocuri. Totui, poate citi textul din Figura 7.4. Se cere s se reconstruiasc pasajul de text (i.e., determinai y i dreapta de regresie a lui x fa de y ). De asemenea, calculai coecientul empiric de corelaie r i comentai asupra aproximrii datelor de seleie prin dreptele de selecie.
Exerciiu 7.4 Tabelul 7.8 conine calicativele obinute de un elev de clasa I la cele 9 discipline, n ecare dintre cele dou semestre. S se gseasc o msur a legturii dintre cele dou seturi de calicative (e.g., coecientul de corelaie Spearman).
Discipline
Sem. I Sem. II
A FB B
B FB B
C B B
D FB FB
E B FB
F B S
G B B
H S S
I FB FB
x y
3 9
2 4
1 1
0 0
1 1
2 4
Exerciiu 7.6 Suntem interesai n determinarea unei legturi ntre nlime i mrimea la pantof. Datele din tabelul de mai jos reprezint observaii asupra nlimilor (H ) i a mrimilor la pantof (M ) pentru 10 brbai, alei la ntmplare.
H M 1.75 43 1.70 41.5 1.80 44 1.65 40.5 1.83 44.5 1.73 41 1.86 44.5 1.65 39.5 1.68 40 1.82 43.5
(a) Calculai coecientul de corelaie Pearson dintre nlime i mrimea la pantof. Ce procent din valorile lui M sunt determinate de valorile lui H (b) Determinai o aproximare pentru dreapta de regresie a lui M fa de H . (c) Obinei o predicie a mrimii la pantof pentru un brbat cu nlimea 1.78. (d) La nivelul de semnicaie = 0.05, testai ipoteza c panta dreptei de regresie este .
3 4
Exerciiu 7.8 n tabelul urmtor, se dau cte 5 valori pentru dou variabile x i y , unde y este variabila independent. Determinai o dreapta de regresie potrivit pentru a calcula (i) valoarea lui x cnd y = 2.5; (ii) valoarea lui y cnd x = 50; (iii) Putem prezice valoarea lui y pentru x = 75?
x y 46 1.7 55 2.1 41 1.5 58 2.9 53 1.9
Exerciiu 7.9 Se msoar viteza unei maini, v , n primele 10 secunde dup aceasta a nceput s accelereze. Aceste date sunt nregistrate n Tabelul 7.9. Se cere:
t v 0 0 1 3. 1 2 6.9 3 9.9 4 12.7 5 16.1 6 19.8 7 21.2 8 22.8 9 24.3 10 25.9
10
(a) Desenai diagrama scatter plot; (b) Determinai dreapta de regresie a lui v fa de t; (c) Calculai coecientul de corelaie empiric i comentai asupra validitii aproximrii datelor cu dreapta de regresie.
83
Exerciiu 7.10 Opinia general este c rata maxim (R) a btilor inimii unei persoane se poate determina dup formula R = 0 + 1 V , unde V este vrsta persoanei, calculat n ani. Cercettorii cardiologi arma c aceti coecieni ar : 0 = 220 i 1 = 1. Pentru o vericare empiric a acestei armaii, sunt alese la ntmplare 15 persoane de diverse vrste, care sunt supuse unui test pentru determinarea ratei maxime ale batilor inimii. Aceste rezultate sunt contabilizate n Tabelul 7.10. (a) Calculai coecientul de corelaie Pearson dintre vrst i rata maxim a batilor inimii. Care este semnicaia acestei valori? (b) Determinai dreapta de regresie a lui R fa de V i desenai-o n acelai sistem de axe cu datele din tabel. (c) Testai ipoteza (H0 ) : 1 = 1, vs. ipoteza alternativ (H1 ) : 1 = 1, la nivelul de semnicaie = 0.05.
Vrsta 15 23 25 35 17 34 54 50 45 42 19 42 20 39 37 Rata max 207 186 187 180 200 175 169 183 156 183 199 174 198 183 178
Tabela 7.10: Tabel cu rata maxim a batilor inimii n funcie de vrst.
Exerciiu 7.11 Dreapta de regresie a variabilei y fa de variabila x este y = 2 x 6. Determinai condiiile n care dreapta de regresie a lui x fa de y este x = 0.5 y + 3.
A 3 1 4 12 11 3 5 2 9 6 4 6 7 6 14 N 9.00 9.50 8.75 4.75 5.50 8.50 6.75 8.25 5.50 6.75 8.00 7.75 6.00 7.00 3.50
Tabela 7.11: Tabel cu absene i note la Statistic.
Exerciiu 7.12 Tabelul 7.11 conine numrul de absene (A) la Statistic i notele corespunztoare (N ) a 15 studeni. (a) Calculai coecientul de corelaie Pearson. Care este semnicaia acestei valori referitor la relaia dintre absene i note? (b) Determinai dreapta de regresie a lui N fa de A i desenai-o n acelai sistem de axe cu datele din tabel. (c) Testai, la un nivel de semnicaie = 0.05, dac exist dovezi suciente pentru a arma c ntre numrul de absene i notele obinute exist o corelaie. Exerciiu 7.13 n Tabelul 7.12 datele reprezint nlimile (H ) i masele corporale (M ) a 10 fete dintr-o clas a unui liceu. Suntem interesai n prezicerea masei corporale, tiind nalimea unei eleve.
H M 179.6 61.2 166.8 48.2 163.1 46 180.0 64.4 158.4 46.3 166.5 54.7 165.8 51.4 168.1 55.3 175.9 65.3 160.7 47.9
10
(a) Desenai diagrama scatter plot a lui H versus M . Bazndu-v pe aceast diagram, considerai c metoda regresiei liniare este potrivit n acest caz? (b) Calculai estimaii ale parametrilor (0 i 1 ) de regresie liniar i reprezentai grac dreapta de regresie liniar. (c) Obinei o estimare nedeplasat pentru 2 . (d) Testai ipoteza nul (H0 ) : 1 = 0.9.
84