Sunteți pe pagina 1din 21

Universitatea din Bucuresti

Facultatea de Matematica si Informatica

CURS nr. 2 TEHNICI DE SIMULARE

1. Recapitulare: notiuni de statistica


2. Generarea numerelor aleatoare

Lect. dr. Bianca Mogos


Continut

Partea I
I Scopul experimentului aleator. Statistica inferentiala.
I Populatie tinta. Esantion
I Model probabilist. Selectie. Repartitia selectiei
I Model statistic. Statistica
I Convergenta in probabilitate
I Estimator. Estimatie. Consistenta unui estimator

Partea a II - a
I Numere aleatoare. Variabile uniforme
I Generarea numerelor aleatoare uniform distribuite
Scopul experimentului aleator

I Experimentul aleator se realizeaza pentru colectarea de date


necesara pentru a obtine informatii privind un anumit fenomen
de interes.
I Pe baza datelor se emit concluzii care, n general, ies din sfera
experimentului particular.
I Cercetatorii generalizeaza concluziile experimentului pentru clasa
tuturor experimentelor similare.
I Problema acestui demers este ca nu putem garanta corecti-
tudinea concluziilor obtinute.
I Totusi, folosind tehnici statistice, putem masura si administra
gradul de incertitudine al rezultatelor.
Statistica inferentiala

I Statistica inferentiala este o colectie de metode care permit


cercetatorilor sa observe o submultime a obiectelor de interes si
folosind informatia obtinuta pe baza acestor observatii sa faca
afirmatii sau inferente privind ntreaga populatie.

I Cateva dintre aceste metode sunt:


I estimarea parametrilor unei populatii

I verificarea ipotezelor statistice


I estimarea densitatii de repartitie.
Populatie tinta

I Populatia tinta este definita ca fiind ntreaga colectie de obiecte


sau indivizi despre care vrem sa obtinem anumite informatii.
I Populatia tinta trebuie bine definita indicand
I ce constituie membrii acesteia (de ex, populatia unei zone ge-
ografice, o anumita firma care construieste componente hard-
ware, etc.)
I caracteristicile populatiei (de ex, starea de sanatate, numarul de
defectiuni, etc.).
I In majoritatea cazurilor este imposibil sau nerealist sa observam
ntreaga populatie; cercetatorii masoara numai o parte a populatiei
tinta, denumita esantion.
I Pentru a face inferente privind ntreaga populatie este impor-
tant ca multimea esantion sa fie reprezentativa relativ lantreaga
populatie.
Model probabilist
I Fie X o v.a. cu densitatea f (x, ), x R, R.

Definitie
Multimea densitatilor de repartitie f (x, ), R, ce depind de
parametrul se numeste model probabilist unidimensional.
{f (x, )|x R, } . (1)

I Fie X = (X1 , X2 , . . . , Xn ) un vector aleator cu densitatea de


repartitie
f (x1 , x2 , . . . , xn ; ) , (x1 , x2 , . . . , xn ) Rn , Rk .

Definitie
Multimea densitatilor de repartitie f (x1 , x2 , . . . , xn ; ) cu parametrul
Rk se numeste model probabilist multidimensional.
{f (x1 , x2 , . . . , xn ; )| } . (2)
Selectie. Repartitia selectiei

Definitie
O selectie este o multime de v.a. X1 , X2 , . . . , Xn avand aceeasi den-
sitate de repartitie f (x, ).
I Deoarece selectia este o multime de variabile aleatoare asociate
unui model probabilist, selectia trebuie sa aiba o repartitie, pe
care o vom numi repartitia selectiei.

Definitie
Repartitia selectiei X1 , X2 , . . . , Xn este definita ca fiind repartitia vec-
torului X = (X1 , X2 , . . . , Xn ), notata prin f (x1 , x2 , . . . , xn ; ).
I Cea mai folosita forma de selectie este selectia aleatoare si este
bazata pe ideea experimentului aleator.
Selectie aleatoare
Definitie
Spunem ca X1 , X2 , . . . , Xn este o selectie aleatoare asupra v.a. X
care are densitatea de repartitie f (x; ) daca X1 , X2 , . . . , Xn sunt v.a.
independente si identic repartizate ca X .
X1 , X2 , . . . , Xn se numesc variabile de selectie.

I In cazul selectiei aleatoare, densitatea de repartitie comuna a


variabilelor de selectie este
n
Y
f (x1 , x2 , . . . , xn ) = f (xi ; )
i=1
I O selectie aleatoare poate fi construita prin repetarea unui ex-
periment aleator de n ori.
I Un rezultat al selectiei aleatoare se noteaza prin (x1 , x2 , . . . , xn )
si multimea tuturor rezultatelor definesc spatiul observatiilor
S Rn .
Model statistic. Statistica

Definitie
Modelul probabilist
{f (x; ), )}
mpreuna cu selectia X = (X1 , X2 , . . . , Xn ) definesc modelul statis-
tic.

Definitie
Statistica este o functie tn : S Rk care nu contine niciun
parametru necunoscut.
I Cele mai utilizate statistici sunt momentele de selectie.
Momente de selectie
I Momentul de selectie de ordinul r
n
1X r
mr0 (x1 , x2 , . . . , xn ) = xj (3)
n
j=1

I Momentul de selectie de ordin 1 media de selectie


n
1X
m10 (x1 , x2 , . . . , xn ) = X n = xj (4)
n
j=1

I Momentul centrat de selectie de ordin r


n
1X
mr (x1 , x2 , . . . , xn ) = (xj X n )r . (5)
n
j=1

I Momentul centrat de selectie de ordin 2 dispersia de selectie


n
1X
m2 (x1 , x2 , . . . , xn ) = (xj X n )2 . (6)
n
j=1
Convergenta n probabilitate

Definitie
Sirul de v.a. (Xn )n converge n probabilitate la v.a. X daca
lim P ({ , |Xn () X ()| < }) = 1. (7)
n

Propozitie
Avem relatia
n
1X P
Xn = Xj E [X ] =
n n
j=1
Estimator. Estimatie

Definitie
Se numeste estimator, variabila aleatoare
tn (X ) : , (8)
unde X = (X1 , X2 , . . . , Xn ), este spatiul de selectie; tn (x), x S,
S spatiul observatiilor, se numeste estimatie.

Definitie
Un estimator tn = tn (X ) se numeste consistent pentru daca
lim P(|tn | < ) = 1 (9)
n
P
si notam tn .
Consistenta unui estimator

I Consistenta unui estimator reprezinta o proprietate asimptotica


a estimatorului.
I Un estimator bun pentru parametrul trebuie sa aiba o repartitie
cu o valoare centrala n vecinatatea lui .
I Definitia urmatoare cere ca estimatorul sa aiba o valoare cen-
trala n vecinatatea lui nu numai pentru valori mari ale lui n,
ci pentru orice n.

Definitie
Estimatorul tn se numeste nedeplasat pentru daca
E [tn ] = . (10)
Numere aleatoare

I Majoritatea metodelor de generare a v.a. se bazeaza pe ge-


nerarea unor numere aleatoare uniform distribuite pe intervalul
(0,1).

I Datorita calculatorului avem posibilitatea de a genera foarte


usor numere aleatoare uniforme.

I Totusi, trebuie cunoscut faptul ca numerele generate de calcu-


lator sunt pseudo-aleatoare, deoarece acestea sunt generate cu
un algoritm determinist.
Numere aleatoare uniform distribuite
Fie (, B, P) un camp de probabilitate.
Definitie
(Variabila aleatoare uniforma)
Spunem ca variabila aleatoare continua U : R este repartizata
uniform pe intervalul [a, b] si scriem U U(a, b) daca densitatea
sa de repartitie este de forma:
1 , daca u [a, b]

f (u) = ba (11)
0, altfel

Functia de repartitie F (x) a v.a. U U(a, b) este definita prin




0, daca x a

x a
F (x) = , daca x (a, b) (12)

ba

1, daca x b

Observatii referitoare la repartitia uniforma si v.a. uniforme

I Probabilitatea ca v.a. uniforma U U(a, b) sa cada ntr-un


interval [u1 , u2 ], a u1 < u2 b este proportionala cu
lungimea intervalului:
u2 u1
P(u1 < U u2 ) = . (13)
ba

I Pentru a genera numere aleatoare uniform distribuite pe un


interval [a,b], si scriem X U(a, b), pornind de la numere
generate uniform pe intervalul [0,1] se poate folosi
transformarea
X = (b a) U + a, (14)
unde U U(0, 1).
Generarea numerelor uniforme n Matlab (1)

I In Matlab exista functia rand pentru generarea variabilelor alea-


toare uniforme.

I rand(n), unde n este un numar natural, returneaza o matrice de


dimensiune n n avand ca elemente numere aleatoare uniform
distribuite ntre 0 si 1.

I rand(m, n), unde m, n sunt numere naturale, returneaza o ma-


trice de dimensiune m n avand ca elemente numere aleatoare
uniform distribuite ntre 0 si 1.
Generarea numerelor uniforme n Matlab (2)
I O secventa de numere aleatoare generata n Matlab depinde
de samanta sau starea generatorului. Starea este resetata
la valoarea implicita n momentul pornirii Matlab-ului, astfel
aceeasi secventa de variabile aleatoare este generata la o noua
pornire a Matlab-ului. Acesta poate fi un avantaj n situatiile n
care analistul are nevoie sa reproduca rezultatele unei simulari
pentru a verifica anumite concluzii.
I rng(SD) seteaza samanta generatorului pe bazantregului neneg-
ativ SD
I rng(shuffle) seteaza samanta generatorului pe baza momen-
tului curent de timp
I rng(default) reseteaza setarile generatorului la valorile initiale,
si anume, se foloseste generatorul Mersenne Twister cu samanta
0.
Generarea numerelor uniforme n Matlab (4)
Exemplu care ilustreaza utilizarea functiei rand.
% Generam un vector de numere aleatoare pe intervalul (0,1).
x = rand(1,1000);
% Histograma esantionului generat in x.
[N, C] = hist(x,15);
% x: multimea esantion
% 15 reprezinta numarul de dreptunghiuri ale histogramei
% N: vector continand numarul de elemente din fiecare dintre drep-
tunghiuri.
% C: vector continand centrele dreptunghiurilor
% Folosirea functiei bar pentru reprezentarea grafica a histogramei.
bar(C,N,1,w)
title(Histograma asociata unei variabile aleatoare uniforme)
xlabel(X)
ylabel(Frecventa absoluta)

Histograma rezultata este prezentata n Figura 1.


Generarea numerelor uniforme n Matlab (5)

Histograma asociata unei variabile aleatoare uniforme


90

80

70

60
Frecventa absoluta

50

40

30

20

10

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Figura : 1 Histograma asociata unui esantion de numere aleatoare


uniform distribuite
Bibliografie I

M. Craiu (1998), Statistica matematica: teorie si probleme,


Editura Matrix Rom, Bucuresti
W. L. Martinez, A. R. Martinez (2002), Computational
Statistics Handbook with MATLAB, Chapman & Hall/CRC,
Boca Raton London New York Washington, D.C.
I. Vaduva (2004), Modele de simulare: note de curs, Editura
Universitatii din Bucuresti, Bucuresti

S-ar putea să vă placă și