Sunteți pe pagina 1din 20

Fundamente de statistică: variabile aleatoare

Constantin Vertan

Politehnica University of Bucharest

March 11, 2019

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 1 / 20


Cuprinsul prezentării

1 Introducere

2 Variabile aleatoare

3 Variabile aleatore multiple

4 Regresia

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 2 / 20


Introducere

Statistică: O prezentare generală

Definiţie
Statistica este o ramură a matematicii care se ocupă cu colectarea,
organizarea, analiza, interpretarea şi prezentarea datelor.

De ce ne interesează
Datele (numerele) extrase din interacţiunea cu lumea sunt interpretate ca
ansamblu. Interpretarea ı̂ncearcă să extragă caracteristici cu sens din
ansamblul de date. De multe ori acestea sunt legate de modelarea
matematică a caracteristicilor măsurate ca variabile aleatoare.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 3 / 20


Variabile aleatoare

Variabile aleatoare
Definiţie
O variabilă aleatoare este o funcţie care asociază unei realizări particulare
a unui experiment (numit eveniment) un număr real.

ξ : Ω −→ R

Caracterizare
Variabla aleatoare poate fi caracterizată de numerele ce au fost asociate
evenimentelor observate. Pentru o mulţime de observaţii care este suficient
de mare, se poate calcula probabilitatea experimetală de apariţie a unei
valori x ca
Numar (observatii = x)
Prob(x) =
Total numar observatii
Numarătoarea observaţiilor poate fi extinsă la alte relaţii ce implică
observaţiile.
Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 4 / 20
Variabile aleatoare

Variabile aleatoare

Funcţia de repartiţie
Dându-se o variabilă aleatoare ξ, putem defini funcţia sa de repartiţie ca o
funcţie a cărei valoare, ı̂n orice punct, este probabilitatea ca valorile
realizărilor particulare ale variabilei aleatoare să fie mai mici decât acel
punct.
Fξ (x) = Prob{ξ (i) ≤ x}.

Observaţie
Evident, F este crescătoare şi Fξ (x) ∈ [0, 1], ∀x ∈ R.

Observaţie
Funcţia de repartiţie poate fi construită experimental.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 5 / 20


Variabile aleatoare

Variabile aleatoare

Funcţia de densitate de probabilitate


Dându-se funcţia de repartiţie a unei variabile aleatoare, derivata sa este
numită funcţia de densitate de probabilitate (pdf).

dFξ (x)
wξ (x) = .
dx

Caracteristicile funcţiei de densitate de probabilitate


Sunt două caracteristici principale ce derivă din definiţie

wξ (x) ≥ 0.
Z +∞
wξ (x)dx = 1.
−∞

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 6 / 20


Variabile aleatoare

Variabile aleatoare

Funcţii simple de densitate de probabilitate

Figure: a) Gaussiană (normală); b) Uniformă.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 7 / 20


Variabile aleatoare

Variabile aleatoare

Variabilă aleatoare discretă


In cazul unei variabile aleatoare discrete, mulţimea de valori posibile
(realizările particulare) este finită, doar valorile menţionate fiind posibile, şi
acestea apar cu o probabilitate ne-nulă.

ξ : Ω −→ {x1 , x2 , . . . , xN }

Funcţia de densitate de probabilitate discretă


Funcţia de densitate de probabilitate a unei variabile aleatoare discrete
este o sumă de impulsuri unitare (distribuţii Dirac), deplasate ı̂n valorile
particulare xi .
XN
wξ (x) = Prob(xi )δ(x − xi )
i=1

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 8 / 20


Variabile aleatoare

Variabile aleatoare

Variabilă aleatoare discretă

Figure: a) Binomială; b) Uniformă.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 9 / 20


Variabile aleatoare

Variabile aleatoare continue

Momente statistice
Pentru orice variabilă aleatoare continuă ξ se poate defini momentul
statistic de ordin ”k”, k ∈ N:
Z +∞
mk = x k wξ (x)dx.
−∞

Momente statistice importante


Media statistică este momentul statistic de ordin 1, m1 = ξ = µξ . Media
pătratică este momentul statistic de ordin 2, m2 = ξ 2 .

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 10 / 20


Variabile aleatoare

Variabile aleatoare continue

Momente statistice centrate


Fentru orice variabilă aleatoare continuă ξ se poate defini momentul
statistic centrat de ordin k, k ∈ N∗ :
Z +∞
Mk = (x − m1 )k wξ (x)dx.
−∞

Varianţa este momentul statistic centrat de ordinul 2,


M2 = (ξ − µξ )2 = σξ2 .

Exerciţiu
Să se găsească relaţia dintre medie, medie pătratică şi varianţă.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 11 / 20


Variabile aleatoare

Variabile aleatoare continue

Momentele statistice ale unei v.a. distribuite uniform


Calculul mediei şi varianţei

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 12 / 20


Variabile aleatoare

Variabile aleatoare discrete

Momente statistice
Pentru orice variabilă aleatoare discretă ξ, având un număr finit de realizări
particulare, se poate defini momentul statistic de ordin ”k”, k ∈ N:
N
X N
X
mk = xi k wξ (xi ) = xi k Prob(xi ).
i=1 i=1

Momente statistice centrate


Pentru orice variabilă aleatoare discretă ξ, având un număr finit de realizări
particulare, se poate defini momentul statistic centrat de ordin ”k”, k ∈ N:
N
X N
X
Mk = (xi − m1 )k wξ (xi ) = (xi − m1 )k Prob(xi ).
i=1 i=1

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 13 / 20


Variabile aleatoare

Variabile aleatoare discrete

Exerciţiu
Se dă următoarea imagine de 5 × 5 pixeli, reprezentată pe 10 nivele de gri,
numerotate de 0 la 9.
3 2 4 3 3
1 3 3 2 3
3 7 6 8 3
2 7 4 4 2
2 4 3 4 3.
Să se calculeze distribuţia valorilor pixelilor, valoare medie a nivelului de
gri, dispersia.
Să se calculeze imaginea după egalizarea de histogramă.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 14 / 20


Variabile aleatore multiple

Dacă există mai mult de o variabilă aleatoare...

Pereche de variabile aleatoare


Dându-se o pereche de variabile aleatoare putem defini funcţia lor mixtă
de repartiţie, clculabilă experimental, prin:
n \ o
Fξη (x, y ) = Prob (ξ (i) ≤ x) (η (i) ≤ y ) .

Funcţia de densitate de probabilitate mixtă se obţine prin derivarea funcţiei


de repartiţie mixte.
δ 2 Fξη (x, y )
wξη (x, y ) =
δxδy

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 15 / 20


Variabile aleatore multiple

Momente statistice ale unei perechi de v.a.

Definiţie
Dându-se două variabile aleatoare ξ şi µ, momentul statistic de ordin p şi
q este definit ca:
Z +∞ Z +∞
mp,q = x p y q wξµ (x, y )dxdy .
−∞ −∞

Corelaţia
Corelaţia dintre două variabile aleatoare este momentul statistic mixt de
ordin 1 şi 1.
Z +∞ Z +∞
m1,1 = xywξµ (x, y )dxdy = ξη = Rξη .
−∞ −∞

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 16 / 20


Variabile aleatore multiple

Corelaţia

Interpretarea corelaţiei
Corelaţia măsoară posibilitatea unei dependenţe liniare (şi a unei
aproximări liniare subsecvente) ı̂ntre o pereche de variabile aleatoare.

Figure: a) V.a. corelate b) V.a. independente, deci ne-corelate. c) Ne-corelate,


dar dependente.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 17 / 20


Regresia

Regresia

Definiţie
Regresia este procesul de estimare a dependenţei dintre variabile
[aleatoare]. Procesul se poate formula matematic ca:

Y ≈ f (X, β)

In ecuaţia anterioară, Y sunt variabilele dependente, X sunt variabilele


independente, β sunt parametrii modelului f .

Rezolvarea
(X şi Y) se dau, modelul f este indicat astfel că trebuie determinaţi
parametrii β.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 18 / 20


Regresia

Regresia
Regresia liniară
Este bazată pe existenţa corelaţiei ı̂ntre variabile; dependenţa este liniară.
Cel mai simplu caz implică o dependenţă unu-la-unu.

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 19 / 20


Regresia

Regresia
Regresia neliniară
Se poate rezolva orice tip de dependenţă (inclusiv orice tip de neliniaritate).

Constantin Vertan (LAPI / UPB) Variabile aleatoare March 11, 2019 20 / 20