Sunteți pe pagina 1din 6

Distribuţii statistice remarcabile

1. Curba normală (Curba lui Gauss)

Definiţie. Curba normală sau Curba lui Gauss este o curbă în formă de clopot cu centre şi
împrăştieri diferite, care depind de media şi abaterea standard a colectivităţii generale.

Tabel 1. Principalele proprietăţi ale Curbei lui Gauss

Proprietăţi • Depinde de doi parametri: media, care determină centrul


curbei şi de abaterea standard, care determină
împrăştierea distribuţiei.
• Este simetrică faţă de media, μ (media, modul şi mediana
sunt egale).
• Aria totală de sub curbă este egală cu 1 (sau 100%).
• 50% din arie se află la stânga mediei, iar 50% la dreapta.
• Aproximativ 68% din această arie se află la +/- 1σ (o
abatere medie pătratică) faţă de media μ.
• Aproximativ 95% din această arie se află la +/- 2σ (două
abateri medii pătratice) faţă de media μ.
• Aproximativ 99% din această arie se află la +/- 3σ (3
abateri medii pătratice) faţă de media μ.

Reprezentare
grafică

99%

95%

68%

-3σ -2σ -1σ μ 1σ 2σ 3σ x


Notaţia pentru o X ~ N ( , 2 )
variabilă
aleatoare normal
distribuită
Funcţia densitate 1  x 
  
2

1  
de probabilitate f ( x)  e 2  ,    x  
 2
unde x este media din eşantion (sau o variantă observată), µ
reprezintă media, iar σ abaterea standard (abaterea medie
pătratică) din colectivitatea generală.
Constante: =3.14159
e=2.71828
Notaţia pentru o X 
variabilă Z cu Z ~ N (0,1)

aleatoare normală
standard
Funcţia densitate 1
1
  Z 2
de probabilitate p( Z )  e 2
standardizată 2
Aplicaţii posibile  Testarea ipotezei privind media unei populaţii statistice
 Testarea ipotezei privind diferenţa dintre două medii
* se utilizează atunci când colectivitatea statistică este
normal distribuită (sau atunci când eşantionul extras din
colectivitatea statistică este suficient de mare, astfel încât să
poată fi aplicată Teorema Limită Centrală), iar abaterea
standard a colectivităţii generale este cunoscută.

Funcţii în Excel  =NORM.DIST(x,mean,standard_dev,cumulative)


 =NORM.S.DIST(z,cumulative)
 =NORM.INV(probability,mean,standard_dev)
 =NORM.S.INV(probability)
2. Distribuţia Student (t)

Fie două variabile aleatoare independente: Z (o variabilă aleatoare normal distribuită) şi V (o


variabilă aleatoare care urmează o distribuţie hi-pătrat cu r grade de libertate), atunci raportul:
Z
T , unde Z ~ N (0,1) , iar V ~  r2
V /r
urmează o distribuţie Student cu r grade de libertate ( T ~ t r ).
Definiţie. Distribuţia Student reprezintă o clasă de distribuţii continue de probabilitate utilă în
estimarea mediei unei colectivităţi statistice normal distribuite pe baza unui eşantion de dimensiuni reduse
(n<30 de observaţii), când abaterea standard a colectivităţii generale nu este cunoscută.

Tabel 2. Principalele proprietăţi ale distribuţiei Student

Proprietăţi • Are tot o fomă de clopot ca şi curba normală, dar forma


depinde de numărul gradelor de libertate (r).
• Este mai aplatizată decât curba normală în centru, dar are
cozile mai înalte.
• Este cu atât mai aplatizată cu cât numărul de grade de libertate
este mai mic.
• Se apropie de forma distribuţiei normale cu cât numărul
gradelor de libertate creşte ( r  30 ).
• Este simetrică faţă de t=0.
• Este cuprinsă între   şi   .
• Media este egală cu 0 (egală cu mediana şi modul):
  0 pentru r  0
• Dispersia este mai mare decât 1 şi este definită atunci când
numărul gradelor de libertate este mai mare decât 2:
r , pentru r  2
2 
r 2

Reprezentare
grafică t (df=5)

t (df=13)

0 t
Funcţia  r 1
densitate de   
r 1

 2   t2  2
probabilitate f (t )  1   , tR
 r   r 
r   
2
unde Γ este funcţia gamma, iar r numărul gradelor de libertate.
Constanta: =3.14159.

Funcţia 1
1
 t 2
densitate de f (t )  e 2
, când r  
probabilitate 2
normalizată
Aplicaţii  Testarea ipotezei privind media unei populaţii statistice
posibile  Testarea ipotezei privind diferenţa dintre două medii
 Testarea ipotezei privind diferenţa dintre două medii pe acelaşi
eşantion
 Testarea semnificaţiei coeficientului de corelaţie liniară
Pearson
* se utilizează atunci când eşantionul este de volum mic (n<30
observaţii), iar abaterea standard din colectivitatea generală nu este
cunoscută.
Funcţii în  =T.DIST(x, deg_freedom, cumulative)
Excel  =T.INV(probability, deg_freedom)
 =T.TEST(array1,array2, tails, type)
3. Repartiţia Hi-pătrat (χ2)

Fie r variabile aleatore independente şi identic distribuite Z1, Z2, ...Zr, Z ~ N (0,1) atunci suma
pătratelor acestora V= Z12+ Z22+ ...+Zr2 urmează o distribuţie χ2 cu r grade de libertate ( V ~  r2 ).
Definiţie. Repartiţia χ2 reprezintă o clasă de distribuţii continue de probabilitate, fiecare dintre
acestea fiind determinate de numărul gradelor de libertate (r). Este distribuţia sumei pătratelor a r
variabile aleatoare independente şi normal distribuite.

Tabel 3. Principalele proprietăţi ale repartiţiei χ2

Proprietăţi • Depinde de un singur parametru (r=grade de libertate)


care influenţează forma, centrul şi împrăştierea
distribuţiei.
• La valori mici ale gradelor de libertate, distribuţia
prezintă o asimetrie pozitivă.
• Cu cât numărul gradelor de liberatate creşte,
distribuţia devine simetrică, apropiindu-se de
distribuţia normală (pentru r > 90).
• Este cuprinsă între 0 şi   , neputând lua valori
negative.
• Media este egală cu numărul gradelor de libertate, iar
dispersia este de două ori numărul gradelor de
libertate:
  r iar  2  2r
Funcţia densitate x ( r 2) / 2  e  x / 2
de probabilitate f ( x; r )  ,
2 r / 2 (r / 2)
unde Γ este funcţia gamma, iar r numărul gradelor de
libertate.
Constanta: e=2.71828

Aplicaţii posibile  Ca test de cooncordanţă verifică dacă o distribuţie


observată corespunde unei anumite distribuţii
teoretice.
 Ca test de asociere poate fi utilizat pentru testarea
asocierii (relaţiei) dintre două serii de atribute.
Funcţii Excel  =CHISQ.DIST(x, deg_freedom, cumulative)
 =CHISQ.INV (probability, deg_freedom)
 =CHISQ.TEST(actual_range, expected_range)
4. Repartiţia Fisher-Snedecor (F)

Fie două variabile aleatoare independente U şi V, care urmează fiecare o distribuţie hi-pătrat cu m,
respectiv n grade de libertate, atunci raportul:
U /m
F urmează o distribuţie F cu m şi n grade de libertate ( F ~ Fm ,n , iar U ~  m2 , V ~  n2 ).
V /n

Definiţie. Repartiţia F reprezintă distribuţia raportului dintre dispersiile a două populaţii statistice
normal distribuite.

Tabel 2.4. Principalele proprietăţi ale repartiţiei F

Proprietăţi • Forma distribuţiei depinde de doi parametri, gradele de


libertate m şi n.
• Distribuţia prezintă o asimetrie de dreapta pentru grade
mici de libertate, asimetria reducându-se odată cu
creşterea numărului de grade de libertate.
• Este cuprinsă între 0 şi   , neputând lua valori
negative.
n
•  , pentru n  2
n2
2n 2 (m  n  2)
•  
2
, n4
m(n  2) 2 (n  4)

Funcţia densitate m  n  / 2  m 


n/2  ( m n ) / 2
m / 2 1  m 
de probabilitate f ( w)    w 1  w 
(m / 2)(n / 2)  n   n 
unde w>0.
Aplicaţii posibile  Testarea ipotezei privind egalitatea dispersiilor a două
populaţii statistice
 Testarea ipotezei privind egalitatea a două sau mai
multe medii
Funcţii Excel  =F.DIST(x, deg_freedom1, deg_freedom2, cumulative)
 =F.INV(probability,deg_freedom1, deg_freedom2)
 =F.TEST(array1,array2)

S-ar putea să vă placă și