Sunteți pe pagina 1din 5

3.6.

INDICATORII FORMEI DISTRIBUŢIEI EXPERIMENTALE

Distribuţia experimentală poate fi caracterizată şi după forma curbei de frecvanţă care


poate fi simetrică sau asimetrică turtită sau ascuţită. Caracterizarea formei curbei poate fi
apreciată în mod orientativ prin simpla apreciere a aspectului ei sau în mod riguros cu ajutorul
unor indicatori statistici, cum sunt asimetria şi excesul.
Prin asimetrie se înţelege acea proprietate a distribuţiei unei variabile aleatoare de a
prezenta un indice de asimetrie diferit de zero sau acea proprietate a unei curbe unimodale de a
fi deplasată spre stânga sau spre dreapta faţă de curba normală. Altfel spus, asimetria reprezintă
deplasarea pe orizontală a vârfului curbei experimentale faţă de curba normală
Excesul sau boltirea (E) este aceea proprietate a unei curbe unimodale de a fi mai turtită
sau mai ascuţită decât curba normală corespunzătoare.
Excesul este definit ca diferenţa dintre momentul de ordinul 4 al distribuţiei reale şi
momentul de ordinul 4 al distribuţiei normale teoretice (pentru o distribuţie normală momentul
de ordinul 4 este m4 = 3)
E =m4 real -m4 teoretic
Aşadar , asimetria şi excesul caracterizează poziţia pe abscisă şi respectiv pe ordonată a
vârfului curbei experimentale comparativ cu cea normală (teoretică).
Deplasarea pe orizontală a vârfului curbei faţă de curba normală poate fi spre stânga -
când avem de-a face cu asimetrie de stânga sau asimetrie pozitivă ( repartiţia arborilor pe categorii
de diametre ) sau spre dreapta când asimetria este de dreapta sau negatirvă (repartiţia arborilor
pe clase de înălţimi ) (fig. 3.6).
Dintr-un alt punct de vedere asimetria mai poate fi aparentă sau reală. Asimetria aparentă
apare atunci când eşantionul este nereprezentativ ( de volum mic sau de volum necorespunzător)
sau când mărimea intervalului de clasă şi respectiv numărul de clase s-au stabilit în mod
necorespunzător. Acest gen de asimetrie poate fi eliminată funcţie de cauzele care o generează.
Asimetria reală se datorează unor factori externi sau intrinseci ( ex. ereditatea ). Ea este o
caracteristică a variabilei cercetate şi trebuie luată în considerare. O măsură a asimetriei este dată
de relaţia lui Pearson:
x − M o 3( x − M e )
A= =
s s
Relaţiile de calcul pentru indicele de asimetrie şi pentru indicele excesului sunt redate în
tabelul următor :

Relaţiile de calcul pentru asimetrie şi


exces

Tabelul3.7
Procedeul Asimetria Excesul

Procedeul direct A= ∑ (x − x )
i
3
E= ∑ (x − x )
i
4

−3
3 4
-pt. valori sN s N
negrupate în clase E=
-pt.valori
A=
∑ n (x − x )
i i ∑ n (x − x )
3
i i
4

−3
grupate în clase 3⋅
⋅∑
s (a)
Fig. 3.6 Asimetrie de stânga n dreapta (b). s ∑ n
şi de i
4
i

m3 m4
Procedeul A= E= −3
( m2 ) 3 m22
momentelor
6 24
Eroarea de sE =
determinare sA= N +3 N +5
Pentru testarea A E
indicelui se
sA sE
calculează

O modalitate expeditivă de determinare a asimetriei constă din compararea mediei


aritmetice cu modulul distribuţiei (fig. 3.7). Dacă media aritmetică este mai mare decăt modulul (
x > Mo ) asimetria este de stânga ( asimetrie pozitivă A > 0), iar dacă media aritmetică este mai
mică decât modulul, asimetria este de dreapta (asimetrie negativă A < o ).
La o distribuţie normală toţi cei trei indicatori ai tendinţei centrale ( x , M e , M 0 ) sunt
egali între ei.
Testarea indicelui de asimetrie (stabilirea autenticităţiii asimetriei ) se face prin
intermediul raportului dintre asimetrie şi eroarea de determinare a acesteia ( A/sA).
Dacă pentru o probabilitate de acoperire de 95%
avem valoarea raportului mai mare decât doi ( A/sA >2)
înseamnă că asimetria e un fapt real (este semnificativă şi
trebuie să fie luată în considerare constituind o proprietate a
colectivităţii studiate. In acest caz distribuţia nu se supune
distribuţiei normale ci unei distribuţii mai generale, cum este
distribuţia Charlier de tip A. Dacă valoarea raportului
menţionat mai sus este mai mică decât doi ( A/s A<2)
asimetria este nesemnificativă, rezultă că deplasarea pe
orizontală a vârfului curbei experimentale nu merită să fie
Fig. 3.7 Poziţionarea modulului, medianei şi luată în considerare deoarece în acest caz, curba de distribuţie
mediei aritmetice în legătură cu asimetria. experimentală se supune legilor distribuţiei normale.
Excesul reprezintă deplasarea pe verticală a vârfului
curbei experimentale faţă de curba normală .
Când vârful curbei experimentale este deasupra celei normale excesul este pozitiv (E > 0,
curbă leptokurtică), dacă vârful curbei experimentale se află sub vârful curbei normale excesul
este negativ (E < 0, curbă platikurtică), iar în cazul când vârful curbei experimentale corespunde
cu vârful curbei normale excesul este egal cu zero (E = 0,
curbă mezokurtică) (fig. 3.8).
Testarea indicelui de exces sau stabilirea autenticităţii
excesului se face prin intermediul raportului dintre exces şi
eroarea indicelui de exces (E / sE).
La o probabilitate de acoperire de p = 95%, dacă
valoarea raportului este mai mare decât doi (E / sE >2),
excesul este semnificativ şi trebuie să fie luat în considerare,
constituind o proprietate din punct de vedere a variabilei
Fig. 3.8 Excesul: curbă normală (a), curbă
leptokurtică (b), curbă platikurtică ( c). pentru colectivitatea studiată, iar dacă valoarea raportului
este mai mică decât doi (E / sE < 2) excesul este
nesemnificativ şi nu merită să fie luat în considerare.
In urma studiilor pot să apară curbe care prezintă numai asimetrie semnificativă sau
numai exces semnificativ, sau pot să apară distribuţii care prezintă în acelaşi timp atât exces, cât
şi asimetrie semnificative.
Calculul asimetriei şi excesului este indicat a fi efectuat, respectiv valorile obţinute
caracterizează colectivitatea, în cazul distribuţiilor de tip clopot normal sau apropiate de acestea.

3.7. ERORI DE REPREZENTATIVITATE


Ori de câte ori
observaţiile se fac la nivelul unei probe, indicii statistici aflaţi prin calcul vor fi afectaţi de erori,
respectiv vor exista diferenţe între indicii stabiliţi la nivelul probelor şi parametri care corespund
populaţiei din care provin, respectiv s-au extras probele.
Erorile de reprezentativitate exprimă gradul de depărtare dintre indicatorii eşantionului şi
parametrii populaţiei.
Erorile sunt cu atât mai mici cu cât volumul probei este mai mare.
Dacă observaţiile se fac la nivelul populaţiei, atunci se obţin parametri respectivi ai
populaţiei.
Parametri populaţiei se estimează prin intermediul indicilor statistici ai eşantioanelor şi a
erorilor standard.

3.7.1. Eroarea standard a mediei aritmetice

Mediile unor eşantioane de probă ale unei populaţii se distribuie întotdeauna în jurul
mediei populaţiei din care probele au fost extrase după o curbă normală, chiar dacă distribuţia
variabilei x a eşantioanelor în jurul mediei populaţiei se face după o curbă asimetrică.
Varianţa mediilor eşantioanelor în jurul valorii medii a populaţiei se numeşte eroare
standard ( σ x 2 ).
Abaterea standard a mediilor eşantioanelor în cadrul populaţiei respective se numeşte
eroare standard a mediei aritmetice ( σ x ), exprimată prin relaţia :

σ
σx =
N
în care : σ - abaterea standard ;
N - volumul eşantioanelor considerate.
Când observaţiile se efectuează la nivelul unei singure probe, eroarea standard a probei se
notează cu sx şi se determină cu relaţia :

s
sx = , pentru o probabilitate p = 68,27%
n

în care n - volumul probei , şi cu relaţia:

ts
tsx = , pentru o probabilitate p = 95%
n

în care t - criteriul de student = 1,9 ; f - grade de libertate = ∞ .


Intervalul de încredere se exprimă funcţie de eroarea standard, x ± tsx .

3.7.2. Indicele de precizie

Pentru evaluarea preciziei cu care a fost deteminată valoarea medie ( x ) pentru variabile
exprimate în unităţi diferite se foloseşte indicele de precizie. De regulă, acest indice se calculează
pentru o probabilitate de acoperire p = 95%, ceea ce corespunde probabilităţii de transgresiune
q = α = 5% . Formulele de calcul sunt următoarele :

ts% ts x
ts% = ; ts x% = ⋅ 100.
n x

Această relaţie se foloseşte în cazul unei populaţii infinite pentru care proporţia de
observare n / N < 1.
ts x ts x
ts x = 100 ; ts x % = 100
n x
n 1
relaţie care se utilizează în cazul populaţiilor infinite, când > .
N 3
n
In cazul populaţiilor finite, indicele de precizie se corectează cu factorul 1− .
N
ts n ts% n
tsx = 1− , pentru populaţii infinite; ts% = 1− , pentru
n N n N
populaţii finite.

Coeficientul de variaţie al populaţiei este σ % = s% ± tss % iar eroarea coeficientului de


variaţie se exprimă sub forma:
s%
ss% = .
2N

3.7.3. Eroarea maximă

Este denumită şi toleranţă - ∆x -% şi reprezintă eroarea admisă, dincolo de care o


valoare observată poate fi respinsă ca nefăcând parte din seria de distribuţie studiată sau dincolo
de care rezultatele unui experiment nu mai pot fi acceptate datorită unei precizii insuficiente.
Exprimarea erorii maxime în aceeaşi unitate de măsură ca şi variabila studiată se face cu relaţia:
x ⋅ ∆x %

∆x =
100
In general, se acceptă erori cuprinse între 3 - 5%. Comparaţia se face între valoarea
indicelui de precizie şi valoarea toleranţei: tsx % ≤ ∆x %
Importanţa erorilor de reprezentativitate constă în faptul că ele stau la baza estimării
mediei populaţiei prin intervale, precum şi a determinării volumului eşantionului.
Astfel, datorită faptului că valoarea medie a populaţiei este o valoare inabordabilă, ea
poate fi estimată pentru diferite probabilităţi de acoperire în funcţie de valoarea medie a
eşantionului şi indicele de precizie. Spre exemplu, se poate garanta cu o probabilitate de acoperire
de 95% că media populaţiei se află în intervalul: x − tsx < µ < x + tsx .
Intervalul de încredere al mediei aritmetice trebuie să fie mai mic decât intervalul stabilit
cu ajutorul toloranţei: x ± tsx < x ± ∆x .

3.7.4. Determinarea mărimii eşantionului


Determinarea mărimii eşantionului (volumul colectivităţii de selecţie), se face în funcţie
de indicele de precizie şi toleranţă după cum urmează:
- pentru populaţii infinite cu p = 95%:
2
 t ⋅ s% 
n1 =   ;
 ∆x % 

- pentru populaţii finite, mărimea eşantionului se determină în funcţie de indicele de


precizie şi coeficientul de variaţie cu p = 95%:
2 t 2 s2 %
 t ⋅ s%  n2 =
n2 =   ; t 2 s% .
 tsx %  s %+
2
N

Coeficientul de variaţie (s%) în ipoteza că nu se cunoaşte, se obţine pe baza unui sondaj


pilot.

S-ar putea să vă placă și