Sunteți pe pagina 1din 8

Studiul variabilității populațiilor

Noţiunea de populaţie poate fi privită din două puncte de vedere:


biologic și statistic.
Din punct de vedere biologic, populaţia reprezintă o comunitate
reproductivă (un grup) de indivizi, care prezintă un fond de gene comun
(genofond, gene pool), consecinţă a izolării reproductive (W. L. Johannsen,
1903).
Asemenea populații au fost denumite și unităţi panmictice (S.
Wright, 1921) sau populaţii mendeliene locale (Dobzhansky, 1952).

Din punct de vedere statistic populaţia este asociată noțiunii de


variabilă aleatoare. În acest context, populația statistică este definită prin
totalitatea valorilor pe care variabila aleatoare le poate lua, în urma
măsurătorilor/înregistrărilor efectuate.

Exemple de populatii statistice:

- multimea persoanelor dintr-o anumita tara (localitate, zona etc.)


in anul t,
- multimea gospodariilor din Romania, la momentul t,
- multimea consumatorilor unui produs,
- multimea societatilor producatoare sau concurente ale unui
produs,
- multimea societatilor distribuitoare,
- angajatii unei societati,
- greutatea unui anumit tip de produs (de ex. paine), etc.
- numărul de animale dintr-o zonă geografică,
- greutatea corporală a porcilor dintr-o anumită rasă/linie.
- Cantitatea de grîu/mere la hectar, etc

Notă! O populație genetică este în același timp și o populație


statistică, reciproca nefiind valabilă.

1
Populaţiile statistice (inclusiv cele biologice) pot fi descrise prin trei
grupe de parametrii:

a) de nivel (medie, mediană şi modul);


b) de dispersie (amplitudinea, varianţa, deviaţia standard şi
coeficientul de variabilitate);
c) de format (coeficientul de asimetrie).

MEDIA SI VARIANŢA

În cazul populaţiilor normal distribuite media este egală cu mediana şi


cu modul, astfel incat pentru descrierea distribuţiei lor sunt suficiente doar
un singur parametru de nivel (media) şi un singur parametru de dispersie
(varianţa).

2
Indicatori statistici
Proba/Eşantion
Indicatorul Populaţie (parametri)
(statistici)
Media
Varianţa μ
X
2
S2
Abaterea (dispersia)  S
standard

Calculul PARAMETRILOR la nivelul POPULAŢIEI

Calculul mediei si variantei la nivelul populatiei

Xi
 X1 
X 
Fie X i o variabila aleatoare:  2 
 . 
 
 . 
 X N 

Media este o valoare abstractă care oferă informaţii asupra tendinţei


centrale a caracterului în populaţie, în jurul căreia fluctuează valorile
individuale.


 X i

Media nu dă nici o indicaţie asupra gradului de dispersie, de abatere


a fiecărei valori individuale în jurul mediei. Măsurarea gradului de dispersie
printr-o singură cifră, ca şi media, presupune însumarea abaterilor respective
şi împărţirea sumei obţinute la numărul valorilor participante. Această medie
va fi totdeauna zero, deoarece abaterile cu semn pozitiv se anulează reciproc
cu cele cu semn negativ, făcând astfel imposibilă calcularea varianţei.

3
Dispersia Varianţa   2 
 X 1      X 2   ,..., X n     0
N

2 
10  30  20  30  30  30  40  30  50  30
5

 20  10  0  10  20
2  0
5

Nr. X i (Caracterul [X] măsurat la un Xi  


crt. număr de “i”animale)
1 10 10-30=-20
2 20 20-30=-10
3 30 30-30=0
4 40 40-30=+10
5 50 50-30=+20
  30  X i    0

Pentru a accentua efectul abaterilor mari, cauzatoare de dispersii


mari, statisticienii au propus ca abaterile respective să fie ridicate la pătrat
(codificare). Media acestor abateri pătratice se numeşte varianţă sau
dispersie.

Dispersia Varianţa   2 
 X 1   2   X 2   2 ,..., X n   2 0
N

2 
10  302  20  302  30  302  40  302  50  302
5

 2

 20   10  0  102  202
2 2 2

400  100  100  400 1000
  200
5 5 5

4
Nr. Xi Xi    X i   2
crt. (Caracterul
[X] masurat
la
“i”animale)
1 10 10-30=-20  202  400
2 20 20-30=-10 100
3 30 30-30=0 0
4 40 40-30=+10 100
5 50 50-30=+20 400
  30  X i    0  X i     1000
2

 2

 X i  
2


1000
 200
N 5

Varianţa se exprimă în unităţi pătratice , ca urmare a ridicarii la pătrat


a abterilor valorilor individuale faţă de medie.
De ex., daca valorile individuale ( X i ) reprezinta cantitatea de
lapte/vaca/zi, varianţa rezultată (200) reprezintă cantitatea de lapte la pătrat.

ABATEREA STANDARD (abatere medie patratică.)

Calculul varianţei presupune ridicarea la pătrat a abaterilor valorilor


individuale fata de media lor, insumarea acestora si raportarea rezultatului
obtinut la dimensiunea populatiei. Prin urmare valoarea varianţei se exprimă
in unitaţi la pătrat (de exemplu, kg2., cm2., etc.), dificil de interpretat.
Revenirea la unitatea de măsură a caracterului analizat (kg., cm) se
face prin extragere de radical din varianţă (decodificare). Rezultatul obtinut
se numeşte abatere standard sau abatere medie patratică:

  2

In cazul considerat, abaterea standard este de 14,142 kg. lapte:

  200  14,142

Valoarea obtinută arata faptul ca, în medie, fiecare valoare individuală


se abate de la media caracterului analizat cu 14,142 kg. lapte.

5
Calculul STATISTICILOR la nivelul PROBEI (eşantionului)

Extragerea unei submultimi din multimea de baza (populatie) se


numeste eşantionare, iar rezultatul obtinut se numeste probă sau eşantion.
Dimensiunea eşantionului (n) este totdeauna mai mică decât mărimea
populaţiei (N), respectiv:

n<N

Media eşantionului este dată de expresia:

X
 X  i

n
2
iar varianţa (S ):

 X  X
2


2 i
S
n 1

Notă:
a) Când datele analizate sunt puţine, sub 30, gradele de libertate se
ajustează, scăzând cifra 1 din numarul datelor.
b) Când datele analizate sunt peste 30, se consideră că proba este
suficient de mare, numitorul este chiar n, iar varianţa se calculează
astfel:

 X  X
2


2 i
S
n

Prin decodificarea varianţei se obţine abaterea standard a eşantionului:

S  S2

6
RELAŢIA DINTRE PARAMETRII ŞI STATISTICI

1) Statisticii: X si S 2 sunt estimatori ai parametrilor  si  2

Statistici Parametri
X 
S2  2
2) Statisticii trebuie sa indeplineasca trei cerinte:

a) sa fie nedeplasati (Media statisticilor sa coincidă cu valoarea


parametrului)

 X 
p

i
 i 1
; p= nr. probe
p

b) sa aiba varianţa minimă ( S 2 cea mai mică);


c) sa fie consistenţi (probe suficient de mari: n  N )

Varianţa şi abaterea standard sunt măsuri absolute ale variabilităţii,


ambele fiind afectate de scara mărimilor. Din această cauză caracterele
exprimate în unităţi de măsură diferite (kg ; mm) nu pot fi comparate
între ele prin varianţă sau abatere standard. În situaţii de acest gen se
recomandă utilizarea unei măsuri relative a variabilităţii, indicator numit
coeficient de variabilitate.

COEFICIENTUL DE VARIABILITATE

Coeficientul de variabilitate (cv%) se exprimă procentual şi arată cât


reprezintă o unitate abatere standard din media caracterului analizat. La
nivelul unui esantion, coeficientul de variabilitate se calculeaza pe baza
relatiei :

S
CV (%)   100
X

7
Interpretarea coeficientului de variabilitate:

a. CV =0-15 %, inseamna ca proba este omogena, împrastierea datelor


este foarte mica si media este reprezentativa;
b. CV =15-30 %, media este înca suficient de reprezentativa,
împrastierea datelor este mijlocie;
c. CV > 30%, inseamna ca proba este heterogenă. In acest caz se
recomandata utilizarea medianei in local mediei.

S-ar putea să vă placă și