Documente Academic
Documente Profesional
Documente Cultură
Dorim să estimăm, cât mai eficace, centrul unei populaţii folosind, bineînţeles, un
eşantion. Ar fi de dorit oare să calculăm media de eşantion, ceea ce ar însemna efectuarea
multor adunări? Sau poate determinarea medianei, după reordonarea datelor, ar fi mai
eficace?
Este imperios necesar să ne fie cât se poate de clar ce trebuie să înţelegem prin
cuvântul „eficace”. Prin acest cuvânt am putea înţelege, de exemplu, timp scurt de efectuare
a calculelor. Dar azi, în epoca calculatoarelor, rapiditatea calculelor nu mai constituie o
problemă; rămâne doar să luăm în considerare opinia statisticianului privind „precizia”
rezultatelor.
Am văzut anterior că „precizie mare” înseamnă de fapt „varianţă scăzută”. Dacă ştim
că populaţia noastră este normală, de exemplu distribuită , atunci media de ),(N2σμ
eşantion este cu 57% mai „eficace” (mai eficientă) decât mediana. (Cu alte cuvinte,
pentru a obţine aceeaşi precizie, eşantionul din care obţinem mediana ar trebui să aibă cu
57% mai mulţi indivizi decât cel din care calculăm media.)
Această preferinţă pentru medie s-ar putea să nu mai fie justificată în caz că populaţia nu
este distribuită normal. În figura următoare este reprezentată o distribuţie cu „cozi mai
groase” decât normala. POZA
Indivizii ce fac parte din aceste „cozi” au şanse mai mari să fie selectaţi în eşantion
(decât în cazul normalei), iar depărtarea lor faţă de „centru” face ca ei să contribuie mai
mult la calculul mediei. Iar indivizii „aberant” de depărtaţi vor exercita un „efect de
pârghie” (leverage effect) mult prea serios asupra mediei, şi vor face ca să nu mai avem
încredere în media de eşantion ca estimator al centrului. Dimpotrivă, pentru a obţine
mediana, se iau în considerare foarte puţini indivizi ai eşantionului (doar unul sau doi), în
nici un caz cei aberanţi, nici măcar cei depărtaţi.
Neîncrederea pe care o avem în mediană, ca estimator al centrului, provine tocmai din
acest număr extrem de mic de indivizi care se iau în consideraţie. Un compromis între
medie şi mediană, des utilizat, constă în luarea în considerare a mediei jumătăţii centrale a
indivizilor din eşantion. Cu alte cuvinte, după îndepărtarea a câte unui sfert dintre indivizii
de la fiecare extremitate, vom calcula media celor rămaşi. În acest fel indivizii aberanţi vor
fi eliminaţi cu siguranţă, de asemenea cei depărtaţi.
O altă soluţie, uşor de implementat în programele de calculator, constă în
înlocuirea mediei de eşantion cu o medie ponderată de eşantion. Ponderea w (x)a fiecărei
valori x se calculează, cu o formulă convenabilă, în funcţie de depărtarea valorii x faţă de
„centrul” estimat. POZA
De exemplu, în figura de mai sus este reprezentată funcţia Hamming de ponderare:
ECUATIE
În aplicarea ei putem lua drept centru 0 fie media de eşantion (în care caz valoarea 1
corespunde abaterii standard de eşantion), fie mediana (în care caz valoarea 2 corespunde
intervalului inter-cuartile).
Estimarea centrului se va face apoi prin statistica ECUATIE
Folosirea calculatorului face posibilă obţinerea de estimări „robuste” – cum este
media ponderată – care oferă garanţii de eficienţă chiar în prezenţa unor valori aberante sau
a altor situaţii complicate.