Documente Academic
Documente Profesional
Documente Cultură
- ai variabilității, de dispersie -
Definire și semnificații
‒ amplitudinea;
‒ abaterea intercuartilă;
‒ abaterea medie;
‒ varianţa;
‒ abaterea standard.
Amplitudinea
Amplitudinea este un indicator al variabilitaţii care măsoară distanţa dintre valoarea
maximă şi valoarea minimă dintr-o distribuţie. Formula de calcul este:
Distribuţia A: 0 2 3 4 6
Distribuţia B: 1 5 5 5 5
Distribuţia C: 1 5 5 5 9
Amplitudinea distribuției B: A = 5 - 1 = 4
Amplitudinea distribuției C: A = 9 - 1 = 8
Considerăm cele 12 valori din Tabelul 1. Cuartila 1 cade între valorile 3 şi 4, şi cuartila 3 cade
între valorile 9 şi 10. Abaterea intercuartilă al datelor prezentate în Tabelul 1 este:
Este necesar un timp mai mare pentru a-l calcula decât timpul necesar pentru
aflarea amplitudinii.
Abaterea semi-intercuartilă
Tabelul 2 listează cinci valori, media lor şi mărimea abaterilor. Mărimea abaterii pentru o valoare
oarecare este diferenţa dintre valoarea observată şi media grupului.
Pentru a calcula abaterea medie pentru datele din Tabelul 2 procedăm după cum
urmează:
Valoarea de 1,25 este media abaterilor valorilor faţă de media lor (din Tabelul 2).
Abaterea medie
Este ușor de înţeles conceptul distanţei medii faţă de media unei distribuţii. Este
relativ uşor de calculat şi de interpretat.
Abaterea medie poate fi calculată folosind şi alte valori de referinţă, nu numai
media. De exemplu abaterea medie faţă de o valoare oarecare, să zicem „a”. Se
poate demonstra că valoarea de referinţă pentru care abaterea medie este cea
mai mică este mediana.
Utilizările (2) şi (3) sunt valabile numai în cazul în care distribuţia de frecvenţe a
datelor empirice se apropie de modelul matematic al distribuţiei normale.
Abaterea standard și varianța
Media sugerează care este nivelul general al datelor pentru o variabilă, dar ea nu
ne spune cum sunt dispersate celelalte valori în jurul mediei. Această informaţie ne
este dată de către abaterea standard.
De exemplu, putem avea două distribuţii care au medii identice şi acelaşi număr
de valori), dar variabilităţi diferite, ca în distribuţiile D şi E.
Distribuţia D: 8 9 10 10 13
Distribuţia E: 1 5 10 16 18
Figurile 1 şi 2 reprezintă câte cinci valori pentru fiecare din cele două distribuţii.
Figurile 1 şi 2 înfăţişează valorile celor două distribuţii ca şi greutăţi pe o bară
gradată. Putem observa cu uşurinţă din Figurile 1 şi 2 că distribuţia E este mult
mai variabilă decât distribuţia D. Câteodată nici acest tip de reprezentare nu poate
vizualiza care dintre cele două distribuţii este mai variabilă.
Abaterea standard și varianța
| | | | | | | | | | | | | | | | | | |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| | | | | | | | | | | | | | | | | | |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Algoritmul de calcul al abaterii standard
Abaterea standard (ca şi abaterea medie) sugerează gradul în care valorile cazurilor dintr-o
distribuţie tind să varieze faţă de media lor. Într-un raport de cercetare, media se prezintă de
obicei imediat înaintea abaterii standard, astfel încât cititorul să aibă o mai bună imagine
asupra a cum arată valorile reale. Adăugând o cantitate fixă la toate valorile unei serii de
date, aceasta va afecta media prin creşterea sumei tuturor valorilor, dar nu va afecta
abaterea standard pentru acea distribuţie. Acest fenomen se întâmplă, de exemplu, când o
creştere de 50$ este dată tuturor angajaţilor unei agenţii sociale. Media salariului va fi cu 50$
mai mare, dar cantitatea variaţiei de salariu între angajaţi va rămâne exact la fel.
k x
s
i i x
2
2 i 1
n
Abaterea standard și varianța
Varianţa are proprietatea că este cea mai mică abatere medie pătratică
faţă de o valoare oarecare. Abaterea medie pătratică de la o valoare a se
calculează, aşa cum arată şi denumirea, prin ridicarea la pătrat a
diferenţelor dintre valorile individuale şi o mărime constantă, arbitrar
aleasă, a, urmată de însumarea pătratelor respective şi de raportarea la
numărul cazurilor observate.
În plus, abaterea medie pătratică de la o valoare a, este mai mare decât
varianţa exact cu pătratul diferenţei dintre cele două valori de referinţă,
adică valoarea mediei minus valoarea a. Această proprietate este deosebit
de utilă în calculul manual al varianţelor în cazul în care valoarea mediei
are zecimale, iar ridicările la pătrat devin astfel laborioase. În loc de a
calcula diferenţele faţă de valoarea medie, le vom calcula faţă de o
valoare apropiată, convenabil aleasă, apoi vom calcula abaterea medie
pătratică faţă de acea valoare, urmând ca la sfârşit să aducem „corecţia”
necesară prin scăderea pătratului diferenţei dintre valoarea mediei şi
valoarea aleasă. Abaterea medie pătratică, astfel „corectată” va fi chiar
valoarea varianţei căutate.
Aplicații practice
5a. Distribuțiile A și B se referă la numărul de copii pe care îl au familiile care
domiciliază într-un imobil cu 5 nivele, care are două scări, A și B. Calculaţi
amplitudinea, varianţa şi abaterea standard pentru cele două distribuţii şi
interpretaţi rezultatele obţinute (aproximativ 300-400 cuvinte). Luând în
considerare valorile indicatorilor variabilității obținuți, comparați cele două distribuții
(de ex., Au niveluri de omogenitate / eterogenitate asemănătoare sau diferite?
Care dintre cele două distribuții este mai eterogenă?)
Distribuția A: 0 2 3 4 6
Distribuția B: 2 3 3 3 4
A=52-19=33