Sunteți pe pagina 1din 15

Biostatistică

Curs 5 - 2020
2.2 Indicatorii variabilității (dispersiei, împrăștierii)
• Doar simpla cunoaștere a mediei aritmetice sau a altor indicatori ai tendinței
centrale nu este suficientă pentru a putea caracteriza satisfăcător o serie de
distribuție.
• Pentru o descriere cât mai completă a caracteristicii studiate este necesară și
cunoașterea variabilității acesteia, adică a împrăștierii valorilor măsurate în jurul
centrelor de grupare (cel mai des întâlnit fiind media aritmetică sau mediana) sub
influența unor factori întâmplători.

• Indicii de variație sunt utilizați pentru a reda o imagine clară a gradului de


împrăștiere a valorilor în jurul unui indicator al tendinței centrale.

• Cea mai expeditivă măsură a variabilității este amplitudinea de variație calculată ca


diferență între valoarea maximă și valoarea minimă. Este un indice simplu însă este
foarte imprecis deoarece depinde în mare măsură de valorile extreme.
2.1. Varianța sau dispersia
Notată pentru populație cu

Si cu pentru eșantion s2

Definiție: este media aritmetică a pătratelor abaterilor valorilor individuale


observate/măsurate față de media aritmetică a șirului/seriei de distribuție și oferă o imagine
fidelă asupra gradului de variabilitate a valorilor observate/măsurate în jurul centrului de grupare
(ex.media aritmetică)

Formula de calcul pt dispersie (varianță)

-pentru valori negrupate pe clase de mărime:

-pentru valori grupate pe clase de mărime:


• În practică se poate determina valoarea dispersiei utilizând și alte
relații de calcul echivalente. Una dintre acestea este procedeul
multiplicării, ce are la bază o formulă de calcul ce nu ia în considerare
media aritmetică (nu necesită calculul prealabil al mediei aritmetice)
-pentru valori negrupate pe clase

-pentru valori grupate pe clase


Observații
• Acest indicator este caracteristic pentru distribuțiile relativ simetrice. În
cazul distribuțiilor cu o asimetrie puternică la fel ca și media aritmetică
acest indicator își pierde din puterea de reprezentativitate.
• Valoarea dispersiei (varianței) este întotdeauna pozitivă
s2>0
s2=0, atunci când xi=xmed, pentru orice i.
- O valoare mică/redusă a dispersiei indică o grupare strânsă a valorilor
individuale în jurul mediei.
- Suma pătratelor abaterilor se împarte la N-1 și nu la N, deoarece prin
calcularea mediei aritmetice (folosită la stabilirea abaterilor), o observație
este deja blocată rămânând libere N-1 observații (grade de libertate).
• Dacă avem o variabilă xi a cărei dispersie este sx2 și o nouă variabilă
yi=a+b*xi atunci dispersia noii variabile este
• sy2 = a + b* sx2
• În cazul în care se dispune de mai multe sondaje referitoare la aceeași
caracteristică și la aceeași populație, dar cu medii diferite, se poate
calcula o varianță (dispersie) ponderată
• Smediu2 = ∑ Si2 (Ni-1) / (N-1)
, unde Si2 și Ni sunt dispersiile și numărul de unități statistice/
mărimea probei i, iar N este numărul total al populației.
!!!!! Însă calculul dispersiei medii este admis numai după ce, în
prealabil, prin teste statistice corespunzătoare, se demonstrează că
dispersiile eșantioanelor sunt estimații ale aceleiași dispersii generale
H0: S12 = S22 = .....=Si2 .....= S2
• 2.2.2. Abaterea standard (sau abaterea medie pătratică) = radicalul de ordinul
doi din varianță

• S=

Are aceeași dimensiune ca și variabila studiată


Interpretare:
1. Dacă avem valori reduse ale lui s și S2 atunci avem de-a face cu o grupare strânsă a
valorilor unei probe în jurul mediei aritmetice
2. Dacă s și S2 prezintă valori ridicate rezultă că proba prezintă o are variabilitate
accentuată.
3. Pentru distribuțiile unimodale, putem construi pe baza abaterii standard limitele de
încredere a valorii medii pentru anumite probabilități.
Pentru distribuțiile unimodale, putem construi pe baza
erorii standard a mediei (calculată ca raport dintre
abaterea standard și radical din mărimea populației)
limitele de încredere a valorii medii pentru anumite
probabilități.
• 2.2.3. Coeficientul de variație
- Este abaterea standard exprimată în procente față de media
aritmetică

-este adimensional (nu are unitate de măsură)


-prezintă avantajul comparării variabilității a 2 sau mai multe variabile
ce se referă la distribuții din domenii diferite din punct de vedere al
variabilității exprimate în unități de măsură diferite.
• Interpretare a coeficientului de variație (s%)
= cu cât valoarea coeficientului de variație este mai mică cu atât variația este
mai redusă, colectivitatea este mai omogenă, iar media are un grad mai
ridicat de reprezentativitate.
Criteriu de testare
Dacă s% > 30% === existența unei variabilități accentuate și acest fapt denotă
o neomogenitate a populației. În asemenea situații se recurge la o stratificare
pe subcolectivități omogene pentru care s%<30%.
Criteriu de testare a omogenității unei populații
1. Dacă s% < 30% rezultă că avem de-a face cu o populație omogenă
2. Dacă s% > 30% rezultă că avem de-a face cu o populație neomogenă
(heterogenă)
•3. Indicatorii formei distribuției experimentale
Distribuția experimentală poate fi caracterizată și după forma curbei de
frecvență care poate să fie:
• -simetrică sau asimetrică
• -turtită sau ascuțită
Caracterizarea formei distribuției poate fi realizată cu ajutorul unor indicatori
statistici cum ar fi:
-indicele de asimetrie
-indicele de exces.
• ASIMETRIA- deplasare pe orizontală a vârfului curbei experimentale
față de curba normală, perfect simetrică.
Deplasarea pe orizontală a vârfului curbei față de curba normală poate
fi de stânga și atunci avem de-a face cu o asimetrie de stânga sau o
asimetrie pozitivă sau spre dreapta când asimetria este de dreapta
sau asimetrie negativă
• Formula de calcul pt indicele de asimetrie

, unde Ni este frecvența clasei i, xi este clasa de mărime i, iar N este


mărimea populației, s – abaterea standard

• Testarea indicelui de asimetrie se realizează prin intermediul


raportului dintre indicele de asimetrie și eroarea de determinare a
acestuia.

• Eroarea de determinare a indicelui de asimetrie se determină cu


formula

S-ar putea să vă placă și