Sunteți pe pagina 1din 31

SERII DE REPARTIŢIE

UNIDIMENSIONALE -partea a doua-

Prof.univ.dr. Cristache Silvia Elena


Tendinta centrala si variatia pentru o
serie de distributie de frecvente
Descrierea Datelor

Tendinţă centrală Variaţie

Medie aritmetică Amplitudine

Mediană Abatere Interquartilică

Modul Dispersie

Abatere standard
Quartile
Coeficient de variaţie
Tendinta centrala-EXEMPLU
• Exemplu 1: Să se calculeze indicatorii tendinţei centrale
pentru seria notelor unui student obţinute pentru 10 examene:
7, 10, 3, 6, 7, 10, 7, 8, 9, 10. Precizaţi care este populaţia
statistică, unitatea statistică şi variabila.
Rezolvare: caz 1: Serie negrupata- un sir de valori

Notaţii: xi – seria notelor studentului.


• Observaţie: populaţia statistică este formată din mulţimea
disciplinelor; unitatea statistică este disciplina; variabila este
nivelul studentului exprimat prin notele obţinute
 
Tendinta centrala-EXEMPLU
• Media aritmetică (x)

• Mediana:Pentru determinarea medianei se ordonează


crescător seria: 3, 6, 7, 7, 7, 8, 9, 10, 10, 10.
• Deoarece avem o serie formată din 10 valori (număr par de
termeni), se determină locul medianei, apoi valoarea acesteia
este dată de media aritmetică a valorilor termenilor din
mijlocul seriei. Locul medianei:
, un loc egal amplasat intre locurile 5 şi 6
• Pe locul 5 se află valoarea 7 iar pe locul 6 se află valoarea 8,
astfel mediana va fi media aritmetica a acestor doua valori
aflate pe locurile centrale:
Tendinta centrala-EXEMPLU

Apreciem că la 50% din discipline studentul a luat peste 7,5 puncte iar la 50% din
discipline a luat note sub 7,5 puncte.

Modul: Pentru un şir de valori, modul este valoarea care se repetă de cele mai multe deci:
M 01  7
 seria notelor este bimodală, modulul nu este o valoare unică, exista 2 valori
M 02  10
modale
ANALIZA VARIABILITĂŢII

Necesitate:

- Statistica studiază fenomene de masă, adică fenomene care se


produc la numeroase unităţi statistice şi variază ca nivel de la o unitate
la alta. Cu cât fenomenele sunt influenţate de mai mulţi factori, cu atât
sunt mai complexe şi prezintă un grad mai mare de variaţie.
- pentru folosirea corectă a indicatorilor medii, este necesară
verificarea reprezentativităţii lor. Media este reprezentativă doar dacă
seria de date din care s-a calculat este omogenă (prezintă un grad
scăzut de variaţie).
- variabilitatea este, deci, o trăsătură esenţială a fenomenelor şi
proceselor care formează obiectul de studiu al statisticii, indicatorii de
măsurare a variabilităţii completează informaţiile aduse de indicatorii
descriptivi ai tendinţei centrale, pentru o analiză mai aprofundată a
unui set de date.
6
ni ni
B A B

xi

xi

x b) xA xB
a)
B
ni Două distribuţii pot avea:
- tendinţe centrale asemănătoare, dar
A grade diferite de împrăştiere a
valorilor (a)
- tendinţe centrale diferite, dar grade
xi identice de dispersare a valorilor (b)
c) xA xB - tendinţe centrale diferite, dar si grade
diferite de variabilitate a valorilor (c)
7
Indicatori ai variaţiei
• Indicatorii variaţiei au în vedere stabilirea gradului de
repartiţie a valorilor faţă de valoarea medie.
• Aplicabilitatea indicatorilor variaţiei vizează, în
principal:
 caracterizarea independentă a fenomenelor
 estimarea erorilor de selecţie
 analiza corelaţiei statistice
• În funcţie de tipul analizei variaţiei se pot calcula
două tipuri de indicatori ai variaţiei:
1. - indicatori simpli ai variaţiei
2. - indicatori sintetici ai variaţiei
Indicatori ai variaţiei
• Detalierea indicatorilor variaţiei:

1. - indicatori simpli ai variaţiei


1.1. – amplitudinea variaţiei (absolută, relativă)
1.2. – abateri individuale (absolute, relative)
1.3 – abaterea intercuartilica

2. - indicatori sintetici ai variaţiei


2.1. – abaterea medie liniară
2.2. – dispersia
2.3. – deviatie standard (abaterea medie pătratică)
2.4. – coeficient de variaţie (de omogenitate)
1. Indicatorii simpli ai variaţiei
1.1. Amplitudinea variaţiei
amplitudinea absolută a variaţiei : se calculează ca diferenţă între
nivelul maxim şi nivelul minim al caracteristicii şi ne indică lungimea
intervalului maxim de variaţie:

Ax  xmax  x min
 Amplitudinea absolută a variațieiu este foarte sensibilă la valorile extreme și nu ţine cont de distribuţia celorlalte
valori din serie.
 amplitudinea relativă a variaţiei: utilizată, în general când se compară gradul de împrăştiere a
valorilor individuale pentru două colectivităţi statistice cu caracteristici care se exprimă în
unităţi de măsură diferite, este determinată ca raport între amplitudinea absolută a variaţiei şi
nivelul mediu al caracteristicii:

Ax
Ax %   100
x
1. Indicatorii simpli ai variaţiei
1.2. Abateri individuale
abateri individuale absolute se obţin ca diferenţă între fiecare
variantă înregistrată şi media aritmetică a acestora, evidenţiind
cu cât se abate fiecare valoare de la valoarea medie:

d i  xi  x
 abateri individuale relative apar ca raport a abaterilor
absolute la nivelul mediu al caracteristicii :
xi  x
di%  100
x
2. Indicatorii sintetici ai variaţiei
2.1. Abaterea medie liniară
• Abaterea medie liniară se calculează ca o medie aritmetică
simplă (în cazul seriilor simple) sau ponderată (în cazul
seriilor de distribuţie de frecvenţe) a abaterilor termenilor
seriei de la media lor în valoare absolută.
• - pentru o serie simplă ,date negrupate:

• - pentru o serie de distribuţie de frecvenţe absolute, date


grupate pe variante sau intervale de variatie: este calculată
ca o medie arimetică ponderată a abaterilor individuale a
fiecarei valori inregistrate de la medie, luate in valoare
absoluta:
2. Indicatorii sintetici ai variaţiei
2.1. Abaterea medie liniară
 Formula de calcul este pentru date grupate pe variante
sau pe intervale de variatie
Dezavantaje ale abaterii medii liniare:
•se exprimă în aceeaşi unitate de măsură ca şi caracteristica
analizată, deci nu poate fi utilizată la compararea a două sau mai
multe serii după caracteristici exprimate în unităţi de măsură
diferite;
•nu ţine seama de semnul algebric;
•nu ţine seama de faptul că abaterile mai mari în valoare absolută
influenţează în mai mare măsură gradul de variaţie al unei
caracteristici comparativ cu abaterile mici.
2. Indicatorii sintetici ai variaţiei
2.2. Dispersia
• Este denumită şi moment centrat de ordinul doi,
• Se calculează ca medie aritmetică simplă (în cazul seriilor
simple) sau ponderată (în cazul seriilor de distribuţie de
frecvenţă) a pătratelor abaterilor termenilor seriei de la
tendinţa centrală (cel mai adesea media aritmetică).
• - pentru o serie simplă ,date negrupate:

• - pentru o serie de frecvenţe absolute, date grupate : se


determină ca o medie aritmetică ponderată a pătratelor
abaterilor individuale, astfel:
2. Indicatorii sintetici ai variaţiei
2.2. Dispersia
n

2
i 1
x i2 ni
2
S  k
 x
n
i 1
i

S 2

 xi 2
 x 2

Este un indicator abstract, care nu are forma concretă de exprimare


deoarece arată modul în care valorile caracteristicii gravitează în jurul mediei,
măsurând variaţia totală a acesteia datorită cauzelor esenţiale şi
întâmplătoare . Dacă datele provin din eşantioane de volum redus şi le
folosim pentru extinderea rezultatelor la nivelul colectivităţii generale (le
folosim pentru o inferenţă statistică), atunci în calculul dispersiei la numitor
se va folosi (n-1) şi nu “n” fiind astfel dispersia eşantionului un estimator mai
bun al dispersiei în colectivitatea generală:
2. Indicatorii sintetici ai variaţiei
2.2. Dispersia

In cazul seriilor de date in care n≤30 ( avem un


esantion de volum redus) de observatii si sunt
grupate pe variante sau interval de variatie
dispersia se determina prin urmatoarele relatii
de calcul:

unde n=volumul esantionului


2. Indicatorii sintetici ai variaţiei
2.2. Dispersia
Dispersia se poate determina şi fără calculul în prealabil
al abaterilor absolute:
2

 x  x  x
n n n
2  n

i
2
i  x 2
i   xi 
 x  i 1   i 1 
2
s2  i 1
 i 1

n n n  n  (pentru serii simple)


 
 
2

 x  x n  x n
n
2
n n
 n

i i
2
i i x i i  i i 
2
n x n
 i 1n  x  i 1n   i 1n 
2
s2  i 1
n   (pentru serii de frecvenţe)
n
i 1
i i1 ni i1 ni  i1 ni 
2. Indicatorii sintetici ai variabilităţii
2.3 Abaterea standard/Deviatia standard
 Abaterea medie pătratică (sau abatere standard, sau deviaţie standard) este media pătratică
simplă sau ponderată a abaterilor individuale absolute faţă de medie:

n

 i
x  x 2

s  s2  i 1
 pentru o serie simplă: n
r
r
 xi  x  ni
2 
 i
x  x 2 *
ni
s  s2  i 1 s  s2  i 1
r
r
 pentru o serie de frecvenţe  ni sau  ni*
i 1 i 1

18
2. Indicatorii sintetici ai variaţiei
2.3. Abaterea standard/Deviatia stand
Abaterea medie pătratică este un indicator care ne oferă informaţii privind
modul de împrăştiere a termenilor unei serii cu tendinţă de normalitate. Astfel, o
regulă empirică spune:
•- 68,37% din termenii unei serii se situează în intervalul ;

• - 98,45% din termenii unei serii se situează în intervalul ;

•- 99,73% din termenii unei serii se situează în intervalul ;

•- 99,94% din termeni se găsesc în intervalul ;


•Deoarece rezultă că d S .
•În cazul unei serii de distribuţie de frecvenţe simetrică sau uşor asimetrică,
adică pentru o serie cu tendinţă de normalitate între abaterea medie liniară şi
abaterea medie pătratică există relaţia : d  0,8 * S
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate
Propus de Pearson, este denumit şi coeficient de omogenitate
ne arată gradul de împrăştiere a valorilor faţă de valoarea medie
se calculează fie ca raport dintre abatera medie liniară şi nivelul
mediu, fie între abaterea medie pătratică şi nivelul mediu:
dx Sx
vx   100 sau vx  100
x x
se determină pentru a stabili câte unităţi din abaterea medie
liniară sau pătratică revin la 100 unităţi de medie
Acest indicator nu se poate utiliza (adică este lipsit de
semnificaţie) în cazul în care media aritmetică este apropiată de
zero sau când valorile termenilor seriei sunt foarte apropiate.
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie (continuare)
În funcţie de valoarea pe care o ia în intervalul [0 – 100 %], are o arie
destul de largă de aplicabilitate, fiind stabilit pentru:
• a preciza gradul de omogenitate a colectivităţii;
• a testa semnificaţia reprezentativităţii mediei;
• a preciza dacă gruparea este bine realizată.
• Dacă v = 0 seria este perfect omogenă, toţi termenii seriei sunt egali
între ei şi sunt egali cu media: în acest caz nu există variaţie.
• Dacă v  5%, seria este foarte omogenă, variaţia este foarte mică,
media este foarte reprezentativă, iar gruparea a fost foarte bine
executată (în cazul seriilor de distribuţie de frecvenţe).
• Dacă v [6%-35%], seria este omogenă, media este reprezentativă,
iar gruparea a fost bine executată .
• Dacă v  [36%-50%), seria are o omogenitate relativa, variaţia este
destul de semnificativa, media nu este destul de reprezentativă, iar
gruparea ar trebui refăcută.
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie (continuare)
• Dacă v [50%-100%], seria este eterogenă, variaţia este
foarte mare, media nu este reprezentativă, iar gruparea
trebuie refăcută.
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate
Indicatorii tendinţei centrale şi de structură pentru o grupare
pe variante
•Exemplu 2:Se cunosc următoarele date despre un lot de 100 de
aparate defecte existente in depozitul de produse finite:
Număr de aparate cu defecte Număr de loturi de aparate
0 10
1 20
2 40
3 15
4 10
5 5
Total 100
Se cere:
1) Să se determine indicatorii tendinţei centrale;
Să se reprezinte grafic structura aparatelor
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate
• Notaţii:
• xi = numărul de aparate defecte.
• ni = lotul aparatelor
1. Se vor calcula ca indicatori ai tendinţei centrale: media, mediana şi modulul.

Media aritmetică :
Nr. Frecvenţe absolute Structura
Nr. de loturi
de aparate defecte xi . ni cumulate crescător aparatelor
de aparate (ni)
(xi) F(xi) ni *

A 1 2 3 4
0 10 0 10 10
1 20 20 30 20
2 40 80 70 40
3 15 45 85 15
4 10 40 95 10
5 5 25 100 5

Total 100 210 - 100


2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate

Mediana:

• Pentru stabilirea valorii care conţine mediana, observăm că


prima frecvenţă, absolută cumulată crescător care depăşeşte
valoarea de 50,5 este 70 şi, corespunde numărului median de
aparate defecte: Me = 2 aparate.
• Modulul
• Valoarea modală se găseşte în dreptul valorii maxime a
numărului de loturi de aparate respectiv valoarea 40, deci M 0 =
2 aparate. Deoarece aparate defecte pe lot putem aprecia că
seria este simetrică. Aşadar apreciem că din lotul de 100 de
aparate doar 2 au fost găsite cu defecte intr-un lot.
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate
2. Structura aparatelor se calculează cu ajutorul
frecvenţelor relative:

Fig. 1 Structura loturilor după numărul de aparate defecte


2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate
Exemplu 3: Se cunosc următoarele date referitoare la prețul unui gram
de aur pentru 9 magazine:
Preț aur (lei/gr.) 125 121 117 122 119 124 119
119 114
Cerințe:
a) Să se calculeze indicatorii simpli ai variației;
b) Să se calculeze indicatorii sintetici ai variației;
•a.1) Indicatorii simpli ai variației:
• Amplitudinea absolută a variației:
•Ax = xmax - xmin=125-114=11 lei/gram
•Câmpul maxim de împrăștiere al prețului unui gram de aur la nivelul
celor nouă magazine este de 11 lei/gram.
•a.2) Abaterile individuale absolute (vezi tabel col 2):

2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate
2. Indicatorii sintetici ai variaţiei
2.4. Coeficientul de variaţie/omogenitate

S-ar putea să vă placă și