Documente Academic
Documente Profesional
Documente Cultură
=
2. Frecvenţe relative – numărul de frecvenţe identice asociate unei variabile raportat la numărul
total de cazuri dintr-o distribuţie statistică
Dacă un subiect a participat la testare, atunci el aparţine cu siguranţă unei categorii a variabilei
menţionate.
La nivel de interval – Pe lângă operaţiunile de clasificare ( nivel nominal) şi ordonare ( nivel ordinal),
apare relaţia de echidistanţă între două cazuri consecutive ale unor clase succesive (identice ca
mărime).
Exemplu: variabila – vârsta subiecţilor participanţi la sondaj
Clasa vârstelor : 18 -20 ani – 4 persoane
21- 23 ani – 5 persoane
24 -26 ani – 3 persoane
La nivel de raport – Pe lângă relaţiile de clasificare, ordonare, situare a cazurilor în clase de mărimi
egale, apare şi relaţia de comparare a cazurilor situate în clase diferite ( raportate la o valoare de
0 a unei axe).
Exemplu: variabila – salariu
Angajaţi cu 0 -3 ani vechime – 1.000 lei
4 – 7 ani vechime – 1.500 lei
8- 11 ani vechime – 2.000 lei
Un angajat cu 10 ani vechime câştigă dublu în raport cu un angajat cu 2 ani vechime.
În aproape orice tip de analiză statistică ( în afara statisticilor elementare), înainte ca datele statistice
să fie analizate, acestea trebuie să fie mai întâi ordonate!
Scorul Frecv
6
Avem prezentat în cadrul tabelului de mai sus o serie simplă de frecvenţe, ordonate în sens crescător
după valoarea scorului înregistrat.
Unde:
7
i = lungimea recomandată a intervalului de grupare statistic
Xmax = cel mai mare scor al seriei statistice
Xmin = cel mai mic scor al seriei statistice
Atunci când scorurile statistice sunt dispuse în clase de intervale trebuie ţinut cont de următoarele
8
reguli:
1. Intervalul de clasă are o valoare întreagă
2. Lungimea claselor trebuie fie egală
3. Clasele trebuie să includă toate scorurile statistice aferente sondajului
4. Fiecare clasă trebuie să conţină cel puţin un scor statistic
9
centralizată
Interval Lim ite reale Cen tre d e interv alFrecvenţe absolute Frecvenţe
de clasă cum ulate
6-7 5,5 – 7,5 6,5 6 6
8-9 7,5 - 9,5 8,5 10 16
10 -11 9 ,5 – 11,5 10,5 4 20
10
De reţinut!
1. Intervalele de clasă sunt aproximări statistice ale realităţii
2. Trebuie construite limitele reale ale claselor, pentru a putea include toate scorurile statistice în
sondaj
Media aritmetică
Media aritmetică – reprezintă principalul indicator statistic de definire a unei colectivităţi statistice.
∑x
La nivel de măsură ordinal,media se calculează:
i – indice de indexare al scorului statistic i
n – numărul total de scoruri
X= i =1
n
Atunci când se doreşte calculul mediei aritmetice la nivel de interval sau raport, nu mai pot intra în
calcul scorurile individuale înregistrate, ci se introduc în formula de calcul “centrele de interval”
aferente limitelor reale ale claselor. n
Mediana
Modulul
Indicatorul statistic ce defineşte numărul cel mai mare de apariţie a unui scor (frecvenţa) în cadrul
unei distribuţii statistice de date.
În cazul exemplului nostru Mo = 9 ( scorul care apare de cele mai multe ori în distribuţia statistică,
la nivel ordinal)
Distribuţii statistice simetrice
Cea mai cunoscută distribuţie statistică simetrică de scoruri – distribuţia de tip Gauss
În cadrul unei distribuţii statistice Gauss – media, mediana şi modulul coincid ca valoare şi poziţie
în cadrul distribuţiei statistice de date.
Curba Gauss – este asimilată cu o curbă de probabilitate statistică!
Tendinţa centrală - Reprezintă fenomenul de organizare a datelor statistice în jurul “valorii centrale”
(reprezentate prin media, mediana şi modulul) ale unei distribuţii experimentale.
Cu cât datele statistice se apropie mai mult în mod uniform de valoarea centrală a distribuţiei, putem
afirma că acea colectivitate statistică are un grad ridicat de omogenitate.
Media - Reprezintă indicatorul ce caracterizează printr-o singură valoare întreaga serie statistică
investigată.
Media aritmetică - caracterizează evoluţia medie a scorurilor statistice a unei colectivităţi
1. Pentru seriile de date statistice “simple”, negrupate în clase (pentru date la nivel nominal
sau ordinal)
n
∑x i
X = i =1
n statistic
i – indice de indexare al scorului
n – numărul total de scoruri
1. Pentru distribuţiile de statistice simple ( fără a avea date incluse în clase) ce includ un număr
par de scoruri, mediana se calculează prin intermediul celor 2 termeni din mijlocul şirului
de date ( formula de identificare termen -N/2).
1. Pentru distribuţiile de statistice simple ( fără a avea date incluse în clase) ce includ un număr
impar de scoruri, mediana este indicatorul de la mijlocul şirului de date statistice ( formula
de identificare termen (N+1)/2)
Concluzie: termenul de la mijlocul distribuţiei statistice ordonate are valoarea asociată 8,5
Pentru calculul medianei la nivel de interval sau raport utilizăm formula corespunzătoare acestui
indicator pentru valorile statistice incluse în clase.
Unde:
Liminf= limita inferioară reală a intervalului ce cuprinde mediana
n/2 = cota medianei ( unde n reprezintă numărul total de scoruri)
i = mărimea intervalului de clasă
fi = frecvenţa absolută a intervalului ce conţine mediana
fci = frecvenţa cumulată până la nivelul intervalului ce conţine mediana
Aplicând formula de grupare a datelor statistice în clase ( a lui Sturges) obţinem următoarea situaţie
(pentru exemplul precedent):
Interval Limite reale Centre de interval Frecvenţe absolute Frecvenţe
de clasă cumulate
6-7 5,5 – 7,5 6,5 6 6
8-9 7,5 - 9,5 8,5 10 16
10 -11 9,5 – 11,5 10,5 4 20
În acest caz:
1. Cota medianei = n/2 = 20/2 =10 (al zecelea caz)
2. Identificarea intervalului: cazul 10 se află în intervalul 8-9 cu limite reale 7,5 – 9,5
3. Se identifică limita reală inferioară a intervalului – în cazul nostru are valoarea 7,5
4. Numărul de frecvenţe cumulate până la acel nivel – 6 (corespunzătoare clasei 6-7)
n / 2 − fci
Md = Liminf + i = 7,5 + 20 / 2 − 6 2 = 8,3
fi 10
Deoarece în cadrul seriei de date simple (negrupate în clase de valori) mediana calculată anterior avea
valoarea 8,50, iar în cazul de faţă valoarea nouă înregistrată prin calcul este de 8,30, opinăm că
diferenţa de 0,20 înregistrată se datorează aprecierilor statistice aproximative.
Modulul
Indicatorul statistic ce defineşte numărul cel mai mare de apariţie a unui scor (frecvenţe) în cadrul
unei distribuţii statistice de date.
În cazul exemplului nostru (în seriile simple de date negrupate) Mo = 9 ( scorul care apare de cele
mai multe ori în distribuţia statistică, la nivel ordinal, în speţă valoarea 9 apare de 6 ori
Pentru a putea calcula modulul unei distribuţii statistice de date cu valorile grupate în clase, se
utilizează următoarea formulă:
Unde:
Liminf= limita inferioară reală a intervalului ce cuprinde modulul
i = mărimea intervalului de clasă
= diferenţa între frecvenţa intervalului modal şi cea a celui precedent
= diferenţa între frecvenţa intervalului modal şi cea a celui următor
În această nouă situaţie (pentru datele grupate în clase), modulul distribuţiei statistice are forma:
∆1 10 − 6
Mo = Liminf + i = 7,5 + 2 = 8,3
∆ + ∆ ( 10 − 6 ) + ( 10 − 4 )
1 2
Percentilele
Sunt indicatori ai tendinţei centrale ce furnizează informaţii despre poziţia unui scor individual în
raport cu acest tip de indicatori.
Percentile – împart în principiu un şir ordonat de valori/o distribuţie statistică de valori grupate în clase
în 100 de părţi egale
Subdiviziuni:
Cuartilele – împart un şir ordonat de valori/o distribuţie statistică de valori grupate în 4 părţi egale
Decilele – împart şir ordonat de valori/o distribuţie statistică de valori grupate în zece părţi egale
Pentru şirul ordonat de valori din exemplul anterior:
6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9,10,10, 10, 10
Exemple:
Decila 1: Cota N/10 =20/10=2 (al doilea termen al şirului)
Valoarea Decila 1 = 6
Decila 3: Cota 3N/4 =3 x 20/10=6 (al şaselea termen)
Valoarea Decila 3 = 7