Sunteți pe pagina 1din 26

PRELUCRAREA CARACTERISTICILOR CANTITATIVE.

SERIA DE VARIAŢIE. MĂRIMILE MEDII


PREZENTARE REALIZATA DE GRUPA M1917
DEFINITIE

 Seria statistică de variaţie reprezintă şirul de valori numerice ale caracteristicii studiate, care diferă ca mărime de
la o unitate la alta şi sunt ordonate crescător sau descrescător în funcţie de mărimea acestora. Seria de variaţie este
formată din variante „x” (fiecare valoare individuală a caracteristicii studiate, care se întâlneşte în seria respectivă)
şi frecvenţe „ f ’ (ponderea fiecărei variante în seria respectivă). Numărul cazurilor de observaţie, din care este
formată seria de variaţie se notează prin „n”.
PARTICULARITĂŢILE SERIEI DE VARIAŢIE

 omogenitatea termenilor: valorile individuale ale caracteristicii studiate sunt de aceeaşi natură şi cu valori
apropiate, fiind determinate, în cea mai mare măsură, de acţiunea factorilor esenţiali comuni;
 independenţa termenilor seriei: fiecare valoare este specifică unei unităţi a colectivităţii, supuse studiului, şi nu
depinde de valoarea înregistrată la celelalte unităţi;
 variabilitatea valorilor individuale: acţiunea factorilor esenţiali determină tendinţa centrală, iar acţiunea mai
puternică a unor factori întâmplători determină abaterea valorilor individuale de la tendinţa centrală, impusă de
factorii esenţiali;
 forma distribuţiei este rezultatul combinării acţiunii factorilor esenţiali şi întâmplători; astfel, există serii cu
repartiţie relativ uniformă a frecvenţelor şi altele cu unul sau mai multe puncte de concentrare.
CLASIFICAREA SERIEI DE VARIAŢIE

Seria de
variatie

Grupala Simpla

Pe Variante Pe intervale
SERIA SIMPLĂ

 Seria simplă reprezintă şirul valorilor individuale ale caracteristicii studiate, fară o grupare prealabilă, acestea
păstrându-şi individualitatea. într-o serie simplă numărul cazurilor de observaţie (n) este egal cu numărul
variantelor (x), pentru că în această serie fiecărei variante îi corespunde o singură frecvenţă: n — X x .
Exemple:
 Greutatea la naştere la 10 copii (în grame): 3000; 2600; 2800; 3100; 3200; 2700; 3300; 3500; 4000; 3700.
 Inălţimea la 15 persoane (în cm): 160; 167; 185; 178; 161; 171; 165; 183; 162; 176; 163; 181; 168; 174; 179.
SERIA GRUPATĂ PE VARIANTE

 Seria grupată pe variante este formată din două şiruri corespondente: cel al
variantelor caracteristicii (x) şi cel al frecvenţelor (f), motiv pentru care se numeşte şi Scor Apgar(x) Nr. Copii(f)
serie de frecvenţe. în seria grupată variantele se ordonează în sens crescător sau 4 3
descrescător al valorilor. Numărul cazurilor cercetate (n) într-o serie grupată 5 3
corespunde cu suma frecvenţelor variantelor corespunzătoare: n = Y f
6 4
 Exemplu: La măsurarea scorului Apgar la 40 de nou-născuţi s-au înregistrat
7 15
următoarele rezultate: 7; 7; 8; 7; 5; 7; 8; 6; 8; 9; 10; 9; 9; 5; 8; 9; 10; 8; 8; 6; 7; 7; 7;
8 12
4; 7; 7; 8; 7; 4; 7; 7; 8; 8; 9; 9; 9; 10; 6; 6; 8; 8; 9; 10; 7; 7; 4; 5; 7; 9; 8.
9 9
 Observăm că în această serie valorile individuale variază între 4 şi 10, având valori
10 4
din unitate în unitate, iar fiecărei variante îi corespunde un număr diferit de
frecvenţe. Prin gruparea seriei după variante se obţine o serie grupată 93 Biostatistica 50

şi metodologia cercetării ştiinţifice cu 7 variante şi 50 de frecvenţe, numărul de


frecvenţe fiind identic cu numărul de cazuri, incluse în studiu:
GRUPAREA PE INTERVALE

 Gruparea pe intervale se utilizează în cazul seriilor de variaţie, care înregistrează un număr mare de valori
individuale diferite. Pentru a uşura analiza statistică, aceste valori sunt sistematizate într-un număr redus de grupe.
Fiecare grup include unităţile colectivităţii pentru care valoarea caracteristicii se încadrează într-un anumit interval
de valori.
 Ca urmare a grupării, unităţile colectivităţii supuse studiului sunt repartizate în grupe bine definite, cu caracter
omogen. Intervalele de grupare pot fi de mărimi egale (gruparea populaţiei după vârstă pe intervale de câte cinci
ani) şi de mărimi neegale.
 Gruparea pe intervale neegale este justificată numai în cazul distribuţiei neuniforme a valorilor individuale sau
atunci când o parte a colectivităţii statistice prezintă un interes deosebit, fiind necesară o analiză mai detaliată a
acesteia. In acest mod, gruparea pe intervale neegale permite evidenţierea unor aspecte calitative din cadrul
colectivităţii supuse studiului.
GRUPAREA PE INTERVALE
 în cazul grupării pe intervale este foarte importantă stabilirea numărului de grupe şi alegerea mărimii intervalului de grupare.
Astfel, alegerea numărului de grupe trebuie să evite două erori frecvente:
1) stabilirea unui număr prea mare de grupe, ceea ce ar conduce la fărâmiţarea colectivităţii. în consecinţă, este mai dificilă
evidenţierea trăsăturilor esenţiale ale colectivităţii analizate şi devin mai anevoioase calculele statistice ulterioare
2) stabilirea unui număr prea mic de grupe se poate solda cu ştergerea trăsăturilor esenţiale ale colectivităţii, respectiv suferă
exactitatea analizei şi calitatea concluziilor.
 Un răspuns universal referitor la mărimea intervalului de grupare şi numărul de grupe nu există, acestea urmând a fi stabilite
pentru fiecare caz în parte. în general, se recomandă respectarea următoarelor cerinţe:
1. stabilirea unui număr impar de grupe;
2. pentru un număr mare de cazuri observate (peste 100) numărul de grupe va fi mai mare (9-11-13), iar pentru un volum mai
mic de date numărul de grupe va fi, respectiv, mai mic (5-7-9); • respectarea mărimii unice a intervalului de grupare.
 Prin calcule speciale a fost stabilit numărul optim de grupe în funcţie de numărul cazurilor de observaţie, pentru a păstra
particularităţile esenţiale ale fenomenului analizat
nr. de cazuri 31-45 46-100 101-200 201-500

nr.de grupuru 6-7 8-10 11-12 12-17


GRUPAREA PE INTERVALE
 Pentru a efectua gruparea pe intervale egale trebuie efectuate următoarele operaţiuni:
 • stabilirea numărului de grupe
 • calcularea amplitudinii variaţiei
 • calcularea mărimii intervalului de grupare
 • precizarea limitelor superioare şi inferioare ale grupelor
 • repartizarea valorilor individuale în grupele respective de valori.
 Numărul de grupe se va stabili conform cerinţelor anterior menţionate, în funcţie de numărul cazurilor observate.
 Amplitudinea variaţiei (A) este diferenţa dintre valoarea maximă (Xmax) Şi valoarea minimă (xmi„) a
caracteristicii studiate: A = xmax -xmin
 Mărimea intervalului de grupare (h) se determină în baza raportului dintre amplitudinea variaţiei (A) şi
numărul de grupe stabilite(r) . Dacă în urma împărţirii nu se obţine un număr întreg, valoare obţinută se va rotunji.
LIMITELE GRUPELOR

 Limitele grupelor se definesc prin precizarea limitei inferioare şi celei superioare. Determinarea primei grupe
începe de la valoarea minimă a caracteristicii (limita inferioară) la care se adaugă mărimea intervalului de grupare,
obţinându-se limita superioară. în cazul caracteristicilor cantitative cu variaţie continuă, limita superioară a primei
grupe devine limita inferioară pentru grupa a doua. Limita superioară pentru grupa a doua se obţine adăugând
mărimea intervalului la limita inferioară. Limita superioară din grupa a doua devine limita inferioară pentru a treia
grupă şi procedeul continuă până când se precizează limitele tuturor grupelor.
 Astfel, pentru caracteristicile cantitative cu variaţie continuă se va preciza care din cele două limite (inferioară sau
superioară) este inclusă în grupa respectivă.
LIMITELE GRUPELOR

 Exemplul următor explică modalitatea de grupare a datelor pe intervale egale folosind mărimile lungimii la 100 de
nou-născuţi vii (în cm): 36; 37; 37; 39; 39; 40; 40; 40; 40; 41; 41; 41; 41; 42; 42; 42; 42; 42; 42; 42; 42; 43; 43; 43;
43; 43; 43; 43; 43; 45; 45; 45; 45; 45; 45; 45; 45; 45; 45; 46; 46; 46; 46; 46; 46; 46; 46; 46; 46; 46; 47; 47; 47; 47; 47;
47; 47; 47; 47; 47; 47; 47; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 49; 49; 49; 49; 49; 49; 49; 50;
50; 50; 50; 50; 52; 52; 52; 52; 53; 53; 53; 55; 55; 56.
 Lungimea cea mai mică este de 36 cm, iar cea mai mare - 56 cm. Amplitudinea variaţiei (A) este: A = xmax- x min
=56-36=20
 Ţinând cont de amplitudinea variaţiei şi volumul colectivităţii am stabilit un număr de 7 grupe. împărţind
amplitudinea variaţiei la numărul de grupe ales (k), determinăm mărimea intervalelor egale de variaţie (h):
LIMITELE GRUPELOR
în cazul seriei de variaţie grupată pe intervale, pentru a
face posibile calculele ulterioare, stabilim mijlocul
Utilizând mărimea obţinută a intervalului de fiecărei grupe, reprezentat printr-o singură valoare, care
grupare, stabilim limitele grupelor şi este centrul intervalului grupei, obţinut prin semisuma
repartizăm valorile individuale în grupa valorilor variantelor extreme ale fiecărui interval de
respectivă: grupă:
REPREZENTAREA GRAFICĂ A SERIEI DE VARIAŢIE.
HISTOGRAMA

 Seria de variaţie poate fi reprezentată grafic prin


histogramă şi poligonul frecvenţelor.
 Histograma se aseamănă cu diagrama cu bare
(coloane), semnificaţia fiind însă diferită. Bazele
coloanelor corespund grupelor colectivităţii şi pot fi
egale, în cazul unei grupări pe intervale egale sau
inegale, dacă gruparea s-a făcut pe intervale neegale
de variaţie. înălţimea coloanelor este proporţională
cu frecvenţa grupelor în cazul intervalelor de grupare
egale. Pentru gruparea pe intervale neegale,
proporţională cu frecvenţa grupelor este suprafaţa
coloanelor.
REPREZENTAREA GRAFICĂ A SERIEI DE VARIAŢIE.
POLIGONUL FRECVENŢELOR

 Poligonul frecvenţelor este similar histogramei din punct


de vedere al conţinutului informaţional, dar are o formă
grafică diferită. Pentru seria grupată pe intervale,
construirea poligonului frecvenţelor presupune ca pentru
fiecare grupă să se plaseze câte un punct pe
perpendiculara ridicată din centrul intervalului la
înălţimea corespunzătoare frecvenţei grupei respective. în
cazul seriei grupate pe variante (frecvenţe), construirea
poligonului frecvenţelor presupune ca pentru fiecare
variantă să se plaseze câte un punct pe perpendiculara
ridicată din locul variantei la înălţimea corespunzătoare
frecvenţei variantei respective. Punctele obţinute sunt
unite prin segmente de dreaptă, obţinând o linie frântă
PRINCIPALELE MĂRIMI MEDII, UTILIZATE ÎN BIOSTATISTICĂ

Indicatorii fundamentali ai tendinţei


 media aritmetică,
centrale sunt media aritmetică, modulul
 media armonică, şi mediana, celelalte tipuri de mărimi
 media pătratică, medii fiind utilizate în anumite cazuri
speciale. Pentru ca mărimile medii să
 media geometrică,
aibă conţinut real şi să fie reprezentative
 media logaritmică, pentru colectivitatea analizată, este
 media cubică, necesar să fie respectate câteva condiţii: •
omogenitatea valorilor din care se obţine
 media cronologică,
media
 mediana, • număr suficient de mare de cazuri
 modulul. individuale
• alegerea formei adecvate a mediei.
 Mărimile medii exprimă, în mod sintetic şi generalizat, ceea După Yule şi Kendall, o mărime medie
ce este esenţial, tipic şi general pentru un fenomen variabil. trebuie să îndeplinească următoarele
Media este un indicator al tendinţei centrale care arată nivelul la condiţii:
care ar fi ajuns caracteristica dacă în toate cazurile individuale - să fie definită în mod precis, independent
factorii esenţiali şi neesentiali ar fi actionat constant. Valoarea de dorinţa utilizatorului;
medie defineşte cel mai bine tendinţa centrală a unei distribuţii - să fie expresia, sinteza tuturor observaţiilor
de frecvenţă. Totodată, mărimea medie nivelează variaţiile înregistrate;
valorilor individuale prin obţinerea unei valori mijlocii. - să posede proprietăţi simple, evidente,
 în general, indicatorii tendinţei centrale, calculaţi ca mărimi clare chiar şi pentru nespecialişti;
medii, realmente nu satisfac toate condiţiile prevăzute mai sus. - să fie simplu şi rapid de calculat;
Utilizatorul trebuie însă să fie interesat să cunoască condiţiile - să fie puţin sensibilă la fluctuaţiile de
nesatisfacute şi implicaţiile acestora pentru fundamentarea selecţie;
deciziilor. - să poată fi studiată rapid cu ajutorul
calcului algebric.
MEDIA ARITMETICĂ

 Media aritmetică este rezultatul sintetizării într-o singură expresie numerică a tuturor
nivelurilor individuale. Poate fi calculată ca medie aritmetică simplă şi medie aritmetică
ponderată
MEDIANA (ME)
în cazul unei serii simple cu
număr impar de variante,
mediana va corespunde exact
 Mediana este acea valoare a unei serii valorii de la mijlocul seriei.
în seriile cu număr par de
statistice ordonate crescător sau
variante mediana va
descrescător, care împarte seria în două
corespunde mediei aritmetice
părţi egale. Aşadar, mediana este valoarea
simple a celor două valori de
din centrul seriei: jumătate dintre valori
la mijlocul seriei.
sunt mai mici, iar jumătate sunt mai mari.
Mediana se mai numeşte „medie de
poziţie”.
CUARTILE, DECILE, CENTILE

 Cuartilele sunt 3 valori care împart seria statistică în 4 părţi egale


 (Q 1 / Q 3 ).
 Decilele împart seria statistică în 10 părţi egale (D l /D9), iar
 centilele - în 100 de părţi egale (C 1 / C99).
 Decilele şi, mai ales, centilele se calculează doar pentru seriile

statistice cu număr mare de grupe şi cu amplitudine mare a variaţiei.


 Aceşti indicatori sunt utilizaţi îndeosebi pentru seriile pronunţat asimetrice.
ALTE TIPURI DE MEDII
MODULUL

Avantaje: Observaţii:
• Poate fi calculată pentru variabile • Pe graficul repartiţiei statistice, valoarea modală corespunde
calitative (de exemplu: culoarea punctului
ochilor, culoarea părului, starea civilă în care graficul atinge maximul.
etc.). • Modulul este preferat mediei în industria confecţiilor, unde nu există
• Şansele ca rezultatul să fie o valoare mărime medie, ci talia cea mai căutată (la fel la încălţăminte).
existentă în realitate sunt mult • Modulul este util pentru caracterizarea seriei cu distribuţie
mai mari decât la medii asimetrică,
în cazul seriilor de variaţie simple sau grupate pe variante, modulul
este determinat prin examinarea valorilor seriei.
ANALIZA FORMEI DE DISTRIBUŢIE ŞI GRADULUI DE ASIMETRIE

 O distribuţie este simetrică dacă valorile individuale înregistrate sunt egal dispersate de o parte şi de alta a valorii
lor centrale. O repartiţie asimetrică (sau oblică) se caracterizează prin faptul că frecvenţele valorilor caracteristicii
observate sunt deplasate mai mult sau mai puţin într-o parte şi alta faţă de tendinţa centrală.

Distribuţia perfect simetrică se caracterizează prin egalitatea dintre medie,


mediană şi modul: M o=x=M e. Frecvenţele se distribuie simetric la dreapta şi la
stânga valorii centrale, care are frecvenţa maximă. Graficul are formă „de
clopot”. Repartiţia corespunde curbei Gauss-Laplace. în acest caz, acţiunea
factorilor întâmplători are caracter regulat, astfel încât acţiunea lor se
repartizează uniform, în ambele sensuri, faţă de medie.
 Asimetria pozitivă este caracteristică acelor colectivităţi în care predomină valorile mici ale
caracteristicii, de unde rezultă următoarea relaţie de inegalitate: Mo < Me < X . Pentru acest tip de
distribuţie de frecvenţe media reprezintă mai bine valorile mici ale seriei, care sunt predominante,
în timp ce valorile mari sunt mult distanţate faţă de medie. Asimetria negativă este specifică
seriilor de distribuţie în care predomină valorile mari ale caracteristicii, astfel încât:
 X < Me < Mo. în acest caz, media este semnificativă pentru valorile mari ale caracteristicii, iar
termenii cu valori mici ai seriei statistice nu sunt bine reprezentaţi. Distribuţiile de frecvenţe uşor
asimetrice verifică următoarea legătură între medie, mediană şi modul: Mo = X -3 Y X ~Me).

S-ar putea să vă placă și