Documente Academic
Documente Profesional
Documente Cultură
Seria statistică de variaţie reprezintă şirul de valori numerice ale caracteristicii studiate, care diferă ca mărime de
la o unitate la alta şi sunt ordonate crescător sau descrescător în funcţie de mărimea acestora. Seria de variaţie este
formată din variante „x” (fiecare valoare individuală a caracteristicii studiate, care se întâlneşte în seria respectivă)
şi frecvenţe „ f ’ (ponderea fiecărei variante în seria respectivă). Numărul cazurilor de observaţie, din care este
formată seria de variaţie se notează prin „n”.
PARTICULARITĂŢILE SERIEI DE VARIAŢIE
omogenitatea termenilor: valorile individuale ale caracteristicii studiate sunt de aceeaşi natură şi cu valori
apropiate, fiind determinate, în cea mai mare măsură, de acţiunea factorilor esenţiali comuni;
independenţa termenilor seriei: fiecare valoare este specifică unei unităţi a colectivităţii, supuse studiului, şi nu
depinde de valoarea înregistrată la celelalte unităţi;
variabilitatea valorilor individuale: acţiunea factorilor esenţiali determină tendinţa centrală, iar acţiunea mai
puternică a unor factori întâmplători determină abaterea valorilor individuale de la tendinţa centrală, impusă de
factorii esenţiali;
forma distribuţiei este rezultatul combinării acţiunii factorilor esenţiali şi întâmplători; astfel, există serii cu
repartiţie relativ uniformă a frecvenţelor şi altele cu unul sau mai multe puncte de concentrare.
CLASIFICAREA SERIEI DE VARIAŢIE
Seria de
variatie
Grupala Simpla
Pe Variante Pe intervale
SERIA SIMPLĂ
Seria simplă reprezintă şirul valorilor individuale ale caracteristicii studiate, fară o grupare prealabilă, acestea
păstrându-şi individualitatea. într-o serie simplă numărul cazurilor de observaţie (n) este egal cu numărul
variantelor (x), pentru că în această serie fiecărei variante îi corespunde o singură frecvenţă: n — X x .
Exemple:
Greutatea la naştere la 10 copii (în grame): 3000; 2600; 2800; 3100; 3200; 2700; 3300; 3500; 4000; 3700.
Inălţimea la 15 persoane (în cm): 160; 167; 185; 178; 161; 171; 165; 183; 162; 176; 163; 181; 168; 174; 179.
SERIA GRUPATĂ PE VARIANTE
Seria grupată pe variante este formată din două şiruri corespondente: cel al
variantelor caracteristicii (x) şi cel al frecvenţelor (f), motiv pentru care se numeşte şi Scor Apgar(x) Nr. Copii(f)
serie de frecvenţe. în seria grupată variantele se ordonează în sens crescător sau 4 3
descrescător al valorilor. Numărul cazurilor cercetate (n) într-o serie grupată 5 3
corespunde cu suma frecvenţelor variantelor corespunzătoare: n = Y f
6 4
Exemplu: La măsurarea scorului Apgar la 40 de nou-născuţi s-au înregistrat
7 15
următoarele rezultate: 7; 7; 8; 7; 5; 7; 8; 6; 8; 9; 10; 9; 9; 5; 8; 9; 10; 8; 8; 6; 7; 7; 7;
8 12
4; 7; 7; 8; 7; 4; 7; 7; 8; 8; 9; 9; 9; 10; 6; 6; 8; 8; 9; 10; 7; 7; 4; 5; 7; 9; 8.
9 9
Observăm că în această serie valorile individuale variază între 4 şi 10, având valori
10 4
din unitate în unitate, iar fiecărei variante îi corespunde un număr diferit de
frecvenţe. Prin gruparea seriei după variante se obţine o serie grupată 93 Biostatistica 50
Gruparea pe intervale se utilizează în cazul seriilor de variaţie, care înregistrează un număr mare de valori
individuale diferite. Pentru a uşura analiza statistică, aceste valori sunt sistematizate într-un număr redus de grupe.
Fiecare grup include unităţile colectivităţii pentru care valoarea caracteristicii se încadrează într-un anumit interval
de valori.
Ca urmare a grupării, unităţile colectivităţii supuse studiului sunt repartizate în grupe bine definite, cu caracter
omogen. Intervalele de grupare pot fi de mărimi egale (gruparea populaţiei după vârstă pe intervale de câte cinci
ani) şi de mărimi neegale.
Gruparea pe intervale neegale este justificată numai în cazul distribuţiei neuniforme a valorilor individuale sau
atunci când o parte a colectivităţii statistice prezintă un interes deosebit, fiind necesară o analiză mai detaliată a
acesteia. In acest mod, gruparea pe intervale neegale permite evidenţierea unor aspecte calitative din cadrul
colectivităţii supuse studiului.
GRUPAREA PE INTERVALE
în cazul grupării pe intervale este foarte importantă stabilirea numărului de grupe şi alegerea mărimii intervalului de grupare.
Astfel, alegerea numărului de grupe trebuie să evite două erori frecvente:
1) stabilirea unui număr prea mare de grupe, ceea ce ar conduce la fărâmiţarea colectivităţii. în consecinţă, este mai dificilă
evidenţierea trăsăturilor esenţiale ale colectivităţii analizate şi devin mai anevoioase calculele statistice ulterioare
2) stabilirea unui număr prea mic de grupe se poate solda cu ştergerea trăsăturilor esenţiale ale colectivităţii, respectiv suferă
exactitatea analizei şi calitatea concluziilor.
Un răspuns universal referitor la mărimea intervalului de grupare şi numărul de grupe nu există, acestea urmând a fi stabilite
pentru fiecare caz în parte. în general, se recomandă respectarea următoarelor cerinţe:
1. stabilirea unui număr impar de grupe;
2. pentru un număr mare de cazuri observate (peste 100) numărul de grupe va fi mai mare (9-11-13), iar pentru un volum mai
mic de date numărul de grupe va fi, respectiv, mai mic (5-7-9); • respectarea mărimii unice a intervalului de grupare.
Prin calcule speciale a fost stabilit numărul optim de grupe în funcţie de numărul cazurilor de observaţie, pentru a păstra
particularităţile esenţiale ale fenomenului analizat
nr. de cazuri 31-45 46-100 101-200 201-500
Limitele grupelor se definesc prin precizarea limitei inferioare şi celei superioare. Determinarea primei grupe
începe de la valoarea minimă a caracteristicii (limita inferioară) la care se adaugă mărimea intervalului de grupare,
obţinându-se limita superioară. în cazul caracteristicilor cantitative cu variaţie continuă, limita superioară a primei
grupe devine limita inferioară pentru grupa a doua. Limita superioară pentru grupa a doua se obţine adăugând
mărimea intervalului la limita inferioară. Limita superioară din grupa a doua devine limita inferioară pentru a treia
grupă şi procedeul continuă până când se precizează limitele tuturor grupelor.
Astfel, pentru caracteristicile cantitative cu variaţie continuă se va preciza care din cele două limite (inferioară sau
superioară) este inclusă în grupa respectivă.
LIMITELE GRUPELOR
Exemplul următor explică modalitatea de grupare a datelor pe intervale egale folosind mărimile lungimii la 100 de
nou-născuţi vii (în cm): 36; 37; 37; 39; 39; 40; 40; 40; 40; 41; 41; 41; 41; 42; 42; 42; 42; 42; 42; 42; 42; 43; 43; 43;
43; 43; 43; 43; 43; 45; 45; 45; 45; 45; 45; 45; 45; 45; 45; 46; 46; 46; 46; 46; 46; 46; 46; 46; 46; 46; 47; 47; 47; 47; 47;
47; 47; 47; 47; 47; 47; 47; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 48; 49; 49; 49; 49; 49; 49; 49; 50;
50; 50; 50; 50; 52; 52; 52; 52; 53; 53; 53; 55; 55; 56.
Lungimea cea mai mică este de 36 cm, iar cea mai mare - 56 cm. Amplitudinea variaţiei (A) este: A = xmax- x min
=56-36=20
Ţinând cont de amplitudinea variaţiei şi volumul colectivităţii am stabilit un număr de 7 grupe. împărţind
amplitudinea variaţiei la numărul de grupe ales (k), determinăm mărimea intervalelor egale de variaţie (h):
LIMITELE GRUPELOR
în cazul seriei de variaţie grupată pe intervale, pentru a
face posibile calculele ulterioare, stabilim mijlocul
Utilizând mărimea obţinută a intervalului de fiecărei grupe, reprezentat printr-o singură valoare, care
grupare, stabilim limitele grupelor şi este centrul intervalului grupei, obţinut prin semisuma
repartizăm valorile individuale în grupa valorilor variantelor extreme ale fiecărui interval de
respectivă: grupă:
REPREZENTAREA GRAFICĂ A SERIEI DE VARIAŢIE.
HISTOGRAMA
Media aritmetică este rezultatul sintetizării într-o singură expresie numerică a tuturor
nivelurilor individuale. Poate fi calculată ca medie aritmetică simplă şi medie aritmetică
ponderată
MEDIANA (ME)
în cazul unei serii simple cu
număr impar de variante,
mediana va corespunde exact
Mediana este acea valoare a unei serii valorii de la mijlocul seriei.
în seriile cu număr par de
statistice ordonate crescător sau
variante mediana va
descrescător, care împarte seria în două
corespunde mediei aritmetice
părţi egale. Aşadar, mediana este valoarea
simple a celor două valori de
din centrul seriei: jumătate dintre valori
la mijlocul seriei.
sunt mai mici, iar jumătate sunt mai mari.
Mediana se mai numeşte „medie de
poziţie”.
CUARTILE, DECILE, CENTILE
Avantaje: Observaţii:
• Poate fi calculată pentru variabile • Pe graficul repartiţiei statistice, valoarea modală corespunde
calitative (de exemplu: culoarea punctului
ochilor, culoarea părului, starea civilă în care graficul atinge maximul.
etc.). • Modulul este preferat mediei în industria confecţiilor, unde nu există
• Şansele ca rezultatul să fie o valoare mărime medie, ci talia cea mai căutată (la fel la încălţăminte).
existentă în realitate sunt mult • Modulul este util pentru caracterizarea seriei cu distribuţie
mai mari decât la medii asimetrică,
în cazul seriilor de variaţie simple sau grupate pe variante, modulul
este determinat prin examinarea valorilor seriei.
ANALIZA FORMEI DE DISTRIBUŢIE ŞI GRADULUI DE ASIMETRIE
O distribuţie este simetrică dacă valorile individuale înregistrate sunt egal dispersate de o parte şi de alta a valorii
lor centrale. O repartiţie asimetrică (sau oblică) se caracterizează prin faptul că frecvenţele valorilor caracteristicii
observate sunt deplasate mai mult sau mai puţin într-o parte şi alta faţă de tendinţa centrală.