Sunteți pe pagina 1din 11

Tema

ANALIZA STATISTICĂ A VARIABILITĂȚII /


PARAMETRII DE ÎMPRĂȘTIERE ȘI SIMETRIE

Pentru rezolarea problemelor practice si a testelor a rog a consultati PRELEGERILE,


MATERIALUL TEORETIC LA TEMA PE CARE IL AVETI MAI JOS SI
SUPORTURILR DE CURS PE CARE LE AVETI IN FORMAT ELECTRONIC (AU
FOST EXPEDIATE PE POSTA LA INCEPUT DE SEMESTRU) Larisa Spinei, Oleg Lozan,
Vladislav Badan; Biostatistica, Univ. de Stat de Medicină şi Farmacie „Nicolae Testemiţanu”; SI
D.Tintiuc, Elena Raevschi, Iu. Grossu, T.Grejdeanu, Corina Vicol, L.Margine, V.Badan, Biostatistica.
Metodologia cercetării ştiinţifice (suport de curs), Univ. de Stat de Medicină şi Farmacie „Nicolae
Testemiţanu.

Subiecte pentru pregătirea individuală


• Noțiuni generale privind variabilitatea .
• Utilitatea şi clasificarea indicatorilor variaţiei.
• Caracteristica generală a indicatorilor simpli ai variaţiei.
• Calcularea și interpretarea amplitudinii absolute și relative, abaterii absolute și relative a
valorilor individuale de la medie și abaterii intercuartilice.
• Caracteristica generală a indicatorilor sintetici ai variaţiei.
• Calcularea şi interpretarea dispersiei, abaterii standard și coeficientului de variaţie.
• Caracteristica indicatorilor asimetriei.

Problema 1
În rezultatul unui studiu s-a obținut următoarea distribuție a persoanelor după vârstă:
Nr. de
Vârsta, ani
persoane x*f d
x
f
30 7
31 9
32 11
33 11
34 10
35 9
36 8
Calculați : media aritmetică, amplitudinea, abaterea valorilor individuale de la medie,
abaterea maximă pozitivă și abaterea maximă negativă

Problema 2
În rezultatul unui studiu s-a obținut următoarea distribuție a persoanelor după înălțime:
Nr. de
Înălțimea
persoane d d2 d2f
x
f
132 4
133 10
134 11
135 14
136 13
Total 52
Media aritmetică ponderată este de 134,4 cm
Completați tabelul. Calculați: dispersia, abaterea standard și coeficientul de variație.
Faceți concluzii.

Problema 3
În rezultatul unui studiu s-a obţinut următoarea distribuţie a persoanelor după
înălţime: 4 peroane – 164 cm, 10 peroane -165, 11 persoane -168 cm, 14 -169 cm, 13 – 170 cm, 10 -171
cm

Calculaţi : Media aritmetică


Amplitudinea variaţiei
Abaterea valorilor individuale de la medie
Dispersia
Abaterea medie pătratică
Coeficentul de variație
Eroarea standard si intervalul de incredere
Interpretați valoarea indicatorilor marcați. Faceți concuzii.

Problema 4
Datele referitor la termenul tratamentului în ssecția de chirurgie N1 a 20 de
bolnavi sunt următoarele (în zile): 6, 4, 5, 5, 7, 9, 8, 5, 8, 7, 8, 5, 7, 10, 10, 6, 9, 7, 8, 10.
Durata medie de tratament este de 7,2 zile, dispersia eșantionului este de 7,57.
La un alt eșantion de 20 pacienți care s-au tratat în secția de chirurgie N2, durata
medie de tratament a constituit 8 zile, dispersia eșantionului este de 8,37.
Calculaţi deviaţia medie pătratică (σ) şi eroarea standard a celor două eșantioane.
Întervalul de încredere pentru un prag de semnificație de 0,05.
De determinat dacă este diferență semnificativă între termenii de tratament și care
secție utilizează mai eficient paturile.
Problemă 5
Durata incapacităţii de muncă (în zile) la 22 bolnavi trataţi de medicul de familie se
prezintă în felul următor: 1, 6, 6, 3, 4, 3, 3, 6, 6, 3, 4, 6, 3, 5, 4, 6, 2, 5, 1, 6, 6, 2.
Calculaţi următorii indicatori:
a. Media aritmetică ponderată, modul și mediana.
b. Dispersia
c. Abaterea medie pătratică
d. Eroarea standard
e. Coeficientul de variație
f. Intervalul de încredere pentru un prag de semnificație de 0,05.
Interpretați valoarea indicatorilor marcați. Faceți concuzii.
Problemă 6
În rezultatul unui studiu s-a obţinut următoarea distribuţie a persoanelor după înălţime:
136 cm – 7 persoane, 137 cm –10 persoane, 138 cm –8 persoane-, 139 cm –5, 140 cm -13
persoane 142 cm – 3 și 143 cm – 3 persoane. Înălțimea medie a lotului de persoane analizat este
de 138,8 cm, abaterea standard este de 2,23 cm. Să se calculeze:
a. Modul și mediana
b. Eroarea standard
c. Coeficientul de variaţie. Interpretați valoarea indicatorului dat.
d. Intervalul de încredere pentru un prag de semnificație de 0,05. Faceți concluzii.
Determinați dacă există diferență semnificativă dintre lotul analizat și un alt lot de
comparație dacă în aplicării testului student valoarea lui tcalculat = 2,17 și ttabelar = 2,00

Surse de literatură pentru pregătirea independentă


• Spinei L., Lozan O., Badan V. Biostatistica. Chişinău, 2009, 186 p.
• Spinei L. Metode de cercetare şi de analiză a stării de sănătate. Chişinău, 2012, 511p

Sarcini pentru lucrul individual


1. Studii de caz
Studenților li se vor repartiza cazurile, conform subiectelor studiate în temă. Studiind
literatura suplimentară, in mod individual, studenții vor soluționa și vor prezenta cazul
profesorului.
2. Analiza critică a două articole științifice
Studenții vor selecta în mod individual 2 articole științifice , în care vor fi prezentați anumiți
indicatori ai variației și vor interpreta acești indicatori.

Teste pentru autocontrol

Compliment simplu
• La criteriile variabilității caracterului se referă:
• eroarea reprezentativității
• coeficientul de variație
• coeficientul de corelație
• intervalul de încredere
• valoarea medie a caracterului
• Deviația medie pătratică caracterizează:
• nivelul mediu al caracterului
• corelația caracterelor
• variabilitatea caracterului
• distribuția caracterului
• evoluția fenomenului
• Amplitudinea absolută în seria de variație indică:
• nivelul mediu al caracterului
• distribuția caracterului
• regresia caracterului
• diferența între valoare maximă şi minimă
• expresia procentuală a diferenței între valoarea maximă şi minimă
• Amplitudinea relativă în seria de variație reprezintă:
• nivelul mediu al caracterului
• distribuția caracterului
• regresia caracterului
• diferența între valoare maximă şi minimă
• expresia procentuală a diferenței între valoarea maximă şi minimă
• Limitele unei serii statistice reprezintă:
• diferența dintre valorile maximă şi minimă
• valorile maximă şi minimă a seriei
• raportul dintre varianta maximă şi cea minimă
• raportul dintre varianta minimă şi cea maximă
• suma valorilor maximă și minimă
• Când coeficientul variaţiei (Cv) este egal cu 17,4%, variație caracterului este:
• joasă
• înaltă
• medie
• foarte înaltă
• mică
• La valoarea lui Cv=7,8% gradul de variabilitate al caracterului este:
• mediu
• mic
• neomogen
• omogen
• mare
• Dacă Cv=26,2% variabilitatea caracterului este:
• foarte mică
• neomogenă
• medie
• înaltă
• mică
• Limita seriei de variație caracterizează:
• distribuția caracterului
• reprezentativitatea
• nivelul mediu a caracterului
• valorile extreme ale seriei
• valoarea maximă a seriei
• Pentru a compara gradul de omogenitate a masei corpului la nou-născuţi şi a lungimii
acestora trebuie de calculat:
• amplitudinea
• coeficientul variaţiei
• deviaţia medie pătratică
• coeficientul corelaţiei;
• limita.
• Gradul de variabilitate a câtorva caractere poate fi comparat calculând:
• amplitudinea
• abaterea media pătratică
• coeficientul variației
• coeficientul corelației
• limita
• Coeficientul ce indică o variaţie mare este:
• un coeficient de variaţie cu valori sub ± 10%;
• un coeficient de variaţie cu valori cuprinse între ± 10% şi ± 20%;
• un coeficient de variaţie cu valori peste ± 20%;
• un coeficient de variaţie cu valori cuprinse între 35 - 40%;
• un coeficient de variaţie cu valori cuprinse între 40 - 45%;
• În seria variaţională unde f =1, iar n <120, deviaţia medie pătratică se calculează conform
formulei:
• = d2n-1
• = d2n-2
• = d2n
• = dn
• = dn-1
• În seria variabilă unde f >1, iar n > 120, deviaţia medie pătratică se calculează după
formula:
• = d2fn
• = d*fn
• = d2fn-1
• = d*fn-1
• = d2fn-1
• În seria variabilă unde f >1, iar n <120, deviaţia medie pătratică se calculează după
formula:
• = d2fn
• = d*fn
• = d2fn-1
• = d*fn-1
• = d2fn-1
• Selectați formula de calcul a coeficientului de variaţie:
• Cv = x100/n
• Cv = x100/(n-1)
• Cv = x100/Ma
• Cv = /Ma
• Cv = x100/(Ma-1)
• În seria variabilă unde f >1, iar n <120, dispersia se calculează după formula:
• 2 = d2*fn
• 2 = d*fn
• 2 = d2*f(n-1)
• 2 = d*f(n-1)
• 2 = d2*f(n-1)
• Formula de calcul a deviaţiei standard conține următoriul indicator:
• media aritmetică
• mediana
• coeficientul de variație
• amplitudinea
• deviația valorilor individuale de la medie
Compliment multiplu

• Abaterea valorilor individuale de la medie este un indicator util în calculul:


• Coeficientului de variație
• Coeficientului de corelație
• Dispersiei
• Deviației standard
• Amplitudinii variației
• Selectați afirmațiile cu referire la abaterea valorilor individuale de la medie:
• Valorile individuale se compara doar cu media
• În seriile pe intervale pentru calcul se iau în considerație centrele de interval
• În seriile pe intervale pentru calcul se ia în considerație începutul intervalului
• În seriile pe intervale pentru calcul se ia în considerație sfârșitul intervalului
• Valorile individuale se pot compara cu toți indicatorii tendinței centrale
• Selectați afirmațiile cu referire la dispersie:
• Se exprimă în unitatea de măsură a caracteristicii
• Este un indicator cu valoare teoretică
• Este un indicator cu valoare practică
• Este sensibilă la prezența valorilor aberante
• Nu are formă concretă de exprimare
• Selectați afirmațiile cu referire la abaterea medie pătratică:
• Se utilizează pentru elaborarea standardelor
• Se exprimă în unitatea de măsură a caracteristicii
• Este un indicator cu valoare teoretică
• Este un indicator cu valoare practică
• Se aplică la estimarea erorilor de selecție
• Coeficientul de variație reprezintă:
• Deviația standard exprimată procentual
• Un indicator sintetic al variației
• Un indicator util în compararea gradelor de omogenitate
• Un indicator simplu al variației
• Raportul procentual dintre deviația standard și medie
• Din criteriile variabilității caracterului fac parte:
• media şi modulul
• amplitudinea şi deviația standard
• dispersia și deviația standard
• coeficientul de variație și eroarea limită admisă
• dispersia și coeficientul de corelație
• Gradul de diversitate a câtorva caractere este posibil de comparat, calculând:
• coeficientul variației
• limita
• coeficientul corelației
• coeficientul regresiei
• gradul de dispersie a variantelor fată de media aritmetică, exprimate procentual
• Valoarea Cv= 24,3% denotă despre:
• omogenitatea perfectă a totalității studiate
• lipsa de omogenitate
• omogenitatea relativă a totalității studiate
• o variație mică
• o variație înaltă
• Pentru a compara gradul variabilităţii lungimii corpului nou-născuţilor băieţi şi fetiţe este mai
eficace a utiliza:
• limita
• amplitudinea
• deviația standard
• coeficientul variației
• abaterea medie pătratică
• Amplitudinea seriei variaționale ne dă informație despre:
• dispersia caracterului luând în considerație structura internă a totalității studiate
• dispersia caracterului fără analiza structurii interne a totalității studiate
• dispersia caracterului în baza variantelor, care depășesc media aritmetică
• omogenitatea valorilor
• împrățtierea fenomenului fără a preciza structura internă a acestuia
• Indicatorii simpli şi sintetici ai variației sunt:
• media aritmetică, pătratică;
• mediana, modul;
• amplitudinea variaţiei, abateri individuale;
• abaterea medie pătratică, dispersia;
• coeficientul de variaţie .
• Utilitatea indicatorilor variaţiei constă în:
• analiza gradului de omogenitate a datelor din care s-au calculat indicatorii
tendinţei centrale şi verificarea reprezentativităţii acestora;
• compararea în timp şi (sau) spaţiu a mai multor serii de distribuţie după
caracteristici independente şi (sau) interdependente;
• separarea acţiunii factorilor esenţiali de factorii întâmplători
• stabilirea metodelor ce vor fi utilizate în scopul culegerii şi /sau analizei datelor;
• concentrarea valorilor individuale ale caracteristicilor şi deplasarea acestora faţă
de valorile tipice.
• Indicatori ai variaţiei după modul de sistematizare a datelor primare sunt:
• indicatori calculaţi pentru serii multidimensionalei;
• indicatori ai variaţiei calculaţi pentru serii de distribuţie unidimensionale;
• determinarea obiectivelor cercetării indicatori ai variaţiei calculaţi ca mărimi
absolute;
• indicatori ai variaţiei calculaţi ca mărimi relative;
• indicatori sintetici.
• Indicatori ai variaţiei după modul de calcul şi exprimare sunt:
• indicatori calculaţi pentru serii multidimensionalei;
• indicatori ai variaţiei calculaţi pentru serii de distribuţie unidimensionale;
• determinarea obiectivelor cercetării indicatori ai variaţiei calculaţi ca mărimi
absolute;
• indicatori ai variaţiei calculaţi ca mărimi relative;
• indicatori sintetici.
• Abaterea medie pătratică:
• este un indicator important în analiza variaţiei;
• este un indicator important în analiza frecvenţei;
• se foloseşte la estimarea erorilor de selecţie;
• se utilizează pentru elaborarea standardelor de dezvoltare fizică;
• se exprimă în unitatea de măsură în care se exprimă şi caracteristica
• După modul de calcul şi exprimare indicatorii variaţiei sunt:
• indicatori calculaţi pentru serii multidimensionalei;
• indicatori ai variaţiei calculaţi pentru serii de distribuţie unidimensionale;
• indicatori ai variaţiei calculaţi ca mărimi absolute;
• indicatori ai variaţiei calculaţi ca mărimi relative;
• indicatori sintetici.
• Coeficientul ce indică o variaţie mică este:
• un coeficient de variaţie cu valori sub ± 10%;
• un coeficient de variaţie cu valori cuprinse între ± 10% şi ± 20%;
• un coeficient de variaţie cu valori peste ± 20%;
• un coeficient de variaţie cu valoarea de 7%;
• un coeficient de variaţie cu valori cuprinse între 40 - 45%;
• Coeficientul ce indică o variaţie medie este:
• un coeficient de variaţie cu valori sub ± 10%;
• un coeficient de variaţie cu valori cuprinse între ± 10% şi ± 20%;
• un coeficient de variaţie cu valori peste ± 20%;
• un coeficient de variaţie cu valori cuprinse între 35 - 40%;
• un coeficient de variaţie cu valoarea de 18%;

Referințe bibliografice:
• Spinei L., Lozan O., Badan V. Biostatistica. Chişinău, 2009, 186 p.
• Spinei L. Metode de cercetare şi de analiză a stării de sănătate. Chişinău, 2012, 511p.
• Enăchescu D., Marcu Grigorii. Sănătate publică şi managementul sanitar. Bucureşti,
1998.
• Tintiuc D., Raevschi M., Spinei L. şi alţii, Medicină socială şi management, compendiu
pentru studenţi, Chişinău 2005.
• Лисицин Ю.П. Социальная гигиена (медицина) и организация здравоохранения.
Казань, 2007, 505 стp.

Material teoretic / Repere teoretice


Fenomenele şi procesele social - economice sunt complexe, aflându-se sub influenţa
unui număr mare de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat
indicator al tendinţei centrale, să nu fie suficientă pentru analiza lor.
În analiza unei serii statistice ne interesează, pe lângă analiza tendinţei centrale şi analiza
variaţiei sau a împrățtierii, precum şi studierea formei de distribuţie.
În literatura de specialitate, descrierea variabilelor cantitative se realizează cu ajutorul
unui parametru de centralitate și a unui parametru de împrăștiere, cel mai frecvent aceștia fiind
media aritmetică și abaterea standard.
Parametrii de împrăștiere descriu variabilitatea sau dispersia datelor unei serii statistice.
Variabilitatea reprezintă abaterile măsurabile ale valorilor individuale faţă de o valoare
centrală (tipică).
Indicatorii variaţiei / împrăștierii sunt utili în:
• Analiza gradului de omogenitate a datelor din care s-au calculat indicatorii tendinței
centrale şi verificarea reprezentativității acestora;
• Compararea în timp şi (sau) spaţiu a mai multor serii de distribuţie după caracteristici
independente şi (sau) interdependente;
• Selectarea obiectivă a factorilor semnificativi de influenţă după care se structurează
unităţile unei colectivităţi statistice;
• Separarea acţiunii factorilor esenţiali de factorii întâmplători;
• Concentrarea valorilor individuale ale caracteristicilor şi deplasarea acestora faţă de
valorile tipice etc.
• Estimarea parametrilor statistici și în inferența statistică.
Clasificarea indicatorilor împrăștierii
• După numărul variantelor luate în calcul:
• indicatori simpli (amplitudinea variației, abaterea valorilor individuale de
la medie, abaterea intercuantilică),
• indicatori sintetici (dispersia, abaterea medie pătratică, coeficientul de
variație).
• După modul de sistematizare a datelor primare:
• indicatori calculați pentru serii de distribuție unidimensionale;
• indicatori calculați pentru serii multidimensionale.
• După modul de calcul şi exprimare:
• indicatori calculați ca mărimi absolute;
• indicatori calculați ca mărimi relative.

Indicatorii simpli ai împrăștierii.

Amplitudinea absolute a variaţiei (A)


Amplitudinea absolută, este diferența dintre maximul şi minimul unei serii de valori şi ne
dă informații despre lărgimea plajei de valori pe care se întind datele din serie.
A = xmax – xmin
unde: xmax = max {x1, ..., xn}, xmin = min {x1, ..., xn}.

Amplitudinea relative a variaţiei (A %)


Reprezintă raportul procentual dintre amplitudinea absolute și media aritmetică.

Amplitudinea relativă se poate utiliza pentru comparații între populații statistice studiate
după variabile de grupare exprimate în unități de măsură diferite.

Abaterea valorilor individuale de la medie (di).


Exprimă cu câte unități de măsură sau de câte ori valoarea caracteristicii individuale a
colectivității se abate de la mărimea unui indicator al tendinței centrale.
În forma absolută:
di = xi - X

În forma relativă:

Percentilele. Abaterea intercuartilică.

Percentilele împart seria statistică în părți egale, în dependență de volumul eșantionului,


cele mai utilizate fiind cvartilele și decilele.
Cvartilele împart seria statistică în 4 părți egale, iar decilele în zece.
Abaterea intercvartilică se calculează ca diferenţă între cuartila superioară şi cuartila
inferioară de acelaşi ordin. Astfel pentru r = 4, Q3 – Q1 conţine 50% din numărul observaţiilor;
pentru r = 10 D9 – D1 conţine 80% din numărul observaţiilor.

Indicatorii sintetici ai variației

Dispersia ( ϭ² )
Se calculează ca medie aritmetică a pătratelor abaterilor valorilor individuale de la
tendința centrală.
Pentru seriile de repartiție cu frecvente egale formula dispersiei este:

Pentru seriile de repartiție cu frecvente neegale formula dispersiei este:

Dispersia caracteristicii oferă o mărime cifrica cu caracter abstract a gradului de


variabilitate existent într-o colectivitate statistică deoarece nu poate fi interpretată în mod direct
datorită caracterului ireal al unității de măsură în care se exprimă.

Abaterea standard ( ϭ )
Abaterea standard sau abaterea medie pătratică se calculează prin extragerea rădăcinii
pătrate din dispersie.
Pentru seriile de repartiție cu frecvente egale formula abaterii standard este:

Pentru seriile de repartiție cu frecvente neegale formula abaterii standard este:

Proprietăți ale abaterii standard:


• abaterea standard se exprima în unitatea de măsură în care se exprima si variantele
variabilei studiate, motiv pentru care nu poate fi folosita pentru comparația variației a
doua populații studiate după variabile exprimate in unități de măsură diferite. O statistica
prin care se înlătura acest neajuns este coeficientul de variație;
• se poate verifica faptul ca abaterea medie pătratica este mai mare decât abaterea medie
liniara (proprietatea derivata din relația de mărime dintre media aritmetica si media
pătratica);
• abaterea standard se folosește în calculele de corelație și în diferențierea statistică (la
estimarea erorilor de sondaj, la verificarea semnificației anumitor indicatori statistici
etc.);
• și in cazul abaterii medii pătratice se păstrează neajunsul sensibilității prea mari la
valorile aberante;
• de asemenea, nu se pot compara, din punctul de vedere al abaterii medii pătratice, două
populați ale căror valori au ordine de mărime diferite, rezultatul comparației fiind unul
deformat;
• abaterea standard se folosește și pentru alcătuirea de intervale ale populației statistice
studiate, intervale centrate in jurul mediei si care au o semnificație utila in inferența
statistică.
Abaterea medie pătratică este un indicator care ne oferă informaţii privind modul de
împrăştiere a termenilor unei serii cu tendinţă de normalitate. Astfel, o regulă empirică spune:
• 68,37% din termenii unei serii se situează în intervalul x , x ;
• 98,45% din termenii unei serii se situează în intervalul x 2, x 2 ;
• 99,73% din termenii unei serii se situează în intervalul x 3, x 3 ;
• 99,94% din termeni se găsesc în intervalul x 4, x 4

 Coeficientul de variație permite, datorită formei sale de exprimare procentuala, cea mai
generala apreciere a gradului de variabilitate medie a caracteristicii statistice studiate.

Coeficientul de variație este cel mai sintetic indicator al împrăștierii datelor în raport cu
tendința centrală ( x ). El permite compararea variabilității pentru caracteristici de natură diferită
şi are valorile localizate în intervalul [0, 100] (în procente).
Cu cât valorile sunt mai apropiate de 0, cu atât seria statistică este mai omogenă şi media
x este mai reprezentativă. Cu cât valorile sale sunt mai apropiate de 100, împrăștierea valorilor
individuale observate este mai mare, iar media calculată x este mai puțin reprezentativă.
Utilizarea practică a coeficientului de variație a stabilit ca prag de trecere de la omogenitate la
eterogenitate procentul 30% - 35%.