Documente Academic
Documente Profesional
Documente Cultură
Curs1 2018 PDF
Curs1 2018 PDF
Terapeutul: DA
Ipoteză Cercetătorul: ????
Indicatori utilizați:
- frecvenţa unei categorii: numărul de persoane care aparțin unei anumite categorii
- frecvența relativă (numită și frecvenţă proporţională ): reprezintă proporţia pacienților care aparțin unei anumite categorii
raportată la totalul pacienților incluși într-un studiu
- distribuţia de frecvenţă: mulțimea valorilor frecvenţelor pentru toate categoriile posibile
- frecvenţa cumulată: procentul de indivizi ce se găsesc până la sau sub o treaptă (valoare) a scalei.
Definiție alternativă: Frecvenţa cumulată pentru o valoare a unei variabile reprezintă numărul de indivizi cu valori mai mici sau
egale cu această valoare.
- frecvenţa cumulată relativă = proporţia de indivizi din eşantion cu valori mai mici sau egale cu această valoare
Histograma = reprezentare grafică a frecvenţei de apariţie a unui anumit parametru într-o populaţie/grup; grafic care arată o
distribuţie de frecvenţă.
-Histograma este o imagine a distribuţiei valorilor unui anumit parametru
-Histogramele sunt printre cele mai importante grafice în statistică, deoarece sunt bogate în informaţie despre distribuţia
valorilor pe o coloană numerică
-Intervalele parametrului, ordonate crescător sunt reprezentate pe abscisă, iar pe ordonată este reprezentată frecvenţa de
apariţie
- Histogramele care reprezintă frecvenţele relative au aceeaşi alură cu cele care reprezintă frecvenţele absolute, dar au
avantajul că pot fi utilizate pentru comparaţii de distribuţii în populaţii diferite
Densitatea de frecvență reprezintă nr. de observații pe unitatea de variabilă / frecvenţa împărţită la lăţimea intervalului
respectiv.
(Utilitate: permite folosirea intervalelor de dimensiuni diferite)
Poligonul de frecvenţă - variaţie a histogramei în care este prezentată și distribuţia variabilei respective suprapusă pe graficul
frecvențelor, sub formă de linie; util atunci când trebuie să prezentăm mai multe distribuţii de frecvență (pentru mai multe
variabile care au aceleași unități de măsură sau se raportează la aceleași intervale) folosind aceleaşi axe.
FORMA DISTRIBUȚIILOR DE FRECVENȚĂ
Mediana - valoarea din mijlocul unei distribuţii – are 50% dintre valori deasupra ei şi 50% dintre valori dedesubtul ei
- Poate să nu corespundă unei valori reale (N par);
- Nu reflectă valorile distribuţiei (un scor extrem se poate modifica, fără a afecta Mediana);
- Este mai puţin sigură în extrapolarea de la eşantion la populaţie;
- Greu de utilizat în statistici avansate
Quantilele sunt valori numerice care împart setul de date în q grupe egale. Constanta q se numește ordinul
quantilei. Mediana este quantila de ordinul doi.
Quantilele de ordinul patru împart setul de date în patru grupe egale și se numesc quartile. Quartilele sunt în număr
de trei, notate de obicei cu Q1, Q2, Q3.
Prima quartilă Q1 este reprezentată de valoarea care delimitează primul sfert de distribuţie.
Quartila Q2 este chiar mediana.
Cea de-a treia cuartilă Q3 este valoarea situată la limita dintre primele trei sferturi de distribuţie și ultimul sfert.
Cele trei cuartile împart distribuţia în patru părţi egale. Astfel, prima cuartilă lasă la stânga un sfert din observațiile
obținute (un sfert din observații sunt mai mici decât ea), cea de-a treia cuartilă lasă la stânga trei sferturi din
observaţiile obținute (adică trei sferturi din observații sunt mai mici decât ea). Cea de-a doua cuartilă lasă la stânga
două sferturi, adică jumătate, din observaţii (jumatate din observații sunt mai mici decat ea) și este de fapt mediana.
Alte categorii de quantile folosite sunt:
Astfel, putem împărţi distribuţia în 100 de părţi egale adică în centile sau percentile, iar punctul care delimitează
20% din observaţii va fi centila numărul 20 sau a 20-a percentilă.
Pe de altă parte, numărul unei centile nu trebuie să fie obligatoriu o valoare întreagă. Vorbim adesea, de exemplu,
despre centila a 2.5-a, aceasta reprezentând o valoare care lasă în stânga 2.5% dintre subiecți.
MEDIA
o altă modalitate de a identifica mijlocul unei distribuţii
cel mai frecvent se întâlnește media aritmetică
se poate calcula prin însumarea tuturor observaţiilor şi împărţirea sumei obținute
la numărul acestora
Media utilizează toate valorile observate, fiecare dintre acestea contribuind în mod egal la calculul acesteia.
În cazul medianei valorile observate la extreme au un efect foarte redus asupra sa; valorile acestora pot fi modificate destul de
mult fără ca mediana să fie afectată.
!!!TAKING HOME MESSAGE!!! - media utilizează informaţiile mai eficient decât mediana; astfel se modifică mai puțin de la un
eșantion la altul în comparație cu mediana.
Când distribuţia este simetrică, valoarea mediei şi valoarea medianei vor fi aproximativ aceleași. Într-o distribuţie asimetrică,
media şi mediana vor fi de obicei diferite
Distribuţia este asimetrică la dreapta - valoarea mediei va fi de obicei mai mare decât valoarea medianei
Distribuţia este asimetrică la stânga - valoarea medianei va fi de obicei mai mare decât cea a mediei.
Acest lucru se datorează faptului că valorile din coada distribuției afectează valoarea mediei și nu afectează valoarea medianei.
MĂSURAREA VARIABILITĂȚII FOLOSIND AMPLITUDINEA
Media şi mediana - indicatori de tendinţă centrală (încearcă să determine poziția de mijloc dintr-o distribuţie)
Amplitudinea - măsură pentru împrăștiere, dispersie sau variabilitate a datelor din cadrul distribuției
- diferența dintre cea mai mare și cea mai mică valoare
- măsură utilă din punct de vedere descriptiv
Dezavantaje:
1. depinde doar de valorile extreme care pot varia foarte mult de la un eșantion la altul
2. depinde și de mărimea eșantionului (eșantion mai mare - extremele sunt susceptibile de a fi departe una de
cealaltă)
Amplitudinea intercuartile (interquartile range sau IQR) - diferența dintre prima şi a treia cuartilă (este folosită
aproape întotdeauna doar ca o statistică descriptivă, ca și amplitudinea)
Amplitudine de 95% - amplitudine situată între centila 2.5 şi centila 97.5; calculul ei necesită un eșantion mare – nu
se folosește ca statistică descriptivă
MĂSURAREA VARIABILITĂȚII FOLOSIND VARIANȚA
Abaterea față de medie - diferența dintre medie și fiecare valoare observată
Media abaterilor – nu reprezintă un indicator potrivit pentru variabilitate (unele valori observate vor fi mai mari
decât media - abateri pozitive, altele vor fi mai mici decât media - abateri negative)
Varianța se estimează ca media pătratelor abaterilor față de medie - un raport între suma de
pătrate împărțită la numărul de observații minus unu (la numărul de grade de libertate pentru
varianță)
Varianța eșantionului este suma pătratelor abaterilor față de medie împărțită la gradele de
libertate
MĂSURAREA VARIABILITĂȚII FOLOSIND DEVIAȚIA STANDARD
Varianța se bazează pe pătratul valorilor observațiilor (unitățile de măsură pentru varianță – exprimate în unitățile de
măsură inițiale la pătrat).
Dacă însă vom extrage rădăcina pătrată din varianţă, indicatorul rezultat va fi cuantificat în aceleaşi unităţi de măsură ca şi
observaţiile originale.
Indicatorul care rezultă din extragerea rădăcinii pătrate din varianţă se numeşte abatere standard sau SD (Standard
deviation) și de obicei se notează cu s.
Pentru cele mai multe tipuri de distribuţii, aproximativ două treimi (65%) din valorile observate se află la o deviație
standard (SD) față de medie, iar majoritatea (aproximativ 95%) se încadrează în aproximativ două deviații standard (2xSD)
față de medie. Informațiile poziționate în afara acestui interval pot fi toate, fie spre limita inferioară, fie spre cea
superioară, fie distribuite în mod egal între cele două limite.
Distribuție asimetrică – media sau mediana sunt apropiate ca valori de una din limitele amplitudinii sau amplitudinii
intercuartile