Documente Academic
Documente Profesional
Documente Cultură
Observaie
Definirea problemei
Ipotez
Terapeutul: DA
Cercettorul: ????
Date
Testarea ipotezei
Compararea mediilor
Respingere
Acceptare
Publicare/Concluzie
TIPURI DE DATE
Variabila termen folosit pentru a defini o calitate sau cantitate, cu
valori diferite de la o populaie la alta sau de la un individ la altul (n
cadrul unui eantion)
Exemplul 1 valoarea concentraiei glucozei n snge = variabil ce
poate avea valori diferite ntre diferite persoane, dar i ntre diferite
msurtori la aceeai persoan
Exemplul 2 variabila sex n cadrul unei populaii/eantion, indivizii
pot fi de sex masculin sau feminin
DISTRIBUII DE FRECVEN
a) pentru variabilele calitative
Indicatori utilizai:
- frecvena unei categorii: numrul de persoane care aparin unei anumite categorii
- frecvena relativ (numit i frecven proporional ): reprezint proporia pacienilor care aparin unei anumite categorii
raportat la totalul pacienilor inclui ntr-un studiu
- distribuia de frecven: mulimea valorilor frecvenelor pentru toate categoriile posibile
- frecvena cumulat: procentul de indivizi ce se gsesc pn la sau sub o treapt (valoare) a scalei.
Definiie alternativ: Frecvena cumulat pentru o valoare a unei variabile reprezint numrul de indivizi cu valori mai mici sau
egale cu aceast valoare.
- frecvena cumulat relativ = proporia de indivizi din eantion cu valori mai mici sau egale cu aceast valoare
b) pentru variabilele cantitative
- se poate obine distribuia de frecvene a unei variabile cantitative discrete prin determinarea numrului de apariii pentru
fiecare valoare pe care aceasta o poate avea.
- n cazul unei variabile cantitative continue - pentru a obine o distribuie de frecven este util s se mpart scala (sau plaja de
valori) n intervale (clase)
Histograma = reprezentare grafic a frecvenei de apariie a unui anumit parametru ntr-o populaie/grup; grafic care arat o
distribuie de frecven.
-Histograma este o imagine a distribuiei valorilor unui anumit parametru
-Histogramele sunt printre cele mai importante grafice n statistic, deoarece sunt bogate n informaie despre distribuia
valorilor pe o coloan numeric
-Intervalele parametrului, ordonate cresctor sunt reprezentate pe abscis, iar pe ordonat este reprezentat frecvena de
apariie
- Histogramele care reprezint frecvenele relative au aceeai alur cu cele care reprezint frecvenele absolute, dar au
avantajul c pot fi utilizate pentru comparaii de distribuii n populaii diferite
Densitatea de frecven reprezint nr. de observaii pe unitatea de variabil / frecvena mprit la limea intervalului
respectiv.
(Utilitate: permite folosirea intervalelor de dimensiuni diferite)
Poligonul de frecven - variaie a histogramei n care este prezentat i distribuia variabilei respective suprapus pe graficul
frecvenelor, sub form de linie; util atunci cnd trebuie s prezentm mai multe distribuii de frecven (pentru mai multe
variabile care au aceleai uniti de msur sau se raporteaz la aceleai intervale) folosind aceleai axe.
Distribuie bimodal
SINTETIZAREA DATELOR
MEDIANE I CUARTILE
Mediana - valoarea din mijlocul unei distribuii are 50% dintre valori deasupra ei i 50% dintre valori dedesubtul ei
- Poate s nu corespund unei valori reale (N par);
- Nu reflect valorile distribuiei (un scor extrem se poate modifica, fr a afecta Mediana);
- Este mai puin sigur n extrapolarea de la eantion la populaie;
- Greu de utilizat n statistici avansate
Quantilele sunt valori numerice care mpart setul de date n q grupe egale. Constanta q se numete ordinul
quantilei. Mediana este quantila de ordinul doi.
Quantilele de ordinul patru mpart setul de date n patru grupe egale i se numesc quartile. Quartilele sunt n numr
de trei, notate de obicei cu Q1, Q2, Q3.
Prima quartil Q1 este reprezentat de valoarea care delimiteaz primul sfert de distribuie.
Quartila Q2 este chiar mediana.
Cea de-a treia cuartil Q3 este valoarea situat la limita dintre primele trei sferturi de distribuie i ultimul sfert.
Cele trei cuartile mpart distribuia n patru pri egale. Astfel, prima cuartil las la stnga un sfert din observaiile
obinute (un sfert din observaii sunt mai mici dect ea), cea de-a treia cuartil las la stnga trei sferturi din
observaiile obinute (adic trei sferturi din observaii sunt mai mici dect ea). Cea de-a doua cuartil las la stnga
dou sferturi, adic jumtate, din observaii (jumatate din observaii sunt mai mici decat ea) i este de fapt mediana.
MEDIA
o alt modalitate de a identifica mijlocul unei distribuii
cel mai frecvent se ntlnete media aritmetic
se poate calcula prin nsumarea tuturor observaiilor i mprirea sumei obinute
la numrul acestora
Media utilizeaz toate valorile observate, fiecare dintre acestea contribuind n mod egal la calculul acesteia.
n cazul medianei valorile observate la extreme au un efect foarte redus asupra sa; valorile acestora pot fi modificate destul de
mult fr ca mediana s fie afectat.
!!!TAKING HOME MESSAGE!!! - media utilizeaz informaiile mai eficient dect mediana; astfel se modific mai puin de la un
eantion la altul n comparaie cu mediana.
Cnd distribuia este simetric, valoarea mediei i valoarea medianei vor fi aproximativ aceleai. ntr-o distribuie asimetric,
media i mediana vor fi de obicei diferite
Distribuia este asimetric la dreapta - valoarea mediei va fi de obicei mai mare dect valoarea medianei
Distribuia este asimetric la stnga - valoarea medianei va fi de obicei mai mare dect cea a mediei.
Acest lucru se datoreaz faptului c valorile din coada distribuiei afecteaz valoarea mediei i nu afecteaz valoarea medianei.
Dezavantaje:
1. depinde doar de valorile extreme care pot varia foarte mult de la un eantion la altul
2. depinde i de mrimea eantionului (eantion mai mare - extremele sunt susceptibile de a fi departe una de
cealalt)
Amplitudinea intercuartile (interquartile range sau IQR) - diferena dintre prima i a treia cuartil (este folosit
aproape ntotdeauna doar ca o statistic descriptiv, ca i amplitudinea)
Amplitudine de 95% - amplitudine situat ntre centila 2.5 i centila 97.5; calculul ei necesit un eantion mare nu
se folosete ca statistic descriptiv
Media abaterilor nu reprezint un indicator potrivit pentru variabilitate (unele valori observate vor fi mai mari
dect media - abateri pozitive, altele vor fi mai mici dect media - abateri negative)
Suma abateri pozitive + negative= zero
Se folosete suma ptratelor abaterilor fa de medie (sum de ptrate)
date cu variabilitate extrem - suma de ptrate ale abaterilor fa de medie = mare
date cu variabilitate redus - suma de ptrate ale abaterilor fa de medie = mic
Suma de ptrate - depinde de dimensiunea eantionului
- indicatorul statistic pe care dorim s l obinem este o medie, nu o sum
Indicatorul care rezult din extragerea rdcinii ptrate din varian se numete abatere standard sau SD (Standard
deviation) i de obicei se noteaz cu s.
Pentru cele mai multe tipuri de distribuii, aproximativ dou treimi (65%) din valorile observate se afl la o deviaie
standard (SD) fa de medie, iar majoritatea (aproximativ 95%) se ncadreaz n aproximativ dou deviaii standard (2xSD)
fa de medie. Informaiile poziionate n afara acestui interval pot fi toate, fie spre limita inferioar, fie spre cea
superioar, fie distribuite n mod egal ntre cele dou limite.
Distribuie asimetric media sau mediana sunt apropiate ca valori de una din limitele amplitudinii sau amplitudinii
intercuartile