Sunteți pe pagina 1din 32

CURS BIOSTATISTICĂ

Facultatea de Inginerie Medicală


Departamentul - Bioinginerie și
Biotehnologii
Universitatea Politehnica București
Ciclul de studii- MASTER
Curs 4

I.Histograme și grafice
II.Ipoteze statistice și testarea lor
• Histograma este o modalitate de reprezentare grafică
des folosită, deoarece ea permite o perspectivă de
ansamblu mult îmbunătățită asupra datelor.
• În continuare vom vedea pe o serie de exemple astfel
de histograme, precum și alte modalități de
reprezentare grafică a rezultatelor.
Lungimea claselor

• Cea mai importantă decizie în construcţia unei


histograme este alegerea lungimii unei clase
• Se împarte amplitudinea absolută la numărul de clase
(bare) dorit:
• Lungimea = (Max – Min)/număr clase
• Numărul de clase este 8-10-12 pentru eşantioane de
zeci de indivizi şi 15-20 pentru eşantioane de sute de
indivizi
Analiza ce precede luarea unei decizii

• Această analiză se face în anumite ipoteze numite ipoteze statistice,


ce sunt sau nu verificate.
• Verificarea lor conduce la formularea unor concluzii și este un
proces in 5 etape:
– Formularea ipotezei nule H0
– Formularea ipotetezei alternative Ha
– Metodologia propriu- zisă de verificare a ipotezelor prin
utilizarea unui test statistic valabil, nivelul de semnificație cu o
anumită probabilitate, specificarea regiunii critice
– Determinarea valorii testului statistic
– Luarea unei decizii și interpretarea ei
Etapa1: Ipoteza nulă

• Prin ipoteza nulă înțelegem o afirmație care susține că ceva este


adevarat
• H0 este o afirmație referitoare la un parametru al unui/unei eșantion/
populații, selecții, etc.
• H0 este ipoteza care postulează faptul că eșantioanele sau populațiile
pe care le avem de comparat în cadrul unui studiu, experiment sau
test sunt similare, sau cu alte cuvinte, orice diferență este atribuită
șansei și nu unui anumit factor.
• Diferența semnificativă apare cand ipoteza nulă este respinsă.
Etapa2: Ipoteza alternativă

• Ipoteza alternativă Ha este o afirmație referitoare la același


parametru al eșantionului care apare în ipoteza nulă H0;
• In ipoteza alternativă Ha se afirmă că parametrul are o valoare
diferită de cea susținută în ipoteza nulă;
• Ipoteza H0 și ipoteza alternativă Ha se formulează după o analiză a
afirmației care trebuie investigată.
Observații

• Când ipoteza nulă este respinsă, cel puțin una din ipotezele
alternative este acceptată, deci diferența poate fi explicată prin alt
factor decat șansa.
• Când nici o diferență nu poate fi susținută între două populații,
înseamnă că se acceptă ipoteza nulă, dar nu înseamnă că mediile
populațiilor sunt identice.
• Valoarea probabilității pentru care diferența se datorează numai
șansei se numește nivel de semnificație. Dacă el este de maximum
5% atunci ipoteza nulă este respinsă și o ipoteză alternativă este
acceptată;

spunem
că diferența este statistic semnificativă.
• H0:P1-P0=0 sau P1=P0
• Ha:P1-P0 0 sau P1 P0
Unde P1 este probabilitatea caracteristicii studiate în eșantion, iar P0
este probabilitatea aceleiași caracteristici în populație sau o
probabilitate teoretică sau din literatură.
Etapa 3: Metodologia și nivelul de semnificație

• Metodologia utilizată ( testele recomandate a fi folosite) vor fi


prezentate in cursurile următoare.
• Nivelul de semnificație al unui test pe care îl folosim în testarea
ipotezei statistice aleasă , se notează cu α sau p-value( vom discuta
imediat despre aceasta) și este ales de cercetător a priori.
• În orice procedeu de comparare se pot emite două tipuri de erori pe
care le-am amintit în primul curs, astfel:
• Eroarea de speța I care reprezintă decizia de a respinge ipoteza nulă
când ea este adevarată;
• Eroarea de speța aII-a care reprezintă decizia de a accepta ipoteza
nulă când aceasta este falsă.
Etapa 4:Determinarea valorii testului statistic

• Nivelul de semnificație al unui test pe care îl folosim în testarea


ipotezei statistice aleasă , se notează cu α sau p-value- după cum am
mai spus- și este ales de cercetător a priori.
• Probabilitățile erorilor asociate sunt:
Pr (respingere H0/ H0=adevarat)=α=riscul erorii de speța I
Pr(acceptare H0/ H0=fals)=β=riscul erorii de speța aII-a
1- β = puterea testului
• Pe baza acestei interpretări, în spațiul eșantioanelor mulțimea
valorilor posibile calculate se împarte în două intervale:
• Intervalul de acceptare sau “intervalul critic” reprezintă mulțimea
valorilor pentru care dacă o valoare a statisticii calculate se înscrie
printre valorile sale, se acceptă ipoteza nulă.
• Intervalul de respingere reprezintă mulțimea valorilor pentru care
dacă o valoare a statisticii calculate prin test se înscrie printre
valorile sale se respinge ipoteza nulă.
• Diferențele statistic semnificative pot să nu fie semnificative clinic,
si diferențele clinic importante pot să nu fie statistic semnificative.
Etapa 5 - Luarea unei decizii și interpretarea ei

Limitele de încredere ale unui parametru

• Definesc valorile probabile pentru un parametru al populației, pe


baza volumului eșantionului și a valorii erorii standard.
• Intervalele de încredere sunt exprimate în termenii probabilității
bazate pe eroarea α.
• Un interval de încredere (1- α), exprima faptul că probabilitatea ca
parametrul populației să se găsească în intervalul de încredere este
1- α, iar probabilitatea ca parametrul populației să se găsească în
afara intervalului de încredere este α.
• Ex: Limitele de încredere ale mediei populației (µ) definesc
intervalul de încredere pentru media populației pe baza mediei
eșantionului.
• Pentru eșantioane mai mari sau egale cu 30 limitele de încredere
sunt bazate pe raportul critic corespunzător probabilității asociate.
• Pentru eșantioane mici sub 30 limitele de încredere sunt bazate pe
valorile lui t din tabele, corespunzător numărului de grade de
libertate si probabilității asociate.
• Cel mai des folosite sunt limitele de încredere de 95%, care indică
faptul că probabilitatea ca valoarea mediei necunoscută din
populație să se afle între aceste limite este de 95%, iar în afara lor
este de 5%.
P value

• Reprezintă probabilitatea de apariție a unei erori observate din


întamplare
• Arată semnificația statistică a testului
• Apare în ~ 4/5 din articolele publicate
• Testează ipoteza nulă (null hypothesis) - H0
• H0 = nu exista nicio diferență între valorile observate și cele știute
(așteptate)
• H1 = ipoteza alternativă (există diferență)
P value
Situația reală
Diferența Există (H1) Nu există (H0)

Există (respinge * 1 – β = Tipul I de


H0) puterea eroare = α
studiului
Nu există (nu Tipul II de * = decizia
respinge H0) eroare = β corecta

Tipul I de eroare (α) = respinge o ipoteză adevarată


Tipul II de eroare (β) = acceptă o ipoteză falsă
P value

• Semnificația statistică ≠ relevanța clinică


• P value = 0.05 → semnificativ statistic
• P value = 0.01 → inalt semnificativ
• P value = 0.001 → foarte înalt semnificativ
• P value < 0.001
Concluzii

• Construirea unui test revine la obținerea regiunii critice U ⊂ Rn


pentru un nivel de semnificație (probabilitate de risc) α dat astfel
încât P((x1,...,xn) ∈ U|H0) = α, unde x1,...,xn sunt variabilele de
selecție corespunzătoare selecției de volum n considerate.
• Dacă (x1,...,xn) ∈ U, H0 va fi acceptată și dacă (x1, ..., xn)  U, H1
va fi respinsă. Există două abordări pentru testele statistice:
abordarea clasică și abordarea bazată pe probabilitate.
Concluzii

• Abordarea clasică
❖ Formularea ipotezei nule
❖ Formularea ipotezei alternative
❖ Determinarea criteriului de test
- constă în determinarea unei statistici a testului;
- specificarea unui nivel de semnificație α;
- determinarea regiunii critice.
❖ Calcularea valorii statisticii
❖ Luare unei decizii și interpretarea ei
❖ Decizia: Dacă valoarea statisticii testului cade în interiorul
regiunii critice se respinge H0, iar în caz contrar se acceptă.
Abordarea pe bază de probabilitate
1. Formularea ipotezei nule.
2. Formularea ipotezei alternative.
3. Se determină α.
4. Se calculează valoarea statisticii z∗ ca și în cazul abordării clasice.
5. Calculul valorii P. Avem trei cazuri în funcție de tipul testului
(bilateral sau unilateral).
– 1 Dacă H1 este unilaterală dreapta (>), atunci P = P(Z > z∗) (aria
din dreapta lui z∗);
– 2 Dacă H1 este unilaterală stânga (<), atunci P = P(Z < z∗) (aria
din stânga lui z∗);
– 3 Dacă H1 este bilaterală (≠), atunci P = 2P(Z > |z∗|).
6.Decizia se ia comparând P cu valoarea stabilită anterior pentru α :
1. dacă P ≤ α, se respinge H0;
2. dacă P > α, se acceptă H0
Testul Z privind media teoretică

• Se consideră caracteristica X care urmează legea normală N(m, σ2),


unde:
• m ∈ R este necunoscut, iar σ > 0 este cunoscut. Relativ la media
teoretică m = M(X ), avem ipoteza nulă:H0 : m = m0,
în raport cu una din alternativele:
• H1 : m ≠m0 (testul Z bilateral);
• H1 : m > m0 (testul Z unilateral dreapta);
• H1 : m < m0 (testul Z unilateral stˆanga).
• Pentru verificarea ipotezei H0 , în raport cu una din alternativele de
mai sus, se consideră o selecție repetată de volum n ¸și un nivel de
semnificație α ∈ (0, 1).
• Se știe că statistica: Z =(X-m)/(/n) urmează legea normală N(0, 1)

S-ar putea să vă placă și