Documente Academic
Documente Profesional
Documente Cultură
Curs5 2018 PDF
Curs5 2018 PDF
Inferență referitoare la
medii
Metode de inferență pentru medii
• CE ESTE INFERENȚA STATISTICĂ?
Eroarea de eşantionare:
distanța de la statistica din eşantion la parametrul din populație. Este datorată
întâmplării
Eroarea de non-eşantionare:
erori datorate altor factori, nealeatori (operatori de teren, operatori de introducere,
de prelucrare, etc.)
Observaţii:
• – deviația standard a distribuției de eşantionare este mai mică decât cea din
populație
• – deviația standard a distribuției de eşantionare scade din ce în ce mai mult, pe
măsură ce creştem mărimea eşantionului
Pentru un eşantion de mărime mare, forma distribuției de eşantionare este normală, indiferent
de forma distribuției în populație.
Concluzii:
Dacă vom calcula mediile tuturor eşantioanelor de aceeaşi mărime (mare), vom constata că:
– aproximativ 68% dintre acestea se află la o distanță de 1 E.S. față de media din populație
– aproximativ 95% dintre acestea se află la o distanță de 2 E.S. față de media din populație
• Rezultă că distribuția de eşantionare este o distribuție de
probabilitate continuă, care arată statisticile din eşantion şi
probabilitățile asociate acestora.
• Media acestei distribuții µx este media tuturor mediilor de eşantioane
posibile şi este chiar media din populație.
• Abaterea standard a acestei distribuții (a acestei variabile aleatoare)
se numeşte Eroare Standard şi este egală cu:
Principii Generale
Deoarece cele trei grupuri de tratament sunt toate eșantioane destul de mari, se poate estima un interval de încredere pentru media
fiecăruia dintre ele
BluePages - 165 de subiecţi
- o medie diferențelor în scoruri de 3.9
- abatere standard de 9.1.
- Eroarea standard a mediei este 0.71
- astfel, intervalul de 95% încredere pentru media diferențelor este de 3.9 - 1.96 x 0.71 la 3.9
+ 1.96 x 0.71, adică de la 2.5 la 5.3 puncte pe scala depresiei. !Atenție: 0 nu se află în interval
- Aceasta reprezintă o estimare pentru intervalul de diferențe ale mediilor punctajelor,
presupunând ca răspunsul nonrespondenților este același.
DIFERENțE ÎNTRE MEDIILE
EșANTIOANELOR PERECHI
• Putem testa
• ipoteza nulă - stabilește că media diferențelor este zero
• ipoteza alternativă - stabilește că există o schimbare, în orice direcție
• Deoarece eșantionul este mare, media va avea o distribuție normală
cu o abatere standard egală cu eroarea standard a mediei (0.71)
• Diferența dintre media observată în eşantion și media necunoscută a
populației (0) împărțită prin eroarea standard (statistica testului) va
urma distribuția normală standard
DIFERENțE ÎNTRE MEDIILE
EșANTIOANELOR PERECHI
• Ipoteza nulă: media schimbărilor în populație este zero
• dacă acest lucru este adevărat, media observată în eșantion împărțită
prin eroarea standard va urma o distribuție normală standard
• Pentru grupul BluePages aceasta este z = 3.9/0.71 = 5.49.
Probabilitatea de a obține o astfel de o valoare extremă la distribuția
normală standard este foarte mică, de 0.00000004. Nu putem fi siguri
că aproximarea distribuției normale este suficient de bună pentru
probabilități foarte mici, așa că vom cita rezultatul în forma: p<0.0001
• Acesta este testul pentru o singură medie în cazul eșantioanelor mari
care au distribuție normală, test cunoscut, de asemenea, și sub
denumirea de testul z pentru o singură medie.
Condițiile care trebuiesc îndeplinite pentru
aplicarea acestei metode sunt:
• Observațiile trebuie să fie independente;