Sunteți pe pagina 1din 19

Generated by Foxit PDF Creator Foxit Software

http://www.foxitsoftware.com For evaluation only.

Elemente de
Statistica Inductiva
Lectie finala Eco2-11

Liviu Dragomirescu

STATISTICA INDUCTIVA
(S.I.) pentru serii univariate cantitative
(unidimensionale)

S.I. extrapoleaza rezultatele de la esantioane la populatii


prin:
I.
II.

TESTAREA de ipoteze statistice (de ex. asupra parametrilor


NECUNOSCUTI, pe baza statisticilor CUNOSCUTE)
ESTIMAREA (de parametri prin statistici)

Extrapolarile sunt INCERTE, dar cu grad de certitudine


calculabil si verificabil experimental. Gradul de
certitudine se numeste:
I.
II.

Nivel de semnificatie, p la testare


(Grad / nivel) de (incredere / certitudine / confidenta), (1-p)
la estimare
Liviu Dragomirescu

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

I. TESTAREA STATISTICA

TESTARILE STATISTICE se fac prin TESTE STATISTICE.


TESTELE STATISTICE verifica IPOTEZE STATISTICE.
IPOTEZELE STATISTICE sunt afirmatii cu privire la una sau
mai multe POPULATII STATISTICE.
O IPOTEZA STATISTICA se formuleaza ca o asa-numita
IPOTEZA DE NUL, IPOTEZA NULA, IPOTEZA A
NONDIFERENTEI / NONDIFERENTELOR, notata H0
Liviu Dragomirescu

Un TEST STATISTIC ofera probablitatea p de


a se obtine din pura intamplare (care apare doar
daca s-a facut RANDOMIZARE) esantionul
respectiv si altele mai excentrice(in raport cu
ipoteza nula), daca ipoteza nula H0 ar fi adevarata.
REGULA de DECIZIE:
Daca p < 0,05 RESPINGEM ipoteza nula, H0
Daca p > 0,05 nu respingem H0 si spunem ca
esantionul nu ne-a dat motive sa respingem H0,
deci ca ori H0 e adevarata ori nu avem suficiente
date pentru ca sa o respingem.

CONCLUZIE: RESPINGEREA e mai TARE


(decat ACCEPTAREA)
Liviu Dragomirescu

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Cand respingem H0 spunem ca am gasit o


diferenta semnificativa

Cand nu respingem H0 spunem ca nu am gasit


o diferenta semnificativa. Deci, ori H0 este
adevatata ori nu am avut suficiente date pentru
ca sa o respingem.

Liviu Dragomirescu

Proces juridic

Verificarea unei ipoteze


statistice

Supect presupus
NEVINOVAT

H0: nici o diferenta (nimic


nou)

Acuzarea trebuie sa aduca


dovezi materiale ale
culpabititatii

Testul statistic trebuie sa aduca dovezi


bazate pe date experimentale care
contrazic statistic ipoteza nula

Cand nu se obtine condamnarea nu


inseamana NEVINOVAT, ci achitat
din lipsa de probe.

Cand nu se respinge H0 nu inseamna


ca este adevarata, ci ca ori este
adevarata, ori ca nu s-au adunat
suficiente date care ar fi impotriva ei.

Liviu Dragomirescu

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Mai detaliat:
Teste statistice

Liviu Dragomirescu

Ipotez tiinific - Ipotez statistic


Ipotez tiinific = tentativa de a explica una
sau mai multe observaii.
Trebuie s fie n concordan cu datele i,
- dac e fals, s permit dovedirea acestui lucru
prin experiment;
- dac e adevrat, nu se va putea dovedi
niciodat c este fals, dar nici c este
adevrat*.
= Deci, vom considera adevrat o ipotez att timp
ct nu putem dovedi (prin experiment) c este fals.
Liviu Dragomirescu

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

O ipotez tiinific vizeaz, de regul, generaliti.


De aceea nu poate fi dovedit ca adevrat dect dac sunt
verificate experimental toate cazurile.
De exemplu: ipoteza c urna cutare contine numai bile albe, devine
adevrat (cu certitudine) doar dac verificm toate bilele, bob cu
bob.

n tiinele experimentale urnele sunt infinite ori de volume


uriae, aproape infinite. Deci nu se pot verifica bob cu
bob.
n consecin, aseriunile generale (n particular, ipotezele
tiinifice generalizatoare) nu pot fi dovedite cu certitudine,
drept adevrate. Ele sunt doar ipoteze, credine impuse de
practic ori imaginaie, credine care se zdruncin la primul
contraexmplu i se volatilizeaz odat cu adncirea
cunoaterii.

Liviu Dragomirescu

Exemplu de ipotez tiinific:


Vom CONSIDERA c un anumit zar este
nemsluit dac, fcnd EXPERIMENTUL
aruncrii cu zarul respectiv de multe ori,
vom obine fiecare fa cam de acelai
numr de ori.
n caz contrar, spunem c am demonstrat
experimental c zarul este msluit.
Liviu Dragomirescu

10

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Ipotez statistic
Ipotezele tiinifice sunt emise ntotdeauna din
observaii pariale, dar vizeaz proprieti
generale. Pentru susinere au nevoie de verificri
prin aa-numitele ipoteze statistice.
Ipotez statistic = o aseriune cu privire la una
sau mai multe populaii statistice.
Se prezint ntotdeauna sub forma unui cuplu
- ipotez nul (sau de nul) H0
- ipotez alternativ HA.

Liviu Dragomirescu

11

Exemple de ipoteze statistice pentru una sau


dou populaii statistice:
H0: 1 = 0
(sau 1 - 0 = 0)
HA: 1 < 0
test unilateral
stnga

H0: 1 = 0

H0: 1 = 0

HA: 1 0

HA: 1 > 0

test bilateral

test unilateral dreapta

n care 0 i 1 sunt medii de populaii din care s-au extras


aleator unul sau dou eantioane.
Liviu Dragomirescu

12

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Convenii de limbaj i notaii standard


Diagnostic statistic:
Praguri pentru
p

explicit

codificat

0,05 p

diferen nesemnificativ

ns

0,01 p < 0,05

diferen semnificativ

0,001 p < 0,01

diferen foarte semnificativ

**

p < 0,001

diferen
nalt semnificativ
Liviu Dragomirescu

***13

Tipuri de erori asociate unui test statistic i riscurile acestora


(p este notat aici )

NU resping H0

Resping H0

H0 adevrat

1-

riscul furnizorului
(riscul de spea I)

H0 fals

riscul beneficiarului

1- (= )

(riscul de spea a II-a)


sn puterea testului.
[ 1 - este, n teoria estimaiei,
Liviu Dragomirescu
gradul de ncredere. ]

14

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Liviu Dragomirescu

15

Explicarea terminologiei "riscul


furnizorului", "riscul beneficiarului"
Acceptarea sau respingerea unui lot de produse se face dup
verificarea unui eantion extras prin randomizare din acel lot. De
regul, furnizorul menioneaz un standard minim de calitate
(0).
Astfel, ipoteza stiintifica poate fi I0: 1 0 (H0: 1 = 0). n
consecin, riscul de respingere a ipotezei nule cnd aceasta este
adevrat va fi riscul furnizorului, cci acesta este cel care
pierde retrgnd de pe pia ntregul lot cnd, de fapt acesta
corespunde standardului afirmat n ipoteza nul.
Dac, invers, este adevrat ipoteza alternativ (HA : 1 < 0),
adic lotul nu corespunde standardului afirmat i totui este
acceptat, atunci riscul este al beneficiarului.
Liviu Dragomirescu

16

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Justificarea nivelurilor de semnificaie


utilizate n medicin i ecologie
Dac admitem c, de regul, ipoteza tiinific devine, ntr-un test
statistic, ipotez alternativ atunci se consider:
mic n medicin, biologie i agricultur
este riscul de a declara bolnav un pacient sntos i n consecin
este riscul de a trata un individ sntos, ceea ce l poate mbolnvi din
cauza efectelor secundare ale medicamentelor. Se ia mic (1) pentru a
respecta principiul hypocratic "primo non nocere, deinde vindecare",
(2) din considerente economice, (3) pentru c riscul chiar dac ar fi
mare afecteaz un numr mic de indivizi i (4) se minimizeaz prin
strategia aplicrii mai multor teste sau prin consultarea mai multor
medici. Se recomand pragurile = 0,001 i 0,01 pentru medicin i
0,05 pentru agricultur.
mare n ecologie ( = 0,1 sau 0,2)
este riscul de a declara n pericol un ecosistem atunci cnd acest
lucru nu este adevrat. Se ia mare (1) pentru a se obine un mic,
reprezentnd probabilitatea de a nu observa o degradare atunci cnd ea
exist, ceea ce poate fi dezastruos pentru o ntreag comunitate.
trebuie s fie mic dintr-un singur test, pentru c (2) vinovaii distrugerii
respective limiteaz la maximum
accesul la aplicarea mai multor teste.
Liviu Dragomirescu
17

Tipuri de teste
Dup` modul de tratare a
variabilelor cantitative:
Parametrice
Neparametrice

Dup` pozi\ia zonei/lor de


respingere:
Unilaterale
Dreapta
Stanga

Dup` tipul ipotezelor de


verificat:
de conformitate
de concordan\` (ajustare)
de compara\ie (omogenitate,
egalitate)
de independen\` vs.
asociere

Bilaterale

Liviu Dragomirescu

18

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Test de conformitate

Liviu Dragomirescu

19

Recapituland P4: Indeplineste asistenta medicala in


sectia X standardul minim de calitate (de 7,7)?
7,7
Ex. 1: Cu RISC 2,5% (GRAD de
CERTITUDINE 97,5%) putem afirma
ca standardul minim de calitate NU
este indeplinit.
indeplinit.

Ex. 2: Cu RISC 2,5% (GRAD de


CERTITUDINE 97,5%) putem afirma
ca standardul minim de calitate este
indeplinit (poate chiar depasit)
depasit)

S-a raspuns,
raspuns, astfel TRANSANT, dar cu GRAD de CERTITUDINE cunoscut
si < 100%, la problema P2:
Liviu Dragomirescu
20
Depaseste sau nu asistenta medicala standardul minim de calitate in sectia,
sectia, X

10

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

In situatia din Ex. 3 insa nu putem nici afirma, nici


respinge ipoteza indeplinirii standardului minim:

Ex. 3: m=7; s=7 er.std=1


Decizia statistica: Deoarece 7 e cuprins intre M-2s si M+2s, adica
intre 7,7-2 si 7,7+2 NU RESPINGEM (acceptam) ipoteza nula.
Exprimarea deciziei: datele esantionului nu ne dau motive sa
consideram ca standardul de 7,7 nu este indeplinit in toata sectia
(populatia).
Interpretarea deciziei: Ori standardul este indeplinit in toata sectia
(populatia) ori nu avem suficiente date pentru a dovedi, eventual,
contrariul.
Liviu Dragomirescu

21

Concluzii generale:
RESPINGEREA (ip
(ip.. nule)
nule) este mai
tare
tare decat acceptarea:
acceptarea:
RESPINGEREA (ip
(ip.. nule)
nule) este sub control
probabilist:
probabilist: putem calcula RISCUL ei,
ei, in caz
ca este adevarata.
adevarata.
GRADUL de CERTITUDINE = 1 RISCUL
respingerii ipotezei nule cand este adevarata.
adevarata.

Pentru acceptare nu putem calcula


GRADUL de CERTITUDINE.
Liviu Dragomirescu

22

11

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Respingem ipoteza nula atunci cand este putin probabil sa se


obtina un esantion de genul celui analizat dintr-o populatie
statistica cu caracteristica din ipoteza nula.
Ex.: Respingem ipoteza nula a scorului mediu de 7,7 in
populatie deoarece probalitatea de a obtine din intamplare
dintr-o asemenea populatie un esantion cu media de 9,9 este
foarte mica (sub 2,5%).
Practic, asimilam ideea de eveniment putin probabil cu cea de
eveniment IMPOSIBIL in conditiile ipotezei nule, sau
eveniment care CONTRAZICE ipoteza nula.
nula
Daca, de exemplu, am presupune ca intr-o urna sunt numai
bile albe (ipoteza nula), dar intamplarea ar extrage un
esantion care are si bile negre, acest eveniment ar
CONTRAZICE ipoteza nula data. In acest caz contrazicerea
este CERTA (100%).
In general, contrazicerea
contrazicerea e incerta STATISITCA -, cu
un GRAD de CERTITUDINE apropiat de 100%, de exemplu,
97,5%.
Liviu Dragomirescu

23

Analogie
(Daudin J.J., Tapiero C.S. Les Outils et le control de la Qualite. ECONOMICA, Paris, 1996.)

Proces juridic

Verificarea unei ipoteze


statistice

Supect presupus NEVINOVAT H0: nici o diferenta (nimic nou)


Acuzarea trebuie sa aduca
dovezi materiale ale
culpabititatii

Testul statistic trebuie sa aduca dovezi


bazate pe date experimentale care
contrazic statistic
statistic ipoteza nula

Cand nu se obtine condamnarea nu


inseamana NEVINOVAT, ci achitat
din lipsa de probe.

Cand nu se respinge H0 nu inseamna


ca este adevarata, ci ca, eventual, nu sau adunat suficiente date impotriva ei.

Liviu Dragomirescu

24

12

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Un rezultat putin probabil RESPINGE


ipoteza (ca unul CONTRADICTORIU):

Liviu Dragomirescu

25

Altfel spus:
Daca un rezultat s-ar obtine DIN
INTAMPLARE cu o mica probabilitate, il
consideram SEMNIFICATIV STATISTIC.
Adica, vom considera ca a aparut nu accidental
(din intamplare) dintr-o populatie cu caracteristica
specificata in ipoteza nula, ci provine din alta
populatie, adica RESPINGEM ipoteza nula.
Sau, echivalent, spunem ca: diferenta e prea mare
fata de valoarea presupusa (in ipoteza nula) ca sa o
atribuim doar intamplarii (fluctuatiilor de
esantionaj).
Liviu Dragomirescu

26

13

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Observatii:
Asa se rezolva probleme de tipul 2,
respectiv 4:
P4:Indeplineste asistenta medicala in sectia X
standardul minim de calitate (de 7,7)?,
7,7

prin test de conformitate:


compara (de ex.) media unui esantion cu
media unei populatii.

Liviu Dragomirescu

27

Problema P3:
P3. Este mai slaba asistenta medicala in sectia X
decat in sectia Y?
cere un test de comparatie:
compararea (de ex.) a doua sau mai multe medii:
Ex. Compararea a 2 medii de esantioane prelevate independent
(nu observatii perechi) se face:
Prin testul t al lui Student (daca variabila e distribuita normal in
fenomen) = ANOVA pt. doua esantioane.
esantioane. Test parametric
Prin testul MannMann-Whitney (daca nu stim distributia variabilei in
fenomen). Test NEPARAMETRIC

Ipoteza nula este:


este: cele doua medii nu difera
difera.
Liviu Dragomirescu

28

14

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

II. ESTIMAREA STATISTICA

Liviu Dragomirescu

29

ESTIMARILE STATISTICE se fac prin


INTERVALE de INCREDERE 95% sau alte
procente > 50%
Necesita 3 numere:
- Gradul de incredere (ex. 95%)
- Limita minima a intervalului.
- Limita maxima a intervalului.
sau
- Gradul de incredere
- Centrul intervalului (media esantionului)
- Marimea jumatatii intevalului (eroarea de estimare)
Liviu Dragomirescu

30

15

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Exemplu:
7,3 0,5 este UN INTERVAL de
INCREDERE 90%
Media din populatie este in acest interval?
Raspuns CORECT: Nu stim
Stim doar ca daca repetam extragerea aleatoare
de esantioane, cca 90% din acestea vor acoperi
media adevarata, dar nu vom sti care dintre
acestea o acopera.
Liviu Dragomirescu

31

Liviu Dragomirescu

32

Estimare
prin
intervale
de
incredere
90%

16

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

ESTIMARILE EMPIRICE (=nestatistice) se fac prin:


Un singur numar (media esantionului nerandomizat)
sau
Doua numere:
- Limita minima a intervalului (centrat in media esantionului
nerandomizat)
- Limita maxima a intervalului ()
gradul de incredere nefiind cuantificat (deci neverificabil)
ori
- Media esantionului nerandomizat
- Marja de eroare (de estimare) din burta
Liviu Dragomirescu

33

Liviu Dragomirescu

34

17

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Liviu Dragomirescu

35

Compromiterea statisticii prin


tratarea superficiala, astazi la moda
Un asculttor: Ce este statistica ?
Radio Erevan : Este ceva asemntor
costumului de baie: arat multe, dar ascunde
esenialul !

Liviu Dragomirescu

36

18

Generated by Foxit PDF Creator Foxit Software


http://www.foxitsoftware.com For evaluation only.

Femeia perfect - o combinaie ntre Kate Middleton, Angelina Jolie i alte


vedete (Monitorul de Suceava 07-01-2012)

Liviu Dragomirescu

37

19

S-ar putea să vă placă și