Sunteți pe pagina 1din 9

STATISTICA INFERENŢIALĂ

χ DE AJUSTARE – APROFUNDAREA ANALIZEI


2

χ2 DE COMPARARE (INDEPENDENŢĂ / ASOCIERE)

NOŢIUNI TEORETICE

Populaţie statistică = mulţime de entităţi care satisfac un criteriu prestabilit (propriu unei
cercetări).
Entităţile sunt de obicei, în psihologie, indivizi.
Observaţie: Acelaşi individ poate face parte din mai multe populaţii. (vezi detalii
în Stan & Clocotici – „Statistică aplicată în psihologie” – cap 6.)
Parametru = indicator numeric calculat din date care provin de la toţi membrii populaţiei.
Are valoare fixă şi se modifică doar la modificarea mărimii populaţiei.
Eşantion = submulţime a populaţiei statistice.
Eşantionarea / Sondajul = operaţia de formare a unui eşantion.
Eşantionul este alcătuit din unităţi de sondaj. Mărimea unui eşantion este dată de numărul
de unităţi.
Estimator = o entitate a cărei valoare poate fi folosită ca valoare aproximativă pentru o
altă entitate.
Estimaţie = valoarea estimatorului.
Estimaţie statistică = valoarea care aproximează, pe baza datelor de sondaj (din eşantion),
valoarea necunoscută a unui parametru al populaţiei.

Inferenţă = operaţia prin care pe baza acceptării unor enunţuri ca adevărate, se acceptă ca
adevărat un alt enunţ derivat logic din celelalte enunţuri (acelaşi principiu ca la inducţie
matematică sau inferenţa logică).
Inferenţă statistică = obţinerea unor concluzii asupra caracteristicilor unei populaţii, pe
baza statisticilor unui eşantion (extras din populaţia respectivă).
Inferenţa statistică presupune estimarea valorii parametrilor (populaţiei) pe baza
statisticilor din eşantion.

CLASIFICAREA EŞANTIOANELOR
- după mărime/volum:
o eşantioane mici – până în 30
o eşantioane mari – peste 30
- după modul de selectare a elementelor (avem cel puţin 2 eşantioane)
o eşantioane dependente (perechi) – 2 situaţii:
 aceeaşi indivizi în ambele eşantioane.
Ex: cercetările cu măsurători repetate (în mai multe etape) – vezi mai jos ;
 egalizarea indivizilor din punctul de vedere al caracteristicilor.
Ex: dacă în primul eşantion am subiecţi de sex masculin, cu vârste între 25-
30 de ani, cu studii superioare, atunci, în al doilea eşantion trebuie să am
subiecţi cu aceleaşi caracteristici (sex masculin, vârsta între ...)
o eşantioane independente – avem indivizi diferiţi în cele două eşantioane, iar
selectarea indivizilor dintr-un eşantion nu depinde de selectarea indivizilor din

1
celălalt eşantion - nu este necesar să aibă aceleaşi caracteristici – ba, mai mult, trebuie
să se diferenţieze din punctul de vedere al uneia dintre caracteristici.
Ex: 2 eşantioane diferenţiate după caracteristica sex – un eşantion cu
subiecţi de sex masculin şi altul cu subiecţi de sex feminin.

Observaţie: criteriile de clasificare se pot combina.

Eşantioanele dependente sunt utilizate în 3 tipuri de cercetări:


- cercetări în care este necesară controlarea factorului de variaţie la nivelul
individului.
Ex: cercetările longitudinale – panel
- cercetări în mai multe etape legate între ele (cu măsurări repetate).
Ex: cercetarea efectului repetiţiei asupra memoriei: în prima etapă se cere
subiecţilor citirea unei liste de 20 de cuvinte şi să precizeze cuvintele pe care
le-au reţinut; în a doua etapă li se cere subiecţilor sa recitească lista şi se
verifică iar numărul de cuvinte pe care le-au reţinut ş.a.m.d. (se repetă
acelaşi lucru). Printr-o astfel de cercetare s-a obţinut curba memoriei lui
Ebbinghaus.
- cercetări în care este necesară controlarea factorului de variaţie la nivelul
eşantionului.

GRADUL DE REPREZENTATIVITATE AL UNUI EŞANTION DEPINDE DE


URMĂTOARELE:

a) Caracteristicile populaţiei – Un eşantion este mai reprezentativ pentru


caracteristici ce evidenţiază o mai mare omogenitate (similaritate din punctul de vedere
al caracteristicii respective.
Ex: populaţia studenţilor din Iaşi este mai omogenă din punctul de vedere al vârstei
decât întreaga populaţie a Iaşului.
Aceasta este o consecinţă a legăturii dintre omogenitatea unei caracteristici (exprimată
prin indicatori ai împrăştierii, din care cel mai folosit este abaterea standard) şi eroarea
de eşantionare (care, cu cât este mai mică, arată o reprezentativitate mai mare a
eşantionului). Legătura este următoarea: eroarea de eşantionare este direct proporţională
cu abaterea standard (cu cât creşte abaterea standard, adică împrăştierea care indică
neomogenitate, cu atât creşte eroarea de eşantionare, adică scade reprezentativitatea
eşantionului).

b) Mărimea eşantionului (Nu a populaţiei !) – Reprezentativitatea creşte odată cu


numărul de indivizi din eşantion, dar această creştere nu este direct proporţională cu
creşterea volumului eşantionului. Pentru un număr mic de subiecţi, adăugarea altora
aduce o creştere mare a reprezentativităţii, dar pentru un număr mai mare de subiecţi,
adăugarea altora duce la o creştere foarte mică a reprezentativităţii.

2
Observaţii:
o reprezentativitatea nu depinde de mărimea populaţiei!
o în practică, creşterea efectivului eşantionului nu se face pentru sporirea
reprezentativităţii acestuia, ci din necesitatea reprezentativităţii unor subgrupuri
din eşantion corespunzătoare unor subpopulaţii. Dacă în eşantion am un
subgrup de 2 subiecţi care corespunde unei subpopulaţii este evident că acest
subgrup (un eşantion şi el) nu este reprezentativ pentru sub-populație (care este
populație pentru eşantionul reprezentat de subgrupul din eşantionul iniţial). Prin
urmare, apare necesitatea măririi subgrupului astfel încât să devină
reprezentativ, ceea ce duce şi la o mărire a eşantionului mare (iniţial). Acesta
din urmă nu va avea o influenţă foarte mare asupra reprezentativităţii
eşantionului mare (care era reprezentativ). Deci, creşterea efectivului se face
pentru sporirea reprezentativităţii unor subgrupuri din eşantion şi nu a
eşantionului.

c) Se poate calcula reprezentativitatea unui eşantion doar pentru eşantioane obţinute


prin tehnici aleatoare sau probabilistice. Chiar şi între acestea există diferenţe mari în
ce priveşte asigurarea reprezentativităţii.

Populaţie Eşantion Observaţii


Notaţii: Media μ X X este o estimaţie a lui μ
Abaterea σ s s este o estimaţie a lui σ
standard
Volum N n

Ipoteza nulă (ipoteza de nul)


– H0: susține faptul că nu există o asociere între VI și VD. Rezultatele obținute sunt
datorate hazardului.

Ipoteza alternativă (ipoteza de cercetare)


– H1: susține faptul că există o asociere între VI și VD.

Indicatorul p exprimă riscul de eroare şi este 0,05 sau 0,01 (respectiv, 5% sau 1 %) şi se
obţine prin:
p = 1 – P sau p = 100% – P OBS: p se va mai întâlni sub forma lui α.
α este pragul de semnificaţie (în general în statistică se lucrează cu α=0,05 sau 5% şi
α=0,01 sau 1%), care „se traduce prin”:
- pentru 0,05 – 95% din cazuri;
- pentru 0,01 – 99% din cazuri.

3
χ2 DE AJUSTARE – APROFUNDAREA ANALIZEI
(𝒇𝒐 − 𝒇𝒕)𝟐
𝛘𝟐 = ∑
𝒇𝒕
Verifică dacă există o asociere între două variabile, dintre care cel puțin una este
calitativă.

Dacă n reprezintă numărul de categorii, ν = n–1 poartă denumirea de grad de libertate.


H0 se acceptă dacă valoarea obținută a lui 𝛘𝟐 este < decât valoarea lui 𝛘𝟐 din tabel
corespunzătoare lui v şi α.
H0 se respinge dacă valoarea obținută a lui 𝛘𝟐 este ≥ decât valoarea lui 𝛘𝟐 din tabel
corespunzătoare lui v şi α.
(Cu alte cuvinte, acceptăm H0 dacă α corespunzător lui 𝛘𝟐 obținut este mai mare decât α
fixat – 0,05 sau 0,01).

Exemplu: verificați dacă există o asociere între numărul de sinucideri și anotimp.


Variabile: V.D. – nr. sinuciderilor. V.I. – anotimpul

H0 – nu există o asociere între numărul de sinucideri și anotimp.


H1 – există o asociere între numărul de sinucideri și anotimp.
Verificăm dacă există diferenţe la nivel global:
(fo - ft)2
fo ft fo - ft (fo - ft)2
ft
1 iarna 50 76 -26 676 8,89
2 primavara 94 77 17 289 3,75
3 vara 62 77 -15 225 2,92
4 toamna 101 77 24 576 7,48
N=307 23,05
ft = N / K, cu rest!!
Verificăm dacă există diferenţe la niveluri specifice ale modalităţilor variabilei
(comparaţii câte 2 sau grupări de categorii):
OBS! Frecvența teoretică se modifică după numărul nou de categorii
Frecvența observată se obține prin însumarea frecvențelor observate inițiale.
Exemple Concluzia
fo ft χ2 calculat ν χ2 tabel
comparaţii (α=0,05)
1,2,3,4 50,94… 76,… 23,05 3 7,81 Respingem H0
1, (2,3,4) 50, 257 153, 154 138,23 1 3,84 Respingem H0
(1,2), (3,4) 144,163 153,154 1,06 1 3,84 Conservăm H0
1,2 50, 94 72,72 13,44 1 3,84 Respingem H0
1,3 50, 62 56,56 1,29 1 3,84 Conservăm H0
1,4 50, 101 75,76 16,56 1 3,84 Respingem H0
2,3 94, 62 78,78 6,56 1 3,84 Respingem H0
2,4 94, 101 97,98 0,18 1 3,84 Conservăm H0
3,4 62, 101 81,82 8,86 1 3,84 Respingem H0

4
(fo - ft)2
fo ft fo - ft (fo - ft)2
ft
1,2 iarna+prim. 144 153 -9 81 0,53
3,4 vara+toam. 163 154 9 81 0,53
1,06
1 iarna 50 153 -103 10609 69,34
2,3,4 p+v+t 257 154 103 10609 68,89
138,23
1 iarna 50 72 -22 484 6,72
2 primavara 94 72 22 484 6,72
144 13,44
1 iarna 50 56 6 36 0,64
3 vara 62 56 -6 36 0,64
112 1,29
1 iarna 50 75 25 625 8,33
4 toamna 101 76 -25 625 8,22
151 16,56
2 primavara 94 78 -16 256 3,28
3 vara 62 78 16 256 3,28
156 6,56
2 primavara 94 97 3 9 0,09
4 toamna 101 98 -3 9 0,09
195 0,18
3 vara 62 81 19 361 4,46
4 toamna 101 82 -19 361 4,40
163 8,86

5
χ2 DE INDEPENDENŢĂ/ASOCIERE

Studiază legătura dintre 2 variabile calitative cu câte minim 3 modalităţi.

Exemplu: legătura dintre nivelul venitului şi aspiraţia de studiu.


H0 – nu există o legătură între nivelul venitului și aspirația de studiu.
H1 – există o asociere între nivelul venitului și aspirația de studiu.

Tabelul de contingenţă cu frecvenţe Distribuţii marginale


observate
Venit mic mediu mare H0: nu există o asociere între cele
Total
Aspiratie două variabile (nivelul de aspiraţie şi
Liceu 50 23 9 82 venitul familiei)
Colegiu 20 30 15 65 H1: există o asociere între cele două
Facultate 7 35 56 98 variabile
Total 77 88 80 245

Calculăm frecvenţele teoretice:


mic mediu mare Total Formula generală:
Venit 𝑡𝑜𝑡𝑎𝑙𝑙𝑖𝑛𝑖𝑒 ∗ 𝑡𝑜𝑡𝑎𝑙𝑐𝑜𝑙𝑜𝑎𝑛𝑎
𝑓𝑡 =
Aspiratie 𝑡𝑜𝑡𝑎𝑙𝑔𝑒𝑛𝑒𝑟𝑎𝑙
Liceu a=25,77 d=29,45 g=26,78 82 82 * 77 65 * 77
Colegiu b=20,43 e=23,35 h=21,22 65 a=  25 , 77 ; b=  20 , 43 etc.
245 245
Facultate c=30,80 f=35,20 i=32,00 98
Total 77 88 80 245

6
Verificăm dacă există o legătură semnificativă între nivelul venitului şi nivelul
aspiraţiei prin testul χ2:
(f - f )2
fo ft fo - ft (fo - ft)2 o t
ft
L_mic 50,00 25,77 24,23 587,09 22,78
L_mediu 23,00 29,45 -6,45 41,60 1,41
L_mare 9,00 26,78 -17,78 316,13 11,80
C_mic 20,00 20,43 -0,43 0,18 0,01
C_mediu 30,00 23,35 6,65 44,22 1,89
C_mare 15,00 21,22 -6,22 38,69 1,82
F_mic 7,00 30,80 -23,80 566,44 18,39
F_mediu 35,00 35,20 -0,20 0,04 0,00
F_mare 56,00 32,00 24,00 576,00 18,00
76,12

ν = (L –1)*(C – 1)= (3 – 1)* (3 – 1) = 4

χ2 = 76,12 > 9,48 (la α=0,05)

Respingem H0, deci cele două variabile sunt asociate semnificativ

Venit Efectuând scăderea între valorile observate şi cele


mic mediu mare teoretice/aşteptate, obţinem “atracţia” (valori
Aspiratie pozitive) şi “respingerea” (valori negative) între
Liceu 24.23 -6.45 -17.78 modalităţile celor două variabile. Observăm o
Colegiu -0.43 6.65 -6.22 atracţie între:
Facultate -23.8 -0.2 24 - venitul mic şi nivelul de aspiraţie liceu;
- venitul mediu şi nivelul de aspiraţie colegiu şi
- venitul mare şi nivelul de aspiraţie facultate,
restul modalităţilor respingându-se.

7
EXERCIŢII χ2:

1. În structura populaţiei există 80% fete si 20% băieţi. 60% sunt persoane până la 23 de
ani (inclusiv), iar 40% sunt persoane cu vârste de peste 24 de ani (inclusiv). Trebuie să
efectuăm o cercetare în care au importanţă variabilele sex şi vârstă. Nu putem investiga
decât 300 de subiecţi.
Cerinţa 1:
Calculaţi efectivele teoretice din eşantion corespunzătoare structurii populaţiei de
referinţă.

Derulând cercetarea propriu-zisă, obţinem următoare le efective practice (observate):


34 băieţi ≤ 23 ani,
26 băieţi > 23 ani.
145 fete ≤ 23 ani,
95 fete > 23 ani.
Cerinţa 2:
Verificaţi prin testul χ2 dacă există sau nu diferenţe semnificative între efectivele
teoretice şi practice la un prag de încredere de 99%.

2. Într-un studiu ne interesează influenţa variabilelor gen şi mediu de provenienţă.

Efective observate Efective teoretice

Mediu
Urban Rural Mediu
Urban Rural
Gen
M 25 35
Gen
M 29 40
F 14 26
F 11 20
a. Verificaţi dacă există diferenţe semnificative la nivel global între efectivele
observate şi cele teoretice (p=0,05).
b. Aprofundaţi analiza şi verificaţi dacă există diferenţe în funcţie de gen (indiferent
de mediul de provenienţă).
c. Aprofundaţi analiza şi verificaţi dacă există diferenţe în funcţie de mediul de
provenienţă (indiferent de gen).

8
3. Într-un studiu ne interesează asocierea dintre variabilele nota la statistică şi succesul
pe plan profesional după terminarea facultăţii.
Frecvenţe observate
Notă
mică medie mare Total
Succes
Mic 125 35 47
Mediu 33 85 25
Mare 44 29 75
Total

a. Realizaţi tabelul de contingenţă cu frecvenţe teoretice;


b. Verificaţi asocierea prin testul χ2 de asociere la un p=0,01.
c. Calculaţi atracţiile şi respingerile între cele două variabile.

S-ar putea să vă placă și