Sunteți pe pagina 1din 18

Modelul de regresie

sisteme de variabile dummy

Bibliografie recomandat

Traiman. D, 2004,

Agresti & Finley

norbertpetrovici@yahoo.com
cristina_rat@yahoo.com

Ipoteze i variabile

Ipotez: magicarizarea credinelor religioase a unei persoane depinde de


tipurile de reele instituionale n care este integrat. De exemplu: sistemul
colar sau biserica din care face parte persoana.
Variabile: (BOP 2000 primvara)

Credinelor religioase a unei persoane:


Dvs. personal credei n ?

Da

Nu

NS/NR

Da

Nu

NS/NR

DIV1. Viaa de dup moarte

DIV5. Horoscop

DIV2. Telepatie (transmiterea gndurilor)

DIV6. Judecata de Apoi

DIV3. Ghicit (cafea, cri, etc.)

DIV7. Vrjitorie

DIV4. Rai

DIV8. Puterea rugciunii

Sistemul colar:
SCOALA. Ultima coal absolvit
1. fr scoal
2. 4 clase neterminate
3. 4 clase terminate
4. 8 clase neterminate

5.
6.
7.
8.

8 clase terminate
10 clase
coala profesional/ ucenici terminat
liceu terminat

9. coal postliceal terminat


10. facultate neterminat
11. facultate terminat

Biserica din care face parte.


Care este religia Dvs.?
1. ortodox

3. protestant (calvin, baptist, reformat)

5. greco-catolic

7. fr religie

2. romano-catolic

4. neo-protestant (penticostal, adventist,


evanghelist)

6. alta ______

8. religie nedeclarat

Metoda statistic i variabilele

Ipoteza este formulat n termeni cauzali:


Credinele religioase Sistemul colar + Tipul bisericii
Adic, avem o problem de regresie.

Variabile: sunt calitative. Pentru a formula in termenii unei regresi aceasta


problem trebuie s realizm o serie de transformri ale variabilelor:
1. s mrim scara de msur: s le transformm n variabile cantitative
2. s le transformm n variabile dummy

Transformarea variabilelor: variabila dependent

Credinelor religioase a unei persoane sunt nregistrate de opt variabile. Ele


se grupeaz conceptual n dou dimensiuni sau seturi de variabile
[fapt confirmat i de analiza factorial i analiza de reliabilitate]:
Setul 1 - Religiozitate magica: Telepatie (transmiterea gndurilor), Ghicit (cafea,
cri, etc.), Horoscop, Vrjitorie.
Setul 2 - Religiozitate cretina: Viata de dup moarte, Rai, Judecata de Apoi,
Puterea rugciunii.

Iar acest lucru l facem


recodnd variabilele:

Religiozitate magic

Religiozitate cretin

recode div2 div3 div5 div7


(1=1) (2=0) (9=0)
into magic2 magic3 magic5 magic7.

recode div1 div4 div6 div8


(1=1) (2=0) (9=0)
into relig1 relig4 relig6 relig8.

1 Da; 2 Nu 1 Da; 0 Nu
+

Iar apoi adunm


variabilele din acelai set

Religiozitate magic

Religiozitate cretin

comp magic = magic2 + magic3 +


magic5 + magic7.

comp religios = relig1 + relig4 +


relig6 + relig8.

Transformarea variabilelor: variabila dependent

Adunnd variabilele dihotomice, una cte una, vedem cum noua variabila
dependent se transform, ncet ntr-o variabil continu. Cu ct adunm
mai multe variabile cu att noua variabil va tinde spre o variabil continu.
[msura n care reuete s ating acest deziderat: testul de reliabilitate]
4.00

4.00

3.00

3.00

3.00

2.00

2.00

1.00

0.00

0.00

5.00

10.00

Subiect - Numar ani scoala

1.00

0.00

15.00

0.00

5.00

10.00

Subiect - Numar ani scoala

15.00

Religiozitate magica

4.00

4.00

3.00

2.00

2.00

1.00

1.00

0.00

0.00

0.00

5.00

10.00

Subiect - Numar ani scoala

Nou indice obinut se numete: indice aditiv/sumativ

15.00

0.00

5.00

10.00

Subiect - Numar ani scoala

15.00

Transformarea variabilelor: variabilele independente

Educaia: Variabila care nregistreaz educaia n barometrul de opinie este


msurat pe o scal ordinal, iar pentru regresie avem nevoie de o variabila
cantitativ.

Fiecrei diplome educaionale i corespunde un anumit numr de ani

Recodm variabila:
Diplome educaionale (p0scoa) Numr de ani de coal (educ)
Educatia subiectului
recode p0scoa
(1=0) (2=2) (3=4) (4=6) (5=8) (6=10) (7=11) (8=12) (9=14) (10=15) (11=16)
into educ.

Transformarea variabilelor: variabilele independente

Religia: Variabila care nregistreaz religia, este o variabil categorial,


nominal.

Nu putem:
Crea un nou indice (avem doar o singura variabil)
Echivala cu o variabil cantitativ

Putem:
S tratm aceast variabil ca un sistem de variabile dummy
Recodm religia in urmtorul fel:
R1 = 1 dac este Ortodox i Greco-Catolic i = 0 altfel

R2 = 1 dac este Romano-Catolic i 0 = altfel


R3 = 1 dac este Protestant i = 0 altfel
R4 = 1 dac este Neo-protestant i = 0 altfel
R5 = 1 dac are Alt Religie, Religie Nedeclarat i Fr Religie i = 0 altfel

Transformarea variabilelor: variabilele independente

S observm ce se ntmpl dac facem o regresie cu ajutorul var. dummy:


Religiozitate magic (RM) Religie (R)

RM* = a+ b2R2 + b3R3 +b4R4 + b5R5 = a + biRi

Adic:

RM* = 0,765 - 0,139R2 - 0,288R3 - 0,522R4 - 0,194R5

S rescriem acum ecuaiile pentru fiecare caz:

Pt. Ortotoci:

RM* = a+ b2*0 + b3*0 +b4*0 + b5*0 = a = 0,765

Pt. Catolici:

RM* = a+ b2*1 + b3*0 +b4*0 + b5*0 = a - b2= 0,765 - 0,139 = 0,626

Pt. Protestani:

RM* = a+ b2*0 + b3*1 +b4*0 + b5*0 = a - b3= 0,765 - 0,288 = 0,477

Pt. Neo-protestani:

RM* = a+ b2*0 + b3*0 +b4*1 + b5*0 = a - b4= 0,765 - 0,522 = 0,243

Pt. Alii:

RM* = a+ b2*0 + b3*0 +b4*0 + b5*1 = a - b5= 0,765 - 0,194 = 0,57


Cofficients
Unstd Coef.

Model
(Constant)

Std. Error

Religiozitate magic * Religie

Std Coef.
Beta

Sig.

30.26

0.000

0.765

0.025

Romano-Catolic

-0.139

0.108

-0.030

-1.29

0.198

Protestanta

-0.288

0.127

-0.054

-2.27

0.023

Neo-Protestanta

-0.522

0.167

-0.074

-3.13

0.002

Alte religii

-0.194

0.171

-0.027

-1.13

0.258

Dependent Variable: Religiozitate magica

=0,765- 0.626

Variables

Mean

Std. Deviation

Ortodox

0.765

0.902

Romano-Catolic

0.626

0.850

Protestanta

0.477

0.495

Neo-Protestanta

0.243

0.495

Altele

0.571

0.884

Modelul de regresie

Var. dummy par a fi un mod complicat de a estima mediile, ns ele devin cu


adevrat puternice atunci cnd sunt combinate cu alte variabile cantitative.
Ipoteza noastr poate fi formulat avnd n vedere variabilele noastre n cel
putin trei moduri diferite i pertinente teoretic:
RM Educaie (E):
RM* = a + bE
RM Educaie + Religie (R):
RM* = a + bE + ciRi
RM Educaie + Religie + Religie*Educaie (R*E): RM* = a + bE + ciRi + diRiE

Variabila de interaciune Ri*E:


Presupunem c ntre religie i educaie exist o anumit interaciune n ceea ce
privete credinele magice
Adic, credem c grupurile religioase difer n ceea ce privete modul n care
educaia influeneaz credinele magice

Scopul nostru este s selectm model este mai bun din acestea trei.

Credine magice difereniate n funcie de religie: Selecia modelului


Model 1

Model 2

Model 3

Model 3

.065
(.006)

.004
(.006)

.066
(.006)

.066*
(.006)

R2: Catolic

-.142
(.104)

-.257
(.300)

-.257
(.300)

R3: Protestant

-.295
(.123)

-.207
(.331)

-.207
(.331)

R4: Neoprotestant

-.390
(.161)

-.309
(.310)

.309
(.310)

R5: Altul

-.271
(.168)

-.386
(.441)

-.386
(.441)

R2*E

.012
(.029)

.012
(.029)

R3*E

-.009
(.031)

-.009
(.031)

R4*E

-.090
(.034)

-.090
(.034)

R5*E

.012
(.043)

.012
(.043)

E: Educatie

Constanta
R2

.102
(.062)

.144
(.063)

.120
(.0067)

.762
(.024)

.062

.070

.074

.074

Logica modelelor

S observm ce se ntmpl dac facem o regresie cu ajutorul var. dummy:

Religiozitate magic (RM) Religie (R)


Model 1: RM* = ,102 +,065*E
Model 2: RM* = ,144 + ,004*E ,142*R2
Model 3: RM* = ,120 + ,066*E ,257R2
+ ,012*R2*E

,207*R3

.390*R4
+ ,309*R4

.271*R5
,386*R5 +

,009*R3*E ,090*R4*E + ,012R5*E

S rescriem pt. Modelul 2 ecuaiile pentru Ortodoci, Catolici i Protestani


Pt. Ortodoci:

Pt. Catolici:

Pt. Protestani:

RM* = a + b*E

RM* = a + b*E + c2

RM* = a + bE + c3

= ,144 + ,004*E

,295*R3

= (a+c2) + b*E

= (a+c3) + b*E

= (,144 ,142) + ,004*E

= (,144 ,259) + ,004*E

= .002 + .004*E

= -.115 + .004*E

S rescriem pt. Modelul 3 ecuaiile pentru Ortodoci, Catolici i Protestani


Pt. Ortodoci:

Pt. Catolici:

Pt. Protestani:

RM* = a + bE

RM* = a + bE + c2+ d2*E

RM* = a + b*E + c2 + d3*E

= ,120 + ,066*E

= (a+c2) + (b+d2)*E

= (a+c3) + (b+d3)*E

= (,120 ,257) + (,066+,012)*E

= (,120,207)+(,066+,009)*E

= -.137 + 0.78*E

= -.087 + .075E

Logica modelelor

Diferena dintre Modelul 2 i Modelul 3 este c


n Modelul 1difer doar interceptul modului n care variaz credinele magice n
funcie de educaie.
n Modelul 2 difer i interceptul i panta n care variaz credinele magice n
funcie de educaie

Modelul 2

Numri de ani de coal

Modelul 3

Numri de ani de coal

Credine magice difereniate n funcie de religie: Selecia modelului


Model Summary

Variables Entered/Removedb
Model
1
2
3

Variables Entered
Subiect - Numar ani scoalaa
Romano-Catolic, Alte religii, Protestanta, Neo-Protestantaa
R4*Educ, R5*Educ, R3*Educ, R2*Educa

Variables
Removed
.
.
.

Method
Enter
Enter
Enter

Ne indic cele trei modelele pe care ni le-am


propus. Metoda Enter nseamn c n analiz intr
toate variabilele specificate
ANOVAd

Regression
Residual
Total
Regression
Residual
Total
Regression
Residual
Total

Sum of
Squares
111.785
1688.642
1800.427
125.651
1674.776
1800.427
132.593
1667.835
1800.427

df
1
1791
1792
5
1787
1792
9
1783
1792

Mean Square
111.785
.943

F
118.561

Sig.
.000a

25.130
.937

26.814

.000b

14.733
.935

15.750

.000c

a. Predictors: (Constant), Subiect - Numar ani scoala


b. Predictors: (Constant), Subiect - Numar ani scoala, Romano-Catolic, Alte religii,
Protestanta, Neo-Protestanta
c. Predictors: (Constant), Subiect - Numar ani scoala, Romano-Catolic, Alte religii,
Protestanta, Neo-Protestanta, R4*Educ, R5*Educ, R3*Educ, R2*Educ
d. Dependent Variable: Secularizare

R
.249a
.264b
.271c

R Square
.062
.070
.074

Adjusted
R Square
.062
.067
.069

Std. Error of
the Estimate
.97100
.96809
.96717

a. Predictors: (Constant), Subiect - Numar ani scoala


b. Predictors: (Constant), Subiect - Numar ani scoala,
Romano-Catolic, Alte religii, Protestanta,
Neo-Protestanta
c. Predictors: (Constant), Subiect - Numar ani scoala,
Romano-Catolic, Alte religii, Protestanta,
Neo-Protestanta, R4*Educ, R5*Educ, R3*Educ,
R2*Educ

a. All requested variables entered.


b. Dependent Variable: Secularizare

Model
1

Model
1
2
3

Ne indic Proporia din


varian variabilei dependente
explicat de fiecare model:
Model 1: 0,062;
Model 2: 0,070;
Model 3: 0,074.

Acesta este tabelul de Analiz de


varian, care indica raportul dintre
variane punctelor n jurul drepte de
regresie i variana punctelor de pe
dereapta de regresie n jurul mediei.
Ne indic n ce msru poate fi
generalizat modelul de regresie la
populaie

Credine magice difereniate n funcie de religie: Selecia modelului


Coefficientsa

Model
1
2

(Constant)
Subiect - Numar ani scoala
(Constant)
Subiect - Numar ani scoala
Romano-Catolic
Protestanta
Neo-Protestanta
Alte religii
(Constant)
Subiect - Numar ani scoala
Romano-Catolic
Protestanta
Neo-Protestanta
Alte religii
R2*Educ
R3*Educ
R4*Educ
R5*Educ

Unstandardized
Coefficients
B
Std. Error
.102
.062
.065
.006
.144
.063
.064
.006
-.142
.104
-.295
.123
-.390
.161
-.271
.168
.120
.067
.066
.006
-.257
.300
-.207
.331
.309
.310
-.386
.441
.012
.029
-.009
.031
-.090
.034
.012
.043

Standardized
Coefficients
Beta

a. Dependent Variable: Secularizare

Observm c tabelul are trei


seciuni care indic cele trei
Modele estimate. Care model
este ns mai bun?

.249
.245
-.031
-.055
-.055
-.037
.254
-.056
-.039
.044
-.053
.027
-.018
-.116
.017

t
1.650
10.889
2.284
10.712
-1.362
-2.410
-2.413
-1.616
1.800
10.356
-.857
-.626
.995
-.877
.408
-.287
-2.643
.285

Sig.
.099
.000
.022
.000
.173
.016
.016
.106
.072
.000
.391
.531
.320
.381
.683
.774
.008
.776

-b, reprezint coeficienii de


regresie nestandardizai ai
modelului, care indic efectul net
al fiecrei variabile, n unitile de
mur a variabilei dependente.
- St. Error sunt erorile standard,
care trebuie sa fie de dou ori mai
mici dect b pentru ca acestea s
fie semnificative, pentru P=95%.
- Beta, reprezint coeficienii
standardizai care ne arat efectul
net pe care l are fiecare variabil,
n abateri standard
-t, este valoarea testului t prin care
testm ipoteza nul c un
coeficient de regresie nu este
diferit de 0, dac generalizm la
populaie.
- Sig. nivelul de probabilitate, daca
este mai mic dect 0,05 respingem
ipoteza nul a testului t si
acceptm ipoteza alternativ, ca
coeficientul este diferit de 0 si
poate fi generalizat la populaie

Credine magice difereniate n funcie de religie: Selecia modelului

Noi vrem s estimm care model este mai puternic. Principiile sunt:

cel al simplitii: mai puine variabile introduse n model


cel al adecvrii: varian mai mare explicat
Cele trei modele pe care le-am construit se numesc modele ncorporate
(nested) pentru c adaug termeni succesivi de la o ecuaie la alta,
pstrndu-i pe cei adugai deja la pasul anterior. Pentru aceste modele
exist o metod specific de comparaie:

F=

(1-RB2)/N-K-1

Unde, F este testul F


RB2 este R2 mai mare
RA2 este R2 mai mic
m diferena de variabile ntre cele dou modele
N numrul de cazuri
k numrul de variabile independete n modelul cu mai multe variabile
Modelul 2 vs. Modelul 1: F(5,1784)=3.836 Fcritic (5,1784)=2.21 [semnificativ p=0.05]
Modelul 3 vs. Modelul 1: F(8,1780)=2.883 Fcritic (8,1780)=1.94 [semnificativ p=0.05]
Modelul 3 vs. Modelul 2: F(4,1780)=1.922 Fcritic (4,1780)=2.37 [nesemnificativ p=0.05]

(RB-RA2)/m

Credine cretine difereniate n funcie de religie: Selecia modelului


Model 1

Model 2

Model 3

-0.045
(0.008)

-0.043
(0.008)

-0.040
(0.009)

R2: Catolic

-0.009
(0.146)

0.300
(0.420)

R3: Protestant

-0.273
(0.172)

0.162
(0.465)

R4: Neoprotestant

0.975
(0.226)

0.738
(0.435)

R5: Altul

-0.473
(0.235)

-0.126
(0.618)

E: Educatie(centrat)

R2*E

-0.032
(0.040)

R3*E

-0.044
(0.044)

R4*E

0.032
(0.048)

R5*E

-0.037
(0.061)

Intercept
R2

2.695
(0.032)

2.695
(0.034)

2.695
(0.034)

.016

.028

.027

Credine cretine difereniate n funcie de religie: Selecia modelului


Variables Entered/Removedb
Model
1
2
3

Variables Entered

educmed a
Romano-Catolic, Alte religii, Protestanta, Neo-Protestantaa
R4*Educ, R5*Educ, R3*Educ, R2*Educa

Model Summary
Variables
Removed
.
.
.

Method
Enter
Enter
Enter

a. All requested variables entered.


b. Dependent Variable: Religiozitate

Regression
Residual
Total
Regression
Residual
Total
Regression
Residual
Total

Sum of
Squares
55.004
3334.729
3389.733
102.457
3287.276
3389.733
106.917
3282.816
3389.733

R
.127a
.174b
.178c

R Square
.016
.030
.032

Adjusted
R Square
.016
.028
.027

Std. Error of
the Estimate
1.36453
1.35630
1.35690

a. Predictors: (Constant), educmed


b. Predictors: (Constant), educmed, Romano-Catolic,
Alte religii, Protestanta, Neo-Protestanta
c. Predictors: (Constant), educmed, Romano-Catolic,
Alte religii, Protestanta, Neo-Protestanta, R4*Educ,
R5*Educ, R3*Educ, R2*Educ
ANOVAd

Model
1

Model
1
2
3

df
1
1791
1792
5
1787
1792
9
1783
1792

Mean Square
55.004
1.862

F
29.541

Sig.
.000a

20.491
1.840

11.139

.000b

11.880
1.841

6.452

.000c

a. Predictors: (Constant), educmed


b. Predictors: (Constant), educmed, Romano-Catolic, Alte religii, Protestanta,
Neo-Protestanta
c. Predictors: (Constant), educmed, Romano-Catolic, Alte religii, Protestanta,
Neo-Protestanta, R4*Educ, R5*Educ, R3*Educ, R2*Educ
d. Dependent Variable: Religiozitate

Credine cretine difereniate n funcie de religie: Selecia modelului

Coefficientsa

Model
1
2

(Constant)
educmed
(Constant)
educmed
Romano-Catolic
Protestanta
Neo-Protestanta
Alte religii
(Constant)
educmed
Romano-Catolic
Protestanta
Neo-Protestanta
Alte religii
R2*Educ
R3*Educ
R4*Educ
R5*Educ

Unstandardized
Coefficients
B
Std. Error
2.695
.032
-.045
.008
2.695
.034
-.043
.008
-.009
.146
-.273
.172
.975
.226
-.473
.235
2.695
.034
-.040
.009
.300
.420
.162
.465
.738
.435
-.126
.618
-.032
.040
-.044
.044
.032
.048
-.037
.061

a. Dependent Variable: Religiozitate

Standardized
Coefficients
Beta
-.127
-.120
-.001
-.037
.101
-.047
-.112
.048
.022
.076
-.012
-.053
-.064
.030
-.037

t
83.646
-5.435
78.618
-5.132
-.063
-1.588
4.311
-2.012
78.579
-4.461
.714
.350
1.697
-.203
-.785
-1.008
.660
-.607

Sig.
.000
.000
.000
.000
.950
.113
.000
.044
.000
.000
.475
.727
.090
.839
.432
.314
.509
.544

S-ar putea să vă placă și