Sunteți pe pagina 1din 14

ANALIZA DISCRIMINANT ANALIZA DE REGRESIE LOGISTIC

Ungureanu Iulia-Cristina
Universitatea Al. I. Cuza, Facultatea de matematic, Matematici financiare, Master, anul II iuliacristinaungureanu@yahoo.com Prof. Dr. Elisabeta Jaba

Abstract n vederea relizrii proiectului, am utilizat programul SPSS. Pentru realizarea celor dou tipuri de anaaliz am utilizat date privind salariul, vrsta, naionalitatea, sexul i anii de studiu din mai multe ri ale lumii. Regresia logistic este o metod de analiz multivariat a datelor, din ce n ce mai utilizat datorit faptului c numrul condiiilor ce trebuiesc ndeplinite este mai redus dect n cazul analizei discriminante. n prezentul proiect vom urmri relaia dintre obinerea informaiilor din ziare i anumii factori. De asemenea n cadrul analizei discriminant vom urmri determinarea caracteristicilor persoanelor ce obin noile informaii cu ajutorul ziarului. Variabilele incluse n cele dou analize sunt urmtoarele: Variabila dependent: obinera noutilor din ziare (DA sau NU), Variabilele independente: Vrsta respondentului, Anii de studiu, Genul (masculin sau feminin), Salariul respondentului, ara de provenien (Romnia i alte ri).

CUPRINS 1. Analiza discriminant 1.1 Introducere 1.1.1 Modelul analizei discriscriminant 1.1.2 Obiectivele analizei discriminant 1.2 Formularea problemei 1.3 Obiectivul proiectului 1.4 Estimarea coeficienilor discriminantului 1.5 Determinarea semnificaiei (sig) 1.6 Interpretarea rezultatelor 1.7 Validarea nalizei discriminant 1.7.1 Validarea modelului 1.7.2 Validarea coeficienilor 2. Analiza de regresie logistic 2.1 Introducere 2.1.1 Similitudini cu regresia liniar 2.1.2 Diferene fa de regresia liniar 2.1.3 Avantaje 2.2 Formularea ipotelor 2.2.1 Obiectivul proiectului 2.2.2 Identificarea sau definirea variabilelor 2.2.3 Estimarea parametrilor 2.2.4 Testul Omnibus 2.2.5 Rezultatele modelului 2.3 Aproximarea modelului de regresie 2.4 Estimarea modelului de regresie 2.4.1 Testarea coeficienilor de regresie 2.4.2 Rata anselor 2.5 Concluzii 3. Compararea modelului de regresie logistic cu analiza discriminant 4. Anexe 5. Bibliografie

1. ANALIZA DISCRIMINANT

1.1 Introducere
Analiza discriminant este o metod ce face parte din grupa metodelor explicative de analiz a datelor. Ea utilizeaz o variabil de explicat (y) i mai multe variabile explicative, cantitative sau binare. Acest tip de analiz mai este numit i metoda scorurilor. Prin analiz se ncearc ncadrarea elementului cercetat, n populaia de care aparine. n acest caz se efectueaz msurtori similare efectuate anterior asupra unor elemente cunoscute ca origine. Analiza are ca principal avantaj c nu lucreaz cu elemente medii, generatoare de erori. Tehnica de baz a analizei este estimarea poziiei unui element fa de linie, care separ cel mai bine dou clase de populaii distincte. Cu ajutorul acestei metode se pot face estimaii asupra apartenenei unor elemente la una sau mai multe categorii i de asemenea, se poate testa dac grupurile dintr-un eantion apar ntr-o singur populaie sau n mai multe. Procedura analizei discriminant poate fi folosit pentru: indicarea variabilelor ce sunt mai folositoare la diferenierea grupurilor; dac un set de variabile are rezultate la fel de bune ca celelalte; care grupuri se aseamn cel mai mult; care cazuri sunt outlieri. Analiza datelor prin folosirea discriminantului se poate efectua numai atunci cnd: criteriul sau variabila dependent este categorial; predicatorul sau variabilele independente sunt intervale.;

1.1.1

Modelul analizei discriminant

Modelul analizei discriminant are la baz urmtoarea ecuaie liniar:

unde :

D=valoarea discriminant sau scorul =coeficienii discriminant =variabilele independente sau predictorii Coeficienii sau ponderile sunt astfel estimate nct grupurile s difere la valoarea funciei discriminant ct de mult posibil.

1.1.2
1. 2. 3. 4. 5.

Obiectivele analizei discriminant

Alctuirea funciilor discriminant sau a combinaiilor liniare independente, care caracterizeaz cel mai bine diferenele dintre grupuri; Examinarea diferenelor semnificative ntre grupuri n ceea ce privete variabilele independente; Identificarea predictorilor care contribuie cel mai mult la diferenele intergrup; Clasificarea cazurilor ca aparinnd unui grup sau altuia pe baza valorilor predictorii; Evaluarea preciziei clasificrii

1.2 Formularea problemei


Lumea de azi este ntr-o continu micare. O dat cu apariia noilor tehnologii tot mai muli oameni renun la vechile metode de informare i le folosesc pe cele noi, care sunt mai practice, mai accesibile, mai comode i de ce nu, mai ieftine. Cu toate acestea, un segment mai redus de persoane mai folosesc, pentru a obine noile informaii, ziarul. Acetia sunt

puini, dar totui suficieni pentru ca firmele de specialitate s nu dea faliment. n continuare, se va ncerca efectuarea analizei modului n care diveri factori sau variabile influeneaz sau nu, informarea populaiei din tradiionalele ziare.

1.3 Obiectivul proiectului


Se urmrete determinarea caracteristicilor persoanelor din ntreaga lume ce se informeaz cu ajutorul ziarelor. Pentru a realiza acest lucru vom considera un eantion de 2832 de persoane i vom avea urmtoarele variabile spre analizat: variabila dependent (y): Obinerea noutilor din ziare; variabilele indelendente: vrsta, sexul, naionalitatea, salariul i numrul anilor de coal a respondentului.

1.4 Estinarea coeficienilor discriminantului 1.5 Determinarea semnificaiei (sig) 1.6 Interpretarea rezultatelor 1.7 Validarea analizei discriminante 1.7.1 validarea modelului 1.7.2 validarea coeficienilor

2. ANALIZA DE REGRESIE LOGISTIC 2.1 Introducere


Analiza de regresie este analiza statistic prin care se studiaz legtura dintre o variabil pe care vrem s o modelm (variabila dependent) i un set de variabile independente presupuse c ar influena variabila de modelat. n general, analiza de regresie este folosit pentru modelarea legturii dintre variabila dependent i variabilele independente, pentru testarea ipotezelor i pentru prognoza nivelului variabilei dependente. Regresia logistic modeleaz relaia dintre o variabil dependent dihotomic (nominal, binar) Y i o mulime de variabile independente Xi (categoriale, continue). O astfel de variabil dependent apare, de regul, atunci cnd reprezint apartenena la dou clase, categorii (de exemplu: prezen sau absen, da sau nu, adevrat sau fals). Ecuaia de regresie ofer informaii despre: importana variabilelor n diferenierea claselor; clasificarea unei observaii ntr-o clas. Este de remarcat c diagrama de mprtiere a valorilor nu ofer prea multe informaiiprivind dependena. n asemenea cazuri, regresia liniar clasic nu ne ofer un model adecvat. Aceste model de regresie poate fi studiat n cazul n care avem o variabil independent, dar i n situaia n care avem mai multe variabile independente. ns noi vom trata doar cazul n care avem mai multe variabile independente, iar variabila dependent este dihotomic. Regresia logistic binomial poate fi realizat pentru: identificarea variabilelor care caracterizeaz dou grupuri diferite; efectuarea de predicii cu privire la probabilitatea ca un anumit individ sau caz s fac parte dintr-un grup sau altul.

2.1.1
1. 2. 3. 4. 5.

Similitudini cu regresia liniar

Se realizeaz relaia dintre o variabil dependent i una sau mai multe independente; Variabilele independente pot fi exprimate pe scar cantitativ (numeric) sau calitativ (nominale sau ordinare); Exist teste de semnificaie pentru relaia individual dintre fiecare variabil dependent i independent; Se calculeaz coeficienii de regresie care descriu contribuia fiecrul predictor; Exist o expresie grafic pentru fiecare predicie;

2.1.2
1. 2. 3. 4. 5. 6.

Diferene fa de regresia liniar

Variabilele dependente pot fi exprimate numai pe scar nominal; Predictorii (variabilele independente) categoriali trebuie declarai ca atare; Inpactul variabilelor independente asupra variabilei dependente este evaluat individual (ns exist posibilit i evaluarea aspectului combinat a unor predictori asupra criteriului (variabila dependent)); Regresia logistic estimeaz probabilitatea ca fiecare caz s fie inclus ntr-una sau alta din categoriile definite de variabila dependent; Nu se bazeaz pe minimalizarea sumei ptratelor, ci pe maximizarea ansei de apartenen a fiecrui caz la una sau alta din categoriile variabilei dependente; Modelul grafic de predicie are o form special, care decurge din natura logaritmic a relaiei dintre valorile variabilelor independente i variabila dependent

2.1.3

Avantaje

Regresia logistic nu este condiionat de multe din restriciile impuse de regresia liniar: nu presupune existena unei relaii liniare ntre criteriu i predictor; variabila dependent nu trebuie s aib o distribuie normal; variabila dependent nu trebuie s aib o variabilitate omogen n raport cu valorile variabilelor independente; nu presupune distribuia normal a valorilor reziduale; suport predictori msurai pe orice tip de scar.

2.1.4

Modelul analizei de regresie logistic

n situaia n care avem mai multe variabile independente, modelul general este:

unde p este P(Y = 1 |

)=

, iar

2.2 Formularea ipotezelor


Modelul regresiv logistic va estima proporia subiecilor care vor avea aceeai caracteristic de interes pentru studiul statistic, sau echivalent, probabilitatea ca un subiect oarecare din populaie s aib o anumit caracteristic (Erika KULCSR, pag.51)

2.2.1

Obiectivul urmrit

Dorim s vedem relaia dintre informatiile obinute de ctre populaie cu ajutorul ziarelor i anumiti factori. Astfel se urmrete identificarea variabilelor ce caracterizeaz grupul persoanelor ce se informeaz cu ajutorul ziarelor i a grupului persoanelor ce nu se informeaz cu ajutorul acestora.

2.2.2

Identificarea /definirea variabilelor

Pentru realizarea acestui studiu vom considera urmtoarele variabile: Variabila dependent: Obinerea noutilor din ziare (este o variabil binomial codat astfel: 0 pentru Nu, i 1 pentru Da); Variabilele independente: Vrsta respondentului, Anii de studiu, Genul, Salariul respondentului, ara de provenien. Dintr-un eantion de 2832 persoane, 1843 (65,1%) sunt inclue n analiz, restul de 989 (34,9%) sunt cazuri pierdute. De asemenea, 877 de persoane sunt de sex masculine, 966 de sex feminin, 1841 provin din alte ri, iar 2 persoane provin din ara noastr. ntr-o prim etap a analizei noastre vom folosi datele din Block 0: Beginning Block (ANEXA 1) n cadrul cruia avem informaiile pe care le vom pune n modelul nostru. Tabelul Classification Table ne arat ca1364 (74%) din persoanele respondente nu obin noutile din ziare i doar 479 fac acest lucru. Ceea ce arat c oamenii gsesc i alte moduri de a se informa dect cel traditional. Pentru a vedea dac coeficienii sunt semnificativi sau nu tabelul Variables in the Equation aplic statistica Wald pentru estimarea parametrilor, care este semnificativ (sig.=0,000). Testul Wald este ptratul lui z (coeficientul sau eroarea standard ) Se observ (din tabelul Variables not in the Equation) c legtura dintre Obinerea noutilor din ziare i vrst, educaie, sex, salariu este semnificativ (sig<0,05), pe cnd legtura dintre obinerea informatiilor din ziare i etnie (naionalitate) este nesemnificativ (sig=0,402>0,05). Cu alte cuvinte, naionalitatea nu influene

2.2.3

Estimarea parametrilor

Se observ (din tabelul Variables not in the Equation) c legtura dintre Obinerea noutilor din ziare i vrst, educaie, sex, salariu este semnificativ (sig<0,05), pe cnd legtura dintre obinerea informatiilor din ziare i etnie (naionalitate) este nesemnificativ (sig=0,402>0,05). Cu alte cuvinte, naionalitatea nu influene Partea a doua a analizei unde vom folosi date din Block 1: Method=Enter arat rezultatele finale. Cele cinci variabile independente au fost introduse mpreun n analiz.

2.2.4

Testul Omnibus

Testul omnibus este un test de ansamblu, de semnificaie a modelului. Acesta ne spune c prin mijloacele noastre, unele condiii difer semnificativ unele de altele., ns nu ne spune care anume dintre ele. Pe baza informaiilor obinute n tabelul Omnibus Test of Model Coefficients se poate constata c n urma introducerii variabilelor independente modelul este semnificativ (sig.=0,000). De asemenea, avem cinci grade de libertate pentru fiecare predictor.

2.2.5

Rezultatele modelului
6

Rezultatele tabelului Model Summary ne spune ct la sut din variaia variabilei dependente este explicat de combinaia

variabilelor independente. Pentru aceasta SPSS furnizeaz doi indicatori: Cox &Snell R Square i Nagelkerke R Square. Potrivit primului indicator, Cox &Snell R Square, cele cinci variabile independente explic n proporie de 7,1%, n timp ce cel de-al doilea, Nagelkerke R Square, n proporie de 10,5% variana variabilei dependente (potrivit specialitilor, ne putem baza pe cel de-al doilea indicator, deoarece primul subestimeaz valoarea real). Conform tabelului Classification Table 97,5% (1330 persoane) din subieci nu obin noutile din ziare i acestia au fost clasificate corect de ctre model, pe de alt parte, 8,1% (440 persoane) este proporia celor corect clasificai n czul persoanelor care obin noutile din ziare. Acest lucru nseamn c n final 74,3% din cazuri erau corect clasificate, comparnd aceasta cu succesul de clasificare preconizat (74%) , se poate constata faptul c variabilele independente au contribuit n proporie de 0,3% la clasificarea corect a dependenei.

2.3 Aproximarea modelului de regresie


Pentru fiecare variabil independent avem urmtoarele diagrame de mprtiere:

Din tabelul Correlation Matrix observm c cele mai strns corelate variabile independente sunt sexul i educaia avnd un coeficient de corelaie de 0,094, urmat de educaie i vrst (0,082), iar la polul opus este salariul i educaia cu un coefficient negative de -0,254.

2.4 Estimarea modelului de regresie


Estimarea modelului este bazat pe principiul maximum likelihood. Tabelul Variables in the Equation cuprinde efectul combinat al tuturor variabilelor independente (coeficienii B, raportul de anse, informaii associate testului Wald). Ecuaia de aproximare a modelului nostru de regresie este: , unde p este probabilitatea de a obine informaiile din ziare. Conform tabelului Variables in the Equation ecuaia de predictie este: . Astfel probabilitatea de a obine noile informaii din ziare este:

Aceste estimri ne spune despre relaiile dintre variabilele independente si variabila deendent. Aceste estimri ne spun suma de cretere (sau de descretere n cazul n care avem coeficieni negativi). Cu alte cuvinte pentru: vrst- pentru fiecare cretere de o unitate n punctajul vrst ne ateptm la o cretere de 0,37 a anselor de a obine informaiile din ziare; educaie- pentru fiecare cretere cu o unitate a punctajului educaie, ne ateptm la o cretere de 0,131 a anselor de a obine informaiile din ziare; sex- la creterea cu o unitate a punctajului sex ne ateptm la o cretere de 0,279 a anselor de a obine noile informaii din ziare; salar- la fiecare cretere cu o unitate a punctajului salar ne putem atepta la o cretere de 0,046 a anselor de a obine noile informaii din ziar; de_etnie- pentru fiecare cretere cu o unitate a punctajului etnie, ne ateptm la o cretere de 20,046 a anselor de a obine informaiile din ziare;

2.4.1

Testarea coeficienilor de regresie


, unde sunt

Testarea coeficienilor de regresie se poate face cu ajutorul statisticii z. Aceast statistic este: z= estimaii ale coeficienilor, iar este abaterea n medie ptratic. Avem urmtoarele ipoteze:

,
Valorile lui z sunt reprezentat n SPSS ca valori ale statisticii Wald, . Ipoteza nul este respins deoarece sig<0,05 sau 0,01 (sig=0.000). Deci ipoteza nul este respins, prin urmare coefiienii de regresie sunt diferii de zero.

2.4.2 Rata anselor (OR_Odds Ratio)


Exp(B) reprezint modificarea OR (rata anselor) a variabilei dependente la modificarea cu o unitate a variabilelor independente, deci Exp(B) este aproximativ 1,4 pentru variabilele semnificative. Deci Exp(B)>1, prin urmare avem o cretere a lui Y cu 1,038 pentru vrst, 1,140 pentru educaie, 1,322 pentru sex, 1,047 pentru salar i 5,082 pentru etnie ori de cte ori variabilele X se modific cu o unitate, iar celelalte rmn constante.

2.4.3 Testarea asocierii A. Dac Obinerea informaiilor din ziare ar fi asociat cu vrsta, ne putem atepta ca OR=1. Ipoteza nul este H0: OR=1 vs ipoteza alternativ H1: OR1; 95% IC pentru OR estimat este (1,029;1,047); Deoarece IC nu conine 1, la 5% nivel de semnificaie, se poate respinge ipoteza nul; Concluzia: vrsta nu este caracteristic esenial persoanelor care citesc ziarul. B. Dac Obinerea informaiilor din ziare ar fi asociat cu educaie, ne putem atepta ca OR=1.
Ipoteza nul este H0: OR=1 vs ipoteza alternativ H1: OR1; 95% IC pentru OR estimat este (1,093;1,190); Deoarece IC nu conine 1, la 5% nivel de semnificaie, se poate respinge ipoteza nul; Concluzia: educaia nu este o caracteristic esenial a persoanelor care obin noile informaii din ziare. C. Dac Obinerea informaiilor din ziare ar fi asociat cu sexul, ne putem atepta ca OR=1. Ipoteza nul este H0: OR=1 vs ipoteza alternativ H1: OR1; 95% IC pentru OR estimat este (1,060;1,648); Deoarece IC nu conine 1, la 5% nivel de semnificaie, se poate respinge ipoteza nul; Concluzia: sexul nu este o caracteristic esenial pentru persoanele ce citesc ziarul. D. Dac Obinerea informaiilor din ziare ar fi asociat cu salarul, ne putem atepta ca OR=1. Ipoteza nul este H0: OR=1 vs ipoteza alternativ H1: OR1; 95% IC pentru OR estimat este (1,000;1,095); Deoarece IC nu conine 1, la 5% nivel de semnificaie, se poate respinge ipoteza nul; Concluzia: salarul nu este o caracteristic esenial pentru persoanele ce se informeaz cu ajutorul ziarelor.

2.5 Concluzii
Din studiu, se observ c ziarelor nu li se acorda o atenie prea mare cnd vine vorba de informare. Majoritatea persoanelor respondente prefer un alt mijloc de informare. De asemenea vrsta, educaia, sexul, salarul i etnia nu sunt n relaie strns cu obinerea noutilor din ziare. De altfel, se observ c etnia nici macar nu este semnificativ.

ANEXE
Anexa nr.1

Case Processing Summary Unweighted Casesa Selected Cases Included in Analysis Missing Cases Total Unselected Cases Total N 1843 989 2832 0 2832 Percent 65,1 34,9 100,0 ,0 100,0

a. If weight is in effect, see classification table for the total number of cases.

Dependent Variable Encoding Original Value Nu Da Internal Value 0 1

Categorical Variables Codings Parameter Frequency coding (1) Tara de provenient altele Ro Genul Masculin Feminin 1841 2 877 966 1,000 ,000 1,000 ,000

Block 0: Beginning Block


Iteration Historya,b,c Iteration -2 Log likelihood Coefficients Constant Step 0 1 2 3 4 2114,574 2111,912 2111,911 2111,911 -,960 -1,045 -1,046 -1,046

10

a. Constant is included in the model. b. Initial -2 Log Likelihood: 2111,911 c. Estimation terminated at iteration number 4 because parameter estimates changed by less than ,001.

Classification Tablea,b Observed Predicted Percentage Obtine noutatile din ziare Nu Step 0 Obtine noutatile din ziare Nu Da Overall Percentage a. Constant is included in the model. b. The cut value is ,500 1364 479 Da 0 0 100,0 ,0 74,0 Correct

Variables in the Equation B Step 0 Constant -1,046 S.E. ,053 Wald 388,225 df 1 Sig. ,000 Exp(B) ,351

Variables not in the Equation Score Step 0 Variables age educ sex(1) salar de_etnie(1) Overall Statistics 76,288 45,984 8,285 26,124 ,703 132,108 df 1 1 1 1 1 5 Sig. ,000 ,000 ,004 ,000 ,402 ,000

Block 1: Method=Enter

Iteration Historya,b,c,d Iteration -2 Log likelihood Constant Step 1 1 2 3 4 1992,284 1975,637 1975,331 1975,291 -4,699 -6,863 -8,052 -9,072 age ,028 ,036 ,037 ,037 Coefficients educ ,098 ,128 ,131 ,131 sex(1) ,209 ,273 ,279 ,279 salar ,021 ,041 ,046 ,046 de_etnie(1) ,964 1,976 3,018 4,036

11

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 a. Method: Enter

1975,277 1975,272 1975,270 1975,269 1975,269 1975,269 1975,269 1975,269 1975,269 1975,269 1975,269 1975,269 1975,269 1975,269 1975,269 1975,269

-10,079 -11,081 -12,082 -13,082 -14,082 -15,082 -16,082 -17,082 -18,082 -19,082 -20,082 -21,082 -22,082 -23,082 -24,082 -25,082

,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037 ,037

,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131 ,131

,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279 ,279

,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046 ,046

5,043 6,045 7,046 8,046 9,046 10,046 11,046 12,046 13,046 14,046 15,046 16,046 17,046 18,046 19,046 20,046

b. Constant is included in the model. c. Initial -2 Log Likelihood: 2111,911 d. Estimation terminated at iteration number 20 because maximum iterations has been reached. Final solution cannot be found.

Omnibus Tests of Model Coefficients Chi-square Step 1 Step Block Model 136,642 136,642 136,642 df 5 5 5 Sig. ,000 ,000 ,000

Model Summary Cox & Snell R Step 1 -2 Log likelihood 1975,269


a

Nagelkerke R Square

Square ,071

,105

a. Estimation terminated at iteration number 20 because maximum iterations has been reached. Final solution cannot be found.

Hosmer and Lemeshow Test Step 1 Chi-square 8,526 df 8 Sig. ,384

12

Contingency Table for Hosmer and Lemeshow Test Obtine noutatile din ziare = Nu Observed Step 1 1 2 3 4 5 6 7 8 9 10 168 160 151 138 153 141 128 115 116 94 Expected 166,756 158,456 152,862 146,930 142,668 137,560 130,191 122,465 112,538 93,573 Obtine noutatile din ziare = Da Observed 16 24 33 45 31 44 56 69 68 93 Expected 17,244 25,544 31,138 36,070 41,332 47,440 53,809 61,535 71,462 93,427 184 184 184 183 184 185 184 184 184 187 Total

Classification Tablea Observed Predicted Percentage Obtine noutatile din ziare Nu Step 1 Obtine noutatile din ziare Nu Da Overall Percentage a. The cut value is ,500 1330 440 Da 34 39 97,5 8,1 74,3 Correct

Variables in the Equation


95% C.I.for B S.E. Wald df Sig. Exp(B) EXP(B) Lower Step 1
a

Upper 1,047 1,190 1,648 1,095

age educ sex(1) salar de_etnie(1) Constant

,037 ,131 ,279 ,046 20,046 -25,082

,004 ,022 ,113 ,023 28043,175 28043,175

68,305 36,745 6,132 3,890 ,000 ,000

1 1 1 1 1 1

,000 ,000 ,013 ,049 ,999 ,999

1,038 1,140 1,322 1,047 5,082E8 ,000

1,029 1,093 1,060 1,000 ,000 .

a. Variable(s) entered on step 1: age, educ, sex, salar, de_etnie.

13

Correlation Matrix Constant Step 1 Constant age educ sex(1) salar de_etnie(1) 1,000 ,000 ,000 ,000 ,000 -1,000 age ,000 1,000 ,082 ,030 -,090 ,000 educ ,000 ,082 1,000 ,094 -,254 ,000 sex(1) ,000 ,030 ,094 1,000 -,194 ,000 salar ,000 -,090 -,254 -,194 1,000 ,000 de_etnie(1) -1,000 ,000 ,000 ,000 ,000 1,000

14