Sunteți pe pagina 1din 41

Regresia Binar

Studeni:
Profesor coordonator:
Coroian Bogdan
Conf Univ. Dr. Anua Buiga
Font Oana Cristina
Ilie Oana Cristina
Presecan Alexandra

Ce este regresia binar?


metod de analiz multivariat a datelor;
mai des utilizat, datorit numrului redus de

condiii ce trebuie ndeplinite;


este des ntlnit n cercetrile medicale;
prezint doar dou variabile: 0 adevrat, 1
fals.

Analiza multidimensional a datelor |


Regresia Binar

Exemplul 1 - Evaluare moralitii n


domeniul experimentelor pe
animale
East Carolina University (1998);
315 studeni: 200 femei, 115 brbai; 17 38

de ani; 88% ras cauzazian.

femei
brbai

37%
63%

Analiza multidimensional a datelor |


Regresia Binar

Exemplul 1 - Evaluare moralitii n


domeniul experimentelor pe
animale
studeni neliceniai nc n domeniul

psihologiei;
acetia au fost pui n situaia ipotetic de a
face parte din cominetul unei universiti ce a
primit plngeri legate de experimentele pe
animale ale Doctorului Wissen (personaj
fictiv);
studenii au trebuit s decid dac s retrag
sau nu dreptul doctorului pentru a realiza
aceste experiemnte.
Analiza multidimensional a datelor |
Regresia Binar

Exemplul 1 - Evaluare moralitii n


domeniul experimentelor pe
animale
Rezultate

41%
59%

Analiza multidimensional a datelor |


Regresia Binar

retragerea dreptului
de cercetare
acordarea dreptului
de cercetare

Exemplul 2 - Anemia renal - factor de


risc pentru boala cardiovascular i
boala cronic de rinichi
studiul influenei anemiei renale asupra

funciei cardiace i a progresiei BCR;


165 pacieni: 96 de pacieni cu anemie, 69 de
pacieni fr anemie;
pacieni cu anemie: 55% femei, 45 % brbai;
pacieni fr anemie: 28% femei, 72%
brbai;
vrsta medie: 60 de ani (+/- 15 ani).
Analiza multidimensional a datelor |
Regresia Binar

Exemplul 2 - Anemia renal - factor de


risc pentru boala cardiovascular i
boala cronic de rinichi
prevalena anemiei a fost mai mare la femei

comparativ cu brbaii, femeile prezentnd un


risc de 2 ori mai mare de dezvoltare a anemiei
comparativ cu brbaii;
malnutriia pacienilor cu BCR a fost asociat
cu un risc semnificativ mai mare de dezvoltare
a anemiei comparativ cu pacienii fr
malnutriie;
Analiza multidimensional a datelor |
Regresia Binar

Exemplul 2 - Anemia renal - factor de


risc pentru boala cardiovascular i
boala cronic de rinichi
prezena anemiei prezint un risc de 95% de

a dezvolta boli cronice de rinichi.


Anemia renal - factor de risc pentru boala cronic de rinichi
5%

ansa de a
dezvolta boli
de rinichi
niciun risc

95%

Analiza multidimensional a datelor |


Regresia Binar

Exemplul 2 - Anemia renal - factor de


risc pentru boala cardiovascular i
boala cronic de rinichi
prevalena disfunciei cardiace sistolice a fost

mai mare la pacienii cu anemie comparativ


cu cei fr anemie (39,6% versus 17,4%),
anemia reprezentnd un factor de risc pentru
dezvoltarea disfunciei cardiace sistolice

Analiza multidimensional a datelor |


Regresia Binar

Exemplul 3 -omajul i depresia Studiu


de caz privind prezena i nivelul de
severitate al depresiei la omeri i
angajai
Participanii au fost brbai i femei din mediul urban,
i anume din Bucureti,
Acetia au fost mprii n omeri i respectiv, angajai
(omeri de la sediul Ageniei Municipale pentru
Ocuparea Forei de Munc Bucureti (AMOFM) i alte
surse i angajai din diverse domenii de activitate);
Criteriile de includere au fost: omeri/angajai din
mediul urban, brbai i femei, vrsta: 20-65 ani, studii:
fr studii medii, cu studii medii, cu studii superioare,
motivaie crescut de a participa la studiu i la
programul de intervenie din studiile urmtoare;
200 omeri: 100 brbai i 100 femei i 200 de
Analiza multidimensional a datelor |
Regresia Binar
10
angajai, 100 brbai
i 100 femei.

Exemplul 3 -omajul i depresia Studiu de caz


privind prezena i nivelul de severitate al
depresiei la omeri i angajai

Instrumentele de cercetare :
interviul psihiatric;

inventarul de depresie Beck


(acesta este utilizat n cercetrile tiinifice care
investigheaz depresiile clinice i subclinice, precum
i ca metod de evaluare a eficienei medicaiei sau
psihoterapiei n tratamentul depresiei).
Analiza multidimensional a datelor |
Regresia Binar

11

Analiza multidimensional a datelor |


Regresia Binar

12

Analiza multidimensional a datelor |


Regresia Binar

13

Analiza multidimensional a datelor |


Regresia Binar

14

Analiza multidimensional a datelor |


Regresia Binar

15

Ipoteze
1) Depresia este mai frecvent la

omeri comparativ cu angajaii;


2) Depresia este mai frecvent la
femei dect la brbai, att la
cele omere, ct i la cele
angajate
Analiza multidimensional a datelor |
Regresia Binar

16

Analiza multidimensional a datelor |


Regresia Binar

17

Concluzii
1)Depresia este mai frecvent la omeri comparativ cu
angajaii;
2)Pentru un angajat ansele de a avea depresie scad cu
59.5%, comparativ cu un omer;
3)Depresia este mai frecvent i mai intens la femei
dect la brbai att la omeri ct si la angajai;
4) Pentru o femeie ansele de a avea depresie cresc cu
92.5%, comparativ cu un brbat.
5)n cazul unei femei omere ansele de a avea depresie
cresc cu 102.5%, comparativ cu un brbat omer, n
timp ce pentru o femeie angajat ansele de a avea
depresie cresc numai cu 72.5%, comparativ cu un
brbat angajat.
Analiza multidimensional a datelor |
Regresia Binar

18

Exemplu 4 -Degustare de vinuri n cifre:


utilizarea regresiei binare pentru arta preferinele experilor

Varibilele folosite n cadrul studiului sunt:


Numrul de sulfai/cloruri pe care l conine
vinul;
Acidul;
Dioxidul de sulf;
Densitatea;
Procentajul de alcool.
Obiectiv: determinarea crei variabile are un
efect semnificativ la calitatea vinului.
Analiza multidimensional a datelor |
Regresia Binar

19

Degustare de vinuri
n cifre:
Datele adunate sunt de la un grup de vinificatori care au
degustat mai mult tipuri de vinuri albe i roii, i fiecruia dintre
vinuri i-au oferit cte o evaluare binar a calitii, notat cu (1)bun sau 0-(ru)

Analiza multidimensional a datelor |


Regresia Binar

20

Relaia dintre vinurile albe i roi i


calitatea acestora

Analiza multidimensional a datelor |


Regresia Binar

21

Analiza regresiv a modelului, incluznd att


variabilele ct i toate interaciunile dintre ele
i tipul de vin.
Pasul urmtor fiind eliminarea pe rnd, pe
cele cu valoarea cea mai mare, folosind mai
apoi modelul reduciei, pentru ca ulterior s
realizeze o regresie

Analiza multidimensional a datelor |


Regresia Binar

22

Model de regresie pentru vinurile albe

Analiza multidimensional a datelor |


Regresia Binar

23

Model de regresie pentru


vinurile albe
Prin eliminarea variabilelor care au valori sub, 0.05, s-a ajuns la
urmtorul tabel, care este mai uor de interpretat deoarece nu exist
nici o interaciune.

Analiza multidimensional a datelor |


Regresia Binar

24

Model de regresie pentru


vinurile albe
Valorile P ale variabilelor sunt cu mult peste 0,05;
Deasemenea proporia de perechi concordante / discordante
este o msur a nivelului de nelegere ntre predicii i
observaii ale modelului, n alte cuvinte , i asta ne arat ct
de bine modelul reflect datele observate;
Iar raportul de perechi potrivite este mare .

Analiza multidimensional a datelor |


Regresia Binar

25

S-a folositModel
acelai model
ca n cazul vinurilor
albe,
astfel primul
tabel a fost:
de regresie
pentru
vinurile
roii

Iar dup eliminarea variabilelor, cu valoare mai mic de 0,05, s-a ajuns la
urmtorul tabel:

Analiza multidimensional a datelor |


Regresia Binar

26

Model de regresie pentru vinurile roii


Testele Pearson i abaterile sunt acceptabile,;
ns valoarea Hosmer - Lemeshow este sczut . Acest
lucru sugereaza ca am putea avea o problem cu
precizia acestui model .

Analiza multidimensional a datelor |


Regresia Binar

27

Model de regresie pentru


vinurile roii
Pentru a fi siguri dac este bun sau nu acest model, se creaz un
grafic Delta standardizat pentru a ajuta la validarea modelului .
Graficul arat c avem un exemplu negativ n rndul 34 , care ar
putea fi cauza problemei de potrivire.

Analiza multidimensional a datelor |


Regresia Binar

28

Model de regresie pentru


vinurile roii
Din cauza problemei aprute, s-a eliminat rndul
34 i s-a fcut din nou analiza, din care a reieit
acum un model asemntor, cu aceleai variabile,
dar cu coeficieni uor diferii:

Analiza multidimensional a datelor |


Regresia Binar

29

Model de regresie pentru


vinurile roii
Acum valorile p sunt mari, aa c nu mai este nici o problem n
ceea ce privete gradul de adecvare a modelului:

Iar n legtur cu perechile concordante i discordante, avem


urmtorul tabel:

Analiza multidimensional a datelor |


Regresia Binar

30

Concluzii
Vinurile roii cu un coninut de alcool
mai mare i un coninut mai ridicat de
aciditate fix au primit scoruri de calitate
superioar;
n urma testelor realizate am descoperit
152 de rezultate concordante i 48 de
rezultate discordante cu cercetrile
noastre.

Analiza multidimensional a datelor |


Regresia Binar

31

Exemplul 5 - Abstract

Scopul lucrrii este de a analiza tendina

migranilor de a trimite bani n ara de origine.


Studiul se bazeaza pe date provenite de la
Institutul Naional Imigrant, din Spania.

Exemplul 5 - Introducere
Migraia forei de munc este un fenomen

complex;
Remitenele= surs important de finanare
extern pentru rile aflate n dezvoltare;
Modul n care se comport imigranii n
privina remitenelor este diferit de la o zon
la alta;
Cercetarea caut factori care ar putea
determina probabilitatea de a remite i
valoarea remitenelor.

Obiectiv principal: oferirea unor informaii

pertinente privind migranii care au fost n


Spania pentru cel puin un an i care
inteioneaz s rmn pentru aceast
perioada.
15.550 de persoane intervievate

Exemplul 5 - Analiza
empiric
Se realizeaz n dou etape
1. Motivaia la nivel indiviual de a tranfera
bani, factorii fiind structurai n 3 categorii:
. factori individuali
. factori care evalueaz prezena i
intensitatea legturilor fa de ara de
origine
. factori care s evalueze gradul de integrare
n Spania

2. n funcie de factorii analizai, variabilele


independente implicate n model sunt:
Venit
Vrst
Educaie
Sex
Legturi cu ara de origine
Gradul de integrare n Spania

Remitenele sunt considerate un factor major

de influen asupra migraiei;


Legturile familiale cu ara de origine sunt
factorii cei mai influeni;
Venitul este un factor semnificativ in
caracterizarea migrantului;
Timpul petrecut n Spania determina negativ
tendina de a transfera bani

Concluzii
Venitul este un factor important care

influeneaz pozitiv att decizia de a remite


ct i suma de bani remis;
Ataamentul personal fa de ara de origine,
precum i gradul de integrare n societatea
spaniol;
Factori demografici: vrsta, sexul sau
educaia, de cele mai multe ori nu
influeneaz probabilitatea de a remite sau
suma remis.

V mulumim!

Analiza multidimensional a datelor |


Regresia Binar

41