Documente Academic
Documente Profesional
Documente Cultură
regresie
Analiza de corelaie i regresie
Corelaie
Regresia liniar simpl
Variabile predictor binare
Regresia liniar multipl
Regresie curbilinie
Variabile rezultat binare i regresia logistic
Dimensiunea eantionului
Tipuri de regresie
Corelaie
Ex: Datele referitoare la rezisten (fora muscular) i nlime
pentru 41 de brbai alcoolici (Hickish et al., 1989).
Diagrama de corelaie (scatter):
Fora muscular (newtoni)
Hickish T, Colston K,
Bland JM, Maxwell
JD. (1989) Vitamin D
deficiency and muscle
(rezistena)
strength in male
alcoholics. Clinical
Science 77, 171-176.
nlimea (cm)
Ct de potrivit este relaia?
Corelaia: msoar ct de potrivit este relaia liniar.
Coeficient de corelaie
Vom calcula abaterile scznd media din fiecare observaie i
vom nmuli aceste abateri pentru cele dou variabile
corespunztoare unui subiect.
Fora mucular (newtoni)
Media nlimii
(rezistena)
Media
rezistenei
nlimea (cm)
Vom nsuma produsele de abateri pentru toi subiecii (sum de
produse n jurul mediei).
Coeficient de corelaie
Vom calcula abaterile scznd media din fiecare observaie i
vom nmuli aceste abateri pentru cele dou variabile
corespunztoare unui subiect apoi vom nsuma produsele de
abateri.
Fora mucular (newtoni)
nlimii Media
(rezistena)
Media
rezistenei
nlimea (cm)
Produsele observaiilor din cadranele dreapta sus i stnga jos sunt
pozitive.
Coeficient de corelaie
Vom calcula abaterile scznd media din fiecare observaie i
vom nmuli aceste abateri pentru cele dou variabile
corespunztoare unui subiect. apoi vom nsuma produsele de
abateri.
Fora mucular (newtoni)
nlimii Media
(rezistena)
Media
rezistenei
nlimea (cm)
Produsele observaiilor din cadranele dreapta sus i stnga jos sunt
pozitive. Produsele observaiilor din cadranele dreapta jos i
stnga sus sunt negative.
Coeficient de corelaie
Vom calcula abaterile scznd media din fiecare observaie i
vom nmuli aceste abateri pentru cele dou variabile
corespunztoare unui subiect. apoi vom nsuma produsele de
abateri.
Fora mucular (newtoni)
nlimii Media
(rezistena)
Media
rezistenei
nlimea (cm)
Suma de produse este pozitiv.
Corelaia este pozitiv.
Coeficient de corelaie
Ex: datele referitoare la rezisten (fora muscular) i vrsta
pentru 41 de brbai alcoolici (Hickish et al., 1989).
Diagrama de corelaie (scatter):
Fora mucular (newtoni)
(rezistena)
Vrsta (ani)
Coeficient de corelaie
Ex: datele referitoare la rezisten (fora muscular) i vrsta
pentru 41 de brbai alcoolici.
Diagrama de corelaie (scatter):
Fora mucular (newtoni)
Media vrstei
(rezistena)
Media
rezistenei
Vrsta (ani)
nlimea (cm)
Coeficient de corelaie
Se mparte suma de produse prin produsul celor dou rdcini
ptrate extrase din sumele de ptrate de abateri (care corespund
fiecrei variabile).
Astfel se obine coeficientul de corelaie care de obicei este
notat cu r.
Valoarea minim = -1.00. Valoarea maxim = 1.00.
Fora mucular (newtoni)
r = 0.42.
(rezistena)
nlimea (cm)
Coeficient de corelaie
Se mparte suma de produse prin produsul celor dou rdcini
ptrate extrase din sumele de ptrate de abateri (care corespund
fiecrei variabile).
Astfel se obine coeficientul de corelaie care de obicei este
notat cu r.
Valoarea minim = -1.00. Valoarea maxim = 1.00.
Fora mucular (newtoni)
r = - 0.42.
(rezistena)
Vrsta (ani)
Coeficient de corelaie
Corelaia este pozitiv cnd valori mari ale unei variabile se
asociaz cu valori mari ale celeilalte variabile.
Variabila Y
Variabila X
Coeficient de corelaie
Corelaia este pozitiv cnd valori mari ale unei variabile se
asociaz cu valori mari ale celeilalte variabile.
Variabila Y
Variabila X
Coeficient de corelaie
Corelaia este negativ cnd valori mari ale unei variabile se
asociaz cu valori mici ale celeilalte variabile.
Variabila Y
Variabila X
Coeficient de corelaie
Corelaia este negativ cnd valori mari ale unei variabile se
asociaz cu valori mici ale celeilalte variabile.
Variabila Y
Variabila X
Coeficient de corelaie
r = +1.00 cnd valori mari ale unei variabile sunt asociate cu
valori mari pentru cealalt variabil i punctele se afl exact pe o
linie dreapt.
Variabila Y
Variabila X
Coeficient de corelaie
r = -1.00 cnd valori mari ale unei variabile sunt asociate cu
valori mici pentru cealalt variabil i punctele se afl exact pe o
linie dreapt.
Variabila Y
Variabila X
Coeficient de corelaie
r nu va fi egal cu -1.00 sau +1.00 n cazul n care avem o relaie
perfect ci doar dac punctele se afl exact pe o linie dreapt.
Variabila Y
Variabila X
Coeficient de corelaie
r = 0.00 n cazul n care nu avem o relaie liniar.
Variabila Y
Variabila X
Coeficient de corelaie
Este posibil ca r = 0.00 n cazul n care avem o relaie aproape
perfect ns aceasta nu este liniar.
Variabila Y
Variabila X
Teste pentru coeficientul de corelaie
Putem testa ipoteza nul care stabilete c coeficientul de
corelaie n populaie este zero.
Aceasta se poate face printr-un test t simplu.
Presupunere: observaiile sunt independente i cel puin una
dintre variabilele urmeaz o distribuie normal.
Abateri mari de la aceste presupuneri fac ca valoarea p pentru
acest test s fie foarte instabil.
Fora mucular (newtoni)
r = 0.42. p = 0.006.
Programele de analiz statistic
(rezistena)
nlimea (cm)
Regresia liniar simpl
Ex: Indicele de masa corporal (BMI) i circumferina
abdominal (CA) la 86 femei (Malcolm Savage)
BMI(kg/m2)
BMI(kg/m2)
BMI(kg/m2)
BMI(kg/m2)
BMI(kg/m2)
BMI(kg/m2)
BMI(kg/m2)
BMI(kg/m2)
BMI(kg/m2)
Diferena
(obezi - subponderali) =
10.298 - 8.066 = 2.232.
95% CI = (1.05 - 3.42) MJ,
p = 0.0008.
Subpond. Obeze
Grup femei Obez Cele dou metode sunt
identice!
Variabile predictor binare
Presupunerile metodei t pentru dou eantioane sunt:
1. Consumul de energie urmeaz o distribuie normal n
fiecare populaie
2. Varianele sunt aceleai n fiecare populaie.
Presupunerile modelului de regresie sunt:
1. Diferenele ntre consumul de energie observat i cel
prezis urmeaz o distribuie normal
2. Varianele diferenelor sunt aceleai indiferent de
valoarea predictorului.
Sunt aceleai!
Regresie liniar multipl
Mai mult de o variabil predictor:
BMI (kg/m2)
BMI (kg/m2)
Circumferin abdominal CA (cm) Circumferina braului CB (cm)
Reziduuri
Femei Brbai
Sex
Regresie liniar multipl
Variabile binare: sex
Variabila masculin = 0 pentru o femeie i
= 1 pentru un brbat.
BMI = 20.51 + 0.40 masculin
95% CI (19.64, 21.38) (-0.75, 1.55)
p = 0.5
BMI = -6.44 + 0.18 CA + 0.64 CB - 1.39 masculin
95% CI:(-8.49, -4.39) (0.14, 0.22) (0.50, 0.78) (-1.94, -0.84)
p <0.001 p <0.001 p <0.001
Se poate observa c variabila "masculin" a devenit semnificativ
deoarece att circumferina abdominal (CA) ct i a braului
(CB) ca predictori au micorat mult variana BMI-lui.
Valoarea medie pentru BMI este mai mic la brbai
comparativ cu femeile cu aceeai circumferin abdominal i a
braului cu 1.39 uniti.
Regresie liniar multipl
Variabile binare: sex
Variabila masculin = 0 pentru o femeie i
= 1 pentru un brbat.
BMI = 20.51 + 0.40 masculin
95% CI (19.64, 21.38) (-0.75, 1.55)
p = 0.5
BMI = -6.44 + 0.18 CA + 0.64 CB - 1.39 masculin
95% CI:(-8.49, -4.39) (0.14, 0.22) (0.50, 0.78) (-1.94, -0.84)
p <0.001 p <0.001 p <0.001
BMI = -5.94 + 0.18 CA + 0.59 CB
95% CI:(-8.10, -3.77) (0.14, 0.22) (0.45, 0.74)
p <0.001 p <0.001
Regresie liniar multipl
Variabile binare: sex
Variabila masculin = 0 pentru o femeie i
= 1 pentru un brbat.
BMI = -6.44 + 0.18 CA + 0.64 CB - 1.39 masculin
95% CI:(-8.49, -4.39) (0.14, 0.22) (0.50, 0.78) (-1.94, -0.84)
p <0.001 p <0.001 p <0.001
n cazul n care avem ca predictori att variabile continue ct i
categoriale, regresie este, de asemenea, numit, din motive
istorice, i analiz de covarian sau ANCOVA.
Variabilele continue (precum CA, CB) se numesc covariate.
Variabilele categoriale (precum sex) se numesc factori.
Linii de regresie care nu sunt drepte
n locul liniei de regresie se poate folosi o curb, modificarea
fcndu-se cu destul uurin.
Aceasta se poate face prin adugarea unei variabile egale cu
ptratul circumferinei abdominale (CA).
BMI = 16.03 - 0.16 CA + 0.0030 CA2
95% CI: (4.59, 27.47) (-0.45, 0.14) (0.0011, 0.0049)
p = 0.3 p = 0.003
BMI(kg/m2)
64
MySQL
Comenzi administrator (root):
Grant privilegii (list cmpuri) On identificatoare_tabele To username
(Identified By password);
Revoke
Comenzi utilizatori:
Show Databases ; Show Tables ;
Use nume_baz_de_date;
Create Database nume_baz_de_date;
Create Table nume_tabel ( structur i indeci);
Insert Into nume_tabel Values( lista_valori);
Load Data Infile identificator_fiier_surs Into Table nume_tabel;
Select list_cmpuri From list_tabele Where condiie_de_selecie;
Update nume_tabel Set list_modificri Where condiie_de_identificare ;
Delete From nume_tabel Where condiie_de_ndeplinit;
Drop Table If Exists nume_tabel;
Alte comenzi: pt iruri de caractere, funcii calendaristice, conversii etc.
65