Sunteți pe pagina 1din 5

Curs 10 Regresia liniar

Regresia liniar
Fie o funcie:
f:[a,b], [a,b]
pentru care sunt cunoscute un numr discret de valori yi ntr!un numr de puncte de reea "i[a,b]:
f#"i$%yi, i 1, n
n general, valorile yi sunt afectate de erori de msur sau de erori de calcul
valorile "i se numesc noduri sau puncte de reea
&ste necesar apro"imarea funciei f cu o funcie 'model' F#"i()$ cu j 1, k; i 1, n; unde ) se
numesc parametri ai funciei model* Cunoa+terea formei analitice a funciei F face ca aceasta s
poat fi folosit ulterior n diverse calcule, pentru obinerea valorilor ei n orice punct "i, poate fi
integrat sau derivat*
,eterminarea funciei F implic determinarea parametrilor ) astfel nc-t funcia f s fie apro"imat
'optim'* Forma concret a funciei F se va determina in-nd cont de urmtoarele considerente
[.eu//]:
F este determinat de fenomenul fi0ic modelat
F se va alege dintr!o clas convenabil de funcii care s ofere simplitate +i eficien n
prelucrri ulterioare*
Cum se determin parametrii funciei model1
2entru determinarea parametrilor funciei model se define+te o funcional care s reflecte
gradul n care funcia F apro"imea0 funcia tabelat f*
!distana dintre cele dou funcii:
1 / 2
n
2
i i j
i 1
d(f ,F) f(x ) F(x ; )


1
' ;
]

- apro"imare n medie ptratic


3n funcie de tipul valorilor yi, se disting dou ca0uri:
1$ ,ac yi%f#"i$ sunt valori exacte se impune anularea distanei d#f,F$:
d#f,F$%0
1
Fig*1
Curs 10 Regresia liniar
ceea ce nseamn c F#"i( )$%yi, i 1, n +i metoda corespun0toare de obinere a lui F se
nume+te interpolare*
4nterpolarea implic deci gsirea unei funcii F al crei grafic trece prin toate punctele #"i,yi$*
2) ,ac valorile yi%f#"i$ nu sunt exacte ci sunt afectate de erori datorate de e"emplu unor erori
de msur, se impune minimi0area distanei d#f,F$ n raport cu parametrii ) ai funciei
model:
d#f,F$minim #n raport cu parametrii )$
3n acest ca0, procedeul de determinare a funciei F se nume+te fitare*
Concret, se minimi0ea0 suma abaterilor ptratice ale funciei model fa de funcia tabelat:
n
2
i i j
i 1
S y F(x ; )

1
]

- regresie #a)ustare$ prin metoda celor mai mici ptrate*


Condiiile de obinere ale parametrilor ) re0ult din condiiile de minim ale funcionalei 5 n raport
cu cei 6 parametri ):
j
S
0; j 1, k

Regresia liniar
Funcia model este o funcie de gradul 1: F%F#"i, )$ )%7 F%a"8b
Funcionala 5 are forma:
[ ]
n
2
i i
i 1
S y (ax b)

Condiiile de obinere a parametrilor ) #adic a parametrilor a +i b$ sunt:


S
0
a
S
0
b

'


ceea ce conduce la:
[ ]
[ ]
n
i i i
i 1
n
i i
i 1
2 y (ax b) ( x ) 0
2 y (ax b) 0

'

sau:
n n n
2
i i i i
i 1 i 1 i 1
n n n
i i
i 1 i 1 i 1
2 x y 2 ax 2 bx 0
2 y 2 ax 2 b 0

+ +

'



9otm:
n n n n
2
i i xy i xx i x i y
i 1 i 1 i 1 i 1
x y S x S x S y S



7
Curs 10 Regresia liniar
+i inem cont c
n
i 1
b nb

5istemul de ecuaii de mai sus devine:


xy xx x
y x
S aS bS 0
S aS nb 0

'

3nmulind prima ecuaie cu n +i a doua cu #!5"$ +i adun-ndu!le se obine:


x y xy
2
x xx
S S nS
a
(S ) nS

+i apoi:
( )
y x
1
b S aS
n

Cei doi parametri ai funciei model F%a"8b repre0int:
a ! panta dreptei de regresie, adic a%tg#$, unde este ung:iul fcut de graficul funciei F cu a"a
absciselor
b ! valoarea la care graficul funciei intersectea0 a"a ordonatelor
,atele cu care s!a lucrat n e"emplu de mai sus sunt:
0.1 1310
0.2 1300
0.3 1293
0.4 1283
0.5 1276
0.6 1267
0.7 1260
0.8 1251
0.9 1243
1.0 1233
;
Fig*7 5emnificaia parametrilor funciei model F%a"8b
Curs 10 Regresia liniar
Cum se procedea0 atunci c-nd funcia model nu este o funcie de gradul 11
Fie ca e"emplu un set de msurtori de radioactivitate:
t(ore) (mCi)
7*< 7=0
; 71=
;*< 1>>
? 1?0
?*< 100
< =<
<*< @>
@ ?=
@*< ?7
> ;0
>*< 70
= 1>
,ependena activitii
unui preparat radioactiv de timp este:
t
0
(t) e


Repre0ent-nd grafic datele de mai sus se obine graficul din Fig*;
&vident, pentru fitarea acestor date nu poate fi folosit ca +i funcie model o funcie de gradul 1*
Aotu+i, pentru fitarea datelor poate fi folosit regresia liniar dac se logaritmea0 ecuaia care d
dependena activitii de timp:
0
ln( (t)) ln( ) t
9ot-nd acum ln#B0#t$$%yC se obine o relaie liniar ntre aceste valori +i t:
yC%a!bt unde a%ln#B0$ +i b%D
Repre0ent-nd grafic logaritmul valoriilor
activitii n funcie de timp se obine graficul
din Fig*?, iar prin fitare se obin parametrii:
ln#B0$%@*/<@< +i D%0*<11/
ceea ce nseamn c
B0%e"p#@*/<@<$%10?/*/<*
2reci0m c datele repre0entate n Fig*; au
fost simulate cu valorile B0%1000 mCi +i D%0*<
ore
!1
, dup care, unele valori au fost
modificate fat de valorile calculate e"act*
Calitatea unei drepte de regresie poate fi
anali0at dup coeficientul de corelare R
7
*
Ealoarea acestui coeficient se calculea0 cu
relaia:
( )
( )
2
2
2
1
calc exp
i i
i
exp exp
i i
i
y y
R
y y

?
0
<0
100
1<0
700
7<0
;00
0 7 ? @ = 10
Fig*;
Fig*?
Curs 10 Regresia liniar
F valoare 1 pentru acest coeficient are semnificaia c funcia model e"plic ntreaga variabilitate a
lui y, iar valoarea 0 c nu e"ist nici o relaie liniar ntre variabila rspuns +i variabila " #ntre y +i
"$* F valoare de 0*< a lui R
7
poate fi interpretat n felul urmtor: apro"imativ <0G din variaia
variabilei rspuns poate fi e"plicat de ctre variabila independent*
Program exemplu: regresia liniar
//regresia liniara
#include<stdio.h>
#include<stdlib.h>
oid !ain"#
$
int n%
char n&'50(%
&loat a)b)*)+),*),+),*+),**%
-./0 1&in%
n20%
,*2,+2,**2,*+20%
3rint&"4.ntroduceti nu!ele &isierului de date5 4#%
gets"n&#%
i&""&in2&o3en"n&)4r4##2267//#
$
3rint&"40roare la deschiderea &isierului84#%
e*it"1#%
9
:hile"8&eo&"&in##
$
i&"&scan&"&in)4;& ;&4)<*)<+#222#
$
n==%
,*=2*%
,+=2+%
,**=2*1*%
,*+=2*1+%
9
9
&close"&in#%
a2"n1,*+>,*1,+#/"n1,**>,*1,*#%
b2",+>a1,*#/n%
3rint&"4?nn2 ;d4)n#%
3rint&"4?n@ara!etrii de &it sunt5?na2 ;g?tb2 ;g4)a)b#%
9
Fbservaie: 3nainte de rularea programului trebuie creat un fi+ier cu date e"perimentaleH
&"erciiu: Iodificai programul astfel nc-t acesta s calcule0e +i coeficientul de corelare al dreptei
de regresie*
<

S-ar putea să vă placă și