Sunteți pe pagina 1din 28

1

M
E
T
O
D
E

N
U
M
E
R
I
C
E

N

I
N
G
I
N
E
R
I
E

TUDOR PAUNESCU
MN-2009
1
2
.

C
O
R
E
L
A
T
I
I
,

R
E
G
R
E
S
I
I

CORELAII
REGRESII
BIBLIOGRAFIE
2
[MOR04] C. Morariu, T.Punescu. Informatic aplicat n inginerie. Mathcad 2001. Ed. Univ. Bv. 2004.
[CON80] I.Constantinescu sa. Prelucrarea datelor experimentale cu calculatoare numerice. Aplicaii din construcia de maini.
Edit. Tehnic, Bucureti, 1980.
[TOD76] I.Todoran. Tratarea matematic a datelor experimentale . Funcii empirice. Ed. Academiei. 1976.
[TIR72] M.Tiron. Teoria erorilor de msurare i metoda celor mai mici ptrate. Edit. Tehnic,.
[UND69] G.Undy Zule, M.G. Kendall. Introducere n teoria statisticii. Ed. tiinific. Bucureti, 1969.
[SCH08] E. Scheiber. Analiz numeric. Brasov.
[POS94] M. Postolache. Metode Numerice. Ed. Sirius, Bucureti, 1994.
[BEU92] T.Beu. Analiz numeric n Pascal. Ed. Micro inf. Cluj-Napoca. 1992.
[SAL72] M.G.Salvadori, M.L.Baron. Metode numerice n tehnic. Edit. Tehnic, Bucureti, 1972.
[LAR89] D.Larionescu. Metode numerice.Ed. Tehnic, Bucureti, 1989.
[DOD76] Gh.Dodescu, M.Toma. Metode de calcul numeric. Ed. did. i pedag. Bucureti, 1976.
[MEM80 ] ***, Mic enciclopedie matematic, traducere din limba german. Edit. Tehnic, Bucureti, 1980.
[DOR76] W.S.Dorn, D.D.Mc.Cracken. Metode numerice cu programe in Fortran IV. Ed.Tehhnica. Buc. 76.

[HAU53] A.S.Hauseholder. Principles of Numerical Analysis. Mc Graw-Hill, New Zork, 1953.
[CON80] S.D.Conte- Elementary Numerical Analysis - An Algorithmic Approach, McGraw-Hill 3
rd
, 1980.
[PHI96] G. M. M. Phillips, P.J. Taylor. Theory and Applications of Numerical Analysis 2nd ed, Elsevier, 1996
[COL03] G.W.Collins. Fundamental Numerical Methods and Data Analysis. 2003
BIBLIOGRAFIE
[ HNM08]Numerical Methods for the STEM Undergraduate- http://numericalmethods.eng.usf.edu/index.html
3
1. CORELAII
1.1. Relaia empiric ntre dou mrimi aleatoare [TOD76]
ntr-o colectivitate statistic caracterizat prin dou variabile se pot
ntlnii situaiile:
- cele dou variabile sunt independente ntre ele;
- ntre cele dou variabile poate exista o relaie funcional;
- ntre cele dou variabile exist o corelaie care nu este o relaie
funcional propriu zis.
Fie o colectivitate statistic caracterizat prin mrimile X i Y. Efectund
determinri experimentale se poate ntocmi o tabel de genul
X I x
1
, x
2
, ... x
k
Y I y
1
, y
2
, ...y
k
Acest tip de tabel se folosete cnd avem la dispoziie relativ puine date.
Dac punctele de coordonate x
i
i y
i
sunt situate pe o fie care
urmeaz traseul unei curbe avem o dependen funcional (fig.1.a).
Fig.1. [CON80]
a
b
c
Dac punctele sunt repartizate relativ dezordonat dar exist o tendin ca valorile Y s depind de X, dar
nu riguros, exist o dependen corelaional (fig.1.b).
Dac punctele sunt repartizate dezordonat i nu exist o tendin ca valorile Y s depind de X, nu
exist nicio dependen (fig.1.c).
(tabel tip 1)
cmp de corelaie
4
Colectivitate statistic [TOD76]

5
Dac datele experimentale sunt n numr mare se poate
alctui tabelul alturat. Unde dac se iau o serie de valori
x
(i)
ale caracteristicii X i se scriu pe linie mrimile y
ij

corespunztoare, pentru caracteristica Y avem tabelul
alturat. Pe ultima coloan sunt valorile medii ale liniilor.
Cu aceleai date se poate construi i o tabel pentru X.
(tabel tip 2.1) (tabel tip 2.2)
(tabel tip 3, tabela de corelaie)
Dac numrul de date experimentale este
foarte mare, se mpart intervalele de variaie
ale fiecrei caracteristici n intervale egale i
n locaiile astfel create se scriu numerele
corespunztoare.
n prima linie a tabelei sunt date valorile
mrimii X care corespund mijloacelor
intervalelor respective. Similar pentru prima
coloan. Penultima coloan conine sumele
pe linii, iar ultima mediile ponderate.
Punctul M avnd coordonate mediile X , Z se numete centru de repartiie (distribuie). Dac n fiecare
locaie din cmpul de distribuie se ridic o nlime egal cu numrul de puncte corespunztoare nij se obine
histograma problemei bidimensionale.
6
Fig. 2 [UND69]
Fig. 3 [UND69]
7
1.2. Coeficientul de corelaie pentru dependen funcional liniar [TOD76]

Fig. 4
Se consider c a fost determinat centrul de repartiie definit
prin . Se determin dreptele de regresie: Y dependent
de X i X dependent de Y (fr demonstraie):
y x,
( )
( )


=
= = = =
=
=
n
k k
n
k y
n
k x
n
k
n
k
y
y
x
x
y x y x
n
y y
n
x x
n
y
n
y x
n
x
unde
y Y x x
x X y y
1
11
1
2 2 2
1
2 2 2
1 1
2
11
2
11
1
1
,
1
,
1
,
1

o o
o

(1)


(2)
Dac se efectueaz o transformare de axe (translaie fa de centrul de repartiie ) se obin
ecuaiile de regresie care trec prin centrul de repartiie (fig.4).
Dac dependena este de tip dependen funcional liniar cele dou drepte de regresie trebuie s
coincid:
Dac nu exist nici un fel de dependen
y y v x x u = = ,
1 ) ( ) ( = | o

tg tg
0 ) ( ) ( = | o

tg tg
(3)


(4)
8
Deci rdcina ptrat din poate fi luat ca un criteriu pentru dependena
funcional liniar. n consecin r se numete coeficient de corelaie (coeficientul Pearson):



Pentru r=1 ntre x i z exist o dependen funcional liniar (r=1 cu creterea lui x are loc i creterea
lui y, r=-1 cu creterea lui x are loc descreterea lui y)
Pentru r=0 nu exist o corelaie definit printr-o dependen funcional liniar, eventual pot exista
dependene funcionale neliniare.
n Mathcad pentru calculul coeficientului Pearson exist funcia corr(A,B), A i B fiind doi vectori reali sau
compleci de aceeai dimensiune:
2 2
2
11
) ( ) (
y x
tg tg
o o

| o =

(5)
9
1.3. Corelaii aberante [UND69, CON80]
Existena unor corelaii nu nseamn automat relaii cauz-efect. n general fenomenele pot fi
[CON80]:
- interdependente, cnd exist o legtur direct ntre fenomene, acesta putnd fi unilateral sau cu
feedback (reacie invers);
- covariante, cnd exist cauze comune;
- paralele, cnd exist un paralelism ntmpltor n variaiile a dou sau mai multe fenomene.
n vederea formulrii dependenelor statistice trebuie s se lucreze cu un model statistic care implic
anumite simplificri prin care se ia n considerare doar un factor, sau se iau n considerare mai muli factori
semnificativi. Ceilali factori sunt luai n considerare global, ca variabile aleatorii. Selecionarea variabilelor
trebuie s duc la un model nici prea simplist care ar denatura fenomenul real, nici prea complicat greu
rezolvabil, simulabil.
Pentru problemele de corelaie multipl cnd se presupune c o variabil y depinde de n variabile
independente x
1
, x
2
, x
n
pot apare erori grave dac variabilele nu sunt independente (fenomenul de
multicoliniaritate).
Ca pentru orice calcul statistic corelaiile i regresiile impun condiia omogenitii datelor i a unui
numr mare de msurri care se proceseaz. Utilizarea unui numr mic de de date poate duce la
obinerea unor indicatori de corelaie cu valori mari, dar nesiguri i nereprezentativi.
10
Exemplul 1. Corelaie aberant [UND69].
11
2.1. FUNCII PENTRU REGRESII

Dup efectuarea unei serii de msurtori, se pune problema s se gseasc forma dependenei
funcionale, F(x), precum i a valorilor parametrilor acestei funcii.

NU EXIST O METOD DIRECT CARE S PERMIT PRECIZAREA CELUI MAI POTRIVIT MODEL
AL LUI F(X).

Dac exist legiti, pe care le cunoatem apriori, cu privire la forma legturii dintre variabile, atunci vom
utiliza drept ecuaie de regresie expresia matematic a acestora. Dac nu exist o asemenea baz
teoretic, se procedeaz la o analiz calitativ a esenei fenomenelor i dac se ajunge la concluzia c
poate exista o legtur ntre variabile, pentru a alege cel mai potrivit model de regresie se pot aplica
urmtoarele reguli:
1. Datele experimentale se reprezint grafic. Se obine un numr de n puncte;
2. Se traseaz vizual o curb care s se apropie ct mai mult de punctele experimentale. Apoi, se
traseaz efectiv, grafic, curba corespunztoare, cutndu-se s se acorde ponderi egale tuturor
punctelor nscrise (distante aprox. egale intre curba si puncte);
2. REGRESII
12
3. Se apreciaz forma funciei adecvate curbei trasate i apoi se alege o ecuaie care s corespund ct
mai bine alurei curbei empirice;
4. Se calculeaz valorile parametrilor acestei curbe utiliznd criteriul celor mai mici ptrate;
5. Se apreciaz gradul de concordan dintre punctele experimentale i curba empiric obinut n
etapa 4, prin calculul valorilor unor indicatori de concordan;
6. Dac exist mai multe modele matematice poteniale, a cror alur ar putea modela modul de
dispunere pe grafic a celor n puncte experimentale, pentru fiecare, n parte, se parcurg etapele 4 i 5;
7. n funcie de valorile indicatorilor de concordan i/sau din alte considerente, de ordin teoretic sau
practic, se determin modelul cel mai potrivit.
Observaie
Pentru facilitarea alegerii unei funcii adecvate (punctul 3) consultai C09-Regresii-anexa.pps
Vezi n capitolul anterior C09 interp.pps CRITERII DE APROXIMARE A FUNCIILOR, Criteriul de
aproximare cu abatere medie ptratic minim (CCMMP).

13
2.2. CRITERIUL DE APROXIMARE CU ABATERE MEDIE PTRATIC MINIM
Exemplul 2
n exemplul 2 ntr-o prim etap a fost generat o mulime de puncte aleatoare
n jurul unei curbe (polinom de gradul 2).
n a doua etap a fost rezolvat o problem de minimizare cu ajutorul blocului
Solve, funcia obiectiv fiind suma abaterilor (rezidurilor) ptratice.
In a treia etap pentru verificare s-au obinut coeficienii apelndu-se la functia
regress (s-au obtinut coeficient identicii).
1
2
3
Etapa pregatitoare
14
2.3. REGRESIA LINIAR
Regresia liniar, funcia de regresie are forma: y=a
0
+a
1
x , eroarea unui punct este
i
=y
i
-(a
0
+a
1
x
i
)
Fig. 5
min
1

n
i
c
Criteriul nu conduce la soluii unice, exemplu [HOL08]:
15
Nici criteriul nu este corespunztor [HOL08], ns criteriul abaterii
minime ptratice conduce la o soluie unic.
Condiiile necesare ale extremului sunt:



Din care rezult cei doi coeficieni ai dreptei de regresie:




Se poate verifica uor c semnele derivatele de ordin doi conduc la concluzia c soluia este un minim.

=
n
i
i
1
c
( )
2
1
1 0
1
2

= =
= =
n
i
i i
n
i
i r
x a a y S c
( )( ) 0 2
1
1 0
1
= =
c
c

=
n
i
i i i
r
x x a a y
a
S
( )( ) 0 1 2
1
1 0
0
= =
c
c

=
n
i
i i
r
x a a y
a
S
i
n
i
i i
n
i
i
n
i
x y x a x a

= = =
= +
1
2
1
1
1
0

= = =
= +
n
i
i i
n
i
n
i
y x a a
1 1
1
1
0
2
1 1
2
1 1 1
1
|
.
|

\
|

=


= =
= = =
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i i
x x n
y x y x n
a
2
1 1
2
1 1 1 1
2
0
|
.
|

\
|

=


= =
= = = =
n
i
i
n
i
i
n
i
i i
n
i
i
n
i
i
n
i
i
x x n
y x x y x
a
(7)
(P) Scriei un program n Mathcad care
s determine dreapta de regresie pe
baza criteriului celor mai mici ptrate.
16
REGRESIA LINIAR REZOLVAT CU FUNCIILE MATHCAD
Dac dreapta de regresie se scrie y=A+Bx, iar cu Vx i Vy se noteaz doi vectori reali coninnd
coordonatele punctelor, pentru regresia liniar Mathcad pune la dispoziie funciile:

Funcia line:
Formatul funciei: line(Vx,Vy);
Argumentele funciei: Vx, Vy reprezint doi vectori cu elemente reale i cu aceleai dimensiuni (n
linii 1 coloan), ce conin valorile absciselor i respectiv a ordonatelor, pentru cele n puncte printre
care se traseaz dreapta de regresie;
Valoarea returnat: un vector (2 linii 1 coloan) ce conine valorile calculate ale parametrilor dreptei de
regresie (A i B).

Funcia intercept:
Formatul funciei: intercept(Vx,Vy);
Argumentele funciei: Vx, Vy reprezint doi vectori cu elemente reale i cu aceleai dimensiuni (n linii
1 coloan), ce conin valorile absciselor i respectiv a ordonatelor, pentru cele n puncte printre care se
traseaz dreapta de regresie;
Valoarea returnat: valoarea parametrului A al dreptei de regresie (A reprezint ordonata punctului de
intersecie al dreptei de regresie cu axa Oy.
17
Funcia slope:
Formatul funciei: slope(Vx,Vy);
Argumentele funciei: Vx, Vy reprezint doi vectori
cu elemente reale i cu aceleai dimensiuni (n linii
1 coloan), ce conin valorile absciselor i respectiv a
ordonatelor, pentru cele n puncte printre care se
traseaz dreapta de regresie;
Valoarea returnat: valoarea parametrului B, al
dreptei de regresie (B reprezint panta dreptei de
regresie.
Exemplul 3.

ntr-un experiment se
determin modulul de
elasticitate E a unui material
compozit.
y=A+B
.
x
line(vx,vy)
intercept(vx,vy) slope(vx,vy)
18
2.4. REGRESIA POLINOMIAL
m
m
j
j
x a x a x a x a a y ) x ( F + + + + + + = =
2
2 1 0
m , j , a
j
0 e
( ) | |

=
+ + + + + + =
n
i
m
i m i j i i i m
x a x a x a x a a y ) a , , a (
1
2
2 2
2 1 0 0
c
( )
( )
( )
( )

=
c
c
=
c
c
=
c
c
=
c
c

=
=
=
=
n
i
m
i
m
i m
j
i j i i i
m
n
n
i
j
i
m
i m
j
i j i i i
j
n
n
i
i
m
i m
j
i j i i i
n
n
i
m
i m
j
i j i i i
n
x x a x a x a x a a y
a
) a , , a , a (
x x a x a x a x a a y
a
) a , , a , a (
x x a x a x a x a a y
a
) a , , a , a (
x a x a x a x a a y
a
) a , , a , a (
1
2
2 1 0
1 0
1
2
2 1 0
1 0
1
2
2 1 0
1
1 0
1
2
2 1 0
0
1 0
0 2
0 2
0 2
0 2

Regresia polinomial de gradul m utilizeaz o funcie model de forma:


Determinarea param. ,ai ecuaiei (8), prin metoda celor mai mici ptrate implic minimizarea valorii ecuaiei:

Sistemul ecuaiilor normale, care se obine dac impunem ecuaiei (9) condiia de minim, este:

Sistemul (10) este un sistem liniar de m+1 ecuaii cu m+1 necunoscute. El poate fi scris matriceal, sub forma:
(8)
(9)
(10)
19





=
=
=
=
=

=
+
=
+
=
=
+
=

=
+
=
=
+
=
+
= =
= = =

=
n
i
i
m
i
n
i
i
j
i
n
i
i i
n
i
i
m
j
n
i
m
i
n
i
j m
i
n
i
m
i
n
i
m
i
n
i
j m
i
n
i
j
i
n
i
j
i
n
i
j
i
n
i
m
i
n
i
j
i
n
i
i
n
i
i
n
i
m
i
n
i
j
i
n
i
i
y x
y x
y x
y
a
a
a
a
x x x x
x x x x
x x x x
x x x n
1
1
1
1
1
0
1
2
1 1
1
1
1 1
2
1
1
1
1
1
1
1
1
2
1
1 1 1







(11)
REGRESIA POLINOMIAL REZOLVAT CU FUNCIILE MATHCAD
n Mathcad valorile parametrilor unui polinom de regresie, de gradul m, se calculeaz cu:
Funcia regress
n funcie de tipul argumentelor cu care este apelat, regress permite calculul parametrilor, pentru un
polinom de regresie, n cazul:
a. Bidimensional (cazul n dimensional nu este detaliat n prezentul curs)
o Formatul funciei: regress(Vx,Vy,m);
o Argumentele funciei: Vx, Vy reprezint doi vectori cu elemente reale i cu aceleai dimensiuni (n
linii 1 coloan), ce conin valorile absciselor i respectiv a ordonatelor, pentru cele n puncte printre
care se traseaz polinomul de regresie;
m reprezint gradul polinomului de regresie,
0 > m
20

o Valoarea returnat: un vector, de dimensiuni m+4 linii 1 coloan, ce conine:
primul element reprezint un cod ce indic funcia ce a generat vectorul (pentru funcia regress
aceast valoare este 3);
al doilea element reprezint un cod care indic, ncepnd de la care element al vectorului se
gsesc coeficienii polinomului de regresie (pentru funcia regress aceast valoare este 3);
al treilea element reprezint gradul polinomului de regresie, m.
urmtoarele m

+

1 elemente reprezint coeficientii polinomului de regresie, pornind de la
coeficientul termenului liber i terminnd cu coeficientul puterii m.
o Observaii:
1. Utiliznd precizrile anterioare, se poate construi polinomul de regresie folosind relaia:

=
+
=
m
i
i
i
x C ) x ( Pm
0
3 unde, prin C s-a notat vectorul returnat de funcia regress.
2. Dac dorim s utilizm polinomul de regresie, fr a-i reconstitui expresia algebric, Mathcad-ul
are predefinit funcia interp, care permite calculul valorilor intermediare.
3. Pentru a putea determina coeficientii unui polinom de regresie de gradul m, este necesar ca
numrul de puncte n s ndeplineasc condiia:
1 + > m n
.
1 + > m n
4. Dei, funcia regress poate calcula coeficienii unui polinom de regresie de orice grad, n
aplicaiile practice nu se recomand utilizarea gradelor mai mari de ase.
21
( )
( )
( )
( )

=
1
0
2
1
0
2
1
0
2
1
0
2
1
n
i
i
n
i
i
n
i
i
n
i
i i
y y
y ) x ( f
y y
) x ( f y
q

=
=
1
0
1
n
i
i
y
n
y
5. Ca o msur a concordanei dintre valorile experimentale i polinomul de regresie se poate utiliza
valoarea raportului de corelaie:
relaie n care s-au notat prin:
- x
i
, valorile absciselor celor n valori iniiale. Aceste valori sunt coninute n vectorul Vx;
- y
i
, valorile ordonatelor celor n puncte iniiale. Aceste valori sunt coninute n vectorul Vy;
- f(x
i
), valorile ordonatelor punctelor situate pe curba de regresie;
media aritmetic a ordonatelor celor n valori initiale.

.
(12)
Exemplul 4
22
23
E
x
e
m
p
l
u
l

5
.

R
e
g
r
e
s
i
i

c
u

p
o
l
i
n
o
a
m
e

d
e

d
i
f
e
r
i
t
e

g
r
a
d
e

a
p
l
i
c
a
t
e

p
e

a
c
e
l
e
a

i

d
a
t
e

24
2.4. REGRESIA GENERALIZAT PE BAZA UNEI COMBINAII LINIARE DE FUNCII
Rezolvarea aplicaiilor practice, pot conduce la situaii n care modelele regresiei liniare sau polinomiale
nu asigur o corelaie corespunztoare ntre datele iniiale i curba de regresie. n aceste condiii se
recomand utilizarea unor funcii de regresie avnd o expresie matematic mai complex.
Se pot alege, n aceste situaii, curbe de regresie alctuite ca o combinaie liniar de k+1 funcii
arbitrare,
i
(x):
) x ( a ) x ( a ) x ( a ) x ( a ) x ( F
k k j j
+ + + + + =
1 1 0 0
k , j , a
j
0 e
( ) | |

=
+ + + + + + =
n
i
i k k i j j i i i i k
) x ( a ) x ( a ) x ( a ) x ( a ) x ( a y ) a , a (
1
2
2 2 1 1 0 0 0
c
Determinarea parametrilor ai ecuaiei (13), prin metoda celor mai mici ptrate implic
minimizarea valorii expresiei, n conformitate cu criteriul celor mai mici ptrate:
(13)
(14)
Functia linfit
o Formatul funciei: linfit(Vx,Vy,F);
o Argumentele funciei: Vx, Vy reprezint doi vectori cu elemente reale i cu aceleai dimensiuni (n
linii 1 coloan), ce conin valorile absciselor i respectiv a ordonatelor, pentru cele n puncte printre
care se traseaz curba de regresie;
F reprezint identificatorul unui vector, de dimensiuni k linii 1 coloan ce conine expresiile
matematice ale celor k funcii elementare.
1 0 e k , i , a
i
25
o Valoarea returnat: un vector, de dimensiuni k linii 1 coloan, ce conine valorile celor k
coeficieni, 1 0 e k , i , a
i
Observaii:
1. Elementele vectorului Vx nu trebuie s fie n ordine cresctoare;
2. Funcia F, definit sub forma unui vector, trebuie s conin funcii elementare de o singur variabil;
3. Numrul funciilor trebuie s fie mai mic dect al punctelor experimentale.
a
0
1
0.4
0.6
0.8
0.2
|

\
|
|
|
|
|
|
|
.
:= b
0.44
2.5
0.28
0.19
1
0.22
|

\
|
|
|
|
|
|
|
.
:= ff x ( )
x
2
x
1
x 1 +
|

\
|
|
|
|
|
.
:= coef linfit a b , ff , ( ) := coef
4.976
2.903
0.564
|

\
|
|
|
.
=
rf x ( ) ff x ( ) coef :=
0 0.5 1
1
2
3
4
b
rf x ( )
a x ,
Exemplul 6
26
2.5. REGRESII CU FUNCII SPECIALE (S)
Mathcad poate efectua regresii cu urmtoarele funcii:

- Exponenial expfit

- Logaritmic logfit

- Logistic lgsfit

- Putere pwrfit -
- Sinus sinfit - F(x)= asin(x+b)+c
c e a x F
x b
+ =

) (
F(x) = aln(x + b) + c
x c
e b
a
x F

+
=
1
) (
c x a x F
x
+ = ) (
27
expfit
logfit
lgsfit
28
pwrfit
sinfit

S-ar putea să vă placă și