Sunteți pe pagina 1din 24

ANALIZA GRAFICA A REZULTATELOR DETERMINAREA FUNCTIEI DE REGRESIE OPTIME

A. Scopul lucrarii:
Se urmareste realizarea urmatoarelor obiective: - prezentarea notiunilor generale legate de formele de prezentare a rezultatelor; - prezentarea formei relaiilor matematice pentru reprezentarea rezultatelor; - prezentarea unor metode pentru determinarea legilor de variaie care sa descrie cat mai precis un set de valori; - prezentarea unei aplicaii;

B. Notiuni de baza:
In practica este deseori intalnita situaia masurarii unei variabile dependente Y de mai multe valori stabilite ale unei alte variabile X. Rezultatele pot fi prezentate sub forma de tabele, grafice sau ecuatii Graficele pot fi utilizate pentru reprezentarea datelor in etape intermediare i finale a procesului de prelucrare a rezultatelor cercetrilor experimentale. Motivatia utilizarii graficelor este data de: - reprezentarea grafica permite observarea cu usurinta a prezentei minimelor, maximelor, a punctelor de inflexiune, caracteristicile periodice sau de alta natura; - diagrama care se obtine ofera vizualizarea simpla a dependentei functionale studiate, avand posibilitatea sa concentreze intr-un spatiu minim o mare cantitate de informatii; - prin trasarea curbei de dependenta se simplifica operatiile ulterioare de stabilire a unor valori care nu au fost masurate, in interiorul intervalului studiat (interpolare), sau in afara lui (extrapolare); - forma graficului obtinut sugereaza forma dependentei functionale a variabilei y fata de x (putandu-se deriva sau integra o variabila in raport cu alta, direct din grafic, fara a se stabili forma matematica); Ecuatiile (formulele) redau relatiile care exista intre variabilele indicate in grafice sau tabele, acest mod de reprezentare fiind mai convenabil i avand un grad de generalizare mult mai mare dect celelalte reprezentari, putand fii utilizat cu usurinta in operatii de derivare, integrare sau interpolare. Acestea pot fii: - ecuatii rationale, adic deduse in mod teoretic, pe baza unor legi i teorii cunoscute, valorile constantelor ce le contin fiind determinate in urma prelucrarii datelor observate; - ecuatii empirice, acestea stabilindu-se pe baza experimentala, efectuandu-se o serie de masurari asupra variabilei dependente (functiei) y pentru diverse valori ale variabilei independente x. In acest caz, gasirea reprezentarii analitice a dependentei functionale, implica doua etape i anume: stabilirea formei dependentei analitice (ecuatiei, formulei) i apoi determinarea valorilor adecvate ale constantelor arbitrare. In unele cazuri, este suficient sa se traseze o curba de aproximare vizuala, aceasta fiind procedeul cel mai simplu i mai expeditiv, care se poate considera satisfacator in masura in care punctele studiate sunt suficient de apropiate de curba. Metoda se numeste regresie si

118

Lucrarea 6

este tehnica generala de a ajusta, cat mai bine posibil, datele observate la o curba teoretica data. Exista insa situatii, i nu putine, cand intre anumite marimi teoria nu poate stabili nici o relatie de legatura, astfel ca in functie de tipul de dependenta dintre cele doua variabile, legatura poate fii stabilita fie prin prin corelatie, fie prin metoda ANOVA. 1. Alegerea formulelor empirice pentru reprezentarea datelor Efectuandu-se o serie de masurari asupra variabilei Y pentru diverse valori ale variabilei X, repetandu-se determinarile de un numar oarecare de ori pentru fiecare valoare a lui xi , se pune problema sa se gaseasca forma dependentei functionale: (6.1) y = f ( x , a , b, L , q ) La rezolvarea acestei probleme este necesar sa se aiba in vedere ca functia cautata sa reprezinte cat mai exact datele studiate i sa aiba totodata un numar cat mai mic posibil de constante arbitrare (in general maxim patru constante). In general, pasii parcursi pentru gasirea unei astfel de functii sunt: 1- se realizeaz reprezentarea grafica a datelor observate, de obicei in coordonate x, y obtinand un numar de n puncte, egal cu numarul de valori ale variabilei x; 2- se traseaza curba, cautand sa se acorde ponderi egale tuturor punctelor inscrise. Datorita erorilor aleatoare asociate datelor obtinute in urma masuratorilor, nu se va concepe o dependenta functionala care sa descrie exact rezultatele obtinute, ci graficul functiei va fi in mod firesc o curba lina, fara discontinuitati, care nu uneste, ci trece prin punctele ce reprezinta in campul diagramei valorile masurate, totodata, definind o astfel de curba realizandu-se i o operaie de corectie a rezultatelor msurrilor, atenuandu-se influenta erorilor intamplatoare. 3- pe baza cunostintelor de geometrie analitica se apreciaza forma functiei adecvate curbei trasate, graficul obtinut sugerand in continuare tipul de ajustare care poate fi utilizat (solutia cea mai simpla fiind cea prin incercari: functie liniara, parabolica, polinomiala de ordin superior, exponentiala, etc.); 4- cu ajutorul datelor existente se face proba preliminara pentru a verifica daca forma aleasa este adecvata reprezentarii acestora, proba facandu-se fara determinarea in prealabil a valorilor constantelor pentru fiecare forma a functiei considerata posibila, deoarece in caz contrar ar necesita un volum mare de munca; (daca rezultatul probei nu este satisfacator, se alege o noua forma a functiei - pasul 3- i se supune probei, procedandu-se astfel pana la gasirea formei adecvate). 1. Ajustarea datelor experimentale la o curba teoretica Se pot defini ca existente, doua metode i anume: 1.1. Proba grafica sau alegerea gradului polinomului, utilizata in special pentru functii liniare cu una sau doua constante, cat i pentru functii care se pot liniariza prin calcule matematice. In multe cazuri, dependentele functionale pot fi exprimate in mod satisfacator printr-un polinom, alegerea gradului polinomului asigurand exprimarea suficient de precisa a dependentei studiate cu o forma cat mai simpla a formulei empirice stabilite. Stabilirea gradului optim al polinomului se poate face prin incercari succesive, incepand cu gradele inferioare, estimata dispersiei corespunzatoare gradului m al polinomului comparandu-se cu estimata dispersiei calculata anterior, pentru gradul m-1, recomandanduse ca gradul m al polinomului sa fie ridicat in continuare atata timp cat dispersia 2 inregistreaza o scadere sensibila.

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

119

Proba grafica presupune parcurgerea urmatoarelor etape: 1- functia presupusa ca ar reprezenta datele experimentale, in cazul ca nu este liniara, se scrie sub forma liniara prin schimbarea convenabila a variabilelor cu doua functii Y i X, care nu contin constantele i care depind numai de y i de x (i intre care se considera ca exista o legatura pentru care experimental au fost determinate perechile de valori xi,yi), obtinand astfel functia: (6.2) Y = A + BX Unde:

Y = f ( y );

X = f ( x );

A = f (a ); B = f (b )

(6.3)

2- se calculeaza functiile Y i X pentru 4-6 perechi de valori ale lui y i x, alese cat mai diferit/ departate una de alta, evidentiindu-se extremitatile; 3- se traseaza graficul: (6.4) Y = f (X ) in acelasi tip de coordonate in care s-a trasat graficul:

y = f (x )

(6.5)

Daca se obtine o dreapta, atunci forma functiei adoptata poate fi considerata satisfacatoare reprezentarii datelor studiate. Pentru mrirea certitudinii probei se calculeaza in continuare valorile Y i X pentru alte perechi de valori ale lui y i x, marcandu-se punctele respective pe graficul dat de relatia (6.4), i observandu-se daca acestea se gasesc cat mai aproape de dreapta trasata. In cazul in care legatura dintre variabilele y i x nu este liniara se efectueaza, pentru aducerea sub forma (6.2) a functiilor se foloseste transformarea prin logaritmare sau diferite schimbari convenabile ale variabilelor, cele mai dese situatii intalnite in practica fiind pentru functia putere i functia exponentiala:

y = ax b y = ab x y = ae bx y = e (a +bx )

(6.6)

Pentru care se foloseste transformarea prin logaritmare, ajungandu-se la formele liniare:

lg y = lg a + b lg x lg y = lg a + x lg b pentru functia exp onentiala lg y = lg a + (b lg e) x


In aceste cazuri:

(6.7)

lg y = a lg e + (b lg e )x pentru functia de putere;


X = x; A = lg a; sau A = a lg e; B = b; sau
(6.8)

Y = lg y;

X = lg x; sau

B = lg b; respectiv B = b lg e
Se mai intalnesc functiile:

y=
Utilizandu-se schimbarea de variabila:

1 ax + b

(6.9)

Y=
Pentru functia:

1 ; rezul tan d : Y = ax + b; y

(6.10)

120

Lucrarea 6

Y=
Se aplica schimbarea de variabile:

1 a + be z

(6.11)

Y=
In cazul functiei:

1 ; si y

X = e x ; rezul tan d : Y = a + bX

(6.12)

Y=
Avem schimbarea de variabile:

x ax + b

(6.13) (6.14)

X =
Pentru functia:

1 1 ; si Y = ; rezul tan d : Y = a + bX x y Y= x ax + be x

(6.15) (6.16)

Se face schimbarea de variabile:

X = e x ; si Y =
Functia:

1 ; rezul tan d : Y = a + bX y

Y = ax 2 + bx + c
Necesita schimbarea de variabile:

(6.17)

Y=

y y1 ; si d = ax1 + b; ( x1 , y1 coordonatele unui punct oarecare al curbei), x x1 rezul tan d : Y = aX + b,

(6.18)

In cazul functiei:

Y=
Se face schimbarea de variabile:

x +c ax + b
rezul tan d : Y = dX + e,

(6.19)

Y=

y y1 ; x x1

d = ab + a 2 x1 ; e = abx1 + b 2 ,

(6.20)

Observatie: Pentru functii care se pot liniariza prin logaritmare, proba grafica se simplifica, deoarece nu mai este necesar sa se calculeze functiile Y i X, ci valorile lui y i x se inscriu direct intr-un grafic in coordonate logaritmice (dublu sau simplu logaritmice, dupa cum Y i X sunt ambii sau numai unul, functii logaritmice). Daca pe acest grafic, prin punctele inscrise se poate trasa o dreapta, atunci rezulta ca forma aleasa pentru functia respectiva este adecvata reprezentarii analitice a datelor studiate. 1.2. Proba tabelara sau ajustarea datelor empirice, utilizata pentru forme mai complicate i cu un numar mai mare de constante i care de asemenea se aplica in cazul problemelor de diferentiere sau integrare a datelor, cand determinarea functiilor empirice nu este indispensabila. In acest caz, pentru atenuarea efectului erorilor aleatoare (care este mult amplificat de anumite operatii matematice, spre exemplu efectul de propagare al erorilor prin operatia de derivare), este recomandabil sa se ajusteza tabelul datelor studiate, astfel ca ele sa se inscrie pe o curba suficient de neteda. Aceasta proba presupune parcurgerea urmatoarelor etape:

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

121

1- de pe graficul functiei y=f(x), trasat cu ajutorul datelor studiate, se inscriu intr-un tabel valorile pentru 8-10 perechi de valori ale lui x i y, alegandu-se valorile variabilei x astfel incat intervalele x dintre valorile alaturate sa fie constante; 2- pentru forma functiei presupusa ca fiind corespunzatoare curbei din grafic, se stabilete criteriul de verificare, care consta din gasirea unor diferente succesive ale functiei y care tind sa aiba valori constante; 3- se calculeaza (sub forma tabelara), diferentele succesive corespunzatoare criteriului stabilit i se verifica daca acestea sunt aproximativ constante (cu cat sirul diferentelor respective este mai constant, cu atat forma functiei adoptate este mai adecvata reprezentarii datelor experimentale respective). Metoda are un domeniu larg de utilizare dar prezint dificultati in ceea ce priveste gasirea criteriului de verificare, acestea putand fii: 1- presupunand ca functia care corespunde curbei din graficul intocmit pe baza datelor studiate are forma: (6.21) y = a + bx + cx 2 + dx 3 si pentru variatia cu x a variabilei x, ii corespune variatia y a variabilei y, rezulta:

y + y = a + b( x + x ) + c( x + x ) + d ( x + x )
2

(6.22)

Efectuand calculele din partea dreapta a relatiei (6.22) i facand diferenta dintre (6.22) i (6.21) se obtine: (6.23) y = bx + c2 x + d3 x + 2cx + 3d2 x x + (3dx )x 2

) (

Deoarece b,c, d i x sunt constante, termenii inscrisi inter paranteze sunt constante i se pot nota cu a', b' respectiv c', astfel incat relatia (6.23) va deveni: (6.24) y = a'+b' x + c' x 2 Procedand in continuare similar cu etapa anterioara, se calculeaza diferentele de ordinul doi i respectiv trei, rezultand: (6.25) 2 y = a"+b" x; 3 y = a" = const. Relatia (6.25) exprima faptul ca daca, x=const., atunci diferentele de ordinul trei 3y ale variabilei y din relatia (6.21) sunt constante, sau altfel spus, daca 3y=const., datele studiate cu ajutorul carora s-au calculat aceste diferente, pot fi reprezentate matematic prin functia data de forma relatiei (6.21). 2- Uneori, pentru stabilirea criteriului de verificare, unele diferente trebuie logaritmate, astfel vom avea, pentru functia: (6.26) y = a + bc x (si presupunand de asemenea ca pentru variatia cu x a variabilei x, ii corespune variatia y a variabilei y), rezulta: (6.27) y + y = a + bc ( x + x ) = a + bc x c x Procedand ca i in cazul precedent (adic efectuand calculele din partea dreapta a relatiei (6.27) i facand diferenta dintre (6.27) i (6.26)), se obtine: (6.28) y = b c x 1 c x

Unde, produsul din paranteza este o constanta, deoarece a,b,c respectiv x= const. Prin logaritmarea relatiei (6.28), rezulta:

lg y = lg[b c x 1 ] + x lg c
Notand constantele cu b', respectiv c', se obtine:

(6.29) (6.30)

lg y = b'+ c' x

122

Lucrarea 6

Deoarece partea dreapta a egalitatii (6.30) nu este o constanta, se continua prin calcularea diferentelor logaritmilor lui y: (6.31) lg y + (lg y ) = b'+ c' ( x + x ) = b'+ c' x + c' x Facand diferenta dintre (6.31) i (6.30), rezulta:

(lg y ) = c' x = const.

(6.32)

Aceasta constituind criteriul de verificare in cazul probei tabelare pentru functia de forma (6.26). Observatie: Ajustarea se mai poate efectua cu polinoame care aproximeaza grupe de date studiate pe baza metodei celor mai mici patrate, numarul de puncte intr-un grup alegandu-se impar (3 sau 5), grupul de puncte fiind folosit pentru ajustarea valorii centrale (de exemplu y3 in grupul de valori y1, y2, y3, y4, y5, dupa care grupul se deplaseaza pentru incorporarea valorii urmatoare (y2, y3, y4, y5, y6). In cazul in care se folosesc polinoame de gradul intai (ajustare liniara), pentru grupuri compuse din trei sau cinci puncte, se indica relatiile de calcul de ajustare (6.33), unde avem notatiile: y0 - valoarea care se ajusteaza 0 - valoarea ajustata y-1 y1 respectiv y-2 y2 - valorile simetrice fata de y0 - Ajustarea dupa trei puncte:

y 0 = ( y 1 + y 0 + y1 ) 3
~

y 1 = (5 y 1 + 2 y 0 y1 ) 6
~

y1 = ( y 1 + 2 y 0 + 5 y1 ) 6
~

- Ajustarea dupa cinci puncte:

y 0 = ( y 2 + y 1 + y 0 + y1 + y 2 ) 5
~

(6.33)

y 1 = (4 y 2 + 3 y 1 + 2 y 0 + y1 ) 10
~

y1 = ( y 1 + 2 y 0 + 3 y1 + 4 y 2 ) 10
~

y 2 = (3 y 2 + 2 y 1 + y 0 y 2 ) 5
~

y 2 = ( y 2 + y 0 + 2 y1 + 3 y 2 ) 5
~

2. Determinarea parametrilor formulelor empirice Dup stabilirea formei trebuie sa se determine valorile constantelor ecuatiei, metoda cea mai cunoscuta i cea mai precisa, fiind metoda celor mai mici patrate. Metoda consta din exprimare conditiei de minim a sumei patratelor distantelor punctelor observate la curba de ajustare. In cazul a trei variabile procedeul este similar i se ajunge la o suprafata de ajustare. Pentru functiile liniare sau care se pot liniariza printr-o transformare convenabila, determinarea parametrilor formulelor empirice se mai poate realiza i prin metode aproximative. Datorita formei de prezentare mult mai simplista a acestor metode, chiar daca precizia de determinare a constantelor este mult mai scazuta, se intilnesc situatii in care sunt preferate metodei anterioare. Rezultatele obtinute prin metode aproximative, pot fi imbunatatite ulterior sub aspectul preciziei lor (daca este necesar), prin aproximari succesive sau prin alte metode.

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

123

Alegerea metodei de determinare a valorilor constantelor se face: - in functie de forma relatiei matematice, inclusiv deci de numarul de constante pe care le contine; - in functie de precizia cu care se cer a fi stabilite de procesul supus observatiei; - in functie de existenta mijloacelor de calcul necesare. 2.1. Metodele aproximative de determinare a valorilor constantelor In general, ca metode aproximative se folosesc: - metoda grafica a liniei drepte; - metoda punctelor selectionate/ alese; - metoda mediilor; - metoda momentelor. 2.1.1. Metoda grafica a liniei drepte, se poate folosi pentru orice functie cu doua (2) constante daca aceasta poate fi liniarizata sub forma data de relatia (6.2) i se efectueaza in continuarea probei grafice de verificare a formei relatiei matematice. Astfel, cu ajutorul datelor studiate y1, y2, ,yn care corespund valorilor x1, x2, ,xn s-au calculat functiile Xi=f(xi) i Yi=f(yi), s-au inscris punctele de coordonate XI, Yi, intr-un grafic in coordonate normale i s-a trasat dreapta astfel incat sa se acorde tuturor punctelor ponderi cat mai egal posibil. Determinarea constantelor acestei drepte se determina prin alegerea a doua puncte de pe dreapta, cat mai departe posibil unul fata de celalalt, punctele avand coordonatele X', Y' i respectiv X", Y", valorile lui X' i X" putandu-se alege chiar din cele inscrise pe axa absciselor.

Y Y" .. Y' A 0 p1 x x p2 c b X'

pn-1

pn x x e f d X" X

Fig.6.1: Graficul pentru determinarea constantelor ecuatiei unei drepte Avand relatia (6.2), se stie ca valoarea lui A este ordonata la origina, iar valoarea lui B este panta dreptei, astfel ca din asemanarea triunghiurilor ce se formeaz, "Abc" i "Ade", (Fig.6.1), rezulta:

A=
Iar din triunghiul "cfe" se obtine:

Y ' X "Y " X ' X " X ' Y "Y ' X " X '

(6.34)

B=

(6.35)

Dup calcularea valorilor A i B utilizand relatiile de mai sus, cunoscandu-se functiile A=fa) i B=f(b), se determina valorile constantelor a i b ale functiei y=f(x,a,b). Cu ajutorul functiei obtinute dupa introducerea valorilor numerice ale lui a i b se calculeaza valorile y corespunzatoare lui x, precum i abaterile absolute i relative ale acestora fata de valorile y1, y2, ,yn, rezultate in urma masuratorilor. Daca pentru toate valorile lui y calculate se obtin abateri satisfacatoare, se apreciaza ca functia obtinuta este corespunzatoare reprezentarii datelor studiate respective. In caz contrar (adic pentru unele puncte, valorile

124

Lucrarea 6

lui y rezultate din calcul au abateri mari fata de datele masurate, i exista certitudinea ca sau efectuat corect calculele) se pot trage urmtoarele concluzii: - nu s-au acordat ponderi egale tuturor punctelor de pe grafic la trasarea dreptei Y=A+BX; - forma relatiei stabilite inaintea determinarii constantelor nu reprezinta im mod satisfacator datele studiate, astfel ca se impune alegerea i verificarea altei forme; O recomandare, pentru trasarea cat mai corect posibil a dreptei, este utilizarea "metodei punctelor extinse", metoda ce presupune parcurgerea urmatoarelor etape: - datele studiate se impart in doua grupe egale (sau aproximativ egale daca numarul lor este impar), corespunzatoare valorilor mici ale lui X i respectiv ale celor mari; spre exemplu: p1..p5, respectiv pn-5 ..pn; - se calculeaza mediile aritmetice ale valorilor X i Y din fiecare grupa, determinandu-se astfel coordonatele centroidei punctelor apartinand fiecarei grupe; Pentru exemplul dat:

X
-

p1 ... p5

1 1 X 1...5 ; Y p1 ... p5 = Y1...5 ; 5 5

p n 5 ... p n

1 1 X n 5...n ; Y p1 ... p5 = Yn 5...n ; 5 5

se traseaza dreapta care trece prin centroidele celor doua grupe. Este demonstrat faptul ca dreapta care trece prin centroidele celor doua grupe, trece i prin centroida tuturor punctelor, care (pentru exemplul dat) are coordonatele X

p1 ... pn

si Y p1 ... pn .

Verificarea metodei se face calculand coordonatele centroidei tuturor punctelor, acesta inscriandu-se apoi in grafic; daca acesta se afla pe dreapta centroidelor celor doua grupe (minim i maxim), atunci se apreciaza ca graficul a fost corect trasat. 2.1.2. Metoda punctelor selectionate se poate folosi pentru toate formele de functii, inclusiv pentru cele liniare sau care sunt transformabile sub forma liniara, metoda fiind destul de exacta i relativ simpla pentru determinarea constantelor functiilor cu trei sau patru constante i care au forma polinoamelor: (6.36) y = a + bx + cx 2 + L + qx n Etapele de lucru sunt: - pe graficul trasat pentru stabilirea formei relatiei se aleg un numar de q puncte, egal cu numarul constantelor pe care relatia stabilita le contine, aceste puncte fiind alese cat mai departate intre ele, evidentiindu-se insa punctele de la extremitatile graficului; - se inlocuiesc succesiv in relatie cele q perechi de valori ale lui x i y, obtinandu-se un sistem de q ecuatii cu q necunoscute; - se rezolva acest sistem, determinandu-se necunoscutele, adic cele q constante. Daca relatia aleasa este liniara sau poate fi liniarizata in raport cu constantele sale, rezolvarea sistemului de ecuatii se usureaza, folosind determinantii. Astfel, avand spre exemplu reprezentarea datelor studiate definite de relatia: (6.37) y = a + bx + cx 2 Se aleg de pe grafic cele trei puncte de coordonate (q=numarul constantelor, q=3): x1,y1; x2,y2; x3,y2 i fara sa se mai introduca aceste valori in relatia (6.37) se scrie direct ecuatia sub forma determinantului:

x2 x12
2 x2 2 x3

y1 1 x1 y 2 1 x2 y 3 1 x3
Relatie care se mai poate scrie sub forma:

=0

(6.38)

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

125

1 x1 0 = 1 x2 1 x3

x12 y1 2 x2 y y 2
2 x3

x1 x2 x3

x12 y1 1 x12 y1 1 x1 2 2 x2 + y 2 1 x2 x y 2 1 x2 x 2
2 x3 2 y 3 1 x3

(6.39)

y3

y 3 1 x3

Unde: y1, y2, y3 i x1, x2, x3 respectiv x12, x22, x32 sunt valori numerice. Calculandu-se determinantii i identificandu-se coeficientii cu (6.37) se determina valorile constantelor, verificarea corectitudinii efecturii calculelor realizandu-se prin introducerea in cadrul relatiei (6.37) a valorilor constantelor determinate a,b,c i una din valorile lui x1, x2, x3 , calculandu-se apoi valoarea lui y care trebuie sa rezulte egala cu cea de pe grafic, corespunzatoare valorii x alese. Verificarea metodei, a concordantei relatiei obtinute cu datele studiate, se face introducand in ecuatie i alte valori ale lui x, inclusiv cele periferice i calculandu-se valorile lui y; daca abaterile valorilor calculate ale lui y fata de cele studiate sunt acceptabile, atunci se apreciaza ca relatia stabilita este adecvata reprezentarii matematice a datelor studiate, in caz contrar, procedandu-se in modul aratat la metoda grafica a liniei drepte. 2.2. Metoda celor mai mici patrate, permite determinarea cu maximum de precizie a valorilor constantelor pentru orice forma de ecuatie, atribuindu-se ponderi egale sau neegale, diferitelor date experimentale, singurul dezavantaj al acesteia fiind volumul mare de calcule necesare a fi efectuate. 2.2.1. Formularea metodei celor mai mici patrate Metoda clasica de definire a parametrilor unei functii pe baza datelor studiate se bazeaza pe minimizarea patratelor abaterilor fata de functie a rezultatelor masuratorilor. Se pot intalni urmtoarele situatii practice: 1- Daca numai masuratorile variabilei dependente au fost susceptibile de erori, toate masuratorile valorilor y1, y2,, yn ale variabilei dependente fiind efectuate cu aceasi precizie (abaterile inregistrate sunt egale pentru toate valorile variabilei y), principiul metodei celor mai mici patrate consta in aceea ca estimarea constantelor a,b,c, ale functiei y=f(x, a,b,c), se face din conditia ca suma patratelor abaterilor valorilor rezultate experimental/ studiate, fata de cele calculate cu relatia cautata pentru curba respectiva sa ia valoarea minima, adic:

[y
i =1

f ( xi ; a, b, c L)]

2 min

(6.40)

2- Daca masurarile sunt de precizie inegala, dar se cunosc rapoartele ponderilor wi ale masuratorilor, care sunt invers proportionale cu dispersiile (w1=1/12, w2=1/22 , , wn=1/n2), (precizia este procentual constanta), atunci expresia (6.40) se inlocuieste prin:

[y
i =1

f ( xi ; a, b, c L)] wi

min

(6.41)

3- Daca masurarile au fost repetate pentru fiecare valoare xi, iar drept yi se ia media aritmetica a rezultatelor masuratorilor repetate din seria respectiva, atunci drept ponderi ale msurrilor se pot lua numarul de masurari ale seriei wi=nI, conditia formulata aplicandu-se in cazul determinarii constantelor unei functii de mai multe variabile. Se admite totodata ca abaterile a caror suma a patratelor trebuie sa fie minima, se masoara paralel cu axa y, ceea ce echivaleaza cu a admite ca masurarile variabilei independente x sunt exacte, nefiind afectate de erori aleatoare (ceea ce simplifica mult calculele). Din conditiile mentionate, se pot desprinde cateva cazuri particulare de aplicare a metodei celor mai mici patrate, i anume:

126

Lucrarea 6

2.2.2. Determinarea parametrilor unei functii liniare O aplicatie obisnuita a metodei celor mai mici patrate consta in determinarea parametrilor unei functii liniare (sau a altor functii cu doua constante, care au fost transformate sub forma liniara), de forma: (6.42) y = a + bx Pentru o valoare experimentala yi, care prezint o abatere yi fata de valoarea determinata de relatia (6.42), se poate scrie: (6.43) y i = a + bxi + yi ; sau yi = y i a bxi Ecuatia cautata este determinata de conditia de minimum a sumei abaterilor:
2 yi i =1 n min = ( y i a bxi ) i =1 n 2 min

(6.44)

De unde:

n ( yi a bxi )2 =0 a i =1 n ( yi a bxi )2 =0 b i =1
Obtinandu-se ecuatiile:

(6.45)

(6.46)

2 xi ( y i a bxi ) = 0; 2 ( y i a bxi ) = 0
i =1 i =1

(6.47)

sau:

a xi + b xi2 = xi y i ;
i =1 i =1 i =1

(6.48)

an + b xi = y i
i =1 i =1

(6.49)

Obtinand in final:

a = y b x =

x y x x y
2 i =1 i i =1 i i =1 i

n n xi xi i =1 i =1
n 2 n n n

i =1 2

x y nx y x = y x nx
i i 2 i 2

(6.50)

b=

n xi y i xi y i
i =1 i =1 i =1

n xi2 xi i =1 i =1
n n

xi y i n x y x

2 i

nx

(6.51)

Unde:

i =1

= ;

xi = x;
i =1

y
i =1

= y;

Erorile standard ale celor doi parametrii, a i b, conform relaiilor anterioare, sunt:

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

127

a =

xi
i =1 n 2

n xi x i i =1 i =1
n

yi =

xi
i =1

i =1

2 yi

n 2 n 2 n n xi x i i =1 i =1

(6.52)

b =

n n xi xi i =1 i =1
n 2 n 2

yi =

i =1 2 n

2 yi 2

n n xi xi i =1 i =1
2 yi

(6.53)

Unde yi se calculeaza cu relatia de definire:

yi =

(y

a bxi ) n

(6.54)

n
(6.55)

Pentru linia dreapta ce trece prin origine, deci pentru functia:

y = bx
procedandu-se ca in cazul precedent, rezulta:

b=

x y
i =1 n i

xi2
i =1

(6.56)

2.2.3. Determinarea parametrilor polinomului de gradul doi Daca functiile nu pot fi scrise sub forma: y=a+bx, se procedeaza de asemenea, la rezolvarea sistemului de ecuatii obtinut prin anularea derivatelor partiale in raport cu constantele sumei patratelor abaterilor valorilor calculate y fata de cele rezultate experimental yi. Astfel spre exemplu, pentru parabola exprimata de relatia (6.37):

y = a + bx + cx 2
Calculul constantelor tinand cont de (6.41), se afla prin rezolvarea sistemului de ecuatii:

as 0 + bs1 + cs 2 = y i wi as1 + bs 2 + cs3 = y i xi wi as 2 + bs3 + cs 4 = yi xi2 wi


i =1 i =1 n i =1 n

(6.57) (6.58) (6.59)

Unde:

s m = xim wi ; m = 0,1,2,3,4
i =1

(6.60)
2 2

In final se vor obtine urmtoarele expresii pentru calculul parametrilor functiei:

[ x x a=
2 2

( x ) ] y [ x x x x ] xy + [ x x ( x ) ] x
3 2 4 2 3 3 0 0

y0

N
3 4 2 2

[ x x x x ] y [( x ) b=
0

n x 4 N

] xy + [ x x
0

n x 3

] x

y0

128

Lucrarea 6

[ x x c=
N=
Unde:

( x ) ] y [n x x x ] xy
2 2 3 2 0

+ n x 2 ( x )

] x y
2

N
4

Numitorii notati cu N fiind identici, calculandu-se cu relatia:

[ x x
2

( x ) ]n ( x x x x ) x + [ x x ( x ) ] x
3 2 4 2 3 3 2 2

i =1

= iar x i y0, precum i puterile acestora, au semnificatia unor valori oarecare xi i y0i

Observatie: Printr-o alegere judicioasa a axelor, ecuatia functiei liniare data de relatia (6.42), va fii:
y = a1 + b x x

(6.61)

Unde:

a1 = y ;
n

: = + sau a a b x 1 n n

b=

n xi y i xi y i
i =1 i =1 i =1

(6.62)

n x xi i =1 i =1
n n 2 i

Verificarea metodei se face calculand urmatorii parametrii: 1- suma celor mai mici patrate datorita abaterilor in raport cu functia liniara:

2 y/x

(y =

yc )

n2

(6.63)

unde yc reprezinta valoarea calculata pentru y. Ratiunea pentru care s-a folosit la numitor n-2 si nu n-1 (ca in cazul distributiei monofactoriale) este ca se pierd doua grade de libertate cand se estimeaza a si b. 2- suma celor mai mici patrate explicata prin regresie:

xi y i 2 = SY b x y /X i i n
2 2 3- se determina raportul S Y / X Sy/x .

(6.64)

4- folosind tabelul lui Fischer (Anexa D) pentru un nivel de incredere ales, i un numar de grade de libertate 1=1 si 2=n-2 se citeste valoarea calculata a functiei de repartitie corespondente, F12.
2 2 5- Comparand valoarea raportului S Y / X S y / x cu valoarea critica, F12(critic), (determinata

tabelar pentru numarul gradelor de libertate propuse), daca:


2 2 SY / X S y / x > F 1 2 critic

(6.65)

metoda se poate aplica, rezultatele obtinute fiind corecte. In caz contrar, observatiile trebuie sa fie considerate intamplatoare. 2.2.4. Limitele intervalului de incredere pentru parametri estimati Metoda celor mai mici patrate ne ajuta sa determinam cele mai probabile valori ale constantelor care intra intr-o ecuatie, pentru aceasta nefiind necesara nici o ipoteza asupra

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

129

legii de repartitie a variabilei aleatoare y. In cazul unei functii liniare (sau a altor functii cu doua constante care au fost transformate sub forma liniara), daca repartitia lui Y este normala i observatiile sunt fcute la intamplare se poate construi un interval de incredere pentru parametrii functiei, cu ajutorul estimatorilor punctuali, abaterile/erorile constantelor a i b, respectiv a2 i b2, i a abaterii valorii mediei aritmetice a variabilei dependente y, y. In acest scop se foloseste distributia Student, cu n-2 grade de libertate. Statistica (n-2)Sy/x2/a2, are o repartitie 2 , pentru un nivel de semnificatie obtinandu-se urmtoarele intervale de incredere bilaterale ale valorilor adevarate a i b:

B =bt

n 2;

x y nx y t b = x nx
i i 2 2 i

n 2;

Sy/x
xi x
2

(6.66)

A= at
Avand:

n 2;

a = y b x t

n 2;

.S y / x

1 2 +x n
2

x x i

(6.67)

y = t

n 2;

.S y / x

xi x 1 + 2 n 2 xi n x

(6.68)

Avand determinate limitele intervalelor de incredere se pot trasa functiile, care au expresiile:
y = y y = a + b x x y y = a + (b b ) x x y = a a + b x x

(6.69)

(6.70)

(6.71)

Din reprezentarea lor grafica (Fig.6.2), se observa ca estimarea pentru coeficientul a prezint o mai mica importanta, reprezentand numai intersectia cu axa OY, panta avand o mai mare importanta, respectiv coeficientul b, acesta indicand marimea i directia in care variaza variabila dependenta y.

y = a + (b + b )x

y = (a + a ) + bx

y = a + bx

y = a + bx

y = a + (b b )x
x

y = (a a ) + bx

Fig.6.2: Reprezentarea grafica a functiilor, avand limitele intervalelor de incredere 2.2.5. Criteriul lui Gauss pentru determinarea functiei optime O functie de forma y=f(x) va descrie cu atat mai bine setul de date studiate cu cat minimul expresiei S2 calculate pentru functia respectiva este mai apropiat de valoarea nula,

130

Lucrarea 6

alegandu-se ca functie optima, pentru setul de date studiat, functia care indeplineste cat mai bine aceasta conditie. Repartitia Gauss ne permite sa comparam doua reprezentari dandu-ne posibilitatea sa stabilim care din ele se apropie cel mult de forma optima. In acest scop cu ajutorul relatiei
2 2 2 (6.63) se calculeaza dispersia S x / y pentru cele doua functii, respectiv S x / y ,1 , S x / y , 2 .

Deoarece relatia (6.63) reclama un volum mare de calcule, in special in cazul esantioanelor mari, se utilizeaza o relatie mai simpla: (6.72) y2 a y b x y x y n

S x2/ y =

n2

( ) ]
i i

2 2 Comparand valorile obtinute pentru cele doua reprezentari, S x / y ,1 respectiv S x / y , 2 , se va

alege ca fiind reprezentarea optima cea pentru care dispersia are valoarea cea mai mica. 3. Corelatia Fie cazul a doua variabile aleatoare X cu repartitia N(xx2) i Y cu repartitia N(yy2), repartitia acestora nu poate fi redata numai prin momentele celor doua variabile luate separat, ci este necesar sa se caracterizeze i covariatia. Spre deosebire de legatura de regresie care reprezinta legatura dintre doua variabile, din care una aleatoare iar alta cunoscuta sau data (deci nealeatoare), legatura de corelatie se refera la un cuplu de doua variabile aleatoare a carui legatura poate fi caracterizata de coeficientul de corelatie. Densitatea de probabilitate a functiei de repartitie normala cu doi parametrii (bivariata) este data de expresia:

f ( x, y ) = 1

2 x y

x 1 x exp 2(1 ) x 1

x x 2 x

y y y

y y + y

(6.73)

Functia de repartitie fiind:

F ( x, y ) = P ( X x, Y y ) = 1 2 x y

1 x x x 2 (1 )

x x 2 x

y y y

y y + y

(6.74)

dxdy

Unde: este coeficientul de corelatie, avand o valoare cuprinsa in intervalul: -1< <1 i defineste gradul de dependenta dintre variabile. Observatie: 1- daca =0, cele doua variabile sunt independente, in acest caz relatia (6.73) se poate pune sub forma: ( y y )2 ( x x )2 2 1 1 2 2 (6.75) f ( x, y ) = e 2 x e y = f (x ) f ( y )

x 2

y 2

fiind astfel pusa in evidenta conditia de independenta. 2- Daca II>0, variabilele x,y sunt dependente aleator, coeficientul teoretic de corelatie fiind dat de media produselor abaterilor normate:

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

131

= M
Sau:

x x y y x y
n

(6.76)

= (xi x )( yi y )
n i =1

2 2 ( xi x ) ( y i y ) i =1 i =1

(6.77)

Coeficientul de corelatie poate fi estimat cu relatia:

e = ( xi x )( yi y )
n i =1

xi x i =1 n

2 n

yi y i =1

(6.78)

Sau cu expresia mai usor calculabila:


n 1 n n xi y i + xi y i n i =1 i =1 i =1

e =

n 2 1 n 2 n 2 1 n 2 x i x i y i y i n i =1 n i =1 i =1 i =1

(6.79)

Observatie: Se subliniaza faptul ca acest coeficient de corelatie nu este aplicabil dect in cazul a doua variabile cu repartitii normale, pentru alte cazuri conceptul nefiind fundamentat, putand eventual caracteriza un grad de asociere. Legatura de corelatie pentru cele doua variabile aleatoare X,Y mai poate fi exprimata i functiie de mediile variabilelor, i anume: - deoarece s-a considerat variabila X independenta, pentru fiecare valoare particulara xi, ii va corespunde lui Y un ansamblu de valori yi repartizate normal. La fiecare valoare a lui xi corespunde o valoare medie y/xi a lui Y, deci cand x descrie un anumit domeniu, punctele y/xi descriu o dreapta a carei ecuatie este:

y/x = y +
-

y (x x ) x

(6.80) (6.81)

pentru o anumita valoare xi ansamblul valorilor yI are dispersia:


2 2 y 1 2 ) /x = y (

se stie ca o functie y=f(x) se poate scrie i sub forma x=(y), astfel ca legatura dintre variabilele aleatoare X i Y se poate obtine i fixand Y i determinand mediile variabilei X corespunzatoare:

x/ y = x +
cu dispersia:

x (y y ) y

(6.82) (6.83)

x2/ y = x2 (1 2 )

ecuatiile (6.80) i (6.82) reprezinta in cazul dispersiilor constante dreptele de regresie: (6.84) y = y + yx ( x x )

x = x + xy ( y y )
unde:

(6.85)

yx = y x ; xy = x y

132

Lucrarea 6

C. Desfasurarea lucrarii:
1. Tema: Se considera cazul determinarii debitului de fluid in functie de cusa pistonasului in cazul unui drosel. In timpul experimentului in functie de cursa pistonasului, (in mm): 1; 2; 3; 4; 5; 6; 7, se obtin valorile debitului de fluid (in 1/min): 1.25; 1.75; 2.00; 2.75; 3.50; 4.00; 5.75. Sa se determine functia care reprezinta cel mai bine datele experimentale, pentru un nivel de incredere de 0.950, (1-=95%). 2. Prelucrarea rezultatelor: In vederea determinarii functiei care reprezinta cel mai bine datele experimentale, se va aplica metoda metoda celor mai mici patrate, trasandu-se intr-un sistem de axe ortogonale graficul obtinut in urma prelucrarii datelor. Utilizand functiile oferite de software-ul Excel, metoda celor mai mici patrate, presupune parcurgerea urmatorilor pasi: 1.1se va vizualiza variatia valorilor yi ale variabilei dependente (debitul de fluid) (valori care in cadrul raportului Excel ocupa adresele: B21-B27), in functie de xi (cursa pistonasului) (valori care in cadrul raportului Excel ocupa adresele: C21-C27) reprezentand grafic valorile observate (vezi Lucrarea1), avand pe abscisa valorile cursei pistonasului, iar pe ordonata valorile debitului de fluid, (Fig.6.3):
variatia debitului in functie de cursa
8.00 6.00 4.00 2.00 0.00 0 2 4 6 8 cur sa p ist o nasului 1.25 1.75 2.00 2.75 3.50 4.00 5.75 valorile xiyi

Fig.6.3: Reprezentarea grafica a valorilor observate xi, yi 1.2se alege formula empirica pentru reprezentarea datelor, considerandu-se ca functia care ar reprezenta cel mai bine datele experimentale este functia liniara (6.2):

Y = A + BX
1.2.1- se considera ca functia care ar putea reprezenta cel mai bine sirul de date experimentale este de forma (6.61):
y = a1 + b x x

1.2.2- se determina parametrii functie liniare presupuse (6.62):

a1 = y ;
n

sau a a b x : = + 1

b=

n xi y i xi y i
i =1 i =1 i =1

n x xi i =1 i =1
n n
2 i

parcurgand pasii:

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

133

1- se calculeaza sumele valorilor xi, yi, respectiv Utilizand Excel, vom avea: =SUM(B21:B27), obtinand

xi ; yi i produsul
i =1 i =1

xi y i ;
i =1 i =1

x
i =1 n i =1

= 28, valoare care va ocupa in continuare adresa B28; = 21, valoare care va ocupa in continuare adresa C28;
n

=SUM(C21:C27), respectiv

y
n

=B28*C28, obtinand valoarea raportului Excel adresa B31.

xi yi =588, valoare care va ocupa in continuare in cadrul


i =1 i =1

2- se calculeaza valoarea produsului xiyi , respectiv valoarea sumei acestui produs,

x y
i =1 i

Astfel: =B21*C21; =B22*C22; =B27*C27, valori care vor ocupa in cadrul raportului adresele D21D27; respectiv: =SUM(D21:D27), obtinand valoarea

x y
i =1 i

=103.5, avand adresa D28.

3- se calculeaza valorile xi2 yi2, respectiv valorile sumelor acestora,

x ; y
2

i =1

i =1

aplicandu-se functiile: =POWER(B21,2); =POWER(B22,2); =POWER(B27,2), valorile acestora ocupand in continuare adresele E21-E27; =POWER(C21,2); =POWER(C22,2); =POWER(C27,2), ocupand adresele F21-F27; Respectiv: =SUM(E21:E27), obtinand valoarea =SUM(F21:F27), obtinand valoarea
2

x
i =1 n

=140, avand adresa E28; =77.5, avand adresa F28;


2

y
i =1

n n 4- se calculeaza valorile xi ; y i : i =1 i =1 n =POWER(B28,2), obtinand valoarea xi =784, avand adresa B29; i =1 n =POWER(C28,2), obtinand valoarea y i i =1
5- se calculeaza valorile mediilor x =

=441, avand adresa C29;

xi
i =1

,y =

y
i =1

=B28/7, obtinand valoarea x =4, ocupand in continuare adresa B30; =B28/7, obtinand valoarea y =3, ocupand in continuare in cadrul raportului adresa C30;

134

Lucrarea 6

6- se calculeaza valoarea parametrului b, avand relatia de calcul anterioara, care utilizand functiile Excel este de forma: =(7*D28-B28*C28)/(7*E28-B29), obtinand valoarea b=0.7, valoare care o vom aseza in cadrul raportului Excel la adresa B33. 7- se calculeaza, avand valoarea parametrului b al functiei aproximate, parametrul a1, utilizand functia: =C30, deoarece valoarea acestui parametru este egala cu valoarea mediei, y , astfel incat: a1=3, valoare ce va ocupa in continuare adresa B34 in cadrul raportului Excel. 8- se calculeaza valoarea parametrului a, utilizand functia: =B34-B33*B30, valoarea obtinuta fiind: a=0.21, valoare ce va ocupa in continuare adresa B35 in cadrul raportului Excel. 9- se determina functia, acum ca avem valorile parametrilor a1 i b, calculate, obtinandu-se: y=3+0.7(x-4), astfel ca vom obtine functia: y=0.2+0.7x 1.3se verifica statistic valabilitatea functiei obtinute, pentru nivelul de incredere de 0.950, (1-=95%), parcurgand urmtoarele etape: 1- se calculeaza suma celor mai mici patrate datorita abaterilor in raport cu functia liniara (6.63):

2 y/x

(y =

yc )

n2

in prealabil fiind necesar calculul valorilor yc (valorile calculate pentru yi): =0.2+0.7*B21; =0.2+0.7*B22; =0.2+0.7*B27; obtinand astfel valorile (ce vor ocupa adresele G21-G27 in cadrul raportului Excel): yc1= 0.9; yc2= 1.6; yc3= 2.3; yc4= 3.0; yc5= 3.7; yc6= 4.4; yc7= 5.1; Astfel se pot calcula in continuare valorile (yi-yc), respectiv (yi-yc)2: =POWER(C21-G21,2); =POWER(C22-G22,2); =POWER(C27-G27,2); valorile obtinute ocupand adresele H21-H27 in cadrul raportului Excel.
2 Reusind in final sa calculam valoarea S y /x: 2 =POWER(SUM(H21:H27)/5,2), obtinand valoarea "reziduala", S y / x =0.0339, valoare ce va

ocupa in continuare adresa B38; 2- se calculeaza suma celor mai mici patrate explicata prin regresie (6.64):

x y 2 xi y i i i = SY b /X n
Astfel:

2 =B33*(D28-B28*C28/7), obtinand valoarea, S Y / X =13.5804, valoare ce va ocupa adresa B39 2 2 3- se determina raportul S Y / X Sy/x : 2 2 =B39/B38, obtinand valoarea, S Y / X S y / x =401.1211, valoare ce ocupa adresa B40.

4- folosind tabelul lui Fischer (Anexa D, Lucrarea 4) pentru un nivel de incredere de 0.950, (1-=95%) i un numar de grade de libertate 1=1 si 2=n-2 (se pierd doua grade de libertate cand se estimeaza a si b), se citeste valoarea calculata a functiei de repartitie corespondente, F12: F12=4.06

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

135

2 2 5- se compara valoarea raportului S Y / X S y / x cu valoarea critica, F12(critic), (determinata

tabelar pentru numarul gradelor de libertate propuse), adica: 401.1211 >4.06 Astfel (6.65):
2 2 SY / X S y / x > F 1 2 critic

6- avand acest rezultat, in concluzie se ia decizia: "Pentru un nivel de incredere de 95% dreapta y=0.2+0.7x concorda cu datele prelucrate" 1.4in vederea determinarii limitelor intervalului de incredere, se construieste un interval de incredere pentru parametrii functiei, cu ajutorul estimatorilor punctuali, abaterile/erorile constantelor a i b, respectiv a2 i b2, i a abaterii valorii mediei aritmetice a variabilei dependente y, y, calculandu-se in prealabil valorile a, respectiv b. In acest scop se foloseste distributia Student, cu n-2 grade de libertate, statistica (n-2)Sy/x2/a2, avand o repartitie 2 , astfel (6.66), (6.67):

B =bt

n 2;

x y nx y t b = x nx
i i
2 2 i
2

n 2;

Sy/x
x x i

A= at
Avand (6.68):

n 2;

a = y b x t
2

n 2;

.S y / x
2

1 2 +x n
2

xi x

y = t

n 2;

.S y / x

x x i 1 + 2 n xi2 n x

Pasii parcursi fiind: 1- folosind tabelul repartitie Student (Anexa C, Lucrarea 4) pentru un nivel de incredere de 0.950, (1-=95%, =5%=0.05) i un numar de grade de libertate =n-2 (se pierd doua grade de libertate cand se estimeaza a si b), se citeste valoarea calculata a functiei de repartitie corespondente, t,: t,=2.015 2- se determina valoarea b, utilizand functiile Excel: =$B$42*(POWER($B$38,1/2)/POWER(7*$E$28-$B$29,1/2)), obtinand valoarea b=0.0265, valoare ce va ocupa adresa B43 in cadrul raportului Excel. 3- se determina de asemenea valoarea a, utilizand functiile: =$B$42*$B$38*(POWER(1/7+$B$29/(7*$E$28-$B$29),1/2)), obtinand valoarea a=0.1388, valoare ce va ocupa in continuare in cadrul raportului Excel, adresa B44. 4- se determina dreptele de redresie, care au expresiile (6.70), (6.71):

y = a + (b b )x y = a a + bx

Obtinand in final functiile: y=0.2+(0.7 0.0265)x respectiv y=(0.2 0.1388)+0.7x

136
y = 0.7x + 0.2 R2 = 1

Lucrarea 6

FUNCTIA LINIARA
6 5 valorile yi 4 3 2 1 0 0 2 4 valorile xi

Fig.6.4: Reprezentarea grafica a functiei liniare determinate 1.5Desi dreapta de ecuatie:

y=0.2+0.7x reprezinta o buna aproximatie pentru datele studiate, ne propunem sa determinam o alta functie care cautam sa fie mai apropiate de valorile masurate, astfel: 1.5.1- Observand alura liniei de regresie (Fig. 6.3) i comparand-o cu formele cele mai uzuale dar i cea mai aproximativa, alegem ca functie de reprezentare analitica a rezultatelor experimentale functia (6.6):

y = ae bx
Pentru care se foloseste transformarea prin logaritmare(6.7):

lg y = lg a + (b lg e) x
In acest caz avand (6.8):

Y = lg y; X = x; A = lg a; B = b lg e
1.5.2- se determina parametrii functiei alese:

b=

n xi lg y i xi lg y i
i =1 i =1 i =1 2 0.4343n xi2 xi i =1 i =1 n n

lg a =

n xi xi lg y i xi2 lg y i
i =1 i =1 i =1 i =1

n xi2 xi i =1 i =1
n n n

parcurgand in principiu aceiasi pasi ca i in cazul anterior: 1- se calculeaza sumele valorilor xi, lgyi, respectiv Utilizand Excel, vom avea:

xi , lg yi i produsul
i =1 i =1

xi lg yi ;
i =1 i =1

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

137

=SUM(B21:B27), obtinand
n

x
i =1 i

= 28, valoare care va ocupa in continuare adresa B28;

Pentu calculul sumei

lg y
i =1

, este necesar in prealabil calculul logaritmilor lg y i , astfel:

=LOG10(C21), =LOG10(C22), , =LOG10(C27), valorile obtinute fiind: lgy1=0.097 ; lgy2=0.243; lgy3=0.301; lgy4=0.439; lgy5=0.544; lgy6=0.602; lgy7=0.760, valori care vor va ocupa in continuare adresele D21-D27; =SUM(D21:D27), ne va da valoarea sumei logaritmilor,

lg y
i =1

=2.986, valoare care va

ocupa in continuare in cadrul raportului Excel adresa D28. 2- se calculeaza valoarea produsului xilgyi , respectiv valoarea sumei acestui produs,

x lg y
i =1 i

=B21*D21; =B22*D22; =B27*D27, valori care vor ocupa in cadrul raportului adresele F21F27, acestea fiind: x1lgy1=0.097; x2lgy2=0.486; x3lgy3=0.903; x4lgy4=1.757; x5lgy5=2.720; x6lgy6=3.612; x7lgy7=5.318, respectiv: =SUM(F21:F27), obtinand valoarea

x lg y
i =1 i

=14.894, avand adresa F28.

3- se calculeaza valoarea xi2 respectiv valoarea sumei acesteia,

x
i =1

2 i

, aplicandu-se

functiile: =POWER(B21,2); =POWER(B22,2); =POWER(B27,2), valorile acestora ocupand in continuare adresele E21-E27; Respectiv: =SUM(E21:E27), obtinand valoarea
2

x
i =1

2 i

=140, avand adresa E28;

n 4- se calculeaza valoarea xi : i =1 n =POWER(B28,2), obtinand valoarea xi =784, avand adresa B29; i =1


5- se calculeaza valorile
2

x lg y
i =1 i i =1 n n i =1 n

x lg y
i =1 2 i i =1

, respectiv

x x
i =1 i i =1

lg yi :

=B28*D28, obtinand valoarea =E28*D28, obtinand valoarea raportului adresa B31; respectiv: =B28*F28,

xi lg yi =83.611, ocupand in continuare adresa B30;


i =1 n

xi2 lg yi =418.005, ce va ocupa in continuare in cadrul


i =1 i =1

x x
i =1 i i =1

lg y i =417.026, valoare care va ocupa adresa B32 in cadrul raportului.

138

Lucrarea 6

6- se calculeaza valoarea parametrului b, avand relatia de calcul anterioara, care utilizand functiile Excel este de forma: =(7*$F$28-$B$28*$D$28)/(0.4343*(7*$E$28-$B$29)), obtinand valoarea b=0.243, valoare care o vom aseza in cadrul raportului Excel la adresa B33. 7- se calculeaza, avand valoarea parametrului b al functiei aproximate, parametrul lga, utilizand functia: =(7*$B$28*$F$28-$B$29*$D$28)/(7*$E$28-$B$29), astfel incat vom obtine: lga=0.011, valoare ce va ocupa in continuare adresa B34 in cadrul raportului Excel. 8- se calculeaza valoarea parametrului a, utilizand functia: =EXP($B$34), valoarea obtinuta fiind: a=1.011, valoare ce va ocupa in continuare adresa B35 in cadrul raportului Excel. 9- se determina functia, acum ca avem valorile parametrilor a i b, calculate, obtinandu-se: y=1.011e0.243x 1.6studiul statistic al valabilitatii functiei: y=1.011e0.243x pentru nivelul de incredere de 0.950, (1-=95%), se realizeaz cu ajutorul testului Fischer, parcurgand urmtoarele etape: 1- se calculeaza suma celor mai mici patrate datorita abaterilor in raport cu functia liniara (6.63):

2 y/x

(y =

yc )

n2

in prealabil fiind necesar calculul valorilor yc (valorile calculate pentru yi): =$B$35*POWER(2.718,$B$33*B21); =$B$35*POWER(2.718,$B$33*B22; =$B$35*POWER(2.718,$B$33*B27); obtinand astfel valorile (ce vor ocupa adresele G21G27 in cadrul raportului Excel): yc1= 1.289; yc2= 1.642; yc3= 2.093; yc4= 2.667; yc5= 3.399; yc6= 4.332; yc7= 5.521; Astfel se pot calcula in continuare valorile (yi-yc), respectiv (yi-yc)2: =POWER(C21-G21,2); =POWER(C22-G22,2); =POWER(C27-G27,2); valorile obtinute ocupand adresele I21-I27 in cadrul raportului Excel.
2 Reusind in final sa calculam valoarea S y /x:

=POWER(SUM(I21:I27)/5,2) sau =POWER($I$28/5,2), obtinand valoarea "reziduala",


2 Sy / x =0.0016, valoare ce va ocupa in continuare adresa B38;

2- se calculeaza suma celor mai mici patrate explicata prin regresie, de aceasta data relatia fiind:

xi lg yi 2 SY / X = b lg ae xi lg y i n
Astfel:

2 =B33*LOG10(B35)*EXP(F28-B28*D28/7), obtinand valoarea, S Y / X =0.0221, valoare ce va

ocupa adresa B39


2 2 3- se determina raportul S Y / X Sy/x : 2 2 =$B$39/$B$38, obtinand valoarea, S Y / X S y / x =13.628, valoare ce ocupa adresa B40.

4- folosind tabelul lui Fischer (Anexa D, Lucrarea 4) pentru un nivel de incredere de 0.950, (1-=95%) i un numar de grade de libertate 1=1 si 2=n-2=5, se citeste valoarea calculata a functiei de repartitie corespondente, F12:

Analiza grafica a rezultatelor. Determinarea functiei de regresie optime

139

F12=4.06 5- se compara valoarea raportului S


2 Y/X 2 Sy / x cu valoarea critica, F12(critic), (determinata

tabelar pentru numarul gradelor de libertate propuse), adica: 13.628 >4.06 Astfel (6.65):
2 2 SY / X S y / x > F 1 2 critic

6- avand acest rezultat, in concluzie se ia decizia: "Pentru un nivel de incredere de 95% dreapta y=1.011e0.243x concorda cu datele prelucrate"
FUNCTIA EXPONENTIALA
6.000 5.000 valorile yi 4.000 3.000 2.000 1.000 0.000 0 2 4 valorile xi 6 8

y = 1.0111e 0.2425x R2 = 1

Fig.6.5: Reprezentarea grafica a functiei exponentiala determinata 1.7In acest moment avem doua functii care conform testului Fischer concorda cu datele prelucrate, pentru nivelul de incredere ales, (1-=95%), astfel ca este imperios necesar a se determina functia optima pentru setul de date studiat. Repartitia Gauss ne permite sa comparam doua reprezentari dandu-ne posibilitatea sa stabilim care din ele se apropie cel mult de forma optima, pentru aplicarea acestui criteriu
2 fiind necesare compararea valorilor obtinute pentru cele doua reprezentari, S X / Y ,1 respectiv 2 SX / Y ,2 .

Astfel:
2 2 13.5804 > 0.0221, respectiv: S X / Y ,1 > S X / Y , 2

se observa ca functia: y=1.011e0.243x are dispersie mai mica ceea ce ne conduce la concluzia ca: "Functia: y=1.011e0.243x concorda intr-un grad mai nalt cu datele studiate" aceasta concluzie fiind putand fi vizualizata i in figura 6.4 (respectiv Fig.6.5):

D. Prezentarea rezultatelor:
Rezultatele vor fi prezentate sub forma unui raport (vezi Anexa6) ce cuprinde: - reprezentarea datelor primare, sirul de date; - reprezentarea tabelara a datelor calculate necesare determinarii parametrilor functiilor alese; - reprezentarea tabelara a valorilor parametrilor functiilor alese; - reprezentarea tabelara a limitelor intervalelor de incredere a functiilor alese; - reprezentarea tabelara a datelor calculate necesare verificari functiei alese/ipotezei i prezentarea deciziei;

140

Lucrarea 6

[1] [2] [3] [4] [5] [6] [7] [8]

reprezentarea criteriului de determinare a functiei de regresie optime; Bulgaru, M., Bolboaca, L., Ingineria calitatii.Mangementul calitatii, statistica i control, nasurari in 3D, Alma Mater, Cluj-Napoca 2001, ISBN 973-85153-0-0 Ciocirdia, C., Ungureanu, I., Bazele cercetrii experimentale in tehnologia constructiilor de masini, Editura Didactica i Pedagogica Bucuresti, 1979, Deaconescu, A., Deaconescu, T., Managementul calitatii. Aplicaii, Editura Omnia Uni S.A.S.T., Brasov, 2001, ISBN 973-9478-65-4 Cathy, K., EXCEL pentru Windows tm 95 in 503 imagini, Teora, Bucuresti, 1999, ISBN 973-601-457-6 Faithe, W., Microsoft Office 97 Professional 6in 1, Teora, Bucuresti, 1998, ISBN 973601-907-1 Szuder, A., Luncas, I., Arsenoiu, L., Bazele cercetrii experimentale in tehnologia constructiilor de masini, Indrumator de laborator, Institutul Politehnic Bucuresti, 1990 Tanasescu I Controlul statistic al proceselor si produselor, Editura didactica si pedagogica, Bucuresti, 1987. *** Colectie de standarde, Managementul i asigurarea calitatii, Editura tehnica, Bucuresti, 1996

E. Bibliografie:

S-ar putea să vă placă și