Sunteți pe pagina 1din 5

1

Prelucrarea datelor care exprim dependena liniar a dou variabile




1 Scopul lucrrii
Lucrarea prezint modul de prelucrare a datelor n cazul n care dou mrimi sunt n
dependena liniar.

2 Aspecte teoretice
Aceste date se obin la msurarea unei mrimi Y ale crei valori sunt determinate de
cele ale unei alte mrimi X, mrime care la rndul su ia valori ntr-un interval dat.
Dac aceast dependen Y=Y (X) poate fi reprezentat de ecuaia unei drepte se spune c
avem o dependen liniar, adic irul de date Y este dependent liniar de X.
Datorit faptului c msurrile sunt afectate de diverse tipuri de erori i c mrimea Y
este influenat i de ali factori cu caracter ntmpltor, pentru aceeai valoare a lui X se obin
diverse valori pentru Y, aflate ntr-un cmp.
A prelucra acest ir de date nseamn, n principal, a determina ecuaia dreptei care
exprim cel mai bine dependena respectiv i cmpul n care se ncadreaz dependena
respectiv. Pentru a realiza aceast prelucrare se apeleaz, ca i n cazul eantionului
constant, la metodele din statistic.

2.1 Determinarea ecuaiei
Dac se consider c ecuaia dreptei este de forma general: Y = A + BX trebuie s se
determine valorile A i B. Valorile acestor parametri se determin cu o precizie bun prin
metoda celor mai mici ptrate.
Metoda celor mai mici ptrate permite determinarea celor doi parametri A i B din ipoteza c
dreapta care exprim cel mai bine dependena Y = Y (X) corespunde dreptei pentru care:
( ) =

=
2
1

N
i
i
Y Y minim (1)
unde:Y
i
sunt valorile obinute la msurri pentru Y;
Y

, valorile de pe dreapt;
N, numrul de valori (i = 1,, N)
innd seama de ecuaia dreptei, relaia (4) devine:
( ) | | = +

=
2
1
N
i
i i
BX A Y minim (2)
n relaia (2), valorile X
i
, Y
i
sunt perechile de valori experimentale. Parametrii A i B
sunt variabilele. Pentru a determina pe A i B, n condiiile n care suma este minim, se fac
derivatele pariale n raport cu variabilele A i B i se egaleaz cu zero. Astfel se obine:
( ) | |
| |
( ) | |
( ) | | 0 2
0 ) ( 2
1
2
1
1
2
1
= + =
c
+ c
= + =
c
+ c

=
=
=
=
i i
N
i
i
N
i
i i
N
i
i
N
i
i i
BX A Y X
B
BX A Y
BX A Y
A
BX A Y

Opernd n continuare se obine succesiv:


2
i i i i
i i
i i i i
i
i
Y X X B X A
Y X B NA
Y X BX AX
Y BX A




= +
= +
= +
= +
2
2
,

Sistemul se poate scrie i sub form matricial:
i i
i
i i
i
Y X
Y
B
A
X X
X N



= .
2

(3)
Din rezolvarea sistemului se obin valorile parametrilor A i B ai dreptei care
reprezint irul de date.
2.2 Ecuaia n variabile normate
Trecnd de la variabila X la variabila normat z se obine:
z =
X
X X
c
A


iar ecuaia de forma: Y = B
o
+ B
1
z
Sistemul din care rezult coeficienii B
o
i B
1
ai ecuaiei este:



=
i i
i o
i i
i
Y z
Y
B
B
z z
z N
1
2
.
N
y
B
i
=
0
;


=
2
1
i
i i
z
z y
B

2.2 Eliminarea unor date aberante

La efectuarea unor msurri pot s apar erori grosolane care duc la apariia unor date
numite aberante. Identificarea acestor date aberante const n:
- Calculul valorilor care caracterizeaz funcia de repartiie normal, folosind datele
obinute experimental, pe eantion;
- Valorile calculate ale funciei se compar cu valorile limit ale acesteia
corespunztoare unui anumit nivel de ncredere ales; datele experimentale care depec
limitele calculate se elimin.
STAS 11278 pentru funcia normal de repartiie, n cazul n care datele experimentale
provin din msurarea pe un eantion, recomand urmtoarea succesiune de depistare a
valorilor aberante :
- Se calculeaz valorile X i s folosind irul de date experimentale cu relaiile:
X = ; / ) (
1
n X
n
i
i
=
s =
1
) (
1
2
2

=

=
n
X X
s
n
i
i

- Se ordoneaz irul de date n ordine cresctoare X
1
, X
2
, ,X
n
. Valoarea minim
corespunde lui X
1
, iar valoarea maxim lui X
n
;
- Se calculeaz:


3

u
1
= (X X
1
) / s i u
n
= (X
n
X) / s (4)

- Se compar valorile u
1
i u
n
cu valorile critice h extrase din tabelul 2.3(Ungureanu,
2002); valorile din tabel sunt calculate pentru eantioane de mrimi n=3,4,... i diverse
nivele de ncredere: 1 = 0,9 ; 0.925 ; 0.95 ; 0.975.
Dac u
1
h sau u
n
h ipoteza privind caracterul aberant al rezultatelor poate fi
acceptat i deci valorile respective se elimin din irul de date. Dup aceasta, calculele se
reiau de la capt i n continuare se pot nc elimina valori din noul ir, dac este cazul, pn
cnd u
1
< h i u
n
< h. De reinut c nu se elimin simultan i u
1
i u
n
, chiar dac ambele pot fi
n afara intervalului. Se elimin mai nti cea cu valoarea lui u mai mare, dup care se reia
calculele de la nceput i dac este cazul se elimin n pasul 2.

2.3 Aplicarea unor teste de omogenitate i adecvan
Pentru caracterizarea dependenei obinute se impune aplicarea unor teste.
Testul de omogenitate arat dac cmpurile de valori obinute experimental sunt omogene n
toate punctele, adic au valori apropiate care pot fi exprimate prin aceeai dispersie.
n cazul n care pentru fiecare valoare k a lui X
k
experienele se repet de n ori, numrul de
repetri fiind acelai pentru fiecare experien, omogenitatea se poate verifica cu testul G bazat pe
criteriul lui Cochran.
Pentru aplicarea testului G se calculeaz valoarea G
max
cu relaia:
G
max
=
| |

=
m
k
Dk
Dk
s
s
1
2
max
2

(5)
n care:
- | |
2
Dk
s max este dispersia cu valoarea maxim din irul de dispersii pentru k = 1,, m;
- numitorul reprezint suma dispersiilor pentru cele m iruri de date (puncte).
Dispersiile se calculeaz cu relaia:
( )
1
1
2
2

=

=
n
Y Y
s
n
i
k ki
Dk

(6)
Dac G
max
< G
t
se accept ipoteza c dispersiile sunt omogene. Valoarea lui G
t
se alege din tabelul
2.10 [1], funcie de nivelul de ncredere 1 ales, numrul gradelor de libertate al dispersiilor
D
= n
1 i numrul m al valorilor din care au rezultat dispersiile.
n cazul n care dispersiile sunt omogene, dispersia care se adopt s
D
este cea medie i se
calculeaz cu relaia:
m
s
s
m
k
Dk
D

=
=
1
2

(7)
Prin testul de adecvan se stabilete dac ecuaia aleas pentru a reprezenta datele
experimentale este adecvat precum i msura acestei adecvane. Se poate testa adecvana ecuaiei
pentru a reprezenta datele experimentale folosind testul F (Fisher). Pentru a aplica acest test se
calculeaz:
2
2
D
A
s
s
F = (8)
unde:


4
2
D
s , reprezint dispersia adoptat ca medie a valorilor n cele m puncte;
2
A
s , dispersia adecvanei.
Dispersia adecvanei se determin cu relaia:
( )
2

1
2
2


=
=
m
Y Y
s
m
k
k k
A

(9)
n care:
k k
Y Y

reprezint diferenele de la valorile de pe dreapt la valorile medii calculate pentru


fiecare valoare experimental pentru X.
Valoarea lui F calculat se compar cu o valoare F
t
aleas din tabelul 2.8 (Ungureanu, 2002).
Valoarea lui F
t
din tabel se stabilete funcie de numrul de grade de libertate
1
=
A
ale numrtorului
i respectiv
2
=
D
ale numitorului pentru un anumit nivel de ncredere 1 ales.
Dac F F
t
, se consider c ecuaia aleas pentru reprezentarea datelor experimentale, pentru
nivelul de ncredere ales, este adecvat. Dac F > F
t
, ecuaia aleas nu este adecvat pentru
reprezentarea irului de date experimentale.

2.4 Semnificaia coeficienilor dreptei

Nu ntotdeauna, o valoare diferit de zero poate fi luat n considerare, avnd n vedere c
valoarea respectiv corespunde valorii celei mai probabile i c ea se gsete ntr-un cmp. De regul,
dac cmpul de variaie pentru un coeficient este superior valorii sale, acesta poate fi considerat
nesemnificativ.
Pentru a stabili semnificaia coeficienilor determinai pentru dreapt se pot aplica diverse
teste. n toate cazurile se pleac de la dispersia
2
T
s calculat pe baza reziduurilor fa de dreapta de
reprezentare.
2 2 2
A D T
s s s + = (10)
n cazul cnd experienele sunt ortogonale, ceea ce nseamn c pentru ecuaia exprimat funcie
de variabila normat z este ndeplinit condiia z
i
=0, se determin mai nti dispersia coeficienilor B
o

i B
1
ai ecuaiei cu relaiile:

= =
2
2
2
1
2
2
;
i
T
B
T
Bo
z
s
s
N
s
s (11)
Dup aceasta se determin intervalul de variaie B
i
al coeficienilor cu relaia:
B
i
= t B
I
(12)
Dac
i i
B B A > pentru nivelul de ncredere ales se poate aprecia c aceti coeficieni sunt
semnificativi.
Variabila t este cuantila t a distribuiei Student, care se alege din tabelul 2.5(Ungureanu,
2002), funcie de i nivelul de ncredere 1 stabilit.

Determinarea parametrilor de cmp ai dependenei

Cea mai simpl metod de a determina cmpul n care se gsesc valorile dependenei Y =
Y(X) fa de dreapta determinat plecnd de la tabloul de date, este de a lua n considerare dispersiile
coeficienilor s
2
Bi
calculai la testarea semnificaiei coeficienilor.
Abaterile medii ptratice s
Bi
reprezint parametrul de cmp pentru fiecare coeficient.
Astfel se poate scrie:
Y = B
o
z s k B s k
B Bo
) (
1
1
2 1
1
2
+


5
Coeficientul k
1
2
se poate alege corespunztor unui anumit nivel de ncredere 1 adoptat i
funcie de numrul de experiene (msurri), tabelul 2.8 (Ungureanu, 2002).
Bibliografie
1. Ungureanu, I. Bazele cercetrii experimentale, Editura Universitii Piteti, 2002.

S-ar putea să vă placă și