Sunteți pe pagina 1din 100

CAPITOLUL I.

INTRODUCERE


I.1. OBIECTUL STATISTICII MATEMATICE

Dezvoltarea impetuoasa a stiintelor, mai ales a celor exacte, in timpul ultimului
secol, este indisolubil legata de utilizarea unor noi metode de cercetare, mult mai complexe
de cat cele "traditionale". Printre acestea, statistica matematica ocupa un loc deosebit de
important. Ea este utilizata astazi in marea majoritate a stiintelor, pentru prelucrarea datelor
experimentale, deoarece ofera posibilitatea inlocuirii unor termeni vagi, descriptivi, cu date
complete, cifrice. Cu alte cuvinte, tratarea statistica a datelor experimentale cuantifica
diferitele notiuni calitative specifice unor fenomene sau procese din natura.
Statistica matematica este stiinta legilor cantitative din natura si din societatea
umana, avand ca scop prognoza unor fenomene. Baza practica in statistica matematica este
formata din totalitatea valorilor omogene obtinute prin observatii (masuratori) organizate.
Baza metodologica a statisticii matematice este teoria probabilitatilor.
Statistica se refera la:
- informatii cantitative despre orice fenomen, obtinute cu ajutorul metodei de
observatie de masa;
- studiul fenomenelor de masa in scopul gasirii legaturilor dintre ele;
- teoria metodei observatiilor de masa.
Principalele probleme ce pot fi studiate cu ajutorul statisticii matematice sunt:
- descoperirea legilor de repartitie a marimilor intamplatoare;
- elaborarea metodelor de obtinere a evaluarilor parametrilor repartitiei marimilor
intamplatoare.
Codificarea aspectelor calitative, in sensul cuantificarii lor dupa intensitate,
frecventa, durata sau reaparitie, este o etapa importanta in metodologia de cercetare.
Codificarea calitativa si cantitativa permite prelucrarea complexa a datelor obtinute prin
observare sau experiment, cu ajutorul calculatoarelor, usurand si accelerand evidentierea
unor legitati, ceea ce este greu de realizat cu ajutorul tehnicilor clasice de prelucrare si
analiza.
Precizarea legitatilor dupa care are loc un fenomen se poate face si prin observarea
si descrierea acestuia, dar aceasta metoda necesita un numar mare de cazuri observate si
1
deci o munca anevoioasa. Asocierea metodelor descriptive cu cele experimentale, de
laborator si urmarirea variatiei diferitilor parametri caracteristici, fac posibile nu numai
stabilirea formei matematice a legilor ce guverneaza fenomenul studiat, dar si extrapolarea
datelor pentru valori nemasurate practic. Prelucrarea datelor experimentale cu ajutorul
statisticii matematice, pune la dispozitia analistului metode de stabilire sau de masura a
erorii pe langa cele de stabilire a esentei fenomenului studiat. Chiar si in domeniul practicii
experimentale, in care exista deja metode bine cunoscute datorita unor numeroase cercetari,
se pot aduce multe imbunatatiri, prin utilizarea in mai mare masura a modelarii, prin
introducerea unor noi teste de semnificatie, prin studiul esantionului experimental
comparativ cu lotul martor, etc. Testele de semnificatie certifica daca existenta a doua
aspecte ale unui fenomen este certa sau cazul unui singur fenomen cu o limita de
variabilitate mai mare.
Metodele statistice de prelucrare a datelor experimentale pot de asemenea reproduce
modelul legaturilor multiple corelative ale fenomenelor si indica gradul, intensitatea
acestor corelatii, ca si eroarea probabila a parametrilor de corelatie, de regresie. In unele
cazuri, aceasta poate fi atat de mare, incat sa puna in dubiu valabilitatea si deci existenta
corelatiei respective. In fine, una din cele mai importante metode de cercetare pe care
statistica matematica ne-o pune la dispozitie, pe baza unor calcule probabilistice, se refera
la proiectarea in viitor a fenomenelor complexe cercetate in prezent, inlocuind viziunea
incerta cu calcularea desfasurarii probabile a evenimentelor.


I.2. DEZVOLTAREA ISTORICA

Termenul de "statistician" a aparut pentru prima oara in studiile stiintifice inca din
secolul IV. Termenul de "statistica" (de la termenul latinesc "status", ce inseamna "stare") a
fost folosit pentru prima oara de J.F. von Bielfeld, in "Bazele eruditiei universale" (1770).
Un capitol al acestei carti se numeste "Statistica", prin aceasta intelegandu-se studiul
structurii politice a statului (G.U.Yule si M.G.Kendall, 1960). Mai tarziu, termenul este
folosit de Gottfried Achenwell (1794), pentru a defini stiinta descriptiva aparuta la aceea
vreme despre conducerea statului, cercetand probleme intrate mai apoi in geografia
populatiei (date cu privire la densitatea de populatie, conditiile politice, produse fabricate in
tara, etc.). Ulterior, prin dezvoltarea teoriei probabilitatilor, statistica a evoluat de la o
stiinta descriptiva la una analitica.
2
Teoria probabilitatilor, care ulterior a stat la baza dezvoltarii teoriei cinetice a
gazelor, teoriei erorilor, fizicii nucleare, calculelor zborurilor cosmice etc., a aparut in
legatura cu rezolvarea problemelor puse de jocurile de hazard (zaruri,ruleta, carti de joc
etc.). Incepand cu secolul al XV-lea, multi matematicieni au incercat sa prevada sansa
jucatorilor, a impartirii mizelor intre jucatori: Luca Paciolo (1445-1514), Blaise Pascal
(1623-1662), Pierre Fermat (1601-1665), Cristian Huygens (1629-1695), sau numarul de
partide necesar fiecarui jucator pentru a castiga (Gerolamo Cardano, 1501-1576).
Incercand sa rezolve problema ruinarii jucatorului, Jacob Bernoulli (1654-1705) a
demonstrat teorema ce ii poarta numele, ce sta la baza teoriei probabilitatilor. Metodele
pentru rezolvarea problemelor teoriei jocurilor de hazard au fost apoi dezvoltate de
Abraham de Moivre (1667-1754), demonstrand o teorema ce a fost apoi generalizata de
Laplace (teorema Moivre-Laplace). Leonard Euler a rezolvat apoi o serie de probleme ale
teoriei jocurilor de hazard, cu aplicatie in asigurari si demografie.
O importanta deosebita in teoria probabilitatilor o are metoda celor mai mici
patrate, elaborata de Pierre Simone Laplace (1749-1827) si Adrian Marie Legendre (1752-
1833), confirmata si de Karl Friedrich Gauss (1777-1855). P.L.Cebisev (1821-1894) a
introdus in stiinta si a folosit pe larg notiunea de marime intamplatoare, descoperind de
asemenea metoda momentelor.
Francis Galton (1911-1926) a aplicat pentru prima data analiza de corelatie a
marimilor statistice, fiind unul din intemeietorii revistei engleze "Biometrica" in care s-au
tiparit articole privind metodele de statistica matematica in biologie. De asemenea, la
sfarsitul secolului XIX-lea, statistica matematica a inceput sa fie aplicata in Europa
apuseana in probleme psihologice si morale (statistica capacitatilor mentale la elevi,
statistica penala etc.).
A.A.Markov (1856-1922) a elaborat teoria "experimentelor in lant", care a stat la
baza teoriei dezagregarii radioactive. Karl Pearson (1857-1936) a introdus pentru prima
data in statistica matematica coeficientul de variatie, marime ce a generat o noua orientare
in biometrie. Wiliam Gosset, care a publicat lucrarile sale sub pseudonimul Student, a
elaborat teoria selectiei. Ulterior, au evoluat cu succes discipline derivate din teoria
probabilitatilor, precum teoria informatiei sau cibernetica.




3
CAPITOLUL II. METODOLOGIA CERCETARII


Procesul de cercetare stiintifica este o suita logica de operatii ce cuprinde
pregatirea, elaborarea si sinteza studiului efectuat. Din punctul de vedere al succesiunii in
timp, se pot distinge cinci etape mai importante in decursul cercetarii. In practica, aceste
etape nu sunt net separate, procesul cercetarii necesitand adesea actiuni de tip feed-back.
Etapele temporale mai importante sunt comentate in cele ce urmeaza.


II.1.FIXAREA OBIECTULUI, SCOPULUI, ALEGEREA DOCUMENTATIEI
SI PRECIZAREA PREMIZELOR DE PORNIRE.

Fixarea obiectului si scopului cercetarii consta in stabilirea principalelor activitati
de studiu pentru elucidarea teoretica a unei probleme si fenomenele (independente de
vointa cercetatorului) ce urmeaza a fi observate pentru testare. Observatia si experimentul
sunt doar principalele categorii de investigare, cu utilitate maxima pentru culegerea datelor
experimentale.
Obiectul si scopul cercetarii se fixeaza pe baza unei cercetari bibliografice. Aceasta
presupune sintetizarea a cat mai multe din cunostintele sau studiilor efectuate in domeniul
respectiv pana la data respectiva si a rezultatelor acestora. Procesul cercetarii impune de
obicei o completare continua a documentatiei, functie de problemele ce apar pe parcurs, dar
baza o constituie documentatia initiala. Ea serveste atat precizarii cat mai bune a scopului
urmarit cat si economosirea timpului de cercetare pentru studiul unor aspecte deja analizate
de alti cercetatori.
Premizele de pornire se precizeaza stabilindu-se variabilele independente ce vor fi
studiate, functie de scopul urmarit. Premizele principale ale studiului specifica daca studiul
isi propune verificarea unor ipoteze noi sau neverificate sub toate aspectele, testarea
corelatiei unor fenomene sau a unor aspecte ale unui fenomen, determinarea legitatilor de
dependenta a unor variabile etc.




4

II.2. ALEGEREA METODELOR DE CERCETARE SI PRELUCRARE

Metodele de cercetare se aleg in general functie de natura si scopul studiului.
Metoda cea mai generala este cea a observatiei. In cercetarile de laborator cel mai des se
foloseste metoda experimentala. De cele mai multe ori insa aceste doua metode se imbina
pe parcursul procesului de cercetare, predominand alternativ in diversele etape ale acestuia.
Metoda observatiei consta in urmarirea desfasurarii unor fenomene din natura
sau societate pentru a putea analiza dinamica fenomenelor respective sau a sintetiza
caracteristicile esentiale obtinute prin compararea mai multor fenomene, subiecti sau
probe. In cazul cercetarii fenomenelor cu caracter aparent aleator, aceasta metoda este
foarte importanta. Pornind de la cazuistica numeroaselor masuratori individuale, se trece la
sinteza aspectelor identice sau diferite ale fenomenelor studiate. In observatia bazata pe
criterii unitare, pentru a putea utiliza metodele statistice de prelucrare a datelor
experimentale, datele obtinute trebuiesc grupate dupa caracteristicile esentiale.
Metoda experimentala este afectata mai mult de personalitatea cercetatorului,
deoarece in acest caz, el are posibilitatea de a decide singur obiectul si metoda cercetarii.
Metoda experimentala presupune reducerea fenomenului studiat la scara de laborator,
analiza aspectelor sau detaliilor urmarite, combinarea si corelarea diferitelor elemente si
sintetizarea rezultatelor in functie de scopul precizat initial. Aplicarea acestei metode insa
este limitata de posibilitatea de a dispune de mijloacele necesare reproducerii fenomenului
studiat, obtinerii unei cazuistici suficient de bogate, descompunerii analitice a informatiei si
sintetizarii acesteia.
Cele doua metode de cercetare prezinta deci diferente mari. Adesea insa, in practica,
in decursul aplicarii metodei experimentale, apare necesitatea combinarii acesteia cu
observarea procesului experimentat. Atunci cand se alege metoda de cercetare se fixeaza si
tehnica amanuntita a cercetarii si a prelucrarii datelor obtinute. Nu intotdeauna se pot
stabili gruparile caracteristice si corelarea acestora anterior inceperii cercetarii. Informatiile
concrete obtinute in decursul procesului de cercetare pot conduce spre alte grupe de date
decat cele fixate initial. Totusi practica arata ca este bine ca acest proces sa fie initializat
pornind de la scopuri, ipoteze, metode si tehnici de cercetare prestabilite.



5
II.3. EFECTUAREA CERCETARII

Procesul cercetarii, indiferent prin ce metoda are loc, trebuie sa indeplineasca o
serie de conditii bine precizate. Cele mai importante dintre acestea sunt:


II.3.1. Delimitarea in volum a colectivitatii cercetate

Indiferent de obiectul cercetarii si scopul urmarit, trebuiesc delimitate marimea,
volumul, numarul fenomenelor, probelor sau a marimilor studiate. In cazul cercetarilor
experimentale, trebuiesc delimitate atat lotul experimental cat si cel martor.
Delimitarea volumului poate fi considerata arbitrara, dependenta numai de vointa
analistului. In realitate, scopul, obiectul si precizia unei cercetari impune si numarul minim
al fenomenelor si probelor observate sau experimentale. Posibilitatile practice (tehnice,
financiare, de timp) ale analistului stabilesc de obicei limita superioara a acestui numar.
Majoritatea fenomenelor nu pot fi caracterizate pe un numar oricat de mic de cazuri. Pe de
alta parte, pentru a putea cunoaste esentialul in fenomenul studiat, cercetarea trebuie sa
cuprinda intreaga gama de moduri de manifestare a acestuia.
Atunci cand fenomenul studiat are un volum mic, se prefera studiul sau integral.
Atunci cand fenomenele studiate sunt rare, rezultatele cercetarii partiale se generalizeaza la
intreaga colectivitate din care face parte esantionul studiat cu ajutorul statisticii matematice.
Functie de marimea volumului stabilit pentru colectivitatea cercetata, cercetarea
poate fi integrala sau partiala. Cercetarea integrala este studiul intregului volum al
colectivitatii cercetate, adica a intregii populatii statistice. Cercetarea partiala se limiteaza
la studiul unei parti a populatiei statistice, aleasa in general prin selectie, astfel incat
aceasta sa fie reprezentativa pentru intreaga populatie. Cercetarea partiala poate fi insa si
nereprezentativa pentru intreaga colectivitate. Aceasta situatie apare atunci cand scopul
cercetarii este in primul rand teoretic, de tatonare, pentru fixarea metodelor de cercetare.

Cercetarea partiala poate fi efectuata in mai multe moduri:

- cercetarea prin sondaj are la baza o metodologie precisa, valoarea rezultatelor
obtinute depinzand de corectitudinea precautiilor luate in efectuarea ei corecta,
stiintifica. Tehnica sondajelor, desi prezinta o valoare stiintifica si metodologica
6
importanta, nu permite insa generalizarea concluziilor obtinute din studiul
esantionului, asupra intregii populatii statistice din care acesta face parte.

- cercetarea monografica este un studiu partial, in care volumul restrans al
cercetarii este suplinit de posibilitatea unei aprofundari mai substantiale ale
caracteristicilor esentiale. Acest tip de studiu se preteaza in general cercetarilor
preliminare;

- cercetarea ponderii de baza a colectivitatii presupune selectionarea gruparii cu
ponderea cea mai importanta din cadrul populatiei statistice;

- cercetarea selectiva este cercetarea partiala a unui esantion reprezentativ pentru
intreaga populatie statistica. Cele mai importante metode de cercetare selectiva
sunt:

selectia aleatoare consta in extragerea intamplatoare a cazurilor. Listele contin toate
cazurile, individual, fara nici o grupare sistematica prealabila. Extragerea se
efectueaza prin tragere la sorti pe baza unor tabele de numere intamplatoare combinate
astfel incat fiecare caz (individ statistic) sa prezinte sanse egale de a fi selectat. In acest
caz, selectia aleatoare este simpla. Daca inregistrarea initiala a cazurilor are loc
functie de o grupare prealabila si ulterior se extrag aleator cazurile de cercetat din
fiecare grupa, proportional cu volumul fiecarei grupe, selectia aleatoare este
stratificata.

selectia mecanica este superioara celei aleatoare, fiecare individ (unitate statistica)
avand sanse egale de a fi selectata. Proportia subcolectivitatii studiate se exprima in
procente si se stabileste prin calcule de probabilitate. Pasul de numarare este egal cu
raportul dintre 100 si procentul subcolectivitatii. Daca acest pas este egal cu n, din
populatia totala se aleg cazurile al n-lea, al 2n-lea, al 3n-lea etc. Avantajul acestei
metode este simplitatea extragerii esantionului de cercetat. Dezavantajul este ca uneori
exactitatea rezultatelor obtinute nu este intotdeauna satisfacatoare.

selectia tipica (statificata) se utilizeaza maifrecvent in cazul in care variabilitatea
fenomenelor studiate este mare. Pentru aplicarea acestei metode, cazurile se "zoneaza",
7
se grupeaza pentru o omogenizare superioara. Se alege cate o grupa, specifica unor
zone in care fenomenul are intensitate maxima, medie si respectiv minima. Daca apare
necesitatea unei noi grupari, pentru a se obtine zone si mai omogene, metoda se
numeste selectia in mai multe faze (trepte). Aceasta metoda prezinta avantajul unor
selectii cu un grad ridicat de reprezentativitate pentru populatia totala din care a fost
extras esantionul cercetat. Selectia tipica poate fi combinata, in fazele sale finale, cu
selectia mecanica.

selectia in serii (in cuiburi) are loc atunci cand selectia finala este cercetata in
intregime, fara a se apela la selectie mecanica.


II.3.2. Delimitarea in spatiu a colectivitatii cercetate

Atunci cand variabilitatea datelor este mare in functie de teritoriu, se delimiteaza
volumul cercetarii si se stabileste spatiul (geografic) in care vor fi facute studiile.


II.3.3. Delimitarea in timp a cercetarii

Procesul cercetarii poate fi continuu (permanent), periodic (la anumite intervale de
timp) sau singular (are loc o singura data):

- cercetarea curenta (continua sau permanenta) este necesara in cazul
fenomenelor cu o variabilitate mare in dinamica lor. Pentru studiul lor, se
impune obtinerea unei cazuistici cu volum mare, ca atare observarea trebuie sa
se faca un timp mai indelungat. Acesta poate fi limitat, la o anumita perioada de
timp (cercetare curenta continua) daca fenomenul apare cu o frecventa suficient
de mare, sau poate fi nelimitat (cercetare curenta permanenta).

- cercetarea periodica (la anumite intervale de timp) se foloseste fie in cazul
fenomenelor cu variabilitate mai redusa in timp, fie in cazul fenomenelor cu o
aparitie si evolutie periodica. De asemenea, aceasta metoda se foloseste in cazul
in care volumul selectiei de date obtinute intr-un interval de timp scurt este
foarte mare. In general, in cazul cercetarii periodice, se precizeaza si momentul
8
critic, adica data la care se face observarea sau inregistrarea fenomenelor
studiate. Functie de variabilitatea datelor, momentul critic este o anumita zi si
ora (variabilitate mare) sau numai o data (variabilitate mica).

- cercetarea singulara prezinta de obicei interes atunci cand se verifica
reproductibilitatea unor studii deja efectuate.


II.4. METODE DE MASURA

A masura o marime fizica inseamna a compara marimea respectiva cu o alta
marime de aceeasi natura cu prima, adoptata ca unitate de masura. Rezultatul operatiei de
masura a unei marimi fizice trebuie sa contina urmatoarele informatii: valoarea numerica a
marimii masurate, eroarea cu care aceasta este exprimata, parametrii ce caracterizeaza
conditiile experimentale concret folosite.
Eroarea se mentioneaza in scopul precizarii limitelor in care se cuprinde valoarea
adevarata a marimii masurate si pentru a ilustra precizia metodei de masura folosite. In
cazul in care marimea fizica poate fi masurata prin mai multe metode sau tehnici de
masura, valoarea erorii permite optimizarea procesului de masura in sensul alegerii metodei
si tehnicii de masura cu precizia cea mai mare. De asemenea, daca obiectul si scopul
cercetarii impun exprimarea unor rezultate cu o precizie data, eroarea este un criteriu de
eliminare a metodelor de masura care nu permit atingerea unor performante de masura
adecvate necesitatilor.
Valoarea parametrilor impusi de catre analist pentru efectuarea masuratorii
constituie informatia strict necesara pentru aprecierea reproductibilitatii masuratorilor.
Precizarea conditiilor experimentale in care a fost efectuate masuratoarea se impune si
pentru a permite confirmarea rezultatelor.
Scopul operatiei de masura este determinarea, cu precizie cat mai mare, a valorii
masurate. Pentru a se atinge acest scop, inainte de a se efectua masurarea efectiva a marimii
fizice de interes, trebuie sa se verifice atat functionarea corecta a instalatiei (aparaturii) de
masura folosite cat si precizia oferita de aceasta.
Astfel, se recomanda ca initial sa se masoare cu instalatia respectiva o proba etalon,
a carei caracteristici fizico-chimice sunt bine cunoscute, iar valoarea marimii de masurat
este precizata in tabele de marimi fizice. Daca prin masurare se obtine o valoare a marimii
fizice care aproximeaza valoarea tabelata in limita erorilor admisibile, atunci inseamna ca
9
instalatia de masura functioneaza corect si ca metoda de masura aleasa este suficient de
precisa pentru scopul propus. In cazul in care valoarea obtinuta difera putin de valoarea
tabelata, dar depaseste limitele de eroare admisibila, inseamna ca metoda aleasa nu are
precizia necesara. Daca rezultatul masuratorii este mult diferit de cel tabelat, atunci
inseamna ca instalatia nu functioneaza corect.
Corectitudinea operatiei de masura depinde deci de metoda si mijloacele de masura
adoptate, de conditiile in care au loc masuratorile. Ea este insa influentata, in mod
hotarator, si de pregatirea profesionala, atitudinile de experimentator ale analistului de
atentia acordata masuratorii de catre acesta. Cunoasterea in detaliu a functionarii si modului
de manevrare a instalatiei si mijloacelor de masura, respectarea stricta a ordinii in care
trebuiesc efectuate diferitele etape ale masurarii, a valorii parametrilor experimentali,
constientizarea efectului acestora asupra rezultatului masurarii constituie conditii de baza
pentru obtinerea unor rezultate corecte. Eliminarea surselor ce pot distrage atentia
analistului este o premiza favorabila procesului de masura. De asemenea, cu cat starea de
sanatate este mai buna si eficacitatea analistului creste. O dispozitie pronuntata sau
surmenajul sunt factori care conduc in mod obiectiv la scaderea calitatii masuratorilor
efectuate.
Metodele de masura sunt procedee rationale de executare a operatiei de masura.
Orice metoda de masura are la baza un principiu de masura. Acesta este dat de fenomenul
fizic prin intermediul caruia are loc operatia de masura. De asemenea, o metoda de masura
este caracterizata de corpul sau materialul folosit pentru masuratoare.
De exemplu, masurarea temperaturii cu termometrul se bazeaza pe fenomenul
dilatarii corpurilor odata cu cresterea temperaturilor. Materialul optim pentru masuratori
este mercurul, datorita proprietatilor sale fizice. Astfel, acesta nu unda sticla, se obtine usor
in stare pura si ramane in stare lichida, la presiune normala, pe un interval foarte larg de
temperaturi (-38.6, +356.7C). In plus, coeficientul sau de dilatatie este practic independent
de temperatura pana in jurul valorii de 200C, ceea ce conduce la o scara de etalonare liniara
(cu diviziuni echidistante) a termometrului . De asemenea, mercurul are o caldura specifica
mica, ceea ce confera termometrului inertie mica, adica masurarea temperaturii are loc intr-
un timp suficient de scurt.
Din punct de vedere informational, masurarea poate fi interpretata ca un proces de
inlaturare a unei nedeterminari cu privire la starea obiectului studiat. Informatia de
masurare este egala cu nedeterminarea inlaturata, insa variaza invers fata de aceasta din
10
urma. De aceea, pentru determinarea cantitatii de informatie si cea a gradului de
nedeterminare folosim un indicator unic.
Un fapt care trebuie remarcat este acela ca nedeterminarea maxima initiala variaza
in raport de scara conventionala de masurare. De exemplu, presupunand ca intervalele de
divizare a scarii conventionale au probabilitati egale, nedeterminarea initiala pe scara
duritatii mineralelor, alcatuite din 10 grade de duritate, este mai mica decat nedeterminarea
initiala pe scara seismica cu 12 grade de intensitate.
Sensul informational al procesului de masurare consta in urmatoarele: daca nu
detinem informatii anterioare cu privire la starea obiectului supus masurarii, atunci
diapazonul valorilor sale posibile se disperseaza pe intreaga scara conventionala divizata in
intervale elementare. Rezultatul masurarii ne permite sa localizam cu un anumit grad de
incredere intervalul elementar de pe scara respectiva in care este situata valoarea adevarata
a marimii fizice masurate. Siguranta rezultatului obtinut din masurari este direct
proportionala cu numarul masurarilor efectuate asupra uneia si aceleiasi marimi fizice.
Principalul neajuns al unei scari naturale consta in lipsa de legatura intre diferitele
sale intervale elementare. De aceea, pentru interpolarea valorilor marimii fizice masurate in
interiorul acestor intervale sau pentru o estimare comparativa a lor, se foloseste principiul
divizarii proportionale. De exemplu, pentru a se masura lungimea unui obiect, se aplica pe
acesta succesiv o linie gradata, care reprezinta de fapt operatia de masurare a unitatii de
lungime adoptata.
Totusi, cand se pune problema masurarii simultane a unui ansamblu de marimi
fizice cu game diferite de variatie si unitati de masura diferite, acestea se convertesc mai
intai in semnale de masurare unificate, ca natura (curent electric) si ca gama de variatie (2-
10 mA), dupa care masurarea lor se face cu acelasi aparat avand scara proprie. De altfel,
folosirea convertorului de semnal reprezinta singura metoda de masurare a acelor marimi
fizice pentru care nu sunt inca stabilite unitati de masura corespunzatoare.
Prelucrarea matematica a datelor de masurare este o disciplina stiintifica cu
aplicativitate aproape universala, datorita marii sale capacitati de a reflecta latura
cantitativa a obiectelor din natura si societate. Pentru a construi modelul cantitativ al unui
grup de fenomene ce urmeaza a fi estimate, se impune inainte de toate sa masuram
marimile ce figureaza in acest model.



11
II.4.1. CLASIFICAREA GENERALA A METODELOR DE MASURA

Progresele stiintei si tehnicii din ultimile decenii arata ca aparatele si metodele de
masurat sunt in continua perfectionare si diversificare. De aceea, folosirea lor judicioasa in
raport de natura si precizia necesara presupune inainte de toate cunoasterea exacta a
criteriilor dupa care se clasifica metodele de masura si erorile de masura.
In principiu, metodele de masura se clasifica dupa modul de obtinere a rezultatelor
si aspectul ecuatiilor de masurare, corespondenta dintre numarul ecuatiilor si cel al
necunoscutelor, precizia rezultatelor obtinute din masurari, complexul conditiilor de
masurare, modul de executie al masurarilor, natura si raportul dintre diferite marimi
masurate.
Functie de modul de obtinere a rezultatelor si de forma ecuatiilor de masurare,
metodele de masura pot fi clasificate in metode de masura directe, indirecte sau combinate.
La randul lor toate aceste masurari pot fi considerate dinamice sau statice in raport de
specificul procesului tehnologic.


II.4.2. Metoda de masura directa

Metoda de masura directa se refera la situatiile in care valoarea marimii fizice
masurate se determina direct, cu ajutorul unui singur aparat de masura, si deci nu necesita
calcule ulterioare pentru determinarea ei. In acest sens, avem masurarea unei lungimi cu
metrul sau masurarea unei tensiuni electrice. De asemenea, din categoria masurarilor
directe fac parte si anumite operatii de calcul, cum ar fi diferenta, suma sau produsul dintre
doua numere.
In general, masurarea unei marimi fizice presupune existenta anumitor relatii de
echivalenta si ordonare, stabilirea scarii conventionale, precum si originea acestei scari.
Daca se noteaza N numarul de diviziuni aratate de acul indicator al instrumentului de
masura, pe o scala data a acestuia si cu u valoarea unei diviziuni de pe scala aleasa, atunci
valoarea marimii masurate x este:

x = Nu (II.1)

12

Figura II.1. Clasificarea metodelor de masura

13
Valoarea unei diviziuni de pe o scala a aparatului de masura este raportul dintre
valoarea maxima ce se poate masura pe scala respectiva si numarul maxim de diviziuni
indicate pe scala. De exemplu, rezistenta se determina direct cu ajutorul ohmetrului,
intensitatea cu ajutorul ampermetrului, tensiunea cu ajutorul voltmetrului, etc.
Principial, numarul unitatilor de masura ar trebui sa fie egal cu cel al marimilor
fizice masurate. Totusi, datorita legaturilor de dependenta intre diferite marimi fizice
exprimate prin legi sau ecuatii de definitie, in practica se adopta un numar mic de unitati de
masura fundamentale pe baza carora sunt definite toate celelalte marimi unitare, denumite
din aceasta cauza derivate.
De exemplu, in geometrie este suficienta o singura unitate fundamentala de masura
-unitatea de lungime- celelalte unitati de masura putandu-se determina in functie de aceasta
unitate de lungime. In studiul fenomenelor termice sunt necesare cele trei unitati
fundamentale din mecanica (lungime, masa, timp) la care se adauga o unitate de masura
specifica acestor fenomene, denumita unitate de temperatura.
Pentru ca modelul cantitativ stabilit sa reprezinte realitatea in mod izomorf, este
nevoie de o legatura obiectiva, reala, intre proprietatile fenomenelor studiate si relatiile
matematice folosite. De aceea, caracterul adecvat al marimilor cu care se opereaza in model
reprezinta prima conditie a valabilitatii oricarei analize stiintifice. Pentru a demonstra
corespondenta dintre valorile fizice si numerice, este necesar sa extindem relatia (II.1) la un
sir de marimi fizice x
i
(i = 1, 2, ..., k) masurabile cu aceeasi unitate de masura. In acest caz,
operatia de masurare va fi exprimata astfel:

x
i
=N
i
u(i=1,2,...,k) (II.2)

Daca valorile x
i
se gasesc la intervale egale, atunci intervalul (x
i
, x
j
), exprimat prin
aceeasi unitate de masura u, va fi:

x
j
x
i
= (N
j
N
i
)u = ku (II.3)

Relatia exprima corespondenta dintre valorile fizice echivalente x si valorile numerice
echidistante N.
Daca vom considera doua marimi fizice de aceeasi natura, masurate cu unitati
diferite u si u', ecuatiile de masurare sunt :

14
x
1
= N
1
u = N
1
' u'; x
2
= N
2
u = N
2
'u' (II.4)

t tan cons
N
N
N
N
x
x
'
2
'
1
2
1
2
1
= = = (II.5)

Din analiza ultimelor doua relatii, rezulta ca masurarea poate fi considerata drept
construirea unei dependente functionale de o forma speciala, in care marimile sunt
argumente, iar valorile care le reprezinta sunt functii. Pentru ca, o astfel de functie sa
indeplineasca conditiile descrise, aceasta va trebui sa posede proprietatea de aditivitate.
De exemplu, daca o lungime de 1 m se exprima prin numarul de 100 cm, atunci
doua lungimi de cate 1 m reunite se vor exprima prin numarul 200 egal cu suma celor doua
numere initiale. Evident, de la operatia de adunare se ajunge la toate celelalte operatii
aritmetice. Ca urmare a proprietatii de aditivitate, orice transformare complexa a marimilor
masurate va fi izomorfa fata de operatiile corespunzatoare cu marimile lor, adica cu valorile
care exprima aceste marimi si invers.

Exista mai multe tipuri de metode de masura directa, si anume:

- metoda de masura prin comparare in care marimea fizica de masurat se
compara cu o valoare cunoscuta a unei marimi de aceesi natura. Un exemplu
este masurarea volumului unui corp cu o masura de capacitate.

- metoda de masura prin substitutie consta in evaluarea efectului produs de corpul
caracterizat de marimea fizica de masurat si gasirea unei marimi fizice de
aceeasi natura, care, variata fiind, sa produca acelasi efect. De exemplu, o
rezistanta R
x
poate fi determinata prin aceasta metoda prin masurarea intensitatii
curentului ce o parcurge si apoi prin inlocuirea ei in circuit printr-o cutie de
rezistente. Valoarea rezistentei de determinat R
x
este egala cu valoarea gasita
pentru cutia de rezistenta, care produce in circuit aceeasi valoare a intensitatii
curentului.

- metoda de masura de zero (de echilibru) consta in anularea diferentei intre
efectul produs de valoarea marimii de masurat si cel produs de o marime de
15
aceeasi natura, de valoare cunoscuta. Ca exemplu, o rezistenta R
x
poate fi
masurata prin aceasta metoda daca se foloseste puntea Wheatstone.

- metoda de masura prin coincidenta este utila atunci cand marimea de masurat
poate fi comparata cu anumite semnale regulate, uniforme, standard. De
exemplu, aceasta metoda se foloseste pentru reglarea ceasurilor si a verificarii
exactitatii lor.


II.4.3. Metoda de masura indirecta

O marime fizica este masurata indirect daca ea se determina prin calcul pe baza
masurii directe a altor marimi fizice, in relatie cunoscuta cu cea de determinat. Evident,
numarul marimilor fizice masurate direct este mai mare sau egal cu 2.
Daca notam cu n numarul marimilor fizice ce se masoara direct pentru calcularea
marimii fizice de masurat x, cu N
i
numarul diviziunilor aratate de acul indicator (pe scala
data) de instrumentul ce masoara direct marimea fizica i (i=1,2,..,N) si cu u
i
valoarea
unei diviziuni de pe scala data a aceluiasi instrument, atunci valoarea marimii masurate
indirect este:

x = f(N
1
, N
2
, ,N
n
, u
1
,u
2
, ., u
n
) (II.6)

Prin introducerea valorilor masurate direct in relatia (II.6) se obtin rezultatele masurarii
indirecte in unitati de acelasi fel cu marimea masurata. De exemplu, rezistenta poate fi
masurata si printr-o metoda de masura indirecta: se masoara direct intensitatea si tensiunea
de la bornele ei cu ajutorul unui ampermetru, respectiv a unui voltmetru si apoi se
calculeaza valoarea rezistentei cu ajutorul legii lui Ohm pentru o portiune de circuit. Tot
din aceasta categorie face parte operatia de masurare a suprafetelor care nu se realizeaza
prin comparare directa cu o unitate de suprafata, ci prin intermediul dimensiunilor liniare
caracteristice (curbe, raze, inaltimi linii frante etc.).
Pe langa faptul ca sfera masurarilor indirecte este mult mai larga decat a celor
directe, in multe cazuri primele sunt totusi mai simple. Acest lucru este cu atat mai evident
cu cat anumite marimi nici nu pot fi masurate direct. De exemplu, densitatea unui corp
poate fi determinata numai daca se cunoaste volumul si masa acestuia.
16
In intelesul cel mai apropiat de tehnica prelucrarii automate a datelor, se poate
defini notiunea de masurare ca fiind procesul de receptionare si transformare succesiva a
informatiei despre o anumita marime fizica in scopul compararii ei cu scara conventionala
sau unitatea de masura si folosirea rezultatului obtinut in alte activitati productive. Din
aceasta definitie rezulta ca in procesul de masurare intereseaza nu numai cantitatea de
informatie despre o anumita marime fizica, ci si forma sub care obtinem aceasta informatie,
pentru a fi folosita cu usurinta de om sau masina intr-un ciclu de productie.
Procesul de masurare poate fi interpretat ca un sistem de cibernetica tehnica in care
marimea vectoriala X, supusa unor transformari succesive, apare la iesire sub forma unei
marimi Y legata de prima prin functia dispozitivului de masurat, astfel:

Y = F(X, ) (II.7)

unde X este marime vectoriala de intrare, Y este un operator de transformare si un factor
de influentare a procesului de masurare. De exemplu, in procesul de observare si prelucrare
automata a datelor astronomice, informatiile inregistrate de aparat pot fi transmise
calculatorului electronic, care pe baza unui program ce contine diferite cataloage de stele si
formule, determina automat coordonatele punctului de statie cu precizia necesara.


Figura II.1. Schema-bloc a unui sistem de masurare cu mai multe intrari

17
Datorita variatiei factorilor ce influenteaza direct procesul de masurare, parametrii
functiei de calitate sufera anumite modificari, astfel ca marimea de iesire este cu o eroare
egala cu diferenta dintre rezultatul si valoarea nominala a marimii masurate (vezi Figura
II.1). In acest caz

Y = F (X, ) + (II.8)


II.4.4.Metoda de masura combinata

In cazul aplicarii acestei metode, masurarea aceleiasi marimi fizice are loc in
conditii fizice (experimentale) diferite, valoarea marimii fizice de masurat determinandu-se
prin calcul, respectiv prin rezolvarea unui sistem de ecuatii.
De exemplu, atunci cand nu dispunem de un voltmetru, o rezistenta R
x
poate fi
determinata si printr-o metoda de masura combinata: se monteaza in serie un generator, de
tensiune electromotoare E, un ampermetru si o rezistenta cunoscuta R. Se masoara
intensitatea curentului din circuit. Se monteaza rezistenta R
x
de determinat in locul
rezistentei cunoscute R si se masoara noua valoare a intensitatii curentului din circuit.
Aplicand legea lui Ohm pentru intreg circuitul, pentru cele doua situatii, se obtine un sistem
de doua ecuatii cu doua necunoscute: rezistenta interna r a generatorului si rezistenta de
masurat R
x
.
In cazul metodelor de masura combinate, o parte din marimile si constantele fizice
se masoara direct, iar cealalta parte este dedusa din rezolvarea sistemului de ecuatii. De
exemplu, determinarea alungirii relative a unei bare supuse la intindere se face masurand
lungimea inainte si dupa incercare, iar apoi efectuam raportul procentual dintre diferenta lor
si lungimea initiala. Un alt exemplu de masurare combinata il constituie procedeul
determinarii coeficientilor de temperatura in cazul rezistentei electrice; in acest caz, se
foloseste relatia:

( ) ( ) { } 0 R 20 t 20 t 1 R
i
2
i i 0
= + + i=1, 2, , m (II.9)

unde t
i
si R
i
sunt marimi masurate direct. Dupa rezolvarea sistemului (II.9) se obtin si
parametrii R
0,
si . De fapt, in ultima instanta, orice metoda de masurare presupune si o
operatie de masurare directa, care se efectueaza prin metoda coincidentei, compararii,
18
substitutiei, diferentei etc. Rolul operatorului este acela de a selecta aparatura si metoda de
masurare adecvata, care sa conduca la eficienta maxima.


II.4.5. Alte tipuri de metode de masura

Corespondenta dintre numarul ecuatiilor si cel al necunoscutelor din sistemul cu
ajutorul caruia determinam o marime fizica impune si numarul minim de masurari cu
ajutorul carora se poate stabili valoarea marimii fizice considerate, care constituie categoria
masurarilor necesare sau singulare. Daca numarul determinarilor este mai mare decat cel al
necunoscutelor, spunem ca avem de-a face cu masurari suplimentare sau multiple. De
exemplu, daca in (II.9) avem m> 3, atunci numarul de ecuatii va depasi pe cel al
necunoscutelor, gasindu-ne deci in domeniul masurarilor suplimentare. Acest lucru are un
mare rol atat in ridicarea preciziei de masurare, cat si in preintampinarea eventualelor
greseli care se pot produce in timpul executarii masurarilor.

Din punctul de vedere al gradului de incredere acordat rezultatelor obtinute,
metodele de masura pot fi de inalta precizie, de control si tehnice. Prima categorie de
masurari este legata de acele mijloace tehnice prin intermediul carora se obtin valorile
anumitor constante fizice, precum si cele ale unor etaloane sau unitati de masura. In timpul
executarii unor astfel de masurari, se urmareste ca intregul complex al conditiilor de
masurare sa se mentina relativ constant. De regula, prin conditii de masurare se intelege
continutul concret, starea si influenta in procesul de masurare a unor factori ca: obiectul
supus masurarii, subiectul, aparatura, metodele si conditiile exterioare.
Masurarile de control se executa de regula in scopul verificarii si chiar omologarii
unor aparate noi, sau a unor metode de masurare. In acest caz, se urmareste ca eroarea de
masurare ce afecteaza un anumit rezultat sa nu depaseasca limita dinainte stabilita in raport
de destinatia lucrarilor ulterioare. Toate celelalte masurari se executa in practica curenta, iar
erorile mijloacelor de masurat sunt incadrate intr-o clasa de precizie bine cunoscuta.
Daca ansamblul conditiilor de masurare se mentine constant, cel putin pentru un
anumit interval de timp, spunem ca masurarile sunt de egala pondere. In caz contrar,
masurarile trebuie considerate ponderate. Evident, cunoasterea acestui lucru are o mare
importanta in alegerea metodei de prelucrare ulterioara a datelor experimentale.

19
Dupa cum se stie, ecuatiile fizicii oglindesc raporturi cantitative intre marimi ce
caracterizeaza procese, stari si proprietati ale materiei in miscare sub diversele sale forme
de existenta. In stabilirea acestor raporturi cantitative un rol important il are tipul metodei
de masura. De aceea, tinand cont si de acest considerent, metodele de masura se impart in
conditionate si neconditionate.
Desi in cazul metodelor de masura conditionate marimile masurate nu sunt
dependente functional de alte marimi, intre acestea exista totusi o legatura de forma
empiric-stochastica. In cel de al doilea caz, a metodelor de masura neconditionate, se
determina marimi ale caror ecuatii oglindesc dependente functionale riguroase si comparari
de genul "cu cat" sau "de cate ori" o marime difera de alta marime de aceeasi natura. De
aceea, determinarile neconditionate se impart la randul lor in absolute si relative. In cazul
metodelor de masura absolute comparam intre ele unitati determinate apartinind aceluiasi
sistem de masurare. In cazul celor relative, rezultatele se exprima in unitati conventionale,
in afara sistemelor obisnuite potrivit mijlocului de masurat ales. Un astfel de exemplu ni-l
ofera exprimarea duritatii in unitati Rockwell.


II.5. MIJLOACE DE MASURA

Mijloacele de masura transforma marimea de masurat (semnalul de intrare) in
valoare obtinuta prin masuratori (semnal de iesire). Mijloacele de masura pot fi clasificate
dupa mai multe criterii, dintre care amintim complexitatea si forma semnalului.

II.5.1. Clasificarea mijloacelor de masura dupa complexitatea lor

In functie de complexitatea lor, mijloacele de masura folosite in fizica se pot
clasifica in:

- masurile sunt cele mai simple mijloace de masura si pot fi:
masuri utilizate independent (masuri de capacitate, rigle, etc.)
masuri utilizate impreuna cu un aparat de masura (masele marcate se
folosesc impreuna cu o balanta)
Functie de valoarea lor, masurile pot fi subclasificate si in:
masuri cu valoare unica (masele marcate, masurile de capacitate)
20
masuri cu valoare multipla (riglele de masuri)
De obicei masurile cu valoare unica sunt furnizate in truse. Acestea contin masuri de
diferite valori unice, astfel incat sa se poata masura atat marimii fizice egale cu fiecare
masura in parte, cat si cu combinatiile lor.

- aparatele de masura sunt mijloace de masura ce contin cel putin o masura si
functioneaza comparand marimea de masurat cu unitatea de masura.

Din punctul de vedere al modului de citire, aparatele de masura pot fi subclasificate in:

aparate cu citire directa, ce indica direct valoarea marimii de masurat (balanta analitica
pentru masurarea maselor, cilindrul gradat pentru masurarea volumelor);

aparate de comparare, ce indica egalitatea dintre valoarea marimii fizice de masurat cu
o valoare cunoscuta a unei marimi fizice de aceeasi natura (galvanometrul din puntea
Wheatstone pentru masurarea rezistentei);

aparate diferentiale, ce indica diferenta dintre valoarea marimii de masurat si valoarea
cunoscuta (manometrul cu lichid pentru masurarea presiunii, valoarea cunoscuta fiind
presiunea atmosferica)

aparate de maxim si de minim, ce indica valoarea maxima, respectiv minima pe care a
avut-o marimea de masurat de-a lungul unui proces sau interval de timp (termometrul
de maxima si minima pentru masurarea temperaturilor extreme atinse in decursul unui
interval de timp).

Din punctul de vedere al modului de obtinere a valorii marimii de masurat,
aparatele se mai pot clasifica in:

aparate indicatoare, la care valoarea marimii de masurat se citeste in dreptul unui ac
indicator;

aparate inregistratoare, care noteaza sirul de valori discrete obtinute in timpul
masuratorilor sau inregistreaza grafic dependentele continue;
21
aparate integratoare, care determina valoarea unei marimi fizice printr-o metoda de
sumare succesiva (de exemplu numaratoarele de cuante gamma).

- instalatiile de masura sunt mijloace de masura constituite dintr-un lant de
masuri, aparate si mijloace auxiliare de masura. Dispozitivele auxiliare servesc
la mentinerea parametrilor la valorile dorite, usureaza efectuarea operatiei de
masura sau servesc la schimbarea domeniilor de masura a unui aparat de
masura. Ca dispozitive auxiliare putem aminti intrerupatoarele, clemele,
stativele, comutatoarele, bancul optic, nivelele, etc.


II.5.2. Clasificarea mijloacelor de masurat dupa natura semnalului

In functie de natura semnalului, mijloacele de masura se pot imparti in:

- traductoare de masura ce transforma marimea de masurat intr-o alta marime
dependenta de semnalul de intrare (termometrul, termocuplul, etc.);

- convertizorul analogic digital transforma semnalul de intrare analog (ce apare
sub forma unei tensiuni electrice de exemplu) intr-un semnal digital (sub o
forma numerica, un numar de byti).


II.6. INREGISTRAREA INFORMATIILOR OBTINUTE IN DECURSUL
CERCETARII

In timpul cercetarii propriu-zise se efectueaza si inregistrarea fenomenelor studiate.
Datele inregistrate nu privesc orice amanunt al inregistrarii, fenomenele cercetate fiind
adesea foarte complexe. Ele se refera numai la aspectele stabilite odata cu precizarea
premizelor de pornire, functie de obiectul si scopul cercetarii. Inregistrarea fenomenelor
are ca scop simplificarea caracterizarii acestora prin intermediul unor simboluri sau
coduri calitative si cantitative, pe grupari diferite. Inregistrarea poate fi efectuata in forme
simple (inregistrare manuala in caiete, fise) sau automatizata.
Automatizarea consta in afisarea grafica sau numerica a datelor experimentale.
Informatia poate fi apoi prelucrata automat de calculatoare functie de programele elaborate
22
(prelucrare off-line). Daca sistemul de automatizare permite transformarea semnalului, cu
ajutorul unor convertoare analogic-digitale, astfel incat informatia sa fie stocata direct pe
calculator (fara interventia analistului), atunci se spune ca prelucrarea este efectuata on-
line.
Din punct de vedere temporal deci, inregistrarea poate fi concomitenta cu
observarea sau experimentul, fara insa a se confunda, sau ulterioara acesteia. O importanta
deosebita in faza inregistrarii datelor cercetarii trebuie acordata atat corectitudinii cu care se
face observatia sau experimentul, cat si corectitudinii cu care se inregistreaza datele. De
aceea cercetarea si inregistrarea datelor experimentale trebuiesc efectuate de persoane
calificate, care cunosc tehnica de lucru si mai ales importanta si scopul cercetarii. Chiar in
acest caz pot apare erori de masura si/sau inregistrare, dar acestea pot fi mai usor depistate
daca verificarea lor este realizata de persoane calificate.
De asemenea masuratorile trebuie sa se refere la conditii cat mai similare, astfel
incat rezultatele sa nu fie influentate de variatia unor marimi presupuse constante sau de
timp. In cazul studiilor experimentale care necesita perioada de cercetare mai mari,
pastrarea conditiilor identice de lucru este o precautie primordiala.


II.7. PRELUCRAREA INFORMATIILOR OBTINUTE IN DECURSUL
CERCETARII

Dupa terminarea cercetarii propriu-zise, de culegere a datelor experimentale,
urmeaza etapa de prelucrare a acestora. Procesul de prelucrare a datelor experimentale
consta, in general, in urmatoarele faze: colectarea materialului, verificarea cantitativa si
calitativa, codificarea caracteristicilor (gruparea datelor pentru omogenizarea lor), calculul
marimilor de interes si prezentarea grafica.

- colectarea materialului consta in operatia de centralizare a datelor
experimentale. In cazul in care masuratorile au fost efectuate si inregistrate de
mai multe persoane, se recomanda ca centralizarea datelor sa fie realizata de
persoana (grupul de persoane) care a programat cercetarea. Acest lucru este
necesar pentru ca intreg volumul datelor experimentale sa fie analizat dupa o
metodologie unitara si sa poata primi o interpretare unica.

23
- verificarea calitativa si cantitativa a datelor experimentale este o faza
importanta pentru corectarea greselilor, respectiv eliminarea datelor afectate de
erori inaceptabile. Verificarea calitativa se refera la verificarea logica a datelor,
a plauzibilitatii lor. Tot ceea ce este iesit din comun, anormal fata de restul
datelor, mult dispersat fata de valoarea medie a marimilor respective, trebuie
verificat in vederea descoperirii unor eventuale incompatibilitati cu restul
datelor experimentale. In aceasta faza se pot aplica testele statistice de verificare
si de eliminare a datelor experimentale anomale. De asemenea, pentru cazurile
unde se presupune ca ar fi putut interveni unele erori si se cere o anumita
precizie a datelor experimentale, se poate face un sondaj de control in cateva
puncte sau etape ale cercetarii. Daca cercetarea este efectuata de mai multi
analisti, este bine ca sondajul de control sa fie realizat de catre o alta persoana
dacat cea care a efectuat masuratorile in prima faza. Odata eliminate datele
experimentale "anomale", se trece la verificarea cantitativa acestora, respectiv la
inventarierea datelor experimentale ce vor fi prelucrate si determinarea
volumului total al acestora.

- codificarea datelor este o operatie absolut necesara atunci cand volumul datelor
experimentale este mare. Codificarea datelor experimentale consta in
cuantificarea caracteristicilor esentiale studiate. Practic, aceasta faza consta din
atribuirea unui cod tuturor caracteristicilor cantitative si calitative ale
fenomenului (populatiei statistice) cercetat. Pe baza acestei codificari se poate
apoi efectua lejer gruparea datelor experimentale functie de criteriile dirite, in
loturi mai omogene.

- gruparea datelor experimentale consta in impartirea datelor experimentale dupa
caracteristici cantitative si calitative, pentru a putea gasi ulterior caracteristica
esentiala a acestora. Caracteristica care sta la baza gruparii se numeste
caracteristica de grupare. Aceasta caracteristica poate fi calitativa, exprimand o
trasatura a populatiei cercetate, sau cantitativa, daca ea este exprimata printr-o
distributie de valori numerice. Impartirea pe grupari cantitative si calitative nu
este arbitrara. Gruparea datelor experimentale in categorii omogene se
efectueaza intotdeauna dupa caracteristici esentiale, calitative sau numerice,
24
tipice pentru grupele de date sau fenomene, legate de structura lor intima si de
tendinta de evolutie a fenomenului.

In cazul in care volumul de date nu este prea mare, gruparea poate fi facuta manual.
Pentru un volum de date mai mare, aceasta se poate realiza rapid cu ajutorul
calculatoarelor. Din punctul de vedere al caracteristicilor si al felului de grupare, acestea
pot fi clasificate n :

- gruparea simpla se foloseste atunci cnd datele experimentale se analizeaza
dupa o singura cunoastere detaliata a unei caracteristici tipice fenomenului
analizat, decit la aprofundarea corelativa a fenomenelor studiate;

- gruparea complexa (combinata) este cel mai des folosita in procesul de
cercetare si se efectueaza pe baza mai multor carateristici de grupare, in vederea
studierii lor corelative;

- gruparea repetata consta in scindarea sau reunirea grupelor grupate dupa
diferite caracteristici in vederea unei sinteze generale.

Prin clasificarea datelor se urmareste analiza stiintifica a datelor in grupe omogene.
De aceea numarul grupelor, respectiv subgrupelor, in care poate fi scindat materialul are o
limita, dincolo de care eroarea cu care se poate exprima o caracteristica generala a unei
grupe (subgrupe) devine prea mare. Gruparea si subgruparea exagerata a volumului total de
date experimentale, functie de prea multe criterii, ingreuneaza intelegerea esentialului
carecteristic fenomenului in ansamblul sau. Daca fiecare grupa va insuma un numar prea
mic de date, apare necesitatea reunirii grupelor, respectiv eforturi si cheltuieli materiale si
de timp suplimentare.
Din aceste motive, apare adesea necesitatea alegerii deliberate a unor variante de
grupare. Varianta de grupare este valoarea insusirii cantitative sau calitative ale
caracteristicilor de grupare. Variantele servesc la punerea in evidenta a variabilitatii
caracteristicilor ce pot apare, in cadrul unei limite, prin mai multe valori sau insusiri
concrete. Astfel, fiecarei date experimentale (individ statistic) si fiecarei caracteristici de
grupare, ii corespunde o varianta de grupare, de o anumita valoare sau cu o anumita
insusire calitativa.
25
Daca variabilitatea datelor experimentale este continua, varianta caracteristicilor de
grupare poate lua orice valoare, oricit de mica, pana la o anumita limita. Daca
variabilitatea datelor este discreta, variantele caracteristice de grupare pot lua numai valori
discontinui. Valorile variantelor pot fi nivele fixe sau intervale.
Pentru fiecare valoare sau interval de valori ale variantelor corespunde un numar, o
anumita frecventa a datelor experimentale. Aceste frecvente (de aparitie) pot fi absolute
(numar de valori apartinand unui interval dat) sau relative (procente din totalul colectivitatii
cercetate). Gruparea datelor experimentale pe caracteristici dupa un sir de valori ale
variantelor, cu frecventele lor corespunzatoare, se numeste serie statistica de variatie. Seria
statistica de variatie este reprezentata printr-o coloana care cuprinde valorile variantelor si o
a doua coloana care cuprinde frecventele corespunzatoare.


II.8. PREZENTAREA DATELOR EXPERIMENTALE PRIN TABELE

Odata cuantificate caracteristicile intregului volum de date experimentale dupa
valorile variantelor, materialul statistic se prezinta in tabele. Acestea prezinta marele
avantaj de a sintetiza rezultatele experimentale si ale calculelor efectuate pentru
prelucrarea datelor experimentale. Ele asigura o scriere compacta si prezinta informatia
intr-un mod accesibil la citire si apreciere.
Practica cercetarii impune de obicei sa se apeleze la tabele intr-unul din urmatoarele
cazuri:

- se cunoaste valoarea unei functii pentru o serie de argumente, dar nu se cunoaste
formula matematica a dependentei dintre ele;

- se doreste mediatizarea anumitor marimi fizice care, desi necesare in alte
determinari uzuale, pot fi masurate numai cu ajutorul unor instalatii speciale,
complicate, existente numai in dotarea unor laboratoare speciale;

- se doreste usurarea calculelor necesare in prelucrarea datelor experimentale ce
necesita aplicarea unor functii mai complicate;

- se prelucreaza datele dupa o formula ce necesita multi pasi de calcul.

26
Orice tabel trebuie sa fie numerotat, sa aiba un titlu si sa contina toate datele despre
conditiile in care s-au efectuat masuratorile. Daca in plus se doreste si o analiza ulterioara a
reproductibilitatii rezultatelor, tabelele trebuiesc datate. Capul fiecarei coloane (rand)
trebuie sa specifice denumirea sau simbolul marimii fizice prezentate, unitatea de masura
in care este exprimata marimea fizica, precum si factorul de multiplicare, daca este cazul.
In general, acesta trebuie astfel ales incat in tabel sa apara valori cuprinse intre 0.1 si 1000.
Ordinea de prezentare a datelor este urmatoarea: mai intai coloana (randul) argumentului si
apoi coloana valorilor functiei sau coloanele corespunzatoare diferitilor pasi de calcul.
Tabelele pot fi clasificate in tabele calitative, cantitative si de tip functional.


II.8.1. Tabele calitative

Aceste tabele stabilesc relatii calitative intre diferite marimi, legi ce guverneaza
fenomene analoage sau metode de masura. Dintre acestea putem aminti tabele de
interpretare calitativa a benzilor de absortie (pe domenii spectrale), tabele cu formulele de
calcul ale momentelor de inertie pentru corpuri de diferite forme geometrice, sau tabele ce
justifica motivele pentru care o anumita metoda este preferata dintre mai multe posibile
pentru masurarea unei anumite marimi fizice.


II.8.2. Tabele statistice

Tabelele statistice sunt formate din coloane si randuri. Rubricile rezultate din
intretaierea lor corespund fiecare unei valori (sau interval de valori) a variantelor
respective, exprimand o frecventa de aparitie absoluta sau relativa.

Dupa continutul lor, tabelele statistice sunt:

- tabelele simple au fost obicei scop enumerativ, putand reflecta incidenta spatiala
sau dinamica (cronologica) a unui fenomen;

- tabelele de grupare prezinta o singura caracteristica de grupare;

27
- tabelele combinate cuprind gruparile dupa doua caracteristici, permitand grupari
mai omogene;
- tabelele de corelatie caracterizeaza volumul datelor experimentale dupa doua
sau mai multe caracteristici.


II.8.3. Tabele de tip functional

Aceste tabele contin reprezentarea valorilor unei functii pentru o serie de
argumente, atunci cand se cunoaste forma matematica a functiei de dependenta. Pentru
prelucrarea datelor experimentale in fizica, se folosesc mai des urmatoarele tipuri de tabele:

- tabelele functionale cu date neprelucrate se intocmesc inainte de efectuarea
calculelor. Ele trebuie sa se precizeze continutul capului de tabel, respectiv
variabilele si parametrii de masurat, a calculelor de efectuat. In cazul in care
tabelul nu are un numar prea mare de coloane, este bine sa se rezerve, pentru
fiecare marime masurata direct, cate o coloana in care sa se mentioneze numarul
de diviziuni citit pe aparatul de masura si una alaturata cu valoarea calculata in
unitati de masura. Acest lucru este bine venit pentru depistarea cauzelor
eventualelor erorii si eventualele greseli de transformare in unitati de masura;

- tabelele functionale cu valorile diferitelor marimi fizice prezinta valorile unor
marimi fizice greu de determinat, pentru substante folosite mai uzual in practica
experimentala. De exemplu, ele prezinta valorile densitatii, a temperaturii de
topire, a caldurii latente de topire, a caldurii specifice, a coeficientului de
dilatare liniara etc. Alte tabele prezinta dependenta unor marimi fizice de
anumiti parametri ce induc variatii foarte mici ale valorii marimii fizice
respective, greu de pus in evidenta prin metode uzuale. Un exemplu este
dependenta densitatii apei de temperatura;

- tabelele matematice prezinta valoarea unor functii complicate pentru o serie de
valori ale argumentului mai fina dacat cele uzuale. Dintre acestea putem cita
tabelele cu valorile functiilor trigonometrice, tabelele de logaritmi etc.. Eroarea
de determinare a valorii din tabele se ia egala cu ordinul ultimei cifre
semnificative.
28

- tabelele alcatuite in scopul efectuarii unor calcule contin in mod explicit
valorile obtinute dupa fiecare pas de calcul. Desi par mai laborioase, in mod
paradoxal ele servesc mai ales pentru a economisi timp. Astfel, daca in
verificarile pentru depistarea eventualelor greseli se identifica o eroare la un
calcul intermediar, aceste tabele au marele avantaj de a permite reluarea
calculelor numai de la coloana (randul) incorect mai departe. De asemenea,
anumite rezultate intermediare pot fi folosite ulterior pentru calculul dupa
formule cu termeni similari, economisindu-se si in acest caz timpul necesar
primilor pasi facuti in prelucrarea datelor.


II.9. SISTEMUL INDICATORILOR STATISTICI

Dupa tabelarea datelor statistice, este binevenita calcularea unor indicatori, pentru
analiza si sinteza trasaturilor esentiale ale datelor experimentale. Datele experimentale,
statistice, adunate in decursul cercetarii, exprima valori individuale, insusiri partiale sau de
grup. Fara un element de comparatie sau de corelare, ele sunt greu de sintetizat. Indicatorii
permit generalizarea si abstractizarea, facilitand trecerea de la caracteristicile individuale la
cele de grup, iar de la acestea la cele specifice intregii populatii statistice.

Cei mai obisnuiti indicatori sunt:

- indicatorii extensivi (de repartitie, structura, de pondere) ce arata structura unei
colectivitati. Acestia se exprima in procente si se calculeaza dupa regula de trei
simple, totalul subgrupelor fiind egal cu 100%;

- indicatorii intensivi (de frecventa, de nivel) arata marimea unui fenomen fata de
altul, intre cele doua fenomene existand o legatura logica;

- indicatorii intuitivi (demonstrativ) ne arata raportul marimii unei serii dinamice
de valori fata de o marime luata ca baza si considerata ca fiind egala cu 100.
Prin regula de trei simple se calculeaza valorile corespunzatoare marimilor seriei
dinamice. In acest caz este vorba de indicatori cu baza fixa. Daca baza este
variabila, se numesc indicatori in lant. Diferenta de nivel dintre valorile absolute
29
ale marimii considerate si cea de baza sau cea dinamic anterioara se numeste
spor absolut sau cresterea absoluta. In cazul indicatorilor intuitivi in lant, sporul
absolut se calculeaza intotdeauna functiile de nivel din momentul (perioada)
imediat premergatoare. Raportarea unei valori la nivelul anterior luat ca baza
fixa sau ca baza variabila da ritmul de crestere. Ritmul sporului este raportul
dintre sporul absolut dintr-o perioada si nivelul absolut al perioadei anterioare
luate ca baza fixa sau variabila;

- indicatorii analitici exprima o anumita latura a unui fenomen sau populatii
statistice si servesc la cunoasterea aprofundata a fenomenelor studiate

- indicatorii sintetici servesc pentru abstractizarea, generalizarea sau sinteza mai
multor fenomene sau populatii statistice;

- indicatorii de corelatie si regresie servesc la stabilirea legaturilor functionale,
cauzale, intre doua sau mai multe caracteristici ale unui fenomen sau populatii
statistice.

Toti indicatorii pot fi reprezentati sub diverse forme:

- valorile absolute reprezinta un indicator in cazul fenomenelor sau populatiilor
rare, unde cifra absoluta este cea mai relevanta asupra esentei, structurii si
dinamicii fenomenului;

- valorile relative apar in cazul indicatorilor extensivi, intensivi, intuitivi,
analitici, sintetici sau de corelatie si regresie. Ele pot fi calculate sub forma de
rapoarte, frecvente de aparitie sau ponderi (procente);

- valorile medii sunt foarte des folosite in cercetare, fiind un indicator sintetic de
mare valoare, ce caracterizeaza salectii sau intreaga populatie statistica
analizata. Aceste valori pot fi comparate ulterior cu valorile individuale pentru
stabilirea gradului de dispersie, variabilitatea datelor individuale fata de
fenomenul mediu.

30
II.10. REPREZENTAREA GRAFICA A DATELOR EXPERIMENTALE

Reprezentarea grafica a datelor experimentale este o metoda foarte valoroasa atat
pentru analiza si sinteza cercetarii cat si pentru prezentarea sugestiva a rezultatelor
experimentale. De obicei, reprezentarea grafica a datelor experimentale se face dupa
gruparea, tabelarea si calcularea indicilor statistici ai acestora. Ca atare nu are sens
incercarea de a stabili care tip de reprezentare (sub forma de tabele, prin intermediul
statistici sau sub forma grafica) este mai concludenta sau sugestiva, deoarece aceste operatii
nu sunt alternative ci consecutive. In cele ce urmeaza vom prezenta pe scurt diferite tipuri
de reprezentari grafice utilizate mai frecvent in prelucrarea datelor experimentale in fizica.


II.10.1. Grafice de corelatie

Graficele de corelatie reprezinta curbele de dependenta dintre doua variabile
masurate experimental. Completarea prelucrarii datelor experimentale prin grafice de
corelatie prezinta multiple avantaje, dintre care citam:

- permit identificarea tipului de dependenta matematica dintre cele doua variabile
reprezentate. Daca nu cunoastem forma functiei de dependenta, graficul este un
instrument optim pentru alegerea tipului de functie de folosit pentru
parametrizarea curbei experimentale prin metode statistice.

- permit confirmarea prezentei unui anumit fenomen fizic. Forma teoretica a
functiei de dependenta este de obicei cunoscuta in acest caz. Din forma curbei
experimentale se poate aprecia calitativ daca rezultatele experimentale verifica
forma teoretica a functiei de dependenta sau daca exista abateri de la aceasta.

De exemplu, pentru determinarea tipului de miscare a unui corp, acesta poate fi
fotografic stroboscopic (la intervale de timp egale, foarte scurte si cunoscute ca valoare) in
dreptul unui paravan milimetrat. Se prezinta grafic dependentei dintre pozitia sa si timpul
scurs de la un moment dat. Daca se obtine o dreapta, corpul se afla in miscare uniforma.
Daca curba este o parabola, corpul se afla in miscare uniform accelerata. Daca se obtine alt
tip de curba, se poate deduce ca miscarea corpului are loc neuniform.
31

- permit interpolarea sau extrapolarea datelor, aspect deosebit de important in
cazul reprezentarii grafice a curbelor de calibrare. Odata trasate, ele pot fi
folosite pentru aflarea valorilor functiei corespunzatoare oricarei valori ale
argumentului, fara a necesita parametrizarea curbei. Desigur, interpolarea si
extrapolarea grafica nu sunt metode foarte precise, dar ele furnizeaza adesea
rezultate suficient de pertinente pentru multe aplicatii practice. De asemenea
metodele grafice se remarca prin simplitatea lor, eliminand necesitatea efectuarii
unor calcule mai sofisticate de parametrizare. Avantajul creste in importanta mai
ales atunci cand curbele de etalonare nu pot fi aproximate pe intreg domeniul de
interes printr-o singura functie. In acest caz, curba trebuie simulata cu o functie
definita cu expresii diferite pe diferite intervale de valori.

De exemplu, microcomparatoarele Abb permit masurarea foarte precisa a distantei
la care apare o linie din spectrul de emisie a unui element chimic fata de un reper de pe
placa fotografica. Pentru masurarea spectrului de emisie a unei probe (lungimea de unda a
liniilor de emisie), microcomparatorul trebuie mai intai etalonat. Astfel, se foloseste
spectrul de emisie a unui element pur, considerat etalon. Se identifica lungimile de unda a
celor mai intense din benzile sale de absortie din cataloage de spectre. Se masoara
experimental pozitia acestora pe placa fotografica, cu ajutorul microcomparatorului.
Graficul dependentei dintre lungimile de unda ale liniilor de emisie si pozitiile lor pe placa
fotografica constituie curba de etalonare a microcomparatorului. Masurand apoi pozitiile
liniilor de emisie mai intense din spectrul unei probe necunoscute, se pot extrage din
graficul de etalonare valorile lungimilor de unda corespunzatoare. Proba se poate astfel
identifica cu ajutorul tabelelor din cataloagele cu spectre. Remarcam ca aceasta metoda de
analiza (calitativa) nu a necesitat nici un fel de calcul.

- permit determinarea grafica a unor informatii suplimentare cu semnificatie
fizica, ce pot fi extrase din forma concreta a dependentei dintre cele doua
variabile. Astfel, se pot determina ordonata sau abscisa la origine, panta, pozitia
maximelor si minimelor, a punctelor de inflexiune, sau periodicitatea
fenomenului.
Ca exemplu se poate cita determinarea lucrului mecanic de extractie L
ext
a
electronilor dintr-un metal sub actiunea radiatiei electromagnetice. Pentru acesta, se
32
ilumineaza o celula fotoelectrica a carei catod este facut din metalul de interes. In calea
fascicolului luminos se aseaza filtre care permit trecerea numai a unui fascicul
monocromatic, de lungime de unda cunoscuta . Curentul fotoelectric astfel creat se
anuleaza prin aplicarea unei tensiuni inverse U la capetele celulei. Reprezentand grafic
dependenta dintre valoarea tensiunii inverse si frecventa luminii, se obtine o dreapta
crescatoare. Conform legii efectului fotoelectric,

h= L
ext
+ eU U = -
e
1
L
ext
+
e
h
(II.10)

Ca atare, valoarea lucrului mecanic de extractie specific materialului catodului se
poate determina din valoarea ordonatei la origine. Valoarea constantei lui Plank h se poate
determina din panta dreptei, cunoscand valoare sarcinii electronului e.
Functie de informatia furnizata, graficele de corelatie pot fi calitative sau
cantitative. Graficele calitative prezinta dependenta dintre doua variabile in mod intuitiv,
fara a preciza valorile efective ale punctelor experimentale. Ele mentioneaza numai
variabilele reprezentate pe axe si curba de dependenta in sine. Aceste grafice se folosesc in
general pentru ilustrarea tipului de dependenta dintre variabile. Graficele cantitative
precizeaza toate detaliile numerice legate de domeniile de masura, de valorile
experimentale masurate si de factorii de multiplicare.
Graficele se construiesc tinand cont de principiile geometrice ale lui Descartes
(1637), adica de sistemul cartezian. Acesta se compune dintr-un sistem de doua axe
perpendiculare intre ele, una orizontala (abscisa) si una verticala (ordonata). Punctul lor de
intersectie se numeste originea (sistemului de axe) si constituie punctul de plecare pentru
scara aleasa pentru fiecare din cele doua axe. In prezentarea grafica se foloseste cel mai des
partea din dreapta a abscisei, respectiv cea de sus a ordonatei, ambele corespunzand
valorilor pozitive ale marimilor reprezentative grafic. Pe abscisa se reprezinta marimea
cauza a fenomenului, iar pe ordonata marimea caracteristica efectului obtinut. Cu alte
cuvinte, pe abscisa se reprezinta marimea fizica careia analistul i-a dat valori in mod
deliberat, iar pe ordonata marimea fizica indusa prin fenomenul studiat.
Sub sageata abscisei si in stanga sagetii ordonatei se noteaza marimile fizice
reprezentate, prin intermediul simbolurilor lor consacrate. In caz ca acestea nu au
simboluri consacrate, se folosesc simboluri carora li se explica semnificatia fizica in
legenda graficului sau se noteaza in cuvinte numele marimii fizice, pe grafic, in locul
33
simbolului. In dreapta fiecarui simbol se noteaza, intre paranteze rotunde, unitatea de
masura in care sunt exprimate valorile experimentale.
Scara graficului este conventionala. Ea consta din intervale (diviziuni) ce reprezinta
o valoare data, pentru marimile reprezentate pe fiecare axa in parte, cu unitatile de masura
corespunzatoare. In mod normal, se lucreaza cu scara aritmetica, si in acest caz intervalele
sunt egale (si diviziunile echidistante).
In cazul marimilor mici, pentru a reda mai sugestiv diferentele dintre frecventele
variantelor, se pot folosi scara semilogaritmica. In acest caz intervalele alese, egale ca
valoare, difera ca reprezentare geometrica.
Scara logaritmica se construieste astfel: pe abscisa se iau intervale impartite in
unitati in progresie aritmetica (1, 2, 3, 4 m sau mm) iar pe ordonata sa iau intervale
impartite in logaritmii cifrelor progresiei aritmetice. Astfel, pe acelasi grafic, se pot
reprezenta valori foarte diferite, cuprinse intre limitele mari (unei progresii aritmetice ii
corespunde o crestere mica a logaritmului), variabilitatea datelor fiind insa usor de observat
pentru toate valorile.
Valorile numerice corespunzatoare intervalelor se noteaza sub abscisa si in stanga
ordonatei. Pentru usurinta citirii, valorile nu trebuiesc exprimate prin numere cu prea multe
cifre. Pentru aceasta, la nevoie ele se pot exprima cu ajutorul unui factor de multiplicare,
specificat in paranteza unitatii de masura de la capatul axei. De asemenea, este convenabil
ca diferenta dintre doua valori consecutive de pe o axa sa fie egala cu o putere a lui 10, in
unitatea de masura respectiva (0, 1, 1, 10, 100 etc.).
De obicei originea sistemului corespunzator valorii 0 pentru marimile de pe ambele
axe. In acest caz, aceste valori nu se mentioneaza in dreptul originii, fiind implicite. In caz
contrar, valorile corespunzatoare trebuiesc mentionate in dreptul originii.
Punctele experimentale se prezinta la intersectia dintre verticala x = X
i
si orizontala
y = Y
i
, unde (X
i
, Y
i
) sunt valorile masurate experimental pentru cele doua marimi fizice. In
caz ca pe un grafic se reprezinta mai multe dependente, punctele experimentale se
simbolizeaza diferit pentru fiecare dependenta. Se pot utiliza ca simboluri forme
geometrice precum patrate, triunghiuri, cercuri, stelute etc..
Curba experimentala sa traseaza printre punctele experimentale, in mod continuu si
neted. Abaterea punctelor experimentale de la curba ce le aproximeaza se datoreaza erorilor
experimentale de masura.
Fiecare grafic de corelatie trebuie sa fie insotit de o legenda. Legenda cuprinde
numarul si numele graficului, semnificatia simbolurilor folosite in reprezentarea grafica si,
34
daca este necesar, valoarea parametrilor auxiliari necesari reproducerii rezultatelor
reprezentate grafic.


II.10.2. Diagrame

Din multitudinea tipurilor de diagrame, in fizica se foloseste cel mai des, pentru
prelucrarea datelor experimentale, diagrama de distributie cantitativa. Ea serveste
reprezentarii grafice a distributiilor de frecventa. Pe abscisa se trec intervalele scarii ce
corespund marimilor variantei, iar pe ordonata marimile corespunzatoare frecventelor.

Diagramele de distributie cantitativa se reprezinta in mai multe moduri:

- histograma se reprezinta sub forma de dreptunghiuri, cu baze egale,
corespunzatoare intervalelor egale de pe abscisa, dar inaltimile variabile,
corespunzatoare frecventelor. Acest tip de diagrama se foloseste mai ales pentru
studiul fenomenelor fizice aleatoare, cum ar fi emisia radioactiva sau pentru
aprecierea normalitatii, tendintei centrale si a variabilitatii rezultatelor
experimentale.

- poligonul de frecventa este reprezentat prin linii frante care unesc punctele
corespunzatoare frecventelor din distributia cantitativa. Aceste inaltimi se
construiesc perpendicular pe abscisa, pornind de la mijlocul intervalului de pe
abscisa.

- curba de frecventa se utilizeaza ca o alternativa la poligonul de frecventa, in
cazul in care marimile variantelor sunt reprezentate cu intervale mici pe abscisa.
In acest caz, linia franta devine o curba. Intervalele de pe abscisa trebuie sa
corespunda ca marime variantelor distributiei.

Pentru studiul evolutiei in timp a unui fenomen se folosesc diagramele de
succesiune in timp. Acestea se prezinta de obicei sub forma de historiograma sau de
diagrama polara.
- historiograma este o linie franta, ce leaga valorile frecventelor ce corespund
intervalelor de timp (ore, zile, luni sau ani). Pe aceeasi historiograma se pot
35
reprezenta doua sau mai multe probleme asemanatoare, pentru a facilita o
eventuala comparatie intre dinamica diferitelor aspecte reprezentate grafic. In
general insa, este bine sa nu se reprezinte pe aceeasi historiograma doua
probleme legate de colectivitati diferite: utilizarea a doua scari pentru acelasi
grafic adesea erori de interpretare. De asemenea, nu se recomanda reprezentarea
pe aceeasi historiograma a mai mult de trei - patru probleme, deoarece graficul
devine supraincarcat si greu de interpretat, pierzand mult din sugestivitate. In
cazul in care marimile reprezentate grafic sunt cuprinse intr-un interval de valori
mare, unele fiind foarte mici si altele foarte mari, se utilizeaza scara
semilogaritmica sau se intrerupe scara.

- diagrama polara se utilizeaza pentru reprezentarea succesiva in timp a unei
singure probleme. Ea se construieste impartind un cerc in parti egale pentru
reprezentarea succesiunii (de exemplu in patru parti pentru fenomene
trimestriale sau in douasprezece parti in cadrul succesiunii de luni). Raza cu care
se construieste cercul se ia egala cu media aritmetica a valorilor ce corespund
variantei. Sectoarele de cerc care corespund aceluiasi interval de timp sunt
egale, diferind numai raza lor.

Pentru studiul distributiei geografice al fenomenelor fizice se utilizeaza
cartogramele si cartodiagramele.

- cartogramele reprezinta diferentele in intensitatea fenomenelor prin hasura sau
colorarea suprafetelor de pe harta unei regiuni geografice. Cu cat intensitatea
fenomenului este mai mare cu atat hasurile sunt mai dese sau culoarea mai
inchisa. Lipsa hasurilor sau spatiul alb corespunde teritoriului in care fenomenul
nu se manifesta (are intensitate nula). Cartodiagrama reprezinta frecventa
variantelor mai fidel, dar este mai putin sugestiva decat cartograma.
Cartodiagrama contine dreptunghiuri in fiecare zona, de inaltime direct
proportionala cu frecventa de aparitie sau intensitatea fenomenului in zona
respectiva.



36
CAPITOLUL III. ESTIMAREA MARIMILOR FIZICE PE
BAZA SELECTIILOR DE DATE EXPERIMENTALE

Fenomenele din natura si din societate sunt interdependente, existand corelatii
multiple intre natura sau esenta acestora. Relatiile dintre fenomene pot fi exprimate prin
legi, categorie ce evidentiaza esentialul, generalul, obiectivul, necesarul si suficientul,
repetabilul si stabilul.
Unele legi exprima conexiunile dintre fenomenele individuale, unde legatura dintre
cauza si efect este relativ simpla, fenomenul putand fi reprodus oricand pe cale
experimentala. Acesta este cazul legilor dinamice. Majoritatea legilor fizicii sunt de acest
tip, ca de exemplu legea conservarii energiei, legea caderii corpurilor, legea lui Arhimede.
Ele permit analistului sa prevada relativ usor desfasurarea unor fenomene in timp si spatiu,
legatura dintre cauza si efect.
In alte situatii, conexiunile dintre fenomene sunt atat de complexe, incat, la prima
vedere, par haotice, intamplatoare. In acest caz, nu se poate evidentia legitatea decat ca
rezultanta unui numar mare de fenomene sau cazuri individuale, singulare, uneori
antagoniste, alteori sinergice - care au o dinamica proprie. Desi comportarea fiecarei unitati
pare intamplatoare, rezultanta tuturor acestor comportari exprima o legitate necesara,
relativ stabila si repetabila, avand deci caracterul de lege generala, obiectiva si necesara.
Acesta este cazul legilor statistice, valabile doar pentru caracterizarea intregii colectivitati,
nu si pentru fiecare componenta in parte. Ele exprima rezultanta comuna tuturor fortelor
divergente individuale intamplatoare. Esenta intregii colectivitati este de altfel comuna
marii majoritati a elementelor componente, fara a fi numai o lege a tendintei medii.
O lege statistica nu se poate evidentia in orice populatie, ci numai pentru acelea care
au anumite proprietati, cea mai importanta dintre acestea fiind omogenitatea populatiei
statistice. Aceasta calitate presupune ca fiecare unitate, individ statistic, sa aiba cel putin
una din insusirile esentiale comune colectivitatii.
Asa cum nu se poate demarca net necesarul de intamplator, tot asa nu se poate
delimita net nici cele doua categorii de legi, si anume cele dinamice si cele statistice. In
conexiunile lor complexe, apare des situatia in care fenomenele se supun cand unor legi
statistice, cand unora dinamice. Astfel, in general nu exista fenomene in care sa se
manifeste doar legi dinamice sau doar legi statistice. Cel mai adesea acestea apar
concomitent, predominand comportarea dupa o lege de un tip sau celalalt.

37
III.1. DEFINIREA CONCEPTULUI DE CONTROL AL MASURARII

Pentru o evaluare stiintifica a datelor, procesul de masurare trebuie sa fie secondat
de un alt proces experimental, prin care se verifica rezultatele obtinute sub raport calitativ.
Acest proces poarta denumirea de control. Efectuarea unui control eficient presupune o
normare prealabila a preciziei, adica stabilirea zonei maxim admisibile de existenta a erorii
de masurare. Cu alte cuvinte, in limitele spatiului "starilor admisibile", sistemul real de
masurare trebuie sa se abata foarte putin de la cel ideal.
Orice incalcare a acestei conditii, constituie un semnal de alarma privind dereglarea
sistemului si implicit aparitia erorilor de masurare. Practic acest lucru presupune
respectarea permanenta a conditiei:
Y y (III.1)
unde y este rezultatul masurarii, Yeste valoarea nominala a semnalului de iesire si eroarea
limita admisibila. Daca inegalitatea (III.1) nu este satisfacuta, atunci rezultatul masurarii
trebuie eliminat, considerandu-se nesatisfacator, dupa care se iau masuri de reglarea
sistemului de masura (vezi figura III.1).



Figura III.1. Schema-bloc a sistemului de colectare a datelor
38
In general, controlul tehnic de masurare se prezinta sub forma unui lant de operatii
elementare, prin care trec succesiv toate lucrarile intermediare pana la obtinerea rezultatului
finit. Prin executarea unui astfel de control se urmareste respectarea cu strictete a
indicatiilor tehnice privind calitatea lucrarilor pe toate fazele procesului de culegere si
prelucrare a datelor de masurare.
Definirea sistemului de masurare si control in acest fel usureaza considerabil
interpretarea si prelucrarea datelor, deoarece scopul executarii masurarilor consta nu numai
in gasirea valorii marimii supuse masurarii, ci si in gradul de incredere cu care se obtine
aceasta valoare in conditiile date. De exemplu, inaintea planificarii unui anumit experiment
de masurare, proiectantul urmareste realizarea unei corelatii intre posibilitate si necesitate,
din punct de vedere al preciziei, pentru ca eficienta realizata sa fie maxima. Aceasta
problema este deosebit de importanta, deoarece atat o precizie mica, cat si una exagerat de
mare, duc fie la irosire nejustifcata de resurse materiale si umane, fie la o slaba calitate a
rezultatelor obtinute din masurari.
Calitatea rezultatelor obtinute din masurari este direct proportionala cu volumul
informatiilor si precizia mijloacelor de masurat. Din punct de vedere constructiv-functional,
mijloacele de masurat sunt de diferite categorii si se clasifica astfel :
mijloace etalon care servesc la definirea, materializarea, conservarea sau
reproducerea pentru transmitere a unitatilor de masura a altor mijloace tehnice
destinate operatiilor de masurare curenta in productie sau la receptionarea unor
lucrari de mare precizie.
mijloace tehnice de masurare destinate executarii masurarilor curente, la care
precizia este data in raport de natura si destinatia lucrarilor ulterioare.


III.2. CLASIFICAREA ERORILOR DE MASURA
Practica a dovedit ca oricat de ingrijit s-ar executa masurarile, acestea vor fi afectate
in mod inerent de erori. Perfectionand aparatele si metodele de masurat, putem obtine
aproximatii din ce in ce mai bune, insa marimea unor astfel de precizii nu poate merge
dincolo de orice, limita. De exemplu, efectuand un numar finit de masuratori asupra uneia
si aceleiasi marimi fizice, diferenta dintre rezultatul obtinut si valoarea adevarata a marimii
fizice masurate nu poate fi mai mica decat ordinul de marime a dimensiunilor moleculare,
deoarece in acest caz ar dispare insasi notiunea de marime fizica.

39


Figura III.2. Criterii de clasificare a erorilor de masura

Erorile de masurare se clasifica dupa sursa generatoare, modul lor de actiune in
procesul de masurare sau prelucrare a datelor experimentale, precum si dupa forma in care
acestea pot fi exprimate matematic.



Figura III.3. Clasificarea erorilor de masura functie de sursa acestora
40
Dupa sursa lor de aparitie, erorile se impart in:

erori personale, ce se datoreaza imperfectiunii organelor de simt, prin intermediul
carora operatorul obtine nemijlocit informatii despre obiectul supus masurarii. De
exemplu, precizia de punctare depinde in principal de acuitatea ochiului
operatorului. Astfel, pentru eliminarea erorilor personale, in astronomia geodezica
fiecare operator isi stabileste ecuatia personala inainte de iesirea in campanie, iar la
prelucrarea matematica a datelor de masurare se tine seama de rezultatele acestei
activitati;

erori instrumentale, ce se datoreaza imperfectiunii materialelor din care sunt
confectionate aparatele de masurat, precum si impreciziei in montarea sau reglarea
acestor aparate;

erori metodice, ce se datoreaza simplificarilor aplicate pentru deducerea unor
formule si uneori chiar folosirii incorecte a mijloacelor tehnice cu ajutorul carora
efectuam masuratorile. De exemplu, la deducerea formulei pentru determinarea
expeditiva a azimutului astronomic, anumite triunghiuri sferice pot fi inlocuite cu
altele plane. Aceasta inseamna ca simplificarile introduse constient in metodica
determinarii azimutului astronomic genereaza erori suplimentare care se incadreaza
in categoria erorilor metodice, insa fara implicatii in prelucrarea ulterioara a datelor;

erori exterioare, conditionate de influenta unor factori exteriori ca temperatura,
umiditatea aerului, curbura pamantului, refractia atmosferica, actiunea vantului etc.

erori ale obiectului de masura, datorate variatiei in timp a obiectului supus
masuratorilor. Deoarece obiectul masurat sufera unele modificari sub influenta
factorilor interni si externi, erorile generate din aceasta cauza nu pot fi confundate
nici cu erorile exterioare si nici cu cele datorita reflectarii incomplete a lumii
materiale in constiinta subiectului masuratorii. Aceste erori sunt proprii obiectului
supus masurarii si nu intamplator, se numesc erori ale obiectului.

41
Cercetarile teoretice si practice conduc la concluzia certa ca erorile de masurare,
indiferent de natura factorilor generatori, tind asimtotic catre o anumita limita, care numai
cu o probabilitate foarte mica, poate fi depasita. Aceasta marime se numeste eroare limita.



Figura III.4. Clasificarea erorilor de masura functie de modul lor de manifestare

Am vazut mai sus ca intre erorile rezultate din masurari si parametrii care
caracterizeaza procesul de masurare apar legaturi cu caracter functional si stochastic. De
aceea, eroarea care afecteaza un anumit rezultat al masurarii poate fi conceputa ca o suma
de erori elementare intamplatoare si sistematice determinate astfel:

(III.2) ( ) ( ) ( ) t t t + =

unde (t) este componenta intamplatoare a erorii care, de regula, reprezinta un proces
stationar necorelat, iar (t) este componenta sistematica a erorii de masurare sau procesul
aleator nestationar corelat. De exemplu, influenta erorii de colimatie asupra citirilor
efectuate pe cercul orizontal al unui teodolit este:

(III.3) ( ) ( ) = sec k

In acest caz, parametrul t se inlocuieste cu , iar functia elementara aleatoare () este egala
cu produsul dintre marimea aleatoare k si functia nealeatoare () = sec .
42
Abordarea conceptului de eroare in acest fel reprezinta o necesitate stringenta in
domeniul estimarii preciziei aparatelor de control automat, la care deplasarea centrului de
reglare devine semnificativa in decursul unui numar relativ mic de cicluri de masurare.
Daca ne gasim in cadrul masurarilor indirecte statice si consideram functia (II.7) derivabila
in raport cu argumentele (marimile masurate direct) x
i
(i = 1,2, ..., n) vom avea urmatoarea
diferentiala totala :


n
n
2
2
1
1
dx
x
y
... dx
x
y
dx
x
y
dy

+ +

= (III.4)

Din analiza matematica se stie ca diferentialele variabilelor independente coincid
cu cresterile lor. Notand aceste cresteri cu
1
,
2
,
n
relatia devine:


n
n
2
2
1
1
y
x
y
...
x
y
x
y

+ +

= (III.5)

Avand in vedere relatia (III.2), particularizata pentru cazul masurarilor statice,
relatia (III.5) poate fi scrisa sub forma:

( ) ( ) ( n
x
y
...
x
y
x
y
n
n
2 2
2
1 1
1
y y
+

+ + +

+ +

= + ) (III.6)

In sfirsit, daca separam partea sistematica a erorii de cea aleatoare vom avea:


n
n
2
2
1
1
y
x
y
...
x
y
x
y

+ +

= (III.7)


n
n
2
2
1
1
y
x
y
...
x
y
x
y

+ +

= (III.8)


Relatia (III.7) pune in evidenta partea intamplatoare a erorii de masura. Asa cum
rezulta din insasi denumire, caracteristica principala a acestui tip de erori consta in
repartizarea lor absolut intimplatoare, mai ales atunci cand provin de la acelasi operator sau
43
instrument de masurat. Din aceasta cauza erorile intamplatoare nu pot fi evitate in procesul
masurarii si nici eliminate anticipat din calcule. Singura conditie pe care trebuie sa o
satisfaca operatorul este aceea de a reduce la minim influenta unor astfel de erori atat in
etapa culegerii, cat si in cea a prelucrarii informatiei.
Partea sistematica a erorii de masurare se exprima cu ajutorul relatiei (III.8). Acest
gen de erori se caracterizeaza in mod necesar prin legaturi principale, esentiale, intre diferiti
factori ai masurarii. Deoarece erorile sistematice au un caracter de repetabilitate aproape
identica in procesul executarii mai multor masurari prin aceeasi metoda, de acelasi operator
si cu acelasi aparat, ele devin greu depistabile in ciuda efectului lor cumulatoriu. De aceea,
diminuarea actiunii lor in procesul de masurare presupune inlaturarea cauzei care le
genereaza. De regula, cauza aparitiei unor astfel de erori este conditionata de reglarea
incorecta a aparatului, pozitionarea necorespunzatoare a acestuia, operatorul, conditiile
exterioare, obiectul de masurat etc. Legitatea de propagare a unor astfel de erori se
stabileste teoretic, pornind de la considerentul ca uneori cunoastem atat sursa generatoare,
cat si marimea erorii, iar alte ori se cunoaste numai un singur element sau chiar nici unul.
In sfirsit, este important de mentionat faptul ca erorile sistematice actioneaza asupra
rezultatelor de masurare simultan cu cele intamplatoare. Acest fapt franeaza procesul de
reliefare a cauzelor sistematice. De aceea, in astfel de situatii, procesul de masurare se
organizeaza astfel ca anumiti factori cu actiune sistematica sa fie delimitati cel putin partial
de cei cu actiune aleatoare.
Uneori, pe langa erori intamplatoare si sistematice, in procesul de masurare sau de
prelucrare a datelor experimentale, apar erori inadmisibile cunoscute in literatura de
specialitate sub denumirea de erori grosolane sau greseli (vezi Figura III.3). Totusi, nu
putem spune ca orice eroare inadmisibila reprezinta in acelasi timp o greseala. De exemplu,
orice rezultat gresit, care provine din defectarea brusca a aparatului de masurat sau ca
urmare a neatentiei operatorului in timpul executarii masurarilor, se elimina automat din
sirul celorlalte rezultate. In acelasi timp, o eroare inadmisibila in anumite conditii de
masurare poate fi pe deplin corespunzatoare in alte conditii cand se urmareste o precizie
mai mica. De aceea, pentru a delimita erorile de greseli, consideram necesara introducerea
notiunii de eroare inadmisibila. Aceasta poate fi relativ inadmisibila sau gresala
incontestabila, functie de cauza generatoare.
In sfarsit, trebuie subliniat faptul ca la verificarea calitatii rezultatelor obtinute din
masurari pot fi luate decizii afectate de asa-numitele erori de genul I si II (vezi Figura
III.4). De exemplu, daca un rezultat dintr-o anumita selectie de date se respinge ca fiind
44
necorespunzator, cand de fapt acesta este corespunzator, spunem ca am comis o eroare de
genul I. Daca acceptam drept corespunzator un produs care in realitate este
necorespunzator, spunem ca eroarea comisa in procesul deciziei este de genul II.



Figura III.5. Clasificarea erorilor de masura functie de forma lor matematica

In Figura III.2. se prezinta o varianta de clasificare generala a erorilor de masurare
care poate servi la proiectare si prelucrarea ulterioara a datelor de masurare. Totusi,
clasificarea erorilor de masurare nu poate trasa linii de de marcatie intre diferite tipuri de
erori, deoarece schimband anumite conditii in procesul de masurare se modifica si influenta
factorilor cu actiune sistematica, sau aleatoare. In acest caz, erori sistematice pot actiona ca
erori intamplatoare si invers.
Indicatorii definiti mai inainte ne furnizeaza informatii insuficiente pentru a putea
trage concluzii cu privire la precizia masurarilor daca nu-i legam de marimea fizica
masurata. Din aceste considerente in practica prelucrarii masurarilor se utilizeaza inca un
indicator denumit eroare relativa. Daca eroarea absoluta se raporteaza la o valoare normata
a marimii fizice masurate, atunci eroarea rezultata se numeste eroare redusa.




45
III.3. CALCULUL PARAMETRILOR STATISTICI PE BAZA
SELECTIILOR

Datorita erorilor de masura, valoarea adevarata a unei marimi fizice s-ar putea
determina numai efectuand un numar infinit de masuratori repetate in conditii
experimentale absolut identice. In acest caz, erorile s-ar compensa si in medie s-ar anula.
Cum practic nu se poate studia intreaga populatie de valori a unei variabile, caracteristicile
sale se determina prin intermediul caracteristicilor de acelasi fel ale variabilei de selectie.
Corectitudinea estimatiei depinde de cea a efectuarii selectiei.
Parametri statistici calculati pe baza intregii populatii sunt valori constante. Cei
determinati pe baza selectiilor constituie ei insasi variabile aleatoare. Valorile stabilite pe
baza selectiilor sunt "estimatii" ale intregii populatii daca ele converg in probabilitatea catre
acestea atunci cand volumul de selectie N (numarul datelor experimentale din selectie)
tinde catre infinit. Deci estimatiile reprezinta (cu o anumita probabilitate) caracteristicile
intregii populatii.
Valorile numerice ale unei variabile prin care descriem o selectie reflecta pe de o
parte insusirile proprii valorilor individuale din selectie (nespecifice populatiei) iar pe de
alta parte, in mod necesar, trebuie sa reflecte si proprietatile esentiale ale intregii
colectivitati. Ambele conditii sunt respectate daca valorile din selectie sunt extrase
reprezentativ, respectiv sunt omogene.


III.4. VERIFICAREA CARACTERULUI OMOGEN (ALEATOR) AL
DATELOR EXPERIMENTALE.

Estimarea valorii unei marimi fizice determinate experimental presupune, inainte de
toate, ca valorile succesive ale rezultatelor unor determinari repetate sa aiba un caracter
omogen (aleator), adica sa nu fie afectate de erori grosiere sau sistematice. Pentru
verificarea caracterului omogen al datelor din selectie se poate apela la diferite teste
statistice. Dintre acestea prezentam testul aglomerarii pe faze al lui Wallis si Moore, care se
preteaza si in cazul selectiilor mici, respectiv celor cu volumul N>10.
Testul porneste de la ipoteza ca daca sirul valorilor succesive ale unui sir de
observatii x
1
, x
2
,x
N
difera intamplator intre ele, atunci si succesiunea semnelor
diferentelor
46

(III.9)
i 1 i i , 1 i
x x =
+ +
N ,... 2 , 1 i =

ar trebui sa difere intamplator intre ele (ipoteza zero). Succesiunea a doua semne identice
este denumita "faza". Testul se bazeaza pe frecventa fazelor de (+) si (-) a diferentelor
. Numarul total al fazelor (mai putin cea initiala si cea finala) este notat cu h si
pentru N > 10, acest numar se repartizeaza normal cu media si dispersia
i , 1 i+


3
7 N 2
) h ( Med

=
90
29 N 16
) h ( Disp

= (III.10)

Pentru aplicarea testului, se defineste variabila normata functie de volumul selectiei


) h ( Disp
5 . 0 ) h ( Med h
z

= pentru N < 30 (III.11)
respectiv

) h ( Disp
) h ( Med h
z

= pentru N > 30 (III.12)

Variabila normata calculata z
calculat
se compara cu valoarea teoretica z
tabelar
care se
obtine din tabelul cu valorile functiei Laplace, pentru un nivel de semnificatie ales de
analist. Nivelul de semnificatie este =(1-P)/2 unde P este probabilitatea cu care se verifica
ipoteza. Daca |z
calculat
| < z
tabelar
, se admite ipoteza zero, si se trage concluzia ca diferentele
dintre valorile masurate x
i
(erorile experimentale la masurarea x
i
) au caracter aleator. Altfel
spus, selectia de date experimentale analizata are caracter omogen.
De exemplu, sa presupunem ca se doreste testarea caracterului aleator ale datelor
experimentale obtinute la masurarea densitatii hidrogenului in conditii normale. Valorile
masurate si testarea omogenitatii lor se efectueaza dupa cum este ilustrat in tabelul III.1.
Dupa cum se observa, testul poate da informatii daca selectia de date ca un intreg
are caracter omogen sau nu. In cazul unei selectii heterogene insa, acest test nu poate indica
care dintre valorile individuale din selectie sunt anormale (cu probabilitate foarte mica de a
se produce). Daca |z
calculat
| z
tabelar
, atunci selectia contine date afectate de erori
neacceptabile (grosiere sau sistematice). In acest caz, inainte de a continua cu estimarea
47
valorii adevarate a marimii fizice masurate, se impune identificarea datelor individuale
anormale prin teste statistice specifice, dupa cum se va arata mai jos. Depistarea si
eliminarea lor conduce la o noua selectie, omogena, desi cu volum mai redus.

Tabelul III.1. Testarea omogenitatii unei selectii de date

(Kg/m
3
) Semnul lui

i+1,i
= x
i+1
- x
i

Faza
0.00873
0.00867
0.00898
0.00898
0.00899
0.00872
0.00905
0.00901
0.00899
0.00893
0.00897
0.00895
0.00897
0.00900
0.00904
0.00899
0.00896
0.00902
0.00900
0.00901

-
+
+
+
-
+
-
-
-
+
-
+
+
+
-
-
+
-
+


1


2
3
4


5
6
7


8

9
10




Numarul fazelor: h=10

11
3
7 20 * 2
) h ( Med =

=
233 . 3
90
29 20 * 16
) h ( Disp =

=
278 . 0
233 . 3
5 . 0 11 10
z =

=

z
tabelar
(0.05) = 1.6 =>

|z |< z
tabelar
=> selectie omogena



III.5. ELIMINAREA DATELOR EXPERIMENTALE ANORMALE

Datele individuale din selectie care sunt anormale cu probabilitatea cea mai mare
sunt cele mai mari sau mai mici din selectie. De aceea este logic ca identificarea datelor
anormale se se inceapa prin testarea valorilor extreme. Testul cel mai indicat pentru
eliminarea rezultatelor anormale in cazul selectiilor foarte mici (N<8) este testul Q (Dean si
Dixon), bazat pe calculul parametrului:

min x
d
x
x x
Q
max

= (III.13)
48

unde x
d
este valoarea dubioasa (testata), x este valoarea cea mai apropiata de aceasta, x
max
si
x
min
sunt valoarea maxima, respectiv minima din selectia de valori analizate. Valoarea
Q
calculat
se compara cu valoarea Q
tabelat
in functie de probabilitatea P si numarul de
determinari (valori din selectie) N. Daca |Q
calculat
| < Q
tabelat
, valoarea x
d
este sigura
(omogena).

Tabelul III.2. Valorile parametrului Q (Dean si Dixon)

N P=90% P=95% P=99%
3 0.89 0.94 0.99
4 0.68 0.77 0.89
5 0.56 0.64 0.76
6 0.48 0.56 0.70
7 0.43 0.51 0.64
8 0.40 0.48 0.58

Pentru un lucru eficient, este deci util ca mai intai sa asezam in ordine crescatoare
valorile din selectie. Extremele acestui sir vor fi chiar x
min
respectiv x
max
. Cum valorile
extreme prezinta abaterile cele mai mari fata de tendinta centrala, se va incepe verificarea
normalitatii datelor chiar cu acestea. Daca depistam o valoare anormala (|Q
calculat
|
Q
tabelat
), aceasta se elimina din selectie. Procesul continua pana cand obtinem un sir de date
care au ambele extreme normale. Aceasta noua selectie de date este omogena de oarece
daca extremele sunt normale, atunci si valorile intermediare sunt sigure (omogene,
aleatoare).
De exemplu, la determinarea acceleratiei gravitationale cu ajutorul unui pendul
simplu, s-au gasit urmatoarele valori:

10.04 9.85 9.98 9.63 8.71 (m/s
2
)

Pentru verificarea rezultatelor anormale asezam valorile in ordinea crescatoare:

49
8.71 9.63 9.85 9.98 10.04 (m/s
2
)

Verificam normalitatea extrmei minime, respectiv a valorii dubioase x
d
= 8.71

69 . 0
7 . 8 04 . 10
63 . 9 71 . 8
Q
calculat
=

= 64 . 0 ) 5 N %, 95 P ( Q
tabelar
= = =

Deducem ca valoarea 8.71 m/s
2
este anormala si deci se elimina din selectie. Analizam
extremele noului sir de valori:

9.63 9.85 9.98 10.04 (m/s
2
)

Testam normalitatea noii extreme minime, respectiv a valorii 9.63 m/s
2
:

53 . O
63 . 9 04 . 10
85 . 9 63 . 9
Q
calculat
=

= < 77 . 0 ) 4 N %, 95 P ( Q
tabelar
= = =


de unde deducem ca valoarea 9.63 m/s
2
este normala si deci extrema minima se pastreaza
in selectie. Continuam cu testarea extremei maxime, si anume testam normalitatea valorii
x
d
= 10.04 m/s
2
:

14 , 0
63 . 9 04 . 10
98 . 9 04 . 10
Q
calculat
=

= < 77 . 0 ) 4 N %, 95 P ( Q
tabelar
= = =

Ambele valori extreme din noua selectie fiind normale, tragem concluzia ca selectia
ramasa, formata din N = 4 valori, este omogena.

La baza testarii rezultatelor dubioase in cazul selectiilor mici sta, in general
repartitia t (student). Pentru aplicarea testului t pentru eliminarea rezultatului anormal x
d
, se
determina mai intai media aritmetica
1 N
x

si abaterea standard s
N-1
, calculate pentru
selectia redusa formata din valorile ramase dupa eliminarea valorii dubioase x
d
din selectia
initiala, adica pentru formata din N-1 determinari:

50

1 N
x
x
1 N
1 i
i
1 N


( )
2
1
1 N
1 i
2
1 N i
1 N
2 N
x x
s
(
(
(
(
(



Apoi se calculeaza parametrul t specific selectiei reduse:
2
1
1 N
1 N
N
s
x x
t
d
calculat
(

(III.14)

Tabelul III.3. Valorile parametrului t Student

N
P=90% P=95% P=99%
4 2.132 2.776 4.604
5 2.015 2.571 4.032
6 1.943 2.447 3.707
7 1.895 2.365 3.499
8 1.860 2.306 3.355
9 1.883 2.262 3.250
10 1.812 2.288 3.169
11 1.796 2.201 3.106
12 1.782 2.179 3.055
13 1.771 2.160 3.012

Daca |t
calculat
| < t
tabelat
( P, N-2) ales cu probabilitatea P (la nivelul de incredere
( ) 2 / P 1 = ) si pentru N-2 grade de libertate, atunci valoarea x
d
este normala si
pastreaza in selectie. Daca ambele valori extreme din selectie sunt normale, tragem
concluzia ca selectia este omogena. Daca |t
calculat
| t
tabelat
, x
d
este o valoare neomogena si
51
trebuie eliminata din selectie. Procesul se continua iterativ pana cand obtinem o
(sub)selectie cu extremele omogene. Pe baza acesteia se poate trece in mod legitim la
caracterizarea intregii populatii pe baza selectiei de date, adica la calculul parametrilor
statistici ce estimeaza (cu probabilitatea P) marimea fizica masurata.

De exemplu, se dau urmatoarele N=10 valori obtinute la masurarea coeficientului
de frecare la alunecare dintre doua suprafete lustruite:

0.26 0.21 0.20 0.21 0.21 0.19 0.18 0.17 0.18 0.19

Se cere sa se stabileasca daca valorile extreme ale acestei selectii sunt normale.
Pentru aceasta, testam mai intai normalitatea valorii maxime x
d
= 0.26. Pentru
aceasta, pe baza subselectiei

0.21 0.20 0.21 0.21 0.19 0.18 0.17 0.18 0.19

calculam

193 . 0 x
9
= s
9
= 0.015
|t
calculat
|= |-4.24| > t
tabelar
( P = 95%, N-2 = 8) = 2.306

Tragem concluzia ca valoarea 0.26 este anormala si deci trebuie eliminata din
selectie. Considerand in continuare ca si valoarea minima din selectie (0.17) este dubioasa,
se aplica testul pe baza subselectiei

0.21 0.20 0.21 0.21 0.19 0.18 0.18 0.19


8
x = 0.146 s
8
= 0.0134 t
calculat
= -1.83 < t
tabelar
( P = 95%, 7) = 2.365

Ca atare valoarea 0.17 este normala si se pastreaza in selectie. Pentru obtinerea unei
selectii omogene, se continua cu testarea subselectiei

52
0.21 0.20 0.21 0.21 0.19 0.18 0.17 0.18 0.19

pana cand se obtine si o valoare maxima omogena.



III.6. PARAMETRII STATISTICI

Marimile fizice pot fi caracterizate pe baza unei selectii finite de date prin
parametrii tendintei centrale de grupare, ai variabilitatii si de forma a curbei de distributie a
datelor ce formeaza selectia.

III.6.1. PARAMETRII TENDINTEI CENTRALE
Tendinta centrala se evalueaza curent, in fizica, prin intermediul mediei aritmetice.
Informatiile despre tendinta centrala sunt insa completate eficient si de alti doi parametri, si
anume mediana si modulul. Pe langa tendinta centrala, prin evaluarea acestor trei parametri
se pot aprecia si alte proprietati ale selectiei de date, precum simetria sau omogenitatea
acesteia. In definirea acestor parametrii presupunem ca ei se calculeaza pe baza unei
selectii de N date experimentale obtinute prin masurari repetate pentru marimea fizica x,
deci toate sumele ce intervin in expresia parametrilor se calculeaza de la i=1 la i=N.

Media aritmetica X se foloseste cel mai des pentru evaluarea tendintei centrale
pentru ca este usor de definit matematic, se calculeaza usor, se preteaza la calcule algebrice
si intervine in expresiile altor parametri statistici.

= = =
i
i
i
i i
x
N
n
n
x n
N
x
x
i
(III.15)

= N n
i

unde n
i
arata deci de cate ori se repeta valoarea x
i
. Valorile n
i
se mai numesc frecvente
absolute, iar rapoartele dintre n
i
si N se numesc frecvente relative.
Mediana este acea valoare a unei selectii care imparte sirul datelor in doua grupe cu
acelasi numar de valori atunci cand datele sunt asezate in ordine crescatoare. Pentru o serie
de 2n + 1 valori, mediana are rangul n+1. Pentru o serie de 2n valori, mediana este media
aritmetica dintre valorile de rang n si n+1.
53
Mediana depinde doar de rangul de repartitie, deci ca valoare este mai putin
influentata de valorile extreme. Ca atare in seriile mici sau in seriile puternic asimetrice,
valoarea medianei este mai concludenta pentru tendinta centrala decat media aritmetica. Cu
cat diferenta dintre media aritmetica si mediana este mai mare, cu atat asimetria selectiei
este mai mare. Suma abaterilor in valoare absoluta a valorilor individuale din seria de date
este minima in comparatie cu suma cu suma abaterilor fata de orice alta valoare. Pe de alta
parte insa, mediana este insensibila la valorile efective din serie si nu se preteaza la calcule
algebrice.

Modulul este valoarea dominanta dintr-o serie statistica de date. Modulul este egal
cu valoarea marimii fizice care apare cu frecventa cea mai mare. Aparitia a doua sau mai
multe module arata de regula caracterul heterogen al repartitiei.


III.6.2. PARAMETRII VARIABILITATII

Variabilitatea termenilor unei selectii se calculeaza pentru a evalua gradul de
imprastiere a valorilor individuale in jurul tendintei centrale. Principalii parametri ai
variabilitatii datelor dintr-o selectie sunt:

Amplitudinea R este cea mai simpla forma de apreciere a variabilitatii date. Ea se
defineste ca diferenta dintre valoarea maxima si valoarea minima dintr-o selectie de date.
Cu cat amplitudinea este mai mare, cu atat variabilitatea selectiei este mai mare.

Dispersia s
2
este parametrul principal al imprastierii. Dispersia este media
aritmetica a patratelor abaterilor valorilor fata de media lor aritmetica.

( ) ( )
N
x x n
N
x x
s
2
i i
2
i 2

=

= (III.16)

= N n
i

Abaterea standard s (abaterea medie patratica) este radacina patrata a dispersiei.
Abaterea standard impreuna cu media aritmetica definesc repartitia normala a variabilei
aleatoare x. Curba de frecvente normala este

54
( )
2
2
2
) x (
e
2
1
x f


= (III.17)

unde si sunt valorile adevarate (specifice intregii populatii) a mediei aritmetice xsi
respectiv a abaterii standard s. Valorile si nu pot fi masurate sau calculate in practica,
deoarece ele se refera la populatii cu un numar infinit de determinari. Valorile si sunt
estimate prin media aritmetica x, respectiv abaterea standard s calculate pe baza selectiei
de date.

Coeficientul de variatie este un parametru care serveste pentru compararea a doua
selectii de date de natura diferita. Abaterea standard are aceleasi unitati de masura cu
valorile ce alcatuiesc selectie. De aceea nu se poate compara gradul de imprastiere a doua
selectii de natura diferita pe baza abaterilor standard. A fost necesara deci definirea unui
parametru statistic adimensional si anume coeficientul de variatie Cv, egal cu raportul
dintre abaterea standard si media aritmetica a valorilor selectiei. El arata deci ce fractiune
din media aritmetica reprezinta abaterea standard. Coeficientul de variatie Cv se exprima in
procente ca:

x
s
100 C
v
= (III.18)



III.6.3. CARACTERISTICILE FORMEI

Forma curbei de repartitie a valorilor selectiei in jurul tendintei centrale se defineste
prin boltirea si asimetria curbei, fata de curba normala.

Excesul (boltirea, gradul turtirii) unei curbe de repartitie se masoara prin
intermediul parametrului

( )
3
Ns
x x
Ex
4
4
i

=

(III.19)
55

Abaterile de ordin par mai mare decat 2 ale valorilor individuale de la media aritmetica scot
mai bine in evidenta comportarea valorilor extreme decat dispersia. Termenul de
comparatie este boltirea curbei normale (de frecvente), pentru care primul termen din
expresia excesului ia valoarea 3. Astfel, daca excesul este nul, curba de frecvente a selectiei
de date coincide cu cea normala. Daca excesul este negativ, distributia datelor nu este prea
convenabila, chiar daca selectia este omogena. Curba distributiei este mai turtita decat cea
normala si valorile extreme (afectate de erori experimentale relativ mari) au frecvente de
aparitie mai mari decat normal iar valorile apropiate mediei aritmetice au frecvente de
aparitie mai mici decat normal. Aceasta situatie se intalneste de obicei in cazul metodelor
de masura putin performante (reproductibilitate mica si precizie redusa). Daca excesul este
pozitiv, curba de frecvente este mai ascutita decat cea normala, deci numarul valorilor
extreme este redus, datele "adunandu-se" mai bine in jurul tendintei centrale. Aceasta
situatie denota ca metoda de masura aleasa este foarte performanta (reproductibilitate mare
si precizie semnificativa).

Asimetria curbei de frecvente a datelor indica preponderenta valorilor mai mici sau
mai mari decat media aritmetica. Pentru aceasta coeficientul de asimetrie a curbei de
frecvente se defineste cu ajutorul abaterilor de ordin impar (3) ale valorilor individuale fata
de valoarea mediei aritmetice:

( )
3
3
Ns
x x
As
i


= (III.20)

Intr-o selectie de valori perfect simetrice fata de tendinta centrala (media aritmetica),
abaterile negative si cele pozitive se compenseaza. Este cazul curbei de frecvente normale.
Valorile negative ale coeficientului de simetrie indica faptul ca numarul valorilor mai mici
decat media este preponderent, adica este mai mare decat cel normal. In acest caz este
recomandabil verificarea sistemului de masura din perspectiva erorilor de masura
sistematice prin lipsa. Valorile pozitive ale coeficientului de asimetrie indica faptul ca in
selectie apar valori mai mari decat tendinta centrala cu frecvente superioare decat normal.
In acest caz este posibil ca unele date din selectie sa fie afectate de erori sistematice prin
adaus. Trebuie observat ca asimetria, ca si excesul, este un parametru adimensional, deci
56
poate servi atat compararii unor selectii de date de aceeasi natura, cat si a unora de naturi
diferite.



)
III.7. VARIABILITATEA REZULTATELOR

III.7.1. EVALUAREA REPRODUCTIBILITATII DETERMINARILOR
INDIVIDUALE REPETATE

Domeniul de reproductibilitate al determinarilor individuale repetate al unei marimi
fizice este chiar domeniul de imprastiere al valorilor ei individuale, marimea fizica fiind
considerata variabila aleatoare independenta. In cazul in care selectia are putine valori (n <
30), iar variabilitatea rezultatelor se evalueaza prin intermediul abaterii standard de selectie
s, domeniul de imprastiere al valorilor individuale de o parte si de alta a valorii medii
adevarate este:

( s 1 N , P t x = (III.21)

Domeniul x poate fi atasat si valorilor individuale x
i
. Astfel, intervalul x
i
x
cuprinde, cu probabilitatea cu care s-a definit parametrul Student, valoarea adevarata a
marimii fizice (media intregii populatii) sau media de selectie:

x x x x
i i
+ (III.22)

Determinarea domeniului de reproductibilitate (imprastiere) este necesara in
prelucrarea datelor experimentale in fizica in mod deosebit pentru urmatoarele situatii:

determinarea valorii cu care pot diferi rezultatele obtinute pentru o marime fizica
fata de valoarea adevarata a acesteia, pentru o metoda de determinare data.
De exemplu, la determinarea concentratiei componentului principal dintr-un aliaj,
prin analiza spectrului sau de emisie, s-au gasit urmatoarele valori: 30.1, 31.4 si 30.9 %. Se
cere valoarea maxima cu care o valoare determinata prin aceasta metoda poate diferi de
valoarea adevarata a concentratiei, cu o probabilitate de P=95%, respectiv P = 99%. Pentru
aceasta se calculeaza domeniul de imprastiere:
57

x = 30.8% s = 0.69%
P = 95%: => t (95%, 2) = 4.30 => x = 4.30*0.69 = 2.97 =>
-2.97 x
i
+ 2.97 si x
i
- 2.97 x
i
+ 2.97

P = 99%: => t (99%, 2) = 9.93 => x = 9.93*0.69 = 6.85 =>
- 6.85 x
i
+ 6.85 si x
i
- 6.85 x
i
+ 6.85

Se trage concluzia ca orice determinare efectuata (sau ce se va efectua) cu aceasta
metoda nu poate diferi de valoarea reala cu mai mult de 2.97% sau respectiv 6.85% (cu o
siguranta de P=95% respectiv P=99%).

determinarea reproductibilitatii, de o parte si de alta a valorii nominale in
realizarea unui produs.
De exemplu, se analizeaza reproductibilitatea unei instalatii de prelevare a probelor
de minereu de pe o banda rulanta. Pentru aceasta s-au cantarit un numar de 250 de probe si
s-a gasit x = 126.18 g si s = 4.05g. Se cere sa se defineasca domeniul de reproductibilitate
pentru P = 99% de o parte si de alta a valorii adevarate si intervalele de imprastiere a
datelor individuale in raport cu cea mai mica si cea mai mare valoare gasita (116.6g si
136.6g) cuprinzand valoarea reala .
Domeniul de reproductibilitate (de imprastiere a valorilor individuale de o parte si
de alta a valorii adevarate ) este:

x = 2.58*4.05g = 10.41g

Domeniul de imprastiere a valorilor individuale in raport cu cea mai mica valoare gasita
este:

116.6g - 10.4g 116.6g + 10.4g
106.2g 127.0g

iar in raport cu cea mai mare valoare gasita:

58
136.6g - 10.4g 136.6g + 10.4g
126.2g 147.0g

Se observa ca x = 126.18 g, care estimeaza valoarea adevarata apartine celor
doua intervale calculate pentru , catre una din extremitati, asa cum era de asteptat.


III.7.2. DETERMINAREA INTERVALULUI DE INCREDERE

Intervalul de incredere (sau de siguranta) al valorii adevarate arata domeniul la
care aceasta apartine cu o probabilitate data P. Intervalul de incredere al valorii adevarate
este egal cu domeniul de imprastiere al valorii medii. Daca selectia are un volum N si o
abatere standard s, atunci intervalul de incredere este:

( )
N
s
1 N , P t x = (III.23)

( ) ( )
N
s
1 N , P t x
N
s
1 N , P t x + (III.24)

unde numarul gradelor de libertate este egal cu cel cu care s-a calculat abaterea standard s.
Valoarea adevarata apartine acestui interval cu o siguranta statistica aleasa de analist
(probabilitatea P considerata la alegerea valorii parametrului Student), sau altfel spus, unui
prag de semnificatie = 100 - P%.
De exemplu, se doreste evaluarea intervalului de incredere pentru selectia de date
obtinute la determinarea componentei principale a unui aliaj, din exemplul numeric din
paragraful anterior. Atunci:

x = 30.8% s = 0.69%
P = 95% : t (95%, 2) = 4.30 => % 71 . 1 %
3
69 . 0 3 . 4
x =

=
30.8% - 1.71% 30.8% + 1.71% =>
28.1% 32.51%
59

P = 99%: t (95%, 2) = 9.93 => % 96 . 3 %
3
69 . 0 93 . 9
x =

=
30.8% - 3.96% 30.8% + 3.96% =>
26.84% 34.76%

Se observa ca, pentru aceeasi selectie de valori, largimea intervalului de incredere
este cu atat mai mare cu cat apartenenta valorii adevarate la acest interval este afirmata cu
mai multa siguranta (probabilitatea P mai mare). Cu cat intervalul de incredere este mai
ingust, cu atat precizia determinarilor este mai mare. Valoarea intervalului de incredere
tinde la 0 atunci cand N al selectiei tinde catre infinit. Deci teoretic, acest interval poate fi
facut ori cat de mic prin marirea volumului selectiei, respectiv prin efectuarea unui numar
mai mare de determinari repetate. Totusi, intervalul de incredere depinzand invers
proportional de radacina patrata a volumului selectiei, pe masura ce N creste, influenta lui
asupra valorii intervalului de incredere devine din ce in ce mai slaba. Cresterea lui N are o
influenta puternica la trecerea de la N = 2 la N = 3 sau N = 4 determinari repetate. Mai
departe efectul cresterii volumului selectiei devine putin marcant. Ca atare, din motive
pragmatice, este util ca in situatia in care se doreste atingerea unei precizii date, sa se
determine numarul minim de determinari repetate necesare in acest scop.


III.7.3. DETERMINAREA NUMARULUI MINIM DE DETERMINARI
REPETATE PENTRU OBTINEREA UNEI PRECIZII DORITE

In acest scop se rearanjeaza ecuatia (III.15) in modul:


N
t
s
x
=

(III.25)

Fie E eroarea maxima procentuala admisibila:

100
x
x
E

= =>
100
x E
x

= (III.26)

60
Inlocuind x in relatia (III.17) se obtine:


N
t
s 100
x E
=

(III.27)

Dar raportul dintre medie si abaterea standard este chiar coeficientul de variatie, deci:


N
t
C 100
E
v
=

(III.28)

unde 100*C
v
este coeficientul de variatie exprimat in procente. Cunoscand coeficientul de
variatie si eroarea maxima procentuala admisa, se determina valoarea
N
t
. Folosind
tabelele cu valorile acestui raport functie de probabilitatea Pdorita, se determina valoarea
numarul de determinari necesare.

De exemplu se cere sa se stabileasca numarul de determinari necesare obtinerii unui
coeficient de variatie procentual 100 C
v
=3% si o eroare maxima procentuala admisibila de
2%. Este suficienta siguranta ca eroarea nu va depasi 2% cu o probabilitate de 95%. Avem:

67 . 0
% 3
% 2
C 100
E
v
= =

=> 67 . 0
N
t
= P = 95% => N = 11

Daca ar fi suficienta o eroare maxima procentuala de 3%, atunci 1
N
t
= si din tabel se
obtine un numar minim de masuratori necesare N=7.
Pentru a obtine aceeasi eroare procentuala printr-un numar de determinari repetate
mai mic, trebuie deci sa se foloseasca o metoda de determinare mai precisa (caracterizata
de o valoare mai mica a coeficientului de corelatie).



61
Tabelul III.4. Valorile parametrului
N
t


N / t N / t
N
P=95% P=99%

N
P=95% P=99%
2 9.02 45.1 11 0.67 0.95
3 2.48 5.73 12 0.64 0.90
4 1.59 2.92 13 0.60 0.85
5 1.24 2.05 14 0.58 0.80
6 1.05 1.65 15 0.55 0.77
7 0.92 1.40 16 0.53 0.74
8 0.84 1.24 17 0.51 0.71
9 0.77 1.12 18 0.50 0.68
10 0.72 1.03 19 0.48 0.66


III.8. COMPARATII STATISTICE

III.8.1. COMPARAREA UNEI MEDII DE SELECTIE CU MEDIA
CUNOSCUTA A INTREGII POPULATII. EVIDENTIEREA ERORILOR
SISTEMATICE

Cea mai simpla problema de comparatie care se pune in prelucrarea datelor
experimentale in fizica este compararea mediei unei serii de determinari paralele cu
valoarea reala, respectiv cu valoarea cunoscuta a unei marimi fizice (a etalonului). Stabilind
daca metoda, difera de cea cunoscuta (nominala) semnificativ sau din contra, difera
intamplator, se pot pune in evidenta erorile sistematice.
Pentru compararea mediei unei serii de determinari paralele cu valoarea reala,
aceasta din urma se ia egala cu cea nominala si se aplica testul Student. Astfel, avand o
62
selectie de N observatii independente, cu media x, care face parte dintr-o populatie cu
media generala si abaterea standard , testarea se face cu ajutorul relatiei


x
x
t


= ,
N
x

= (III.29)

Valoarea parametrului t se estimeaza in practica prin valoarea calculata


N
s
x
t
calculat

=

care se compara cu valoarea teoretica t
tabelat
=t(P,N-1) regasita in tabele. Daca ,t
calculat
,<
t
tabelat
, atunci diferenta dintre medie si valoarea adevarata (cunoscuta) este intamplatoare.
Daca ,t
calculat
, t
tabelat
, atunci aceasta diferenta este semnificativa si poate indica prezenta
unor erori sistematice.

De exemplu, la instituirea unei noi metode de masura, facandu-se 10 determinari
repetate, s-a gasit continutul probei in elementul de determinat

x = 34.45 mg / ml s = 0.806 mg / ml

Cantitatea luata in proba a fost = 34.00 mg / ml. Se intreaba daca valoarea gasita pentru
medie este intamplatoare sau metoda noua de masura are erori sistematice. Aplicand testul
Student, se obtine:

76 . 1
10
ml
mg
806 . 0
ml
mg
00 . 34
ml
mg
45 . 34
N
s
x
t
calculat
=

=

=

t
calculat
= 1.76

< t(P=95%, N-1) = 2.26

63
Deci media de selectie difera doar intamplator de valoarea reala. Se poate trage concluzia
ca noua metoda de masura nu introduce erori sistematice.
Tot prin compararea valorii medii se poate aprecia daca o selectie apartine sau nu
unei populatii date. Aceasta situatie apare de exemplu in cazul verificarii masurilor.
Presupunem astfel ca s-a cantarit de N = 10 ori o masa marcata, gasindu-se urmatoarele
valori (in grame):

100.3 99.2 99.4 100.0 99.7
99.9 99.4 100.1 99.4 99.6

Se cere sa se stabileasca daca masa marcata apartine sau nu populatiei cu media = 100g
(valoarea inscriptionata pe masa marcata respectiva). Calculele conduc la urmatoarele
rezultate:

6 . 2
10
g 359 . 0
g 100 g 7 . 99
N
s
x
t
calculat
=

=

=

| t
calculat
| > t (P=95%, N - 1 = 9) = 2.26

Se trage concluzia ca diferenta este semnificativa si ca deci masa marcata este
necorespunzatoare si nu mai poate fi folosita fara o reconditionare. Media masuratorilor
fiind mai mica (semnificativ) decat valoarea nominala , inseamna ca masa marcata
respectiva introduce erori sistematice prin lipsa.


III.8.2. COMPARAREA A DOUA MEDII DE SELECTIE

Verificarea distinctiei dintre doua medii de selectie
1
x si
2
x este folositoare
pentru a stabili daca doua medii statistice, intre care exista diferente mici de valoare, sunt
caracteristice aceleasi populatii totale sau caracterizeaza populatii statistice diferite.
Rezolvarea consta in aplicarea ipotezei nule = =
2 1
x x . Se formeaza variabila redusa

64

d
2 1
d
x x d
u

= unde
2
2
1
1
d
N N

+

= (III.30)

care difera intamplator de zero daca cele doua medii de selectie difera intamplator intre ele
(apartin aceleiasi populatii totale). Daca variabila redusa difera semnificativ de zero, atunci
intre cele doua medii de selectie exista o diferenta semnificativa si deci ele caracterizeaza
doua populatii diferite. Atunci cand determinarile pentru ambele selectii de date se fac cu
acelasi aparat de masura, se poate accepta, fara verificare, ca dispersiile adevarate
1
si
2

sunt egale. In acest caz, expresia abaterii standard a diferentei se simplifica:


2 1
2 1
2
2
1
1
d
N N
N N
N N
+
=

= (III.31)

In practica valorile
1
=
2
= se estimeaza prin abaterile standard de selectie s
1
= s
2
=s.
Daca selectiile de date au fost obtinute astfel incat sa aiba si volume egale N
1
=N
2
=N, atunci


N
2
d
= (III.32)

Testarea gradului de semnificatie intre doua medii de selectie se efectueaza insa diferit
functie de volumul celor doua selectii de date experimentale. Avem urmatoarele cazuri:

Daca ( s ) si cele doua selectii au volum mare (N
2 1

2 1
s
1
, N
2
>30),
variabila redusa u are o distributie normal-normata si distinctia dintre cele doua
medii de selectie se face cu ajutorul testului z. Pentru testare se calculeaza variabila

d
2 1
s
x x
z u

= = unde
2
2
2
1
2
1
N
s
N
s
d
+ = s (III.33)

unde s
d
este abaterea standard a diferentei. Daca cele doua selectii au volum egal N
1
=N
2
=N,
expresia abaterii standard a diferentei se simplifica:

65

N
s s
s
2
2
2
1
d
+
= (III.34)

Pentru testarea ipotezei nule, modulul valorii calculate a parametrului z se compara cu
valoarea tabelata a parametrului z dupa repartitia normal-normata. Daca |z
calculat
|< z
tabelar,
diferenta dintre cele doua medii de selectie este nesemnificativa, iar selectiile
caracterizeaza aceeasi populatie de valori, respectiv = =
2 1
x x .

Daca
1
=
2
= (s
1
= s
2
= s) si cele doua selectii au volum mare (N
1
, N
2
>30),
variabila redusa u are tot distributie normal-normata si distinctia dintre cele doua
medii de selectie se face si in acest caz cu ajutorul testului z. Pentru testare se
calculeaza variabila

d
2 1
s
x x
z u

= = unde
2 1
d
N
1
N
1
s
N
s
N
s
2
2
2
1
2
1
+ = + = s (III.35)

unde s
d
este abaterea standard a diferentei. Daca N
1
=N
2
=N,


N
2
s s
d
= (III.36)


In cazul in care
1
=
2
= (estimate prin s
1
= s
2
=s) si cele doua selectii au volum
mic (N
1
, N
2
<30), variabila redusa u are o distributie normala si deci distinctia
dintre cele doua medii de selectie se face cu ajutorul testului t:

d
2 1
x x
t u

= = (III.37)

Abaterea standard
d
a diferentei dintre medii se estimeaza prin

66

2 1
2 1
N N
N N
s s
T d d

+
= =
( )
2 N N
s 1 N s ) 1 N (
s
2 1
2
2 2
2
1 1
T
+
+
= (III.38)

unde s
T
este abaterea standard (totala) calculata pentru ansamblul celor doua selectii. Cum
s
1
= s
2
=s, atunci s
T
=s si


2 1
2 1
N N
N N
s s
d d

+
= = (III.39)

iar daca cele doua selectii au si acelasi volum N
1
=N
2
=N


N
2
s s
d d
= = (III.40)

Pentru testarea semnificatiei diferentei dintre cele doua medii de selectie, se
compara modulul parametrului t
calculat
cu valoarea tabelata t(P,=N
1
+N
2
-2) corespunzatoare
repartitiei Student. Daca t
calculat
< t
tabelar
, atunci diferenta dintre cele doua medii este
intamplatoare (nesemnificativa).


Si in cazul in care ( s ) si cele doua selectii au volum mic (N
2 1

2 1
s
1
, N
2

<30), variabila redusa u are o distributie normala, ca atare semnificatia diferentei
dintre cele doua medii de selectie se face cu ajutorul testului t:

2
2
2
1
2
1
2 1
N
s
N
s
x x
s
x x
t
d
2 1
+

= (III.41)

Insa in acest caz marimea t are o repartitie Student cu numarul de grade de libertate

67

( ) ( )
1 N
c 1
1 N
c
1
c 1 c
1
2
2
1
2
2
2
1
2

= (III.42)

unde
1
si
2
sunt numarul de grade de libertate a celor doua selectii, iar


2
2
2
1
2
1
1
2
1
N
s
N
s
N
s
c
+
= (III.43)

Daca cele doua selectii au si volume egale N
1
=N
2
=N, iar
1
= N
1
-1 si
2
= N
2
-1,
atunci si
1
=
2
=


N
s s
x x
t
2
2
2
1
2 1
+

= (III.44)


( ) ( )
2 2 2 2
1
c 1 c
1 N
c 1 c +

=
+

= (III.45)


2
2
2
1
2
1
s s
s
c
+
= (III.46)

Compararea valorii a doua medii de selectie isi gaseste multiple aplicatii in
prelucrarea datelor experimentale in fizica. Dintre acestea amintim:


III.8.2.1. TESTAREA CALITATII UNUI MATERIAL

Adeseori apare situatia in care o anumita marime fizica se masoara periodic, prin
aceeasi metoda si de catre acelasi analist, pentru a caracteriza calitatile unui material. Sa
68
presupunem ca o prima sarja din proba respectiva a fost analizata printr-un numar de N
1

masuratori repetate, ce au condus la o valoare medie
1
x a marimii fizice x si o abatere
standard s
1
. O a doua sarja a fost analizata printr-un numar de N
2
masuratori repetate.
Valoarea medie a marimii fizice
2
x este foarte apropiata de cea specifica primei sarje, dar
totusi diferita. De asemenea abaterea standard pentru al doilea set de masuratori, s
2
difera
de s
1
. Se pune problema daca cele doua sarje sunt identice, respectiv daca constituie
materiale cu aceleasi calitati din punctul de vedere al marimii fizice x.
Acest lucru se poate demonstra aratand ca diferenta dintre cele doua medii este
nesemnificativa, adica se datoreaza numai erorilor intamplatoare. Daca cele doua sarje sunt
diferite, inseamna ca ele reprezinta materiale cu calitati fizice diferite, adica diferenta dintre
cele doua medii este semnificativa (nu este intamplatoare).
De exemplu, doua probe de fonta obtinute prin aceeasi tehnologie au fost analizate
prin aceeasi metoda, in acelasi laborator, de catre acelasi analist. S-au obtinut urmatorii
parametri statistici pentru continutul de carbon al probelor

N
1
= 30 x
1
= 2.50% s
1
= 0.15%
N
2
= 35 x
2
= 2.38% s
2
= 0.08%

Se pune intrebarea daca cele doua fonte difera sub raportul compozitiei in carbon. Pentru a
testa daca diferenta dintre cele doua medii de selectie difera semnificativ, se calculeaza
parametrul.
92 . 3
35
%) 08 . 0 (
30
%) 15 . 0 (
% 38 . 2 % 50 . 2
z
2 2
=
+

=

In tabelul cu valorile parametrului z (valorile functiei Laplace) se gaseste ca pentru
2 = 0.05 si P = 2*0.495 = 0.99, z

= 2.58

z
calculat
= 3.92 > z
tabelar
= 2.58

deci cele doua sarje de fonta difera semnificativ din punctul de vedere al compozitiei prin
concentratia de carbon.


69
III.8.2.2. TESTAREA PRECIZIEI MASURATORILOR EFECTUATE DE
CATRE UN ANALIST

Testarea modului in care un analist incepator si-a insusit o tehnica de masura se
poate face comparand rezultatele obtinute de acesta cu cele obtinute de un analist suficient
de experimentat, la masurarea aceleasi marimi fizice, pentru aceeasi proba.
De exemplu, doi analisti determina frecventa aceluiasi semnal electric variabil
folosind aceeasi metoda de determinare (figuri Lissajoux). Se cere sa se stabileasca daca
rezultatul gasit de analistul A difera semnificativ de rezultatele gasite de analistul B.

N
A
= 5
A
x = 12.36 Hz = 0.0232 Hz
2
A
s
2

N
B
= 5
B
x

= 12.24 Hz = 0.0332 Hz
2
B
s
2


Hz 168 . 0
8
Hz 0332 . 0 * 4 Hz 0232 . 0 * 4
s
2 2
T
=
+
=

cu =8 grade de libertate, iar

13 . 1
5
1
5
1
* Hz 168 . 0
Hz 24 . 12 Hz 36 . 12
t =
+

=

Luand = 5%, in tabel gasim t (P = 95%, = 8) = 1.86. Cum t
calculat
= 1.13 < t
tabelar
=
1.86, rezulta ca rezultatele celor doi analisti difera intamplator intre ele. Cu alte cuvinte,
diferentele sunt nesemnificative si se datoreaza erorilor intamplatoare. In exemplul concret
ales se poate deci trage concluzia ca analistul B (incepator) si-a insusit corest tehnica de
masura.





70
III.8.2.3 DETERMINAREA CELEI MAI MICI DIFERENTE
SEMNIFICATIVE DINTRE DOUA MEDII.

O alta problema care poate apare in prelucrarea datelor experimentale in fizica este
calculul diferentei minime dintre doua medii dincolo de care se poate afirma ca cele doua
selectii provin de la populatii diferite, respectiv ca diferenta dintre mediile de selectie
obtinute este semnificativa. O metoda de masura este cu atat mai precisa cu cat diferenta
semnificativa caracteristica ei este mai mica. Obtinerea unei diferente mai mari decat cea
semnificativa pentru doua selectii de date obtinute prin masuratori cu aceasta metoda
asupra aceleasi probe denota prezenta (in cazul uneia dintre selectii) a erorilor sistematice.
Cea mai mica diferenta semnificativa dintre doua medii de selectie se defineste ca:

( )
d 2 1 2 1 im min
s 2 N N , P t x x x + = = =

(III.47)


N
s 2
s
2
T
d
=
(III.48)

unde s
T
este dispersia ansamblului celor doua selectii, s
d
este abaterea standard a diferentei
dintre mediile de selectie, iar N = N
1
+N
2
-2 este volumul total de selectie.
De exemplu, daca consideram ca s-au efectuat doua serii de masuratori repetate de
egala precizie
1
=
2
= (masuratori efectuate cu acelasi aparat), asupra tensiunii dintr-un
circuit si s-au obtinut urmatorii parametri statistici:
N
1
= 25
1
x = 23.56 V s
1
= 1.10 V
N
2
= 50
2
x = 22.80 V s
2
= 1.25 V

Cea mai mica diferenta semnificativa dintre doua medii obtinute pe baza unor selectii de
date masurate in aceleasi conditii ca si aceste doua selectii este:

V 298 . 0
50
1
25
1
*
2 50 25
25 . 1 * 49 10 . 1 * 24
s
2 2
d
= +
+
+
=

t (P=99%,73) = 2.65 =>
im min
x = 2.65*0.298 = 0.789 V
71
III.8.2.4. COMPARAREA EXACTITATII A DOUA METODE DE
MASURA

In cazul compararii a doua valori medii avand dispersii adevarate
1
si
2
diferite
(selectiile fac parte din populatii diferite) si necunoscute, atunci testarea semnificatiei
diferentei dintre mediile celor doua selectii se efectueaza prin intermediul parametrului t
Student calculat dupa expresia:

2
2
2
1
2
1
2 1
N
s
N
s
x x
t
+

=
2
2
1
2
) c 1 ( c
1

=
2 N
s
N
s
N
s
2
2
1
2
1
1
2
1
+
= c (III.49)

Calculele se simplifica mult daca se alege N
1
= N
2
= N. Atunci expresia lui t se
reduce la:

N *
s s
x x
t
2
2
2
1
2 1
+

= (III.50)

Daca modulul valorii parametrului t astfel calculat este mai mic decat valoarea tabelata
pentru t(P, N-1), atunci diferenta dintre medii este nesemnificativa.
Mediile referindu-se la populatii diferite, inseamna ca se refera la doua selectii de
masuratori asupra aceleasi probe dar prin doua metode diferite. Daca diferenta nu este
semnificativa, inseamna ca nici una dintre cele doua metode de masura a acelei marimi
fizice nu este afectata de erori sistematice.
De exemplu, pentru determinarea unui component dintr-un material omogen se
utilizeaza doua metode diferite (1 si 2). S-a obtinut:

N
1
= 25
1
x = 10.48% s
1
= 0.052
2
N
2
= 20
2
x = 11.22% s = 0.275
2
2

Se pune intrebarea daca cele metode sunt la fel de exacte (daca cele doua medii nu
difera semnificativ), deoarece se vede ca a doua metoda este mult mai precisa.

72
13 . 0
20
% 275 . 0
25
% 052 . 0
25
% 052 . 0
c =
+
=

25
19
) 13 . 0 1 (
24
13 . 0
1
2 2
=

+
=

86 . 5
20
% 275 . 0
25
% 052 . 0
% 22 . 1 % 48 . 10
t =
+

=

| t
calculat
| > t(P = 99%, 25) = 2.79

deci diferenta dintre medii este semnificativa. Ca atare se poate trage concluzia ca a doua
metoda este mult mai putin exacta decat prima, respectiv ca una dintre metode este insotita
de erori sistematice.
Daca se doreste compararea a doua metode de determinare a aceleasi marimi fizice,
prin doua metode: una precisa si exacta dar lenta, iar a doua rapida dar cu precizie redusa.
Trebuie sa stabilim daca metodele sunt la fel de exacte. Prin ambele metode s-au efectuat
un numar de N = 10 determinari repetate.


1
x = 20.5 mg / 1 = 0.050 mg
2
1
s
2
/ l
2


2
x = 21.4 mg / l = 0.420 mg
2
2
s
2
/ l
2


1 . 4
420 . 0 050 . 0
4 . 21 5 . 20
t =
+

=

| t
calculat
| > t (P = 99%, N-1 = 9) = 3.25

Se trage concluzia ca diferenta dintre medii este semnificativa. Cea de-a doua metoda nu
numai ca nu este precisa, dar este insotita si de o eroare sistematica.
73
CAPITOLUL IV. LEGATURA INTRE VARIABILE


IV.1. CORELATIE SI REGRESIE

Fie doua variabile, respectiv variabila independenta x si variabila y dependenta de
aceasta. Daca pentru o valoare determinata a variabilei independente x, variabila
dependenta y ia de asemenea o valoare determinata, discreta, se spune ca intre ele exista o
legatura functionala y = f(x).



Daca fiecarei valori x ii corespunde nu o singura valoare y, ci o repartitie legata de
valori y (legata de valoarea lui x), caracterizata fiecare prin cate o medie y legata, avem
de-a face cu o legatura statistica (stohastica), respectiv exista o corelatie intre y si x.
Consideratiile ce s-au facut presupun ca repartitia variabilei y este normala.
Daca fixam valoarea lui x, putem estima valoarea repartitiei legate y. Mediile
repartitiilor legate se plaseaza aproximativ de-a lungul unei drepte. Dreapta care trece cel
mai aproape de toate punctele, reprezentand aceste medii, se numeste dreapta de regresie a
lui y in raport cu x. In practica avem adesea la dispozitie pentru diferite valori x numai cate
o singura valoare observata y. In acest caz dreapta de regresie se construieste pe baza
74
acestor valori individuale (in loc de valorile medii). Este vorba despre dreptele de etalonare
(calibrare) din metodele instrumentale de analiza.


Figura IV.2. Dreapta de regresie

Daca cele doua variabile x si y sunt independente, legatura functionala este o
dreapta paralela cu abscisa, respectiv functia f(x) ia aceeasi valoare Y oricare ar fi valoarea
variabilei x:

Figura IV.3. Independenta a doua variabile
75
In practica experimentala, datorita inerentei erorilor de masurare, independenta dintre
marimile x si y se manifesta printr-un anumit domeniu in care avem o repartitie de valori y,
domeniul avand aceeasi valoare pentru orice valoare x:


Estimatia dreptei de regresie are o precizie cu cat mai mare cu cat corelatia este mai
intensa. Gradul de legatura intre variabilele x si y este masurat prin parametrul covarianta:


1 N
) y y )( x x (
s
i i 2
xy


=


N
x
x
i

=
N
y
y
i

= (IV.1)

in care N este numarul de observatii perechi (x
i
,y
i
), iar x si y sunt valorile medii. Expresia
data este covariatia estimata pe baza unei selectii de date. Pentru intreaga populatie (N
), covarianta ia valoarea adevarata si se noteaza
xy
2
. Ca atare s
xy
2
este o estimatie a
valorii adevarate
xy
2
.
Facand expresia independenta de unitatea de masura, covarianta se transforma in
coeficient de corelatie:


y x
i i
xy
s s ) 1 N (
) y y )( x x (
r


=

(IV.2)

76
Expresia data se calculeaza pe baza datelor unei selectii si este o estimatie a valorii
adevarate
xy
a coeficientul de corelatie pentru intreaga populatie de valori.
In practica, suma produselor

se pot calcula mai comod, tinand


cont de faptul ca
) y y )( x x (
i i

=

) y y )( x x (
i i
= +

y x N y x x y y x
i i i i

= +


N
y
N
x
N x N y x N y y x
i i
i i

N
) y ( ) x (
y x
i i
i i
(IV.3)

Covariatia devine:


1 N
N
y x
y x
s
i i
i i
2
xy

=


(IV.4)

Abaterile standard s
x
si s
y
se calculeaza in mod analog acestei relatii:

( )
( )
1 N
N
x
x
1 N
x x
s
2
i 2
i
2
i 2
x

(IV.5)

( )
( )
1 N
N
y
y
1 N
y y
s
2
i 2
i
2
i 2
y

(IV.6)

iar coeficientul de corelatie:


y x
i i
i i
xy
s s ) 1 N (
N
y x
y x
r

=


(IV.7a)

77
adica

y x
2
xy
xy
s s
s
r = (IV.7b)

Coeficientul de corelatie poate varia intre -1 si +1. Cu cat este mai apropiat de una
din valoarile extreme -1 sau +1, corelatia rectilinie este mai intensa. Daca valorile mici ale
unei variabile se intalnesc cu valori mici ale celeilalte variabile, sau daca valori mai mari
ale unei variabile, se intalnesc cu valori mari ale celeilalte, r
xy
este pozitiv si spunem ca
variabilele sunt corelate pozitiv. Daca valori mici ale unei variabile se intalnesc cu valori
mari ale celeilalte, sau invers, coeficientul de corelatie r
xy
(si bineinteles si covarianta) este
negativ si variabilele au o corelatie negativa.
Daca variabilele nu sunt corelate liniar, coeficientul de corelatie este nul.
Coeficientul de corelatie calculat pentru intreaga populatie de valori se anuleaza in cazul a
doua variabile independente. In practica experimentala, datorita erorilor de masurare, nu
obtinem niciodata valoarea zero. Trebuie insa subliniat faptul ca un coeficient de corelatie
nul nu indica neaparat faptul ca cele doua variabile ar fi independente, ci numai ca intre ele
nu exista nici o corelatie liniara. Un coeficient nul se poate obtine pentru doua variabile
intre care exista orice alt tip de dependenta (polinomiala de grad mai mare sau egal cu 2,
exponentiala, logaritmica, etc) in afara de cea liniara.
Cand se pune problema stabilirii unei legaturi intre doua variabile pe baza unor date
de observatie, in primul rand se determina coeficientul de corelatie. Daca acesta este in
jurul valorii 1 atunci se poate presupune ca intre cele doua variabile este o legatura
cvasifunctionala ce se traduce printr-o relatie liniara si se trece la experimentarea
sistematica. Pentru aceasta variem variabila x nesupusa la erori (respectiv supusa la erori
minime) si determinam valorile raspuns ale variabilei y dependenta ( supusa la erori
experimentale). Se stabileste apoi dreapta de regresie care da mult mai multa informatie. In
practica analitica, in cazul operatiei de etalonare (calibrare) se trece, in general, direct la
construirea dreptelor de regresie. Nu mai este necesar sa se calculeze in prealabil
coeficientul de corelatie, corelatia liniara foarte stransa intre cele doua variabile fiind
cunoscuta.



78
IV.2. TESTAREA EXISTENTEI UNEI CORELATII LINIARE

Pentru testarea existentei unei dependente liniare intre variabilele x si y, se emite
ipoteza nula ca valoarea coeficientului de corelatie de selectie este r=0. Apoi se verifica pe
baza valorii tabelare a lui r, care da probabilitatea de a se gasi o valoare a lui r
calculat
egala
sau superioara valorii specificate, pe baza datelor selectiei, pentru grade de libertate.
Numarul gradelor de libertate este = N-2 deoarece sunt doua restrictii: atat x cat si y
sunt calculate pe baza datelor de selectie. Daca |r
calculat
| r(P, ), ipoteza nula se confirma
si tragem concluzia ca intre cele doua variabile nu exista o corelatie liniara. Daca |r
calculat
|
> r(P, ), corelatia liniara este dovedita.


Tabelul IV.1. Repartitia coeficientului de corelatie r
Pragul de probabilitate P (%)

10 8 2 1 0,1
3 0.805 0.878 0.934 0.959 0.991
4 0.729 0.811 0.882 0.917 0.974
6 0.621 0.707 0.789 0.834 0.925
8 0.549 0.632 0.715 0.765 0.872
10 0.497 0.576 0.658 0.708 0.823
12 0.457 0.532 0.612 0.661 0.780
14 0.426 0.497 0.574 0.623 0.742
16 0.400 0.468 0.543 0.590 0.708
18 0.378 0.444 0.516 0.561 0.679
20 0.360 0.423 0.492 0.537 0.652


Sa consideram urmatorul exemplu: in decursul unui studiu asupra aducerii in solutie
a streptomicinei in pulbere (dizolvarea rapida este o calitate importanta), dintre factorii care
pot influenta aceasta dizolvare a retinut atentia in mod deosebit densitatea solutiilor de
79
streptomicina masurata in faza imediat anterioara uscarii. Se cere sa se stabileasca daca
exista o corelatie intre aceste doua marimi. In tabelul IV.2, in primele doua coloane cuprind
se dau rezultatele experimentale privind 13 loturi de streptomicina luate la intamplare (prin
sondaj).
Reprezentarea datelor experimentale (vezi Figura IV.5) arata ca ar exista o corelatie
pozitiva. Cum insa aceasta corelatie nu este foarte evidenta, existenta ei trebuie testata
statistic.



Figura IV.5. Corelatia densitatii streptomicinei de timpul de aducere in solutie


Avem conform relatiilor IV.5-7:

16 , 701
12
13
494
27186
s
2
2
x
=

= 3 , 1092
12
13
830
66100
s
2
2
y
=

=

778 , 0
3 , 1092 16 , 701 12
13
830 494
39705
r
xy
=

=

80
Tabelul IV.2. Dependenta densitatii streptomicinei de timpul de aducere in solutie
Densitate
x =
(mg/ml)
Timpul de
aducere in
solutie y = t(s)

x' = (x-1100)

x'
2

y
i
2

x
i
'y
i
1140
1092
1127
1175
1162
1105
1160
1143
1170
1105
1150
1145
1120
95
35
15
120
105
20
70
90
100
45
45
45
45
40
-8
27
75
62
5
60
43
70
5
50
45
20
1600
94
729
5625
3844
25
3600
1849
4900
25
2500
2025
400
9025
1225
226
12100
11025
400
4900
8100
10000
2025
2025
2025
2025
3800
-280
405
8250
6510
100
4200
3870
7000
225
2250
2475
900
Sume y
i
=
830
x'
i
=
494
x'
i
2
=
27186
y
i
2
=
66100
x
i
'y
i
=
39705


Cautand in tabelul IV.1. pentru N-2 = 11 si pragul P=5%, gasim r(P,N-2) ~ 0.555,
iar pentru pragul P=1%, valoarea r(P,N-2) ~ 0.68. Reiese ca viteza de dizolvare este
corelata liniar cu densitatea.


IV.3. REGRESIA LINIARA IN CAZUL A DOUA VARIABILE

Variabila aleatoare y este repartizata normal cu dispersia
0
2
si media + x. Pentru
fiecare valoare fixata x corespunde o populatie de valori y repartizata normal. Dispersia
tuturor repartitiilor y este aceeasi, adica
0
2
, iar media acestor repartitii este:

f(x, , ) = + x (IV.8)
81
unde este ordonata la origine a dreptei de regresie, iar panta.
Estimarea marimilor si se face pe baza datelor de selectie, prin variabilele de
selectie a si b:

Y = a + bx (IV.9)

unde Y este functia de regresie empirica care estimeaza pe f(x, , ). Valorile x sunt
considerate exacte, nesupuse la erori. In practica erorile lui x sunt foarte mici comparativ cu
fluctuatiile valorilor y. Dispersia
0
2
nu depinde de valorile x.


IV.3.1. ESTIMAREA MARIMILOR SI PRIN VARIABILE DE
SELECTIE a SI b

Functia Y, ca sa fie dreapta cautata, trebuie sa indeplineasca urmatoarea conditie:
suma patratelor abaterilor fata de ea, a tuturor valorilor de observatie y, sa fie minima.
Uzual pentru simplitate, abaterile se masoara paralel cu axa Oy:

(IV.10) ( )

= = ima min Y y S
2
i i

Inlocuim pe Y cu expresia sa si avem:

( )

= = ima min bx a y S
2
i i
(IV.11)

Luarea unor valori a si b, astfel incat suma patratelor abaterilor sa fie minima,
impune ca derivatele partiale de ordinul intai
a
S

si
b
S

sa se anuleze. Deci avem sistemul


de ecuatii:

0 ) bx a y (
a
2
i i
=

(IV.12)

82
0 ) bx a y (
b
2
i i
=

(IV.13)

Avem:



= + = =

0 x b 2 y 2 Na 2 ) bx a y ( 2
a
S
i i i i

=>

(IV.14)

= +
i i
y x b Na



= + = =

0 x a 2 y x x b 2 ) bx a y ( x 2
b
S
i i i
2
i i i i

=>

(IV.15)
i
i
2
i i
y x x b x a

= +

Ecuatiile IV.14-15 sunt denumite ecuatii normale, iar necunoscutele sunt a si b.
Valorile sumelor se cunosc, fiind calculate pe baza valorilor masurate experimental x
i
si y
i
.
Pentru determinarea parametrilor a si b se elimina necunoscuta a intre cele doua ecuatii
normale si se obtine:


=
2
i
2
i
i i i i
) x ( x N
) y )( x ( y x N
b (IV.16)

sau de aici:

N
) x (
x
N
) y )( x (
y x
b
2
i 2
i
i i
i i

= (IV.17)

Valoarea a se obtine prin inlocuirea lui b astfel calculat in prima ecuatie normala
(IV.14):

83
N
x b y
a
i i

= (IV.18)

Fie acum x si y mediile valorilor x
i
, respectiv y
i
. Remarcam usor ca x = Nx si
y = Ny . Ecuatiile (IV.17) si (IV.18) devin:


=
2 2
i
i i
x N x
y x N y x
b (IV.19)

x b y a = (IV.20)

Ultima relatie ne asigura ca punctul de coordonate ( x , y ) se gaseste pe dreapta Y =
a + bx. Daca in ecuatia dreptei de regresie Y = a + bx, inlocuim pe a cu y - b x din relatia
(IV.20), vom avea:

bx x b y Y + = => ( ) x x b y Y + = (IV.21)

unde dreapta de regresie se exprima in raport cu b si cu valorile medii generale y si x .
Daca inlocuim in relatia (IV.19) pe x cu (x - x ) si pe y cu (y - y ), adica daca
deplasam originea axelor de coordonate in punctul de coordonate x - x si y - y, valoarea b
nu se modifica deoarece panta dreptei de regresie ramane aceeasi. Numaratorul
y x N y x
i i

devine:

= ) y y )( x x ( N ) y y )( x x (
i i
(IV.22)

= ) y y )( x x (
i i

deoarece x a devenit ( x - x ) si y a devenit ( y - y), care se anuleaza. Numitorul x
i
2
-
Nx devine:


=
2
i
2
i
) x x ( ) x x ( N ) y x ( (IV.23)

84
Se obtine:


=
2
i
i i
) x x (
) y y )( x x (
b (IV.24)

Alte forme pentru b si a se determina pentru cazul cand numai originea axei Ox s-a
mutat in x . In acest caz, ecuatia dreptei de regresie empirice devine:

Y = a + b(x - x ) (IV.25)

Figura IV.6. Dreapta de regresie cu ordonata centratata in x = x

Inlocuind in derivatele partiale
a
S

si
b
S

valoarea x cu (x- x ) avem:


= +
i i
y ) x x ( b Na

(IV.26)



= +
i i
2
i i
y ) x x ( ) x x ( b ) x x ( a (IV.27)

85
Rezolvand sistemul format in raport de a si b, obtinem

=
2
i
i i
) x x (
y ) x x (
b (IV.28)

y
N
y
a
i
= =

(IV.29)

Pentru a concretiza cele discutate mai sus, sa consideram urmatorul exemplu: se
cere sa se stabileasca dreapta de etalonare privind determinarea fotometrica a siliciului in
otel sub forma de complex molibdenic. Datele sunt trecute in primele doua coloane ale
tabelului IV.3. Celelalte coloane contin rezultate ale calculelor.

Tabelul IV.3. Determinarea fotometrica a siliciului in otel
Concentratia
de SiO
2

x = c (mg/ml)
Densitatea
optica
y

x
2

y
2

xy
0.20
0.40
0.60
0.80
1.00
0.15
0.30
0.44
0.61
0.74
0.04
0.16
0.36
0.64
1.00
0.0225
0.0900
0.1936
0.3721
0.5476
0.030
0.120
0.264
0.488
0.740
x = 3.00
x = 0.60
(x)
2
= 9
y = 2.24
y = 0.448

x
2
= 2.20

y
2
= 1.2258

xy = 1.642

745 , 0
9 20 , 2 5
24 , 2 3 642 , 1 5
) x ( x N
) y )( x ( y x N
b
2
i
2
i
i i i i
=


=

=




001 , 0
5
3 745 . 0 24 , 2
N
x b y
a
i i
=

=

=



Y = a + bx = 0,001 + 0,745x
86

Pentru reprezentarea grafica a dreptei de regresie este suficient sa cunoastem
coordonatele a doua puncte de pe aceasta dreapta. De exemplu, putem calcula ordonatele
pentru cea mai mica si cea mai mare valoare a concentratiilor de SiO
2
masurate:

Y(0,2) = 0,001+0,7450,2 = 0,15

Y(1) = 0,001+0,7451 = 0,746

Ca atare dreapta de regresie se reprezinta grafic unind punctele de coordonate (0,2 ; 0,15) si
(1 ; 0,746):



Figura IV.7. Dreapta de regresie (calibrare) pentru determinarea siliciului in otel

In exemplul de mai sus corelatia liniara pozitiva este evidenta, lucrul confirmat de faptul ca
intensitatea acestei corelatii este r = 0,999. Importanta cunoasterii ecuatiei dreptei de
regresie este insa ilustrata si mai sugestiv de exemplul considerat in sectiunea IV.2,
respectiv pentru determinarea dependentei densitatii streptomicinei de timpul de aducere in
solutie, pentru care coeficientul de corelatie este r = 0, 778. Pentru acest exemplu avem:

87


Figura IV.8. Determinarea corelatiei linare dintre densitatea solutiei de streptomicina si
timpul de aducere in solutie

Cunoasterea ecuatiei dreptei de regresie este importanta si pentru determinarea
ulterioara a concentratiei unei probe necunoscute. Revenind la exemplul determinarii
siliciului in otel, daca pentru o astfel de proba se masoara o densitate optica y = 0,52 ,
putem determina rapid concentratia acesteia:

0,52 = 0,001+0,745 C
x
=> C
x
= 0,696 mg/ml

Pentru exprimarea corecta si completa a rezultatului, trebuie insa evaluam si precizia cu
care este determinata aceasta valoare. Procedura este descrisa in sectiunile urmatoare.


IV.3.2. ESTIMAREA DISPERSIEI INTREGII POPULATII A
VALORILOR y

Dispersia
0
2
a intregii populatii se estimeaza pe baza observatiilor y cu relatia:


2 N
) Y y (
s
2
i i 2
0

=

(IV.30)
88

in care y
i
este valoarea masurata pentru x
i
si Y
i
este ordonata de pe dreapta de regresie
corespunzatoare valorii x
i
. Daca y
i
se determina experimental, Y
i
se calculeaza cu relatia Y
i

= a+bx
i
, unde estimatele a si b se calculeaza la randul lor pe baza valorilor masurate
experimental cu ajutorul relatiilor IV.16 si IV.18 sau oricare din variantele acestora
mentionate in sectiunea anterioara. Impartirea la N - 2 se datoreste regresiei: s-au produs
doua restrictii liniare si (y
i
Y
i
)
2
poate fi exprimata ca suma patratelor a N - 2 combinatii
liniare independente cu media zero si dispersia
0
2
. De aici rezulta ca marimea:

2
0
2
0
s ) 2 N (

(IV.31)

are o repartitie
2
cu N - 2 grade de libertate.
In practica (y
i
Y
i
)
2
se calculeaza pe baza relatiei:

(IV.32)

=
i i i
2
i
2
i i
y x b y a y ) Y y (

forma cea mai convenabila pentru calcul, deoarece utilizeaza direct datele de observatie.
Aceasta forma simplificata de calcul se obtine astfel:

= = = ) bx a y )( bx a y ( ) bx a y ( ) Y y (
i i i i
2
i i
2
i i


= ) bx a y ( x b ) bx a y ( a ) bx a y ( y
i i i i i i i i
(IV.33)

Sumele ce intra in termenul al doilea si al treilea din membrul drept sunt nule,
deoarece sunt identice cu sumele egale cu zero ale derivatelor partiale din relatiile (IV.14)
si (IV.15). Avem deci:

(IV.34)

= =
i i i
2
i i i i
2
i i
y x b y a y ) bx a y ( y ) Y y (

adica tocmai relatia cautata.
89
Pentru a ilustra aplicarea estimarii dispersiei intregii populatii a valorilor y sa
consideram urmatorul exemplu: se cere sa se calculeze estimata dispersiei generale a
regresiei s
0
2
si abaterea standard s
0
, in cazul datelor obtinute la determinarea fotometrica a
siliciului in otel (vezi sectiunea anterioara). Avem:


= =
i i i
2
i
2
i i
y x b y a y ) Y y (

=1,2258 - 0,0012,24 - 0,7451,642 = 0,00027

00009 , 0
3
00027 , 0
2 N
) Y y (
s
2
i i 2
0
= =

=



0095 , 0 s s
2
0 0
= =


IV.3.3. ESTIMAREA DISPERSIEI COEFICIENTULUI b

Deoarece x sunt valori constante, cunoscute si nu valorile unei variabile aleatoare,
pentru fiecare din diferitele valori x
i
, constante, avem repartitii legate y
i
in jurul valorii Y
i

care este estimata lui f(x,, ). Astfel relatia (IV.28)

=
2
i
i i
) x x (
y ) x x (
b

se poate scrie sub forma:

N
i
n
2
2
i
2
1
2
i
1
y
) x x (
) x x (
... y
) x x (
) x x (
y
) x x (
) x x (
b

+ +

= (IV.35)

care poate fi privita ca o functie liniara a variabilelor aleatoare de repartitie onormala y
1
, y
2
,
., y
i
, ., y
N
cu coeficientii c
1
, c
2
, , c
i
, ., c
N
, respectiv

90

=
2
i
i
i
) x x (
) x x (
c

adica b = c
i
y
i
. Avem media si dispersia acestei sume:


= + = = ) x ( c y c ) b ( Med
i i i i



( )
( )
( )


=
(

=
i
i
i
x
x x
x x
(IV.36)

| |
=

= = =

2
0
2
2
i
2
i
2
i
2
i
2
b
) x x (
) x x (
c ) b ( Disp
| |
2
2
i
2
i
2
0
) x x (
) x x (

=
2
i
2
0
) x x (
(IV.37)

deoarece . .........
2
0
2
i
2
2
2
1
= = = =
Estimata b este repartizata normal cu media si dispersia

2
exprimata prin relatia
(IV.37). Intrucat obisnuit nu cunoastem
0
2
, aceasta se estimeaza prin s
0
2
si respectiv
b
2

prin s
b
2
. Vom avea:


=
2
i
2
0 2
b
) x x (
s
s (IV.38)

In practica este mai convenabila forma:

=
2
i
2
i
2
0 2
b
) x ( x N
Ns
s (IV.39)

la care se ajunge prin inlocuirea
91



=
N
) x (
x ) x x (
2
i 2
i
2
i


Raportul
2
0
2
0
) 2 N (


are o repartitie
2
cu N - 2 grade de libertate, adica marimea
este egala cu
2
0
2
0
s ) 2 N (

. Pe de alta parte pentru b putem scrie variabila normala


normata
b
b


. Rezulta ca raportul :

=

2
0
2
0
b
) (
) 2 N ( s
) 2 N (
b
z
t



=

=


=

0
2
i
0
0
2
i
0
s
) x x ( ) b (
2 N s
2 N
) x x (
b


b
) 2 N (
s
b
t

= =

(IV.40)

are o repartitie Student cu N - 2 grade de libertate. Acest raport poate fi utilizat la testarea
ipotezei de zero pentru , absolut la fel cum este utilizat t la testarea ipotezei privind media
necunoscuta. Intervalul de incredere pentru este:

92

b b
s ) 2 N , P ( t b s ) 2 N , P ( t b = + < < = (IV.41)

Dupa cum se vede din relatia (IV.38), s
b
2
nu are o valoare constanta, ci descreste cu
cresterea sumei


2
i
) x x ( , adica cu numarul de masuratori N si cu largirea domeniului
de valori x
i
.
Ca aplicatie la cele de mai sus, sa calculam estimata abaterii standard s
b
a
coeficientului b si intervalul de incredere fata de pentru P = 95%. In cazul datelor din
exemplul numeric considerat in sectiunile anterioare privind determinarea fotometrica a
siliciului in otel:

=

=

2
i
2
i
2
0
2
i
2
0 2
b
) x ( x N
Ns
) x x (
s
s

000225 , 0
2
00045 , 0
9 20 , 2 5
00009 , 0 5
= =

=

015 , 0 000225 , 0 s s
2
b b
= = =

Pentru P = 95% si = 5 - 2 = 3 grade de libertate, gasim . 18 , 3 ,
2
, P t =
|
.
|

\
|



0477 , 0 015 , 0 18 , 3 s ,
2
, P t
b
= =
|
.
|

\
|



deci intervalul de incredere este:

b t s
b
= 0,745 0,048 0,697 < < 0,793



93
IV.3.4. ESTIMAREA DISPERSIEI DREPTEI DE REGRESIE

Expresia dreptei de regresie, pentru x = x
o
, in functie de coeficientul b si valorile
medii generale x si y, conform relatiei IV.21, este:

Y
o
= y + b(x
o
- x ) (IV.42)

Aceasta combinatie reprezinta o combinare liniara a variabilelor repartizate normal
y si b. Estimatia Y
o
a valorii medii a lui y pentru o valoare x
o
data este repartizata normal
cu media
0
Y si dispersia :
2
Y
o

Med (Y
o
) =
o
Y = (IV.43)
o
x +

Disp (Y
o
) = = Disp (
2
Y
o
y ) + (x
o
- x )
2
Disp (b) =

( ) = +
2
0
2
b
2
y
x x

( )
( )
( )
( )
(
(

+ =

=

2
i
0 2
0
2
0
2
2
0
2
0
x x
x x
N
1
x x
x x
N
(IV.44)

Valoarea y fiind media generala a celor N observatii, iar
0
2
dispersia generala a
populatiei, dispersia medie este
N
2
0 2
y

= . Valoarea
0
2
estimandu-se prin s
0
2
, vom
avea:

( )
( )
(
(

+ =

2
i
2
0 2
0
2
Y
x x
x x
N
1
s s
0
(IV.45)

In practica este preferata forma:
94

( )
( )
(
(

+ =

2
i
2
i
2
0 2
0
2
Y
x x N
x x N
N
1
s s
0
(IV.46)

Se poate arata (rationamentul este analog cu cel facut in cazul coeficientului b) ca
raportul


( )
0
Y
0 0
s
x Y
t
+
= , (IV.47)

are o repartitie Student cu N-2 grade de libertate. Atunci intervalul de incredere pentru +
x
0
= f(x
0
, , ) este:

( ) ( ) ( )
0 0
Y 0 0 Y 0
S 2 N , P t Y , , x f S 2 N , P t Y = + < < = (IV.48)

Dispersia s , ca si dispersia s , creste pe masura departarii de valoarea centrala
2
Y
0
2
b
y. Se observa ca Y
0
= y + b(x
0
- x ), estimata lui y
0
= + x
0
, are dispersia s cea mai
mica in cazul cand x
2
Y
0
0
= x . In acest caz Y
0
= y cu dispersia
N
2
0
s
s
2
y
2
Y
o
= = s . Intervalul
de incredere se micsoreaza in jurul valorii Y
0
= y la:

( ) ( ) ( )
N
s
2 N , P t y , , x f
N
s
2 N , P t y
0 0
= + < < = (IV.49)

Mai sus am calculat dispersia valorilor regresiei . Cand se fac determinari,
datele de observatiei sunt valori individuale, nu valori ale regresiei Y
2
Y
s
0
0
= y

+ b(x
0
- x ),
estimata functiei F(x
0
, , ). In acest caz, la valorile Y
0
trebuie sa mai adaugam o valoare
ca sursa de variabilitate a datelor individuale Y fata de valorile corespunzatoare ale
regresiei Y. Dispersia corespunzand acestor adaosuri exprima tocmai eroarea
experimentala
0
2
. Vom avea astfel dispersia valorilor individuale:
95

( )
( )

+ =
2
i
2
o
2
o
2
o
2
0
2
y
x x
x x
N
o
(IV.50)

sau trecand estimatele de selectie, dupa scoaterea lui s
0
2
ca factor comun:


( )
( )
(
(

+ + =

2
i
2
0 2
0
2
y
x x
x x
N
1
1 s s
o
(IV.51)

Ca exemplu, sa calculam estimatia dreptei de regresie si intervalul de incredere fata
de f(x
0
, , ) pentru P= 95% in cazul determinarii fotometrice a siliciului in otel. De
asemenea ne propunem sa stabilim si limitele de imprastiere ale valorilor individuale.
Avem:

( )
( )
=
(
(

+ =

2
i
2
i
2
0 2
0
2
Y
x x N
x x N
N
1
s s
o


( )
( )
2
0
2
0
x x 000225 , 0 00018 , 0
9 20 , 2 5
x x 5
5
1
0009 , 0 + =
(
(



+ =

Gasind ( ) 18 . 3 3 %; 5 . 2 %; 95 = t , intervalul de incredere este:

= + + =
0 0
y 0 y 0
ts bx a ts y

( )
2
0
6 6
0
60 , 0 x 10 225 10 18 18 . 3 x 745 , 0 001 , 0 + + =



Limitele de incredere de o parte si de alta a valorilor Y
0
, pentru diferitele valori x
0

sunt urmatoarele:


96

X
0
Limita
inferioara

Y
0
Limita
superioara
t s
y0
0.20
0.40
0.60
0.80
1.00
0.127
0.283
0.434
0.580
0.723
0.150
0.299
0.448
0.597
0.746
0.183
0.316
0.462
0.614
0.769
0.0234
0.0166
0.0135
0.0166
0.0234


Dispersia cea mai mica este pentru x
0
= x = 0.6. Avem:

448 , 0 6 , 0 745 , 0 001 , 0 x b a y = + = + =

Intervalul de incredere este:

0135 , 0 448 , 0
5
0095 , 0
18 , 3 448 , 0
N
s
t y
0
= =

Limitele intre care se pot afla valorile individuale necesita calculul dispersiei s :
2
Y
0

( )
( )
=
(
(

+ + =

2
i
2
o 2
0
2
y
x x
x x
N
1
1 s s
o


( )
( )
=
(
(

+ + =

2
i
2
i
2
o 2
0
x x N
x x N
N
1
1 s


( )
=
(
(



+ + =
9 20 , 2 5
6 , 0 x 5
5
1
1 00009 , 0
2
0


97
= 108 ( )
2
0
6 6
60 , 0 x 10 225 10 +


Intervalul de incredere este:

( )
2
0
6 6
o y 0
60 , 0 x 10 225 10 108 18 , 3 x 745 , 0 001 , 0 ts Y
o
+ + =



Limitele de imprastiere ale valorilor individuale sunt:

x
o
Limita
inferioara
Y
o
Limita
superioara
ts
yo
0.20
0.40
0.60
0.80
1.00
0.112
0.265
0.415
0.563
0.708
0.150
0.299
0.448
0.597
0.746
0.188
0.333
0.481
0.631
0.784
0.0380
0.0343
0.0330
0.0343
0.0380


IV.3.5. ESTIMAREA DISPERSIEI PARAMETRULUI a

Pentru cazul cand x
0
= 0 valoarea Y
0
= a este estimata a valorii . In acest caz avem
.
2
a
2
y
o
=


( )
(
(

+ =

2
i
2
2
0
2
a
x x
x
N
1
(IV.52)

Dispersia estimandu-se prin vom avea:
2
a
2
0
s


( )
(
(

+ =

2
i
2
2
0
2
a
x x
x
N
1
s s (IV.53)

98
In practica se prefera forma:

=
2
i
2
b 2
a
x
N
s
s (IV.54)

la care se ajunge daca efectuam operatiile indicate in (IV.53):

( )
( )
( )
( )
=

(
(

+
=

+
=

N
x
N x N
x N
N
x
x s
x x N
x N x x s
s
2
i 2
i
2
2
i 2
i
2
0
2
i
2 2
i
2
0
2
a


( )

=
2
i
2
b
2
i
2
i
2
i
2
0
x
N
s
x x N
x s
(IV.55)

deoarece
( ) ( ) 2
2
2
i
x N
N
x N
N
x
= =

si conform relatiei (IV.39) avem:




( )
N
s
x x N
s
2
b
2
i
2
i
2
0
=


(IV.56)

Inlocuind in relatia (IV.47), ca mai sus, x
0
= 0, va rezulta:


a
s
a
t

= (IV.57)

care, rationand in acelasi mod ca in cazul coeficientului b, se constata ca parametrul t are de
asemenea o repartitie Student cu N - 2 grade de libertate. Intervalul de incredere pentru
este:

99
( ) ( )
a a
s 2 N , P t a s 2 N , P t a = + < < = (IV.58)

Ca exemplu, sa calculam estimatia s
a
a abaterii standard a marimii a si intervalul de
incredere fata de pentru P= 95% in cazul datelor obtinute pentru determinarea
fotometrica a siliciului in otel.

000099 , 0 20 , 2
5
000225 , 0
x
N
s
s
2
i
2
b 2
a
= = =



0099 , 0 s s
2
a a
= =

cu = 3 grade de libertate. Intervalul de incredere pentru ( ) 18 , 3 3 %; 5 , 2 %; 95 t = este ts
a
=
3,18 0,0099 = 0,031 . Avem:

a t s
a
= 0,001 0.031 si -0,030 < < + 0,032




100