Sunteți pe pagina 1din 5

Lucrarea nr.

Prelucrarea unui şir de date de o singură dimensiune

1 Scopul lucrării

Lucrarea prezintă modul de prelucrare a unui şir de date de o singură dimensiune. Şirul de date
de o singură dimensiune se va obţine la măsurarea repetată a forţei de strângere realizată de şuruburi
acţionate manual.

2 Aspecte teoretice

Şirul de date de o singură dimensiune se obţine la măsurarea repetată a unei mărimi care se
află sub influenţa unor factori întâmplători . Acesta este de forma X 1, X2, …Xn şi corespunde unei
mărimi statice la care măsurările sunt afectate numai de erori întâmplătoare, de măsurare sau de altă
natură.
Teoretic şirul este considerat infinit, deci fără corespondent în practică. În practică poate fi
realizat un număr finit de măsurări, ceea ce se consideră a fi un eşantion prelevat dintr-o populaţie.
Eşantionul poate fi mai mare când n>30 sau mic când n<30.
Se pune problema ca plecând de la datele obţinute pe eşantion să se poată stabili caracteristicile
populaţiei, lucru echivalent cu o estimare a parametrilor acesteia (parametrii populaţiei fiind media M
şi abaterea medie pătratică σ2) prin prelucrarea datelor obţinute pe eşantioane: X 1, X2,..., Xn.
Prelucrarea datelor de o singură dimensiune provenite dintr-un eşantion constă în:
1. calculul parametrilor statistici ai eşantionului prelevat;
2. verificarea normalităţii repartiţiei datelor obţinute la măsurări, dacă sunt determinanţi numai
factorii întâmplători;
3. eliminarea datelor aberante;
4. estimarea parametrilor populaţiei pe intervale;
5. stabilirea intervalelor de toleranţe naturale ale populaţiei.
1.Parametrii statistici ai eşantionului
1.1 de tendinţă:
 Media aritmetică a şirului de date X , şirul având valorile X1, X2,..., Xn:
 n  (1)
X   Xi  / n
 i 1 
în care n reprezintă numărul datelor.
 Mediana de sondaj a şirului Me, egală cu valoarea termenului (n+1)/2 pentru un şir cu
număr impar sau valoarea nedefinită cuprinsă între valorile termenilor de ordin n/2 şi
(n/2)+1, atunci când şirul are un număr par de termeni, pentru cazul în care termenii sunt
ordonaţi crescător ; în al doilea caz se ia media termenilor respectivi:
Ml = X(n+1)/2 , pentru n impar (2)
Ml = [Xn/2 + X(n/2)+1] / 2, pentru n par. (3)
 Moda M0 reprezentând valoarea variabilei căreia îi corespunde cel mai mare efectiv sau
frecvenţă:
M0 =Xk , pentru nk maxim. (4)

1.2 indici de împrăştiere (de precizie):


 Dispersia eşantionului:

1
 X 
 n
2 (5)
s2 =  i  X  / n  1
 i 1 
 Abaterea medie pătratică s a eşantionului de n măsurări:
(6)
s = s2
 Amplitudinea şirului de date R:
 R = Xmax – Xmin (7)
 Abaterea medie absolută a şirului de date ale eşantionului:

 X 
 n
 (8)
Am =  i  X  / n  1
 i 1 
 Coeficientul de asimetrie al şirului de date:

   
 n 3  n 2
2 3 (9)
β1 = (μ3) /(s ) =  X i  X  /  X i  X 
2 2 3

 i 1   i 1 
2.Verificarea normalităţii repartiţiei datelor
Normalitatea unui şir de date corespunzător unui eşantion se poate verifica prin mai multe
metode. Pentru eşantioane cu 3 < n < 50 pentru verificarea normalităţii datelor se foloseşte, de regulă,
testul Shapiro – Wilk, denumit testul S -W.
Aplicarea testului constă în calculul unui parametru statistic W. Dacă W  Wt , ipoteza de
normalitate a datelor poate fi acceptată. Parametrul Wt se alege din tabelul 2.1 [1] pentru un anumit
nivel de încredere 1-α ales şi pentru numărul n de măsurări ( valori ale şirului). Pentru calculul
parametrului W se procedează astfel :
- se ordonează valorile şirului după mărime X1 ≤ X2 ≤ X3 ≤ X4 ≤ Xn;
- se calculează expresia
k (10)
b   a n i 1 [ X n i 1  X i ]
i 1
în care: k = n/2 pentru n par, iar pentru n impar k = (n-1)/2; valorile lui an-i+1 se extrag din tabelul 2.2
[1], funcţie de n şi i = 1…k;
- se calculează valoarea lui W cu relaţia :
b2 (11)
W= n
( X
i 1
i  X )2
3.Eliminarea unor date aberante
La efectuarea unor măsurări pot să apară erori grosolane care duc la apariţia unor date numite
aberante. Identificarea acestor date aberante constă în:
 Calculul valorilor care caracterizează funcţia de repartiţie normală, folosind datele obţinute
experimental, pe eşantion;
 Valorile calculate ale funcţiei se compară cu valorile limită ale acesteia corespunzătoare unui
anumit nivel de încredere ales; datele experimentale care depăşesc limitele calculate se elimină.
STAS 11278 pentru funcţia normală de repartiţie, în cazul în care datele experimentale provin
din măsurarea pe un eşantion, recomandă următoarea succesiune de depistare a valorilor aberante :
- Se calculează valorile X şi s folosind şirul de date experimentale cu relaţiile (1) şi (6).
- Se ordonează şirul de date în ordine crescătoare X1, X2, …,Xn. Valoarea minimă
corespunde lui X1 , iar valoarea maximă lui Xn ;
- Se calculează:
X  X1 Xn  X
u1 şi un (12)
s s

2
-
Se compară valorile u1 şi un cu valorile critice h extrase din tabelul 2.3; valorile din tabel
sunt calculate pentru eşantioane de mărimi n=3,4,... şi diverse nivele de încredere: 1 – α
= 0,9 ; 0.925 ; 0.95 ; 0.975.
În acest caz probabilităţile P ca valorile X 1 şi Xn să fie în afara intervalului sunt:
P((X – X1) / s ≥ h) = α şi respectiv: P((X – Xn) / s ≥ h) = α
Dacă u1 ≥ h sau un ≥ h ipoteza privind caracterul aberant al rezultatelor poate fi acceptată şi
deci valorile respective se elimină din şirul de date. După aceasta, calculele se reiau de la capăt şi în
continuare se pot încă elimina valori din noul şir, dacă este cazul, până când u 1 < h şi un < h. De
reţinut că nu se elimină simultan şi u1 şi un, chiar dacă ambele pot fi în afara intervalului. Se elimină
mai întâi cea cu valoarea lui u mai mare, după care se reia calculele de la început şi dacă este cazul se
elimină în pasul 2.
O problemă care se pune la determinarea unor valori ale şirului care ar putea fi afectate de erori
grosolane este aceea a alegerii nivelului de încredere 1-α, nivel care determină de fapt intervalul în
afara căruia se consideră că datele sunt din această categorie.
Acest nivel trebuie corelat cu numărul n de măsurări conform tabelului 2.4 [1].
4.Estimarea parametrilor populaţiei pe intervale
Problema care se pune este aceea de a evalua valorile tipice ale populaţiei (M şi σ) plecând de
la valorile obţinute pentru eşantion. Probabilistic se poate stabili numai intervalele în care aceste
valori se pot afla. Nu se pot determina valorile efective pe care le are populaţia din care provine
eşantionul. Estimarea mărimii M a populaţiei se face prin determinarea intervalului în care se
găseşte această mărime cu o anumită probabilitate.
Intervalul de încredere bilateral, în care se găseşte M, se stabileşte cu relaţia:
t1 / 2,  s t1 / 2,  s
X M X (13)
n n
iar, pentru intervale unilaterale, cu relaţia:
t1 ,  s t1 ,  s
M< X  sau M > X (14)
n n
în care: X este media eşantionului; n, numărul de determinări;
 = n – 1, gradele de libertate;
s, abaterea medie pătratică;
1–α, nivelul de încredere;
t, variabila repartiţiei student care caracterizează repartiţia lui M.
Variabila t pentru un nivel de încredere 1- α, ales corespunzător numărului de grade de libertate
 = n – 1 se ia din tabelul 2.5 [1].
Estimarea abaterii medii pătratice σ a populaţiei plecând de la s obţinut pe eşantion se face, de
asemenea, prin determinarea intervalului în care se găseşte σ. Intervalul de încredere se stabileşte
pentru un nivel de încredere 1 – α ales, folosind distribuţia χ2.
Pentru un interval de încredere bilateral, dispersia σ2 a populaţiei rezultă din relaţia:
n

(X i  X )2
(X  X )2 (15)
i 1
 
2 i

 2
1 / 2 ,  2
 / 2 ,

sau cu relaţia echivalentă:


s 2 (n  1) s 2 (n  1)
  2
 (16)
 21 / 2,  2 / 2,
unde: χ2 sunt cuantilele repartiţiei χ2.
Pentru intervalele de încredere unilaterale se folosesc relaţiile:
s 2 (n  1)
  2
pentru interval unilateral dreapta (17)
 2 ,

3
s 2 (n  1)
2  pentru interval unilateral stânga
 21 , (18)

Valorile lui χ2 se aleg din tabelul 2.6 [1].


5.Intervalul de toleranţe naturale pentru o populaţie de repartiţie normală
Plecând de la eşantion se poate stabili intervalul de toleranţe naturale pentru populaţie.
Acesta poate fi bilateral, caz în care mărimea trebuie să fie între limita inferioară Li şi cea superioară
Ls, deci Li < X < Ls sau unilateral, caz în care -∞ < X < Ls sau Li < X < +∞, primul cu limita la
dreapta, iar al doilea cu limita la stânga.
Plecând de la un şir de date experimentale obţinute prin măsurarea corespunzătoare a unui
eşantion pentru care s-a calculat X şi s, limitele intervalului se pot stabili admiţând un nivel de
încredere 1 – α pentru care cel puţin o proporţie P din valorile populaţiei să fie în interval. Acest
interval este mai mare decât cel corespunzător unei populaţii, deoarece şi M şi σ2 corespund unor
intervale.
Pentru interval unilateral cu limită la stânga se calculează L i cu relaţia:
Li = X – s k2(n;P;1-α) , (19)
iar cu limita la dreapta Ls cu relaţia:
Ls = X + s k2(n;P;1-α) . (20)
Pentru un interval bilateral Li şi Ls se calculează cu relaţii similare:
Li = X – s k’2(n;P;1-α) , (21)
Ls = X + s k’2(n;P;1-α) .
Coeficienţii k 2' sunt tabelaţi corespunzător distribuţiei normale în funcţie de n, 1-α şi p tabelul
2.7 [1].

3. Metodele şi mijloacele folosite la experimentări

Pentru a măsura forţa de strângere S se foloseşte un stand care să permită: antrenarea


şurubului cu diverse capete de antrenare şi realizarea de diferite cupluri ale suprafeţelor frontale de
frecare (fig. 1).

a b c d
Fig. 1
Standul utilizat, fig.2, constă în şurubul 1 şi plunjerul 2 construite în mai multe variante pentru
a realiza succesiv cuplele din fig.1. Şurubul se poate înşuruba în piuliţa fixă 3 la antrenarea cu capetele
de antrenare 4, 5 sau 6. Forţa de strângere S dezvoltată la plunjer se poate citi la dinamometrul 7 pe
comparatorul acestuia ştiind că la o diviziune de 0,01 mm corespunde 100 N. Se folosesc cinci capete
de antrenare din trei tipuri. Dimensiunile acestora sunt trecute în fig. 2.

4
4 Modul de lucru

Primul student care măsoară forţa va monta plunjerul şi şurubul pentru formarea cuplului a şi
foloseşte primul din cele cinci capete de antrenare, cu =46. Se citeşte şi se înregistrează forţa S
dezvoltată. Se repetă strângerea de 40 ori şi se înregistrează forţa S. Următorul student utilizează
acelaşi cuplu dar schimbă capul de antrenare şi procedează similar. În continuare fiecare student va
măsura forţa de strângere utilizând capete de antrenare sau cupluri diferite de ale celorlalţi.
În final fiecare va obţine un eşantion de 40 de date de o singură dimensiune.

5 Datele obţinute la experimentări

Datele obţinute la experimentări se înscriu în tabelul 1.


Tabelul 1
Capul de antrenare Cuplul de frecare Forţa de strângere măsurată (n = 40)

6 Prelucrarea datelor experimentale

Pe baza aspectelor teoretice prezentate, pentru a prelucra datele experimentale, se parcurg


următoarele etape:
1. calculul parametrilor statistici ai eşantionului prelevat;
2. verificarea normalităţii repartiţiei datelor obţinute la măsurări, dacă sunt determinanţi numai
factorii întâmplători;
3. eliminarea datelor aberante;
4. estimarea parametrilor populaţiei pe intervale;
5. stabilirea intervalelor de toleranţe naturale ale populaţiei.

Bibliografie

1. Ungureanu, I. Bazele cercetării experimentale, Editura Universităţii Piteşti, 2002.


2. Ungureanu, I., Iordache, M. Dispozitive de fabricare 1. Îndrumar de laborator,
Editura Universităţii Piteşti, 2002.