Sunteți pe pagina 1din 7

Facultatea de Mecanică

Proiect la disciplina Colectarea și prelucrarea


datelor în transporturi (CPDT)

Coordonator: Student: Paul ROMAN


Prof. Vasile-Horea ILE

Anul I Master
Semestrul I, an universitar 2017-2018
Analiza indicatorilor statistici oferă o serie de informații utile privind particularitățile
fenomenului observat. Compararea valorilor obținute după anumite criterii oferă posibilitatea
orientării etapelor următoare de prelucrare matematică în vederea determinării legii de variație
a observării și caracterizării ( în acest caz : tendința de distribuție a vitezei pe artera de drum
monitorizată ) tendințelor specifice șirului de valori.

O primă cocluzie ce reiese din compararea rezultatelor este că indicatorii tendinței de


grupare sunt mai apropiați de media geometrică decât de cea aritmetică, fapt ce denotă că
fenomenul observat nu are caracterul de normalitate ce indică un trafic fluent și stabil.
De asemenea există o suspiciune că sondajul de trafic nu este suficient pentru a
caracteriza regimul de viteză. Dacă analizăm valorile indicatorilor tendinței de grupare,
abaterea maximă față de media de sondaj este de 4,5 și aceasta este simetrică atât superior cât
și inferior.
Raportat însă la media geometrică, abaterea maximă este doar de 2,25 (exceptând
valoarea centrală care arată o deviere 7,25). Totuși în valori absolute abaterile sunt
compatibile atât în cazul comparării cu media aritmetică cât și pentru media geometrică.
Constatarea este un argument al faptului că datele de trafic înregistrate sunt credibile
și pot constitui referința privind caracteristicile de viteză.
De asemenea se poate afirma că sondajul efectuat a surprins momente caracteristice
din repartiția regimului de viteze.
O evaluare comparată a mediei de sondaj și a abaterii medii pătratice arată faptul că
față de șirul ordonat de valori, gruparea datelor este suficient de bună (deci concludența
eșantionului poate fi acceptabilă), deoarece intervalul: media de sondaj ± abaterea medie
pătratică cuprinde aproape în totalitate șirul ordonat de valori.
1.2. GRUPAREA DATELOR STATISTICE ȘI FRECVENȚE
CARACTERISTICE

Indicatorii statistici nu oferă în totalitate informații privind evaluarea eșantionului


rezultat în urma observării de trafic. Determinările bazate pe observații discrete, permit
efectuarea unor asocieri, care nu alterează setul de valori sau interpretarea rezultatelor.
Identificarea unei normalități a distribuției valorilor, este necesară pentru a putea fi
intrepretate seturi mari de date.
În acest scop, datele sunt grupate, în așa numitele clase de valori. Caracteristic
acestor grupări este tendința tuturor valorilor din interiorul unei clase de a converge spre o
valoare centrală din interiorul intervalului de clasă. În cele mai multe cazuri, statistica de
trafic, face raportarea directă la variația orară sau în intervale de timp mai mici de ordinul a
10, 15, sau 30 de minute.

Sunt însă situații în care pentru o evaluare corectă și în scopul obținerii unor date
primare cât mai credibile, necesare modelărilor de trafic, acest gen de evaluare statistică nu
este cel mai potrivit și dă naștere la erori de proiect care au repercursiuni asupra acțiunilor de
normalizare a traficului.

Desigur, a se lucra direct pe setul de date colectate în urma observării-monitorizării de


trafic este facil și mai rapid, eliminându-se însă astfel o importantă etapă din “ pregătirea
statistică” a eșantionului: gruparea lor funcție de tendințe și valori de referință. Aceasta poate
aduce prejudicii privind identificarea corectă a valorilor ce indică reala tendință privind
variația parametrului (sau parametrilor) de trafic analizat.

Îndeosebi când eșantioanele de date provin din observații discrete, ce au fost efectuate
în perioade de timp dispersate de-a lungul unui an calendaristic, sau în cazul necesității
identificării tendințelor de macrofluctuație a traficului, gruparea în clase de distribuție a
șirurilor de valori, constitue o etapă obligatorie în evaluarea eșantioanelor de date.

Aceste tendințe constitue și un bun indicator privind legea de distribuție probabilă, care
modelează cât mai fidel evoluția parametrilor măsurați.

Particularitatea este din plin exploatată în cazul determinărilor efectuate pentru un


anumit regim stabil de trafic (pentru care, se spune că artera de circulație prezintă o tendință
de încărcare normală).

Ordonarea și gruparea datelor, se face prin distribuirea acestora în clase de valori, care
cuprind toate rezultatele observației sau măsurătorilor efectuate, ce se încadrează într-un
interval de mărime impus și corelat cu volumul de date disponibil.
Numărul k de clase în care se grupează valorile supuse unei prelucrări statistice se
determină funcție de mărimea n a eșantionului. Relația recomandată pentru determinarea
numărului de clase este:

k =1+3,322⋅lg ( n ) . (21)

Din valoarea calculată cu relația (21), se extrage partea întreagă, fără a se efectua
rotunjiri inferior sau superior, indiferent de tendința părții zecimale.

Pentru un număr redus de date (sub 25 de valori), gruparea în clase este puțin
semnificativă, suplimentul de informație obținut fiind neconcludent.

În cazul în care setul de valori este relativ ridicat (>100), este recomandată pentru
determinarea numărului de clase relația:
1
2 5
k 1 =4⋅[ 0, 75⋅( n−1 ) ] . (22)

Shapiro-Wald, recomandă în cazul eșantioanelor statistice de volum mare, relația:

n
k 2=
5 . (23)

Gruparea valorilor în clase de repartiție necesită stabilirea unor intervale restrictive în


care datele din eșantion vor fi încadrate. Intervalele astfel determinate exprimă o tendință a
valorilor de a coverge local crescător sau descrescător, spre valoarea centrală a fiecărei clase.

Amplitudinea a (distanța intervalului de clasă), ce caracterizează intervalul unei clase,


se determină cu relația:

x max −x min
a=
k , (24)

unde :
x max - este valoarea cea mai mare din șirul ordonat de date;

x min - valoarea cea mai mică din șirul de date.

Intervalul unei clase va fi deci mărginit de două valori: limita inferioară și superioară,
care se determină cu relații de forma:

j j−1
l inf =l sup ;
j j
l sul =l inf +a⋅j , (25)

unde j=1,...,k reprezintă ordinul clasei.


j
Valoarea centrală lc a clasei de repartiție de ordin j se determină cu relația:

a
l cj=l inf
j
+ + ( j−1 )⋅a
2 . (26)

Se face specificarea că limita inferioară a primului interval este identică cu valoarea


minimă din șir, iar limita superioară a ultimului interval este valoarea maximă din șirul
ordonat de valori.

Dezvoltarea acestei grupări în clase de repartiție, permite identificarea valorilor de


referință față de care se va interpreta șirul de date conținut în eșantion . Asfel devin mai puțin
importante valorile efective (conținute în eșantion), cât tendința pe care acestea o exprimă,
în raport cu grupările realizate pe criterii statistice. Tendința, este evaluată față de valorile
centrale ale fiecărui intrerval, fapt ce dă noi valențe analizei datelor din eșantion, constituind o
primă abordare probabilistică a observațiilor efectuate. Din acest punct de vedere se poate
spune că devin mai puțin importante datele efective, crescând semnificația intervalelor în care
acestea se grupează, precum și valoarea centrală a acestor intervale.

Modul de variație a unui fenomen analizat prin evaluări statistice este dat de indicatorul
fecvență de repartiție. Sunt două tipuri de frecvențe care oferă informații distincte privind
comportarea șirului de date :

- frecvența de repartiție a datelor (valori aleatorii);


- frecvența cumulată de repartiție a datelor.

Numărul de date
n j de date conținute într-o clasă, reprezintă frecvența de apariție în
clase a valorilor.

f j =n j . (27)

Raportul dintre numărul de date conținut în clasă și numărul total al datelor din eșantion
reprezintă frecvența relativă. Se determină cu relația:

fj
fr= .
j n (28)

În statistică se utilizează frecvent și noțiunea de frecvență relativă procentuală, care se


determină cu relația:

fj
f pr = ¿ 100
j n .[] (29)
Referitor la frecvențele de grupare în clase, proprietatea acestora de a reprezenta toate
datele din șir permite dezvoltarea relațiilor de evaluare- verificare globală, relații care
constitue în același timp pentru utilizator o modalitate de verificare a corectitudinii calculelor
efectuate, astfel:

n
∑ f j=n;
j=1
n

∑ f r =1 ; j
j=1
n

∑ f pr =100 j
j=1 (30)

Frecvevența cumulată reprezintă un indicator ce permite evaluarea repartiției de valori,


în contextul global, al întregului set de date dispuse în interval.

Ca și în cazul frecvențelor de repartiție în clase se disting următoarele frecvențe


cumulate caracteristice:
-frecvența cumulată absolută, determinată cu relația:
r
fc q = ∑ f q ; r ∈ { 1, .. . , k } ;
q=1 (31)

-frecvența cumulată relativă, determinată după un criteriu similar, cu deosebirea că


raportarea se face la numărul total de valori din șir, prin relația:
r
1
fc q =
N
∑ f q ; r ∈{ 1,. . ., k } ;
q=1 (32)

-frecvența cumulată procentuală, exprimare mai aproape de domeniu statistic decât cel
al probabilităților, este dată de relația:

(
1
)
fc q = ∑ f q ⋅100 [ ] ; r ∈ { 1,. .. , k } .
n q=1
(33)
După cum se poate observa indiferent de modalitatea de exprimare cantitativă (numeric
în valori absolute, procentual sau în valori relative), repartițiile sunt identice ca evoluție
pentru fiecare frecvență caracteristică (absolută și cumulată).

Conform Aplicației 1 se solicită evaluarea statistică a eșantionului de date pentru


analiza caracteristicii vitezei de deplasare în zona de observare: Moțiilor 19.11.2016 sens 1.

1.3. CENTRALIZAREA DATELOR

Indicatorul U.M. Valoare Observatii


n
1
Media de sondaj(m) km/h 57.194 m= ∑ x i
n i =1

(∏ ) √ ∏
n 1 n
n n
Media geometrică(g) km/h 56.622 g= xi = xi
i=1 i=1
n
h= n
Media armonică(h) h/km 56.082 ∑ 1
i =1 xi
1
M e= x +x
Mediana de sondaj(Me) km/h 55 (
2 n2 n2 +1 )
Modul de sondaj(Mo) km/h 50.611 M o=m+3 ( M e−m )

Valoarea central(xc) km/h 63 1


x c= (x +x )
2 max min
Abaterea medie


n
pătratică km/h 8.349 1
σ = ∑ ( x i−m)
2
( σ ) n i=1
n
1
Dispersia(D) km²/h 69.712 D= ∑ ( x i−m )2
n i=1

Amplitudinea șirului(A) km/h 40 A=x max −x min


Coeficientul de σ
variație(Cv, în matchad km/h 0.146 C v=
Zi) m
n

�  xi
1

i 1
Mr 
Mr =57,194 n

Momentele centrate km/h


n

�  xi
3
5
Mr2 =1,996*10
i 1
Mr2 
n

S-ar putea să vă placă și