Sunteți pe pagina 1din 32

Curs 2

Elemente de statistică şi
probabilităţi utilizate în
analiza traficului

29.05.2017 1
A. Indicatorii statistici ai tendinţei de grupare

Exprimă tendinţa oricărui şir de valori de a converge spre o limită interioară


inclusă în intervalul de date
MEDIA DE SONDAJ – “m”
Reprezintă valoarea din şirul de date spre care tind crescător sau descrescător
toate valorile din şir. Se determină cu relaţia:

1 n n este numărul de valori din şir;


m   xi xi valori din şirul de date

n i 1
Ex.
Rezultatul observării unui flux de
autovehicule în intervale de câte 5 minute
este următorul: 15, 18, 22, 16, 14, 16, 18.
Grafic, variaţia fluxului de autovehicule este:
Utilizând relaţia dată, se obţine valoarea
medie de 17 autov. / interval

Acest indicator are proprietatea că: suma algebrică a


29.05.2017 abaterilor diferitelor valori de la medie este nulă. 2
- media geometrică - reprezintă un indicator
1
caracteristic seriilor de numere pozitive şi permite
evaluarea şirului de date în raport cu valoarea  n  n
g    xi 
produsului acestora, conform relaţiei:
 i 1 

- media armonică, reprezintă inversul mediei aritmetice de


n
h n
sondaj şi arată caracterul de variaţie al valorilor inverse din 1
şir, fiind determinată cu relaţia 
i 1 xi
n

- media de aşteptare, reprezintă valoarea combinată a x k


i 1
i i
parametrului evaluat statistic funcţie de un indicator ce mp  n
defineşte puterea valorii medii. Se determină cu relaţia:

În cazul evaluărilor de trafic rutier, media de aşteptare poate


k
i 1
i

reprezenta rezultatul evaluării simultane a:


timpilor de sosire într-un punct de traseu determinat cu
viteza înregistrată de fiecare vehicul;
duratei parcursului şi viteza medie înregistrată;
duratei staţionărilor şi numărul de vehicule staţionate într-
29.05.2017un areal determinat. 3
DETERMINAREA GRUPEI DE INDICATORI STATISTICI CU EXCEPŢIA MEDIEI DE
SONDAJ, NECESITĂ ORDONAREA ŞIRULUI DE DATE ÎN ORDINE CRESCĂTOARE

MEDIANA DE SONDAJ – “Me”


Reprezintă valoarea din şirul ordonat de date care subdivide acest şir în două subşirurii
având acelaşi număr de valori incluse şi care tind crescător, sau descrescător spre mediană

Se determină funcţie de numărul de date impar sau par al şirului cu relaţiile:

M e  x n1 pentru şir impar de valori

1  
Me  xn  xn 
2 1  pentru şir par de valori
 2 2 

În exemplul propus, şirul impar de valori va avea ca mediană a IV-a valoare,


adică: 16 autov / interval:

29.05.2017 4
MODUL DE SONDAJ – “Mo”
Este indicatorul care arată concludenţa observaţiei efectuate, prin legătura pe care
o stabileşte între indicatorii grupării: m şi Me
Se determină cu relaţia:

M o  m  3M e  m 

În exemplul analizat, valoarea medianei de


sondaj este: 14 autov. / interval.

Din punct de vedere al eficienţei determinării


statistice, se pot face cîteva aprecieri privind
“puterea “ (relevanţa) observaţiei efectuate.
Există astfel următoarele situaţii:

29.05.2017 5
VALOAREA CENTRALĂ A ŞIRULUI - xc

Stabileşte legătura între şirul ordonat de valori şi valoarea cea mai probabil situată ca
mijloc al intervalului definit de şirul de date.

Se determină cu relaţia:

1
xc   xmax  xmin 
2
În exemplul dat, valoarea centrală este:
18 autov. /interval

Concludenţa statistică a şirului de date nu


este determinată clar de această valoare,
decât în ipoteza că ar coincide cu
valoarea mediei de sondaj

29.05.2017 6
B. Indicatorii tendinţei de dispersie a datelor

Arată în ce măsură valorile din şirul de date au un caracter divergent, exprimând tendinţa de
a se distribui aleator în intervalul din care şirul ia valori.

ABATEREA MEDIE PĂTRATICĂ - σ -


Se determină cu relaţia:

1 2
 xi  m 
n
DISPERSIA ŞIRULUI DE DATE – D -

1 2
D   xi  m    2
n
AMPLITUDINEA ŞIRULUI – A -

29.05.2017
a  xmax  xmin 7
Valori observate

σ
m
σ

Nr. observări

Identificarea gradului de împrăştiere a datelor prin intermediul


indicatorului: abatere medie pătratică.

29.05.2017 8
C. Grupa indicatorilor statistici compuşi

Exprimă tendinţe ale şirului de date şi permit încadrarea în legi de repartiţie care
modelează fenomenul analizat.

COEFCIENTUL DE VARIAŢIE AL ŞIRULUI – Cv -


Cv  Arată în ce măsură evoluţia fenomenului analizat
poate fi aproximat cu legea de repartiţie normală
m
MOMENTUL DE SONDAJ DE ORDIN r – Mr -

n
1 r Aratăm tendinţa şirului de a răspunde unei legi de
M r   xi repartiţie de tip exponenţial sau Weibull

n i 1

29.05.2017 9
GRUPAREA ÎN CLASE DE REPATIŢIE

Există situaţii în care şirul de valori de date nu oferă informaţii relevante


exhaustive pentru a asigura o interpretare completă a datelor de trafic.
În aceste situaţii valorile din şir sunt prelucrate statistic, fiind luate în
considerare tendinţele pe care le exprimă

Este în general cazul unui şir de date care conţine peste 40 – 50 de valori.

23 24 24
18 21 21

14

Interval de observare

29.05.2017 10
Viteza medie: 39,24
90 [km/h]
% V it e z a i n s t a n t a n e e
80

70
Viteza de trafic [km/h]
60

50

40

30

20

10

-2 0 0 20 40 60 80 100 120 140 160


O b s e r v a t ii in r e g is t r a t e

Valorile vitezei de trafic printr-un punct de observare (înregistrare


radar trafic, pe o arteră urbană intens circulată), într-un interval de
15 minute .

29.05.2017 11
S irul d e d ate o rig ina l
S irul o rdo na t de valo ri
90

80

70

60
Viteza [km/h]

50

40

30

20

10
0 5 10 15 20 25 30
N r. inregistrare

Variaţia vitezei înregistrate: date măsurate şi


29.05.2017 graficul valorilor ordonate crescător. 12
a a/2
Număr de valori în clasă

vmin lc(1) lsup(1) lc(2) lsup(2) lsup(j-1) lc(j) lsup(j) lc(k) vmax
linf linf(2) linf(3) linf(j) linf(j+1) lsup(k)
Domeniul de valori
Succesiunea intervalelor de grupare pentru şiruri de date.
29.05.2017 13
CURS 3

Legi de distribuţie
utilizate în analiza –
predicţia traficului rutier

29.05.2017 14
Clasificarea legilor de distribuţie

• Legi de distribuţie pentru variabile


aleatoare discrete;
– Distribuţia binomială;
– Distribuţia Poisson
• Legi de distribuţie pentru variabile
aleatoare continue
– Dsitribuţia exponenţială;
– Distribuţia normală;
– Distribuţia Weibull;
– Distribuţia Gamma

29.05.2017 15
Distribuţia binomială

Reprezintă din punct de vedere al traficului rutier un instrument de lucru


cu resurse generoase, care permite evaluarea (de tip probabilistic) de
producere a unor fenomene independente (ce nu au o legitate de
derulare în timp), specifice traficului rutier: lungimea plutonului de
vehicule în aşteptare la un semafor, numărul de vehicule care trec
printr-o intersecţie pe durata de verde în condiţiile plutonului neomogen,
număr de vehicule ce depăşesc pe un sector de drum viteza legală de
deplasare, probabilitatea selectării unei rute de deplasare pentru un nod
de artere de trafic

Conexă problemelor statistice distribuţia binomială permite evaluarea


posibilităţii de producere a unui fenomen selectat dintr-un câmp de
evenimente probabile, asociind acestei probabilităţi o şansă de succes
sau insucces.

29.05.2017 16
Indicatorii caracteristici

probabilitatea de succes a evenimentului

Pk , N   C Nk  F k  1  F  N k

N!
C Nk 
k !N  k !
F - funcţia (empirică), care declanşează evenimentul

numărul mediu al evenimentelor probabile

m  FN
modul de sondaj al repartiţiei, este dat de relaţia
Mo  N  1  F

29.05.2017 17
abaterea medie pătratică

  N  F  1  F 

momentul probabilităţii de distribuţie

reprezintă un indicator ce permite evaluarea aşteptării (probabilităţii)


de succes a distribuţiei propuse, reprezentând o modalitate de
cuantificare temporală a variabilei aleatoare discrete


M t   1  F  F  e 
t N

29.05.2017 18
Se consideră un eşantion format din 17 autovehicule ce

A1
urmează să intre în revizie tehnică. Să se determine care este
probabilitatea de acces a 0, 2, 5, 7, 9, 11, 15 şi 17
autovehicule, cunoscând că funcţia ce guvernează această
probabilitate poate lua valori: 1/8; 3/8; 1/2; 5/8 şi 7/8.

Algoritm de rezolvare
Densitatea de probabilitate a ratei de succes f(t)
Probabilitatea 1/8 3/8 1/2 5/8 7/8
de trecere
Număr de
treceri
0 0.10 3.389*10-4 7.629*10-6 5.734*10-8 0.00
2 0.29 0.02 1.037*10-3 2.166*10-5 2.959*10-12
5 0.04 0.16 0.05 4.563*10-3 4.618*10-8
7 2.439*10-3 0.18 0.15 0.04 7.112*10-6
9 6.223*10-5 0.08 0.19 0.14 4.356*10-4
11 6.466*10-7 0.02 0.09 0.20 0.01
15 2.959*10-12 2.166*10-5 1.037*10-3 0.02 0.29
17 0.00 5.734*10-8 7.629*10-6 3.388*10-4 0.10
29.05.2017 19
Densitatea de
probabilitate

3/8 Probabilitatea de
Număr treceri 1/2 trecere
7
5/8
11
7/8
17

Variaţia densităţii de probabilitate ; reprezentare compusă pentru


câmpul de parametrii.

29.05.2017 20
Indicatorul distribuţiei cumulative de probabilitate F(t)

Probabilitatea
de trecere
1/8 3/8 1/2 5/8 7/8
Număr de
treceri

0 0.103 3.388*10-4 7.629*10-6 5.734*10-8 0

2 0.390 0.016 1.045*10-3 2.172*10-5 2.959*10-12

5 0.428 0.179 0.048 4.585*10-3 4.618*10-8

7 0.430 0.364 0.196 0.044 7.158*10-6

9 0.430 0.447 0.382 0.182 4.428*10-4

11 0.430 0.462 0.476 0.378 0.011

15 0.430 0.462 0.477 0.394 0.298

17 0.430 0.462 0.4775 0.395 0.401

29.05.2017 21
F=0,5

N=20
F=0,7

N=20
F=0,5

N=40

F=0,5

N=20
F=0,7

N=20
F=0,5

29.05.2017 Repartiţia binomială, variaţia indicatorilorN=40


caracteristic 22
pentru trei cazuri specifice.
Se consideră un nod divizor de trafic), supus unei observaţii discrete,

A2
prin care într-un interval caracteristic, sosesc în pluton 20 de
autovehicule. Admiţând valorile funcţiei empirice acceptate pentru
prognoza încărcării arterelor divizoare de trafic marcată în figura
menţionată, să se determine probabilitatea de succes a unui număr de
treceri pe arterele I, II, III şi IV, astfel: artera I - 8 vehicule, artera II - 5
vehicule, artera III – 3 vehicule şi artera IV – 4 vehicule. Pentru
probabilităţile determinate să se calculeze valorile medii şi modul de
sondaj caracteristic.
I
F=0,38
II
F=0,22

IV
F=0,33 III
F=0,27

Schiţa nodului divizor de trafic şi funcţiile asociate celor patru


direcţii de deplasare.
29.05.2017 23
Comentariu şi rezolvare

M[1] Mo Δ=
Sensul de
k F P Veh/ob Veh/ob M-Mo
deplasare
s. s. *10-3

0.0923679
I 8 0,28 5.88 5.60 2.8*10-3
57
0.1922986
II 5 0,22 4,62 4,40 2*10-3
36
0.0224026
III 3 0,37 7,77 7,40 3.7*10-3
48
0.1490648
IV 4 0,13 2,73 2,60 1.3*10-3
45

[1]
Se observă că referirea valorile medii se face raportat la unităţi de măsură exprimate în
vehicule şi interval de observare. Mărimea intervalului de observare însă nefiind o valoare
absolut necesară în cazul variabilelor aleatoare discrete poate să lipsească şi în acest caz
rezultatul este intrinsec, fără însă a exista posibilitatea generalizării temporale a valorilor
calculate
29.05.2017 24
Să se determine probabilitatea de defectare a sistemului electric la 1, 2,

A3 4 şi 6 vehicule, ştiind că eşantionul este format din 12 vehicule, iar


probabilitatea ca nici un defect să apară este 0,2

Aplicând relaţiile date se determină:


P(16, k)=0,113; 0,211; 0,246; 0,2; 0,12; 0,055.
Media: 3,2 auto;
Abaterea medie pătratică: 1,6 auto
Dispersia: 2,56 auto2
Grafic, funcţia de probabilitate este de forma:
0.25
0.246
Probabilitatea de asteptare

0.2

Pi 0.15

0.1

0.055 0.05
1 2.25 3.5 4.75 6
29.05.2017 1 i 6 25
Numar vehicule in asteptare
Repartiţia Poisson

Este un caz limită al repartiţiei binomiale, aplicată în general eşantioanelor


formate dintr-un număr mare de observaţii atunci când probabilitatea de
succes a unui eveniment este foarte redusă. În domeniul traficului rutier,
această lege de distribuţie este utilizată pentru prognoza accidentelor de
trafic sau în cazul prognozei ratei de încălcare a normelor de conducere
preventivă[1] ( trecerea pe culoarea roşie a semaforului, întoarcerea pe
sectoare de drum cu restricţie în acest sens, forţarea trecerii la nivel peste
calea ferată, etc.)

[1] Trebuie să facem precizarea că deşi la ora actuală problema frecvenţa


evenimentelor de trafic este ridicată şi cu consecinţe grave, există anumiţi factori
determinanţi care scot aceste evenimente de sub incidenţa legităţii Poisson.
Există contextul factorilor de influenţă ce vor fi trataţi în capitolele următoare care
pot duce la creşterea ratei situaţiilor conflictuale în trafic şi acestea fac ca
elementele ce caracterizează tipologia accidentelor de trafic să determine
evenimentul într-o altă categorie de probabilitate, cu o rată de fatalitate
(incidenţă) diferită.

29.05.2017 26
În cazul distribuţiei Poisson, valoarea caracteristică o reprezintă incidenţa
medie a defectelor, care are a rată constantă de producere independentă

k max
1 k reprezintă numărul de repetări ale evenimentului;

N 
k 0
k  nk nk numărul de probe în care s-a repetat evenimentul.
N numărul total de evenimente analizate.

Densitatea de probabilitate

k 
f k     e
k!
Mediana statistică

1 0,02
Me    
3 

29.05.2017 27
Momentul generator

P t ,    e  e 1
t

Pentru o intersecţie semaforizată, monitorizată video în perioada unei


săptămâni de funcţionare (185.000 autovehicule observate), s-au

A4
înregistrat prin tehnica observării de sondaj, trecerile pe culoarea roşie
a semaforului. Cunoscând numărul de autovehicule care au trecut în
această perioadă prin intersecţie (185.000), precum şi rezultatul
sondajului privind numărul de astfel de infracţiuni comise, să se
determine probabilitatea de producere a 0 .. 6 evenimente de acest tip

Număr de treceri
0 1 2 3 4 5 6
k

Nivelul de repetare
106 162 58 21 0 2 1
nk

29.05.2017 28
Comentariu şi rezolvare:
În traficul rutier urban se întâlnesc frecvent situaţii în care voluntar
sau involuntar conducătorii auto trec pe culoarea roşie a semaforului.
Deşi acest tip de evenimente rutiere are o rată redusă, totuşi nu se
exclude posibilitatea apariţiei acestei infracţiuni. În consecinţă, trebuie
analizat şi acest fenomen iar funcţie de rezultatul analizei se pot aplica
măsuri care să ducă la diminuarea acestui fenomen. Am luat în
considerare în acest exemplu un parametru nk în măsură să exemplifice
amploarea fenomenului analizat: de câte ori pe durate de observare
egale se produc 0, 1, 2 .. 6 treceri pe culoarea roşie.
Este important după cum vom observa în urma aplicării algoritmului
de calcul nivelul de incidenţă al repetabilităţii trecerilor şi astfel se vor
putea formula aprecieri privind riscul apariţiei fiecărei clase k de
fenomene observate.
Se determină utilizând datele din tabel valoarea parametrului
caracteristic λ. Aplicând relaţia, se obţine înlocuirea numerică şi
valoarea calculată alăturată:

1
  0  106  1  162    6  1  0,83022
106  162  58  21  0  2  1

29.05.2017 29
0 .5 d is t r ib u t ia d e p r o b a b ilit a t e a
k f(k, λ) P(k, λ)t r e c e r ilo r p e c u lo a r e a r o s ie a s e m a f o r u lu i

0 0.43594789 0 .4 0.435947891
1 0.36193813 0 .3 0.797886020
2 0.15024641 0 .2
0.948132435
3 0.04157982 0.989712256
0 .1
4 8.63023023 0.998342486
.10-3 0 .0

5 1.43301962 0.999775506
0 1 2 3 4 5 6
E v e n im e n tu l - n r . k d e tr e c e r i
.10-3
6 1.98289925 0.999973796
1 .0
Valorile cumulate ale distributiei de probabilitate

.10-4 0 .9

0 .8

0 .7

0 .6

0 .5

0 .4

0 1 2 3 4 5 6
E v e n im e n tu l - n r . k d e tr e c e r i

Variaţia indicatorilor de probabilitate

29.05.2017 30
Se consideră observarea cu echipament radar a regimului de

A5
viteză pe o arteră urbană. Considerând rezultatele înregistrate,
grupate în intervale de viteze conform tabelului alăturat, să se
determine probabilitatea ca viteza legală admisă fie depăşită cu
10, 20, 30, 40 şi 50 km/h.
Repartiţia statistică a vitezelor observate.

20 30 40 50 60 70 80 90
Interval de 
– – - – – – - -
viteze 20
30 40 50 60 70 80 90 100
[km/h]
Nr.
vehicule 2 39 32 41 77 37 14 1 2
încadrate
În scopul rezolvării acestei aplicaţii, se impune în prealabil reducerea ei la o problemă
de tip probabilistic. În acest scop, vom considera o ierarhizare a evenimentelor k
funcţie de gradul de risc pe care îl reprezintă. Astfel, deplasarea sub limita de viteză
admisă va fi considerat eveniment de rang 0, iar depăşirea acesteia cu intervale de
câte 10 km/h vor constitui evenimente de rang 1 .. 6
Interval de viteze
 50 50 – 60 60 – 70 70 – 80 80 - 90 90 - 100
[km/h]
k 0 1 2 3 4 5
Nr. vehicule
29.05.2017
încadrate 94 77 37 14 1 231
Nk
Valori analitice calculate   1,92
f(k, λ) P(k, λ)
0 .3 0
k
0 .2 5
0 0.147 0.147
densitatea de probabilitate

0 .2 0
1 0.281 0.428
0 .1 5 2 0.27 0.698
0 .1 0 3 0.173 0.871
0 .0 5 4 0.083 0.954
0 .0 0 5 0.032 0.986
50 60 70 80 90 100
d o m e n iu l d e v ite z e [k m /h ]

1 .0
Valori cumulate de probabilitate

0 .8

0 .6

0 .4

0 .2

0 .0
50 6 0 70 80 9 0 10 0
d o m e n iu l d e v it e z e [ k m / h ]
29.05.2017 32
Indicatorii repartiţiei Poisson

S-ar putea să vă placă și