Sunteți pe pagina 1din 9

"Modele de probabilitate pentru pariurile pe hochei"

Ravi Patel IB SL Matematică


Hocheiul s-a impus pe termen nelimitat ca unul dintre sporturile în mare creștere din America
de Nord. De când mă uitam la Hockey Night în Canada, când eram copil, am dezvoltat o pasiune
plăcută pentru sportul național de iarnă din Canada. De-a lungul vieții mele de vizionare a acestor
jocuri, am atins o pasiune plăcută a marii rivalități dintre cele două francize uriașe din NHL. Desigur,
acest lucru se referă la rivalitatea aclamată dintre Toronto Maple Leaf's și Montreal Canadiens.

De-a lungul zilei mele de vizionare a acestor jocuri de hochei, am observat întotdeauna
reclame de la companiile de pariuri care își încurajează spectatorii să parieze pe scorul și câștigătorul
acestor rivalități sportive de nivel înalt în schimbul banilor. Întregul concept de pariuri sportive mi s-
a părut extrem de complicat, mai ales când am dat peste un videoclip CBC care arăta că marea
schemă de câștigători de pe site-ul de pariuri sportive erau indivizi asemănători tocilarilor care au
creat modele matematice pentru a prezice câștigătorii / clasamentele viitoarelor jocuri și / sau
sezoane. Complexitatea acestor modele matematice nu s-a prezentat până când nu am învățat în cele
din urmă conceptele de statistică și distribuție a probabilităților în clasa mea de matematică SL. Am
observat că distribuțiile de probabilitate specifice pot fi analizate și extrapolate folosind teoreme de
probabilitate pentru a crea modele matematice de probabilitate pentru situații viitoare.

La început, am avut îndoielile mele cu privire la co-relaționarea distribuțiilor normale de


probabilitate la pariurile pe hochei, totuși, după cercetarea diferitelor concepte din manualul de
matematică HL, am ajuns la un subiect. Raționamentul meu pentru această evaluare internă este de a
crea modele de probabilitate din statisticile golurilor marcate atât din Toronto, cât și din Montreal din
sezonul 2017-18 al Ligii Naționale de Hochei și apoi de a găsi o ecuație a unui model de
probabilitate care se potrivește cel mai bine datelor pentru a prezice scorul unui viitor joc de ligă.
Pentru a păstra parametrii ecuației limitați și pentru a evita orice părtinire a echipei gazdă în modelul
meu matematic, voi presupune că jocul va fi jucat în Los Angeles ca un "joc clasic de iarnă" anual.
Pentru a crea date extrem de precise, nu voi rotunji niciuna dintre cifrele pe care calculatorul meu
grafic le afișează pentru a mă asigura că valorile parametrilor mei sunt cât mai exacte posibil. În plus,
voi accesa și voi reflecta asupra diferitelor variabile care îmi vor afecta calculele. Aceste precauții
matematice vor asigura că probabilitățile mele finale așteptate vor fi cât mai exacte posibil.

Primul pas care trebuie făcut în procesul de modelare matematică este găsirea valorii așteptate a
golurilor pe care fiecare echipă le poate înscrie în joc. Acest lucru se face prin crearea unei
histograme a golurilor transmise (GF) de către fiecare echipă individuală pe parcursul sezonului de
82 de jocuri din 2017-18. De asemenea, am ales să adaug o linie de tendință pentru a afișa tendința
mediilor de gol ale Maple Leaf's pe tot parcursul sezonului. Datele colectate vor fi afișate pe o
histogramă în figura de mai jos.

(Figura 1.0)

GF of the Toronto Maple Leafs


25
20
20 18
FREQUENCY

15 13
11
10 7 6
5 2 3 2
0
0 1 2 3 4 5 6 7 8
# of goals forwarded

Acum că am creat un tabel de frecvență pentru golurile transmise de Toronto, aceste date trebuie
convertite într-un grafic care afișează probabilitatea, astfel încât să poată fi interpretat pentru a găsi
valorile așteptate ale tendințelor de marcare a golurilor echipei. La început mi-a fost dificil să găsesc
un model de curbă distinct (de exemplu, exponențial, normal) care să se potrivească cu datele mele,
deoarece sunt discrete. După ce am făcut cercetări suplimentare, văd că acest model se potrivește cel
mai bine cu o curbă de distribuție Poisson. Distribuția Poisson este o distribuție discretă a frecvenței
care dă probabilitatea apariției unui număr de evenimente independente într-un timp fix. Pentru a
determina dacă numărul de sosiri pe minut urmează o distribuție Poisson, ipotezele nule și alternative
sunt scrise mai jos:
H 0: Numărul de sosiri pe minut urmează o distribuție Poisson

H 1: Numărul de sosiri pe minut nu urmează o distribuție Poisson

Pentru a analiza dacă datele mele urmează un proces Poisson, trebuie mai întâi să determin
parametrul datelor mele, care este media, modelat ca Lambda ( ƛ ).
c

∑ mj f j
X = j=1
n
277
X= =3.37805= ƛ
82
Această valoare a lui X nu va fi rotunjită la trei cifre semnificative, deoarece folosesc această valoare
medie ca estimare a ƛ . Prin urmare, folosind Lambda ca estimare a mediei, frecvențele succeselor X
pentru ( X =1 ,2 , 3 , 4 , 5 , 6 , 7 , 8) pot fi găsite. Mai mult, frecvența teoretică pentru fiecare valoare a
lui X este derivată din înmulțirea dimensiunii eșantionului (N) cu fiecare valoare X probabilitatea
Poisson.

Acum că am găsit estimarea mediei pentru datele totale, trebuie să calculez probabilitatea Poisson
pentru 10 intervale de X. Aceste intervale includ ( X =1 ,2 , 3 , 4 , 5 , 6 , 7.8.9∨more ). Trebuie să
calculez probabilitatea de 9 sau mai mult, deoarece este important să rețineți că probabilitatea
Poisson afișează un concept teoretic al obiectivelor transmise de Toronto Maple Leaf. Astfel,
deoarece teoretic este posibil să se înscrie mai mult de 9 goluri într-un meci, sau estimarea mediei
(3,37805) va oferi valoarea așteptată a ( X =[ 9 , ∞ ])

Pentru a găsi probabilitatea teoretică Poisson a lui X, am descoperit formula de distribuție Poisson
care este afișată mai jos:
x −ƛ
ƛ e
P ( X=x ) =
x!
Unde:
ƛ = Folosit ca parametru în ecuație (așa cum am menționat anterior)
e = Numărul lui Euler, o constantă matematică cu valoarea 2.71828
Calcularea probabilităților așteptate pentru fiecare obiectiv înaintat pare destul de ușoară la început, totuși
m-am apropiat de o etapă complicată când a trebuit să găsesc probabilitatea așteptată de (X = 0). Atunci
mi-am amintit procesul pe care tutorele meu m-a învățat să-l arăt că factorialul lui 0 este egal cu 1.

n !=n ( n−1 )( n−2 ) ( n−3 ) … .


n !=n(n−1)!
1 !=1(1−1)!
1=1(0! )
1=0!
Folosind expresia " n !=n ! , Am înlocuit apoi o valoare a lui n cu 1", deoarece știam că factorialul
său ar fi pur și simplu 1 (1x1). Mai mult, valoarea (n-1) mi-ar da și zero și, prin urmare, am găsit una
care 1 = 0! Acum pot continua cu calculele mele ale probabilității Poisson înlocuind X cu 0 și ƛ cu
3,37805.
0 −3.37805
3.37805 e
P ( X=0 )=
0!

P ( X=0 )=1 e−3.37805 ¿ ¿


0!
1(0.03411)
P ( X=0 )=
1
P ( X=0 )=0.03411
Acum că mi-am calculat probabilitatea Poisson așteptată de (X = 0), trebuie să continui să fac același
lucru pentru toate celelalte intervale ale lui X, care includ (X = 0,1,2,3,4,5,6,7,8,9 sau mai mult).
Următoarele probabilități așteptate sunt enumerate mai jos:
Tabelul 1.1
# de goluri P(X) de la Poisson
transmise (X) Distribution cu
ƛ=3.37805
0 0.03411 De asemenea, am găsit o ușoară dificultate atunci
1 0.11524 când am încercat să găsesc probabilitatea de 9 sau
2 0.19464 mai mult, totuși pur și simplu mi-am aplicat
3 0.21917 cunoștințele despre statistici și probabilitate
4 0.18509 pentru a obține probabilitatea așteptată.
5 0.12505
P ( X ≥ 9 )=1− [ P ( X =0 ) + P ( X =1 ) + P ( X=2 ) + P ( X =3 ) + P ( X=4 )+
6 0.07040
7 0.03398 P ( X ≥ 9 )=0.00744
8 0.01435
9 sau mai multe 0.00744

Acum că am fiecare dintre P(X) pentru obiectivele transmise de Toronto Maple Leaf's, pot
acum să iau aceste date și să creez o curbă vizuală, care ar trebui să modeleze graficul original
GF vs Frequency din Figura 1.1

Figura 1.2

GF Probablity with Lambda = 3.37805


0.25
0.21917
0.2 0.19464
0.18509
Probability of (X)

0.15
0.12505
0.11524
0.1
0.0704

0.05 0.03411 0.03398


0.01435 0.00744
0
0 1 2 3 4 5 6 7 8 9
# of goals forwarded (X)

Pot vedea în mod evident că această distribuție este o distribuție Poisson ca Figura 1.2 folosind
Lambda ca parametru al probabilității teoretice se potrivește cu modelul original din Figura 1.1. Pot
confirma acest lucru, deoarece linia de trend are aceleași intervale de creștere și scădere între
diferitele puncte. Cu toate acestea, graficul nu prezintă perfect datele obiectivelor înaintate.
În loc să folosesc modele matematice calitative, trebuia să găsesc o modalitate de a obține un proces
matematic care să poată lua datele mele și să determine dacă datele mele erau Poisson în cel mai
precis mod posibil. Pentru a obține o reprezentare mai exactă a cât de apropiate sunt datele mele de
un model Poisson, am decis să efectuez un test Chi-Squared. Testul Chi-Square Goodness of Fit este
un test non-parametric care este utilizat pentru a afla modul în care valoarea observată a unui
fenomen dat este semnificativ diferită de valoarea așteptată. Ecuația este afișată ca:
❑ 2
(f 0−f e )
ƛ k− p−1=∑
2

k fe

Unde:
f 0 = Este frecvența observată

f e = Este frecvența teoretică sau așteptată

k = Numărul de categorii sau clase rămase după combinarea claselor


p = Numărul de parametri estimați din date
Privind ecuația de mai jos, este evident că îmi lipsesc unele variabile din ecuație. Trebuie să găsesc
probabilitatea teoretică ( f e). Această frecvență poate fi găsită din: f e =( n ) ( P ( X ) ) . Următorul tabel
prezintă calculele pe care le-am făcut pentru a obține valoarea finală de aproximare a Lambda la
pătrat. Am făcut acest lucru prin crearea unui tabel de ecuații în care finalizez un proces pas cu pas în
încercarea de a obține suma formulei finale, care sunt toate enumerate în tabelul de mai jos:
Tabelul 1.2
fe ¿) ¿ 2
( f 0−f e )
fe
2.79702 0.79702 0.635241 0.227113
9.44968 1.55032 2.40349 0.254346
15.9605 -2.9605 8.76456 0.549141
17.9719 2.0281 4.11319 0.228868
15.1774 2.8226 7.96707 0.52493
10.2541 -3.2541 10.5892 1.03268
5.7728 0.2272 0.05162 0.008942
2.78636 0.21364 0.045642 0.016381
1.1767 0.8233 0.677823 0.576037
0.61008 0.61008 0.372198 0.61008
Total: 4.02652

După finalizarea tabelului, sunt oarecum precaut cu privire la modul în care cifra pentru frecvența
teoretică de 10,2541 a ajuns să aibă o valoare atât de mare în comparație cu restul. Cu toate acestea,
suma din această ecuație de distribuție Poisson notează că ƛ 2=4.02652 .
Acum că procesul pas cu pas este complet, trebuie să continui să găsesc indicele sub ƛ. Pentru a
determina indicele de sub ƛ, trebuie să determin un concept asociat cu distribuția Poisson cunoscut
sub numele de grade de libertate. Ecuația este scrisă mai jos ca:
2
ƛ =k −p−1
Ne amintim că definițiile variabilelor k și p au fost deja menționate mai sus. Prin urmare, valoarea lui
k, care este numărul de clase rămase odată ce se combină clasele, este 9, deoarece aceasta este clasa
teoretică care nu apare în frecvențele observate efectiv. Mai mult, valoarea lui p este 1, deoarece
singurul parametru luat în considerare este Lambda, care este în corelație cu testul Chi-Squared. Prin
urmare, pot găsi gradele de libertate după cum urmează:
k − p−1=9−1−1=7
Acum că gradele noastre de libertate sunt găsite, trebuie să folosim metoda alternativă de testare a
ipotezelor pentru a determina în cele din urmă dacă distribuția este o distribuție Poisson. Pentru a
continua cu această metodă de testare, trebuie să folosesc aceeași ipoteză de respingere care a fost
menționată la pagina 1. La început, am fost foarte confuz în găsirea relației dintre testul ipotezei nule
și adecvarea datelor mele la o distribuție Poisson. Apoi am decis să vizionez câteva videoclipuri
YouTube și să învăț cum să efectuez metoda de testare, care implică un concept pe care l-am învățat
în clasă, cunoscut sub numele de puncte critice. Am stabilit mai întâi teorema respingerii:
H 0 : ƛ=3.37805

H 1 : ƛ ≠3.37805

Va trebui să continue să lucreze în acest sens. Am continuat cu următorul pas al IA-ului meu,
deoarece puteam deja să deduc că distribuția mea era Poisson din observații calitative, totuși trebuie
să lucrez la acest calcul
Acum că testul meu Chi-Squared a dovedit că distribuția numărului de goluri transmise de Toronto
Maple Leaf este o distribuție Poisson, totuși munca mea nu este încă completă. Deoarece scopul meu
final este de a crea o matrice de probabilități pentru a arăta puterea de atac a fiecărei echipe, trebuie
să determin și distribuția Poisson a Montreal Canadiens.
Din moment ce testul meu anterior Chi-Squared a funcționat pentru a dovedi că distribuția scorului
de goluri a frunzei de arțar a fost într-adevăr o distribuție de otravă, acum pot ajunge la concluzia că
marcarea golurilor în sportul hocheiului este un proces Poisson. Cu aceste cunoștințe, pot crea
acum un model P(X) de marcare a golurilor în raport cu valoarea Lambda găsită de Montreal
Canadiens.
Figura 2

GF by the Montreal Canadiens


20
15 17 18
Frequency

14
10 12
10
5 6
0 2 1 1 1
0 1 2 3 4 5 6 7 8 9 10
# of goals forwaded

Această cifră arată foarte asemănătoare cu figura 1, în care datele privind obiectivele transmise au
fost distribuite într-o curbă similară. Pentru a continua și a găsi diagrama mea P(X), trebuie să
determin valoarea lui ƛ și apoi să calculez încă o dată.
c

∑ mj f j
X = j=1
n
209
X= =2.54878=ƛ
82
# de goluri P(X) de la Poisson
transmise (X) Distribution cu
ƛ=2.54878
0 0.07818
1 0.19926
2 0.25393 P ( X ≥11 )=1− [ P ( X =0 ) + P ( X =1 )+ P ( X=2 ) + P ( X =3 ) + P ( X=
3 0.21574
4 0.13747 P ( X ≥11 )=0.00006
5 0.07007
6 0.02977
7 0.01084
8 0.00345
9 0.00098
10 0.00025
11 sau mai multe 0.00006
Figura 2.1

Probability of GF with Lambda = 2.54878


0.3
0.25393
0.25
0.21574
0.19926
0.2
Probability of (X)

0.15 0.13747

0.1 0.07818
0.07007
0.05 0.02977
0.01084 0.00345 0.00098 0.00025 0.00006
0
0 1 2 3 4 5 6 7 8 9 10 11 or
more
# of goals scored (X)

Figura 2.1 arată similar cu graficul calculat din datele din figura 2. Am observat că probabilitățile
teoretice ale P(7 ≤ X ≤ 11∨more ) lui nu se potriveau cu rezultatele din graficul original. Reflectând
asupra posibililor factori limitativi, motivul pentru aceasta se datorează faptului că frecvența
observată a marcării golurilor în intervale mari este extrem de rară, de aceea există mici fluctuații
între o și 1 pentru P(7 ≤ X ≤ 11∨more ) încă o scădere treptată a graficului teoretic de probabilități.
Acum că toate probabilitățile Poisson sunt găsite pentru golurile transmise ale Toronto Maple Leaf și
ale canadienilor de la Montreal, trebuie să calculez probabilitățile înapoi în formula Poisson
Distribution și apoi să creez o matrice de probabilități cu posibile rezultate ale scorului.

S-ar putea să vă placă și