Sunteți pe pagina 1din 85

11:07

Teoria probabilităților și
statistică matematică

2019-2020

Curs 1
2019-2020

1
11:07

Elemente de teoria
probabilităților

experimentul sau proba

În teoria probabilităților, evenimentul ca rezultat al


desfășurării experimentului
conceptele de bază sunt:

probabilitatea de apariție a
evenimentului

aruncarea monedei

Experimentele clasice în aruncarea zarului cu fețe


teoria probabilităților numerotate de la 1÷6
sunt: extragerea bilelor colorate
dintr-o urnă (două sau mai
multe culori)

2
11:07

În funcție de modul de apariție și desfășurare,


evenimentele se pot clasifica în:

evenimente evenimente
eveniment eveniment independente compatibile
sigur (E) imposibil (ø) sau sau
dependente incompatibile

În teoria probabilităților, conceptul de eveniment este


considerat pentru a preciza producerea sau neproducerea
unui anumit fenomen într-o experiență aleatoare.
Eveniment – rezultatul unui experiment.
Eveniment sigur (cert)– evenimentul E care se produce
ori de câte ori se efectuează experiența.
Ex. La aruncarea unui zar, evenimentul “apariția unui
număr par, ≤3”.
Eveniment imposibil – nu se produce la nici o efectuare a
experienței. Aceste eveniment se notează ⏀.
Ex. La aruncarea unui zar, evenimentul “apariția unui
număr natural,≥7”.
Eveniment aleator – se poate produce sau nu la
efectuarea experienței.

3
11:07

Eveniment elementar – un eveniment implicat numai de


el însuși și de evenimentul imposibil. Evenimentul care
are un singur caz favorabil.
Ex. La aruncarea unui zar, evenimenul “apariția
numărului 3“.

Evenimentul implicat de un alt eveniment. Dacă


evenimentul B se produce ori de câte ori se produce A, se
spune că A implică B și se notează A⊂B.
Dacă A⊂B și B⊂A spunem că evenimentele A și B sunt
echivalente și se notează A=B.
Ex. La aruncarea unui zar, evenimenul A: “apariția
numerelor {1,3}“ implică evenimentul B: “apariția unui
număr impar“ .

Operații cu evenimente

4
11:07

Operații cu evenimente

...sunt similare operațiilor din teoria mulțimilor, și anume:

1. Negarea (evenimentul opus). Se consideră un


eveniment A ca rezultat posibil al desfășurării unei
experiențe. Prin definiție, evenimentul contrar A, notat Ā
sau CA și citit “non A” este evenimentul care se produce
ori de câte ori nu se realizează evenimentul A.

E A

Operații cu evenimente

2. Reuniunea. Se consideră evenimentele A și B. Prin


definiție, reuniunea lor este un nou eveniment notat A∪B
și citit “A sau B“, care se realizează fie dacă se produce
evenimentul A, fie dacă se produce evenimentul B.

E
AA B
A

5
11:07

Operații cu evenimente

3. Intersecția. Se consideră evenimentele A și B. Prin


definiție, intersecția lor este un nou eveniment notat A∩B
și citit “A și B“, care se realizează dacă și numai dacă se
produce atât evenimentul A, cât și evenimentul B.

C C∩A = ø
AA B
A C∩B = ø
E

Evenimentul diferență A-B sau A\B – evenimentul care


se produce atunci și numai atunci când se produce
evenimentul A și nu se produce evenimentul B (cazurile
favorabile lui A care nu sunt cazuri favorabile și lui B).

Evenimente compatibile – Evenimentele A și B se


numesc compatibile dacă se pot realiza simultan, adică
există probe care realizează atât pe A cât și pe B (A∩B ≠
⏀)

Evenimente incompatibile – realizarea unuia dintre


evenimente exclude realizarea celorlalte evenimente într-o
aceeaşi probă. Intersecţia a două evenimente
incompatibile este evenimentul imposibil (A∩B = ⏀)

6
11:07

Operații cu evenimente

Reuniunea și intersecția satisfac proprietăți cunoscute în


algebră:

 Comutativitatea A∩B ≡ B∩A

 Asociativitatea A∪B ≡ B∪A

 Distributivitatea A∩(B∩C) ≡ (A∩B)∩C

Operații cu evenimente. Aplicație

O urnă conține bile albe și bile negre. Se definesc


următoarele evenimente:
A – prima bilă este albă;
B – a doua bilă este albă.
Pe baza operațiilor cu evenimente, să se scrie următoarele:
C – prima bilă este neagră;
D – cel puțin o bilă este albă;
F – ambele bile sunt negre;
G – o bilă și numai una singură este albă.

C = Ā “prima bilă este neagră“ este contrariul evenimentului A


“prima bilă este albă“.

7
11:07

Operații cu evenimente. Aplicație

D – cel puțin o bilă este albă;


F – ambele bile sunt negre;
G – o bilă și numai una singură este albă.

D = A∪B “prima bilă este albă“ sau “a doua bilă este albă“.

F = “prima bilă este neagră“ și “a doua bilă este


neagră“.

G= “prima bilă este albă“ și “a doua bilă este


neagră“ sau “prima bilă este neagră“ și “a doua bilă este
albă“ .

Probabilitatea evenimentelor

8
11:07

Probabilitatea evenimentelor

Probabilitatea evenimentului trebuie înțeleasă ca o


stabilizare a frecvenței de apariție a unui anumit rezultat
sau eveniment în condițiile repetării de mai multe ori a
unui experiment.

 Definiția clasică. Se consideră un experiment a cărui


rezultat posibil este realizarea evenimentului A. Dacă
experimentul se realizează de n ori, iar într-un număr de m
cazuri se produce evenimentul A, conform definiției clasice,
probabilitatea evenimentului A, notată P(A) este dată de
relația:
P(A) = m/n,
adică nr. cazuri favorabile / nr. cazuri total posibile

Probabilitatea evenimentelor

 Definiția statistică. Se presupune că experimentul se


desfășoară de un număr n ori, teoretic tinzând la ∞. Probabilitatea
evenimentului A, notată P(A) este dată de relația:
P(A) = lim m/n
n→∞

 Definiția axiomatică (Kolmogorov). Se consideră


evenimentele A1, A2,..., An, formând cîmpul complet de
evenimente K, care prin definiție înseamnă că evenimentele sunt
mutual exclusive două cîte două. Probabilitatea se introduce ca o
funcție de evenimente definită pe K și luând valori în mulțimea
numerelor reale R și care satisface următoarele proprietăți:

9
11:07

Probabilitatea evenimentelor
P(A): K → R

1. P(A)≥0 2. P(E)=1

3. P(A1∪A2∪...∪An) = P(A1)+P(A2)+...+P(An)

4. P(ø)=0 5. P(A)∊[0,1] 6. P(Ā) = 1-P(A)


P(A)+P(Ā)=1
7. A⊂B, P(A)≤P(B)

8. A, B – evenimente independente. Se pot aplica și pentru trei


sau mai multe evenimente.
P(A∪B) = P(A)+P(B)
P(A∩B) = P(A)·P(B)

Modele clasice de calcul a


probabilităților

10
11:07

Modelul lui Poisson


 Dacă evenimentele independente A1, A2, ... , An au probabilitățile
cunoscute:
P(A1) = p1, P(A2) = p2, ..., P(An) = pn,
atunci probabilitatea realizării a k evenimente din n este:
P(n,k) = Σpi1·pi2·... ·pik · qi1·qi2·... ·qik
unde: qi = 1-pi, i=1,2,...,n
Această probabilitate este chiar coeficientul lui xk din dezvoltarea:

Aplicație: Se experimentează 4 prototipuri de aparate, câte unul pentru fiecare


Aplicație:
tip, probabilitatea ca prototipul să fie corespunzător pentru fiecare categorie în
parte este: p1 = 0,8; p2 = 0,7; p3 = 0,9; p4 = 0,85.
a) Probabilitatea ca toate cele 4 să fie corespunzătoare P(4,4);
b) Probabilitatea ca nici un aparat să nu corespundă P(4,0);
c) Probabilitatea ca unul din cele 4 să fie corespunzător P(4,1).

Modelul lui Poisson

Rezolvare:
Rezolvare:
Conform schemei lui Poisson se calculează coeficientul lui X din
polinomul:
a) (p1x+q1)· (p2x+q2)· (p3x+q3)· (p4x+q4)
P(n,n) = p1· p2·... ·pn
P(n,0) = q1· q2·... ·qn
P(n,k) = Σpi1·pi2·... ·pik · qi1·qi2·... ·qik
P(4,4) = p1·p2·p3·p4 = 0,8·0,7·0,9·0,85 = 0,428
P(4,0) = q1·q2·q3·q4 = 0,2·0,3·0,1·0,15 = 0,0009
P(4,1) = p1·q2·q3·q4 + p2·q1·q3·q4+ p3·q1·q2·q4+ p4·q1·q2·q3=
=0,8·0,3·0,1·0,15+0,7·0,2·0,1·0,15+0,9·0,2·0,3·0,15+0,85·0,2·0,3·
0,1 = 0,0189

11
11:07

Modelul lui Bernoulli cu două stări


Se consideră un experiment în care apar evenimentele A și Ā cu
probabilitățile: P(A) = p, P(Ā) = q, p+q = 1
Cel mai potrivit model pentru acest experiment poate fi o urnă care
conține bile de două culori (albe și negre) în număr cunoscut.
Experimentul cu bila întoarsă – binomială. Experimentul constă în
extragerea unei bile dintr-o urnă, înregistrarea culorii și repunerea acesteia la loc în
urnă. Astfel, structura nu se modifică, rămâne aceeași. Experimentul se repetă de un
număr de n ori, n∊N, și se cere stabilirea probabilității ca din cele n bile extrase, k
bile, k∊N, k≤n, să fie toate de o aceeași culoare precizată (de exemplu, albă). Dacă
bila extrasă este albă se zice că apare evenimentul A, iar dacă bila este neagră,
evenimentul contrar Ā.

Aceste probabilități sunt tocmai coeficienții dezvoltării binomiale următoare:

Modelul lui Bernoulli cu două stări

Experimentul cu bila neîntoarsă – hipergeometrică.


De data aceasta se impune condiția ca bila extrasă să nu mai fie
repusă în urnă. Atunci structura urnei se modifică și P(A) și P(Ā) se
schimbă la fiecare repetare a experimentului.
Dacă N1 reprezintă numărul bilelor albe din urnă și N2 numărul
bilelor negre, avem:

12
11:07

Bibliografie

[1] Gillich N., Praisach V.I. , Probabilități și fiabilitate. Culegere de


probleme, Editura Eftimie Murgu, Reșița, 1995
[2] Lung R.I., Elemente de teoria probabilităților, 2007
[3]Popp C-tin., Gillich N., Praisach V.I., Elemente de teoria
probabilităţilor şi statistică matematică, Editura “Eftimie
Murgu” Reşiţa, 1998.
[4] Pletea A.L., Popa L., Teoria probabilităților, Universitatea tehnică
Gh. Asachi, Iași, 1999

13
23.03.2020

Teoria probabilităților și
statistică matematică

2019-2020

Curs 2
2019-2020

1
23.03.2020

Variabile aleatoare (VA).


Funcția de repartiție

Una dintre noţiunile de bază ale teoriei probabilităţilor


este aceea de variabilă aleatoare, care permite ca
evenimentele unui câmp de evenimente să fie descrise cu
ajutorul unor valori numerice reale.

Variabila aleatoare reprezintă o mărime care – drept


rezultat al unui experiment – poate lua o valoare oarecare,
fară să se poată preciza dinainte care anume.

În continuare vom avea în vedere două categorii de


variabile aleatoare și anume:
-variabile aleatoare discrete;
-variabile aleatoare continue.

2
23.03.2020

Definiţie: se numeşte variabilă aleatoare discretă o


variabilă aleatoare având o mulţime finită sau numărabilă
de valori posibile.

Definiţie: Fie Sc=(Ai)i∈I un sistem complet de evenimente.


Se numește variabilă aleatoare o aplicație X:Sc→R. Se
notează cu xi=X(Ai) și pi= P(Ai). Dacă Sc este cel mult
numărabil, atunci variabila aleatoare atașată este discretă
(VAD) și anume:
 discretă simplă – dacă are un număr finit de valori;
 discretă numărabilă – dacă are o infinitate numărabilă
de valori.

Distribuţia unei variabile aleatoare se poate reprezenta


sub formă de tablou:

sau respectiv

după cum variabila aleatoare discretă este finită (I={1, 2,


…, n}) sau infinită numărabilă (I=N).

3
23.03.2020

Operații cu V.A.D.

Operații cu V.A.D.

Fie X și Y două variabile aleatoare discrete, date prin


tablourile:

unde: pi=P(X=xi) și qj= P(Y=yj)

Se pot face următoarele operații:

 adunarea cu o constantă “a”:

 înmulțirea cu o constantă “a”:

4
23.03.2020

Operații cu V.A.D.

 ridicarea la putere:

 ridicarea la putere. Dacă xi≠0,


atunci k poate fi și întreg negativ:

 suma a două VAD independente:

Dacă V.A. sunt independente, atunci pij=P(X=xi) · P(Y=yj)= pi· qj

Operații cu V.A.D.

 produsul a două VAD independente:

 Observații:

1. Dacă una sau mai multe valori se repetă, valoarea


respectivă se va scrie o singură dată, iar probabilitățile
corespunzătoare se adună.

2. Tabloul final se obține prin ordonarea în sens algebric


crescător a valorilor.

5
23.03.2020

Operații cu V.A.D.

 Observații:

3. În tabloul final se verifică:

4. Împărțirea se transformă într-o operație de ridicare la


putere negativă, urmată de operația de înmulțire.

5.

Funcția de repartiție

6
23.03.2020

Se consideră X o variabilă aleatoare discretă sau continuă


adică având tabloul de distribuţie
 xi   x 
  sau  
 pi i=1,n  f(x) x[a,b]
Se numeşte funcţie de repartiţie corespunzătoare variabilei
X, funcţia F:R[0,1] definită prin F(x0)=P(xx0), x0R .
Funcţia de repartiţie are următoarele proprietăţi rezultate
din definiţia acesteia:
P1. 0F(x0)1, () x0R
P2. F(-)=0, F()=1
P3. F(β)-F(α)=P(αxβ)
P4. F este nedescrescătoare

Funcţia de repartiţie pentru variabila discretă.


Dacă X este variabilă discretă, atunci x<x 0 este reuniunea
acelor evenimente X=xi pentru care xi<x0 adică:
x < x0 =  (x = x i )
x i< x 0

Evenimentele x=xi fiind incompatibile avem :


 
F( x0 ) = P(x < x0 ) = P  (x = xi )  =  P(x = xi ) =  pi
 x i< x 0  x i< x 0 x i< x 0

Acest rezultat defineşte funcţia de repartiţie ca funcţie


cumulativă a probabilităţilor.

7
23.03.2020

Fig.2.1. Graficul funcţiei de repartiţie pentru VAD.

 0 , x  -1
0,1 ,-1 < x  2

F(x) = 
0,8 , 2 < x  4
 1 , x > 4

Într-adevăr, dacă :
x0-1, F(x0)=P(x<x0) = P(Φ)=0
-1<x02, F(x)=P(x<x0)=P(x=-1)=
=0,1
2<x04, F(x)=P(x<x0)=P((x=-1)
(x=2))=P(x=1)+P(x=2)=0,1+0,7=
=0,8
x0>4, F(x)=P(x<x0)=P(E)=1

Apoi, P(0x<5)=F(5)-F(0)=1-0,1=0,9.

8
23.03.2020

Funcţia de repartiţie pentru variabila continuă.

Fie o variabilă aleatoare continuă.

Funcţia de repartiţie în cazul VAC, este dată prin:

şi va avea graficul de forma


prezentată în figura alăturată.

Bibliografie:

1) Gillich N., Praisach V.I. , Probabilități și fiabilitate. Culegere de probleme,


Editura Eftimie Murgu, Reșița, 1995

2) Gillich G-R., Dinamica mașinilor. Modelarea sistemelor tehnice, Editura


AGIR, București, 2003

3) Popp C-tin., Gillich N., Praisach V.I., Elemente de teoria probabilităţilor şi


statistică matematică, Editura “Eftimie Murgu” Reşiţa, 1998.

9
23.03.2020

Teoria probabilităților și
statistică matematică

2019-2020

Curs 3
2019-2020

1
23.03.2020

Caracteristici numerice ale VA

Pentru a putea compara între ele diverse fenomene care


generează variabile aleatoare avem nevoie de date numerice
sau caracteristici, care trebuie să îndeplinească în principal
următoarele condiţii:
să fie definite în mod obiectiv,
să aibă o semnificaţie strict legată de variabila în cauză,
să fie uşor de calculat şi de folosit în operaţiile algebrice,
să fie cât mai insensibile la fluctuaţiile eşantionare, având
volume apropiate.

Caracteristicilor numerice ale variabilelor aleatoare discrete şi


continue se clasifică în funcţie de indicaţiile pe care le oferă,
astfel:
caracteristici de grupare,
caracteristici de împrăştiere,
caracteristici de formă.

2
23.03.2020

I. Caracteristici de grupare
Caracteristicile de grupare oferă indicaţii asupra concentrării
valorilor variabilei aleatoare faţă de valoarea de grupare.
Valoarea medie a variabilei X (discretă sau continuă) este
numărul real M(X)=m, dat de relaţia :

şi având următoarele proprietăţi:


P1: x1M(x)xn, în cazul discret
aM(x)b, în cazul continuu
P2: M(c)=0, c=constantă
P3: M(cx)=cM(x)
P4: M(x+y)=M(x)+M(y)
P5: M(xy)=M(x)M(y) dacă x şi y sunt independente

I. Caracteristici de grupare

Valoarea mediană sau mediana a variabilei X discretă sau


continuă este numărul real Me definit de ecuaţia:
P(x<Me)=P(xMe). Valoarea mediană Me se află rezolvând
ecuaţia F(Me)=1/2.

Valoarea modală sau modulul este valoarea cea mai probabilă


a variabilei aleatoare şi se notează Mo. În cazul discret Mo este
valoarea pe care x o ia cu cea mai mare probabilitate, iar în
cazul continuu este valoarea în care densitatea de probabilitate
f(x) are valoarea maximă.
În cazul variabilei discrete, Mo poate să nu fie unic.

3
23.03.2020

I. Caracteristici de grupare
Se numeşte moment de ordinul r numărul Mr, definit astfel:

Se numeşte medie de ordinul r a variabilei X numărul r dat


de relaţia:

Un rol important îl joacă momentul de ordinul II (M2) iar


momentul de ordinul I este tocmai valoarea medie.

II. Caracteristici de împrăştiere

Variabila abatere
abatere.. Abaterea absolută medie
Se numeşte variabilă abatere a variabilei X faţă de r,
variabila aleatoare (X-r). De regulă se consideră abaterea
faţă de valoarea medie m=M(x).
Abaterea absolută medie este numărul M(X-m) dat de
expresia:

4
23.03.2020

II. Caracteristici de împrăştiere


Dispersia (varianța). Abaterea medie pătratică (abatere standard)
Abaterea absolută medie este mai greu de calculat, din cauza
valorilor absolute, motiv pentru care în practică se foloseşte mai rar.
În locul ei însă se va considera dispersia, notată σ2 sau D(X).
Fie X o variabilă aleatoare discretă sau continuă. Se consideră
variabila abatere (X-m) şi pătratul ei (X-m)2 unde: m=M(X).
Se numeşte dispersia variabilei X numărul : σ2=M((X
=M((X--m)2)
respectiv:

Dispersia este egală cu diferenţa dintre momentul de ordinul II (M2)


şi pătratul momentului de ordinul I(media M12=m2), adică :
σ2=M(X2)-[M(X)]2=M2-m2.

II. Caracteristici de împrăştiere


Se numeşte abatere medie pătratică (), rădăcina pătrată a
dispersiei:
De aici, notaţia: D(x)=2. Abaterea  are aceeaşi dimensiune,
unitate de măsură ca şi variabila aleatoare.

Momente şi medii centrate


Momentul centrat de ordinul r notat μr respectiv media centrată de
ordinul r r, este numărul egal cu momentul respectiv media de
ordinul r al variabilei abatere (X-m): μr=Mr(X-m)=M((X-m)r)
Deci:

Se constată că momentul centrat de ordinul doi este tocmai dispersia

5
23.03.2020

II. Caracteristici de împrăştiere

Normarea variabilei aleatoare


Se consideră variabila aleatoare X cu media M(X)=m şi abaterea
medie pătratică .
Se numeşte normata variabilei X variabila

având proprietăţile

III. Caracteristici numerice privind forma distribuţiei.


distribuţiei
Se vor considera două caracteristici numerice, simetria şi boltirea,
care dau informaţii asupra curbei pe care sunt situate punctele , în
cazul discret, respectiv în cazul continuu.
Simetria şi asimetria
asimetria. O curbă plană y=f(x) este simetrică faţă de o
valoare m dacă f(m-x)=f(m+x) adică punctele simetrice faţă de
dreapta x=m (Oy) au ordonatele egale. În caz contrar curba este
asimetrică.

Asimetria se măsoară prin coeficienţii de asimetrie şi anume:


Coeficientul lui Pearson

unde M0 este valoarea modală.

6
23.03.2020

III. Caracteristici numerice privind forma distribuţiei.


distribuţiei

Coeficientul lui Fischer

Boltirea (turtirea) este caracterizată de coeficientul de boltire:

Repartiții. Repartiții discrete.


Repartiții continue.

7
23.03.2020

Repartiţii ale variabilelor aleatoare discrete

Repartiţia binomială sau repartiţia lui Bernoulli


Se consideră că în urma efectuării unei experienţe se poate
realiza fie evenimentul A cu probabilitatea p, fie
evenimentul contrar acestuia A* cu probabilitatea q.
Experienţa se realizează de n ori, iar realizarea
evenimentului se face de k ori.
Tabloul acestei repartiţii (simple) va fi deci:

Repartiţii ale variabilelor aleatoare discrete

Repartiţia binomială sau repartiţia lui Bernoulli


Funcţia de repartiţie este

Caracteristicile numerice mai importante sunt:


valoarea medie

 dispersia 2=npq

8
23.03.2020

Repartiţii ale variabilelor aleatoare discrete


Repartiţia Poisson sau legea evenimentelor rare
Această repartiţie se poate privi ca un caz particular al repartiţiei
anterioare dacă numărul de efectuări a experienţei creşte foarte mult
(n) iar probabilitatea de realizare este foarte mică (p0). De aici
și denumirea de repartiţie a evenimentelor rare fiind frecvent utilizată
în teoria fiabilităţii.
Tabloul de distribuţie este de forma:

unde k=0,1,2,… şi λ>0 este un număr dat.


Funcţia de repartiţie este:

Specific repartiţiei este că valoarea medie şi dispersia sunt egale,


având valoarea: M(X)=2= şi ea aproximează corect repartiţia
binomială pentru p0,1 şi 5.

Repartiţii ale variabilelor aleatoare continue


Repartiţia normală sau repartiţia Gauss-
Gauss-Laplace
Este repartiţia cea mai importantă, deoarece este cunoscut faptul că
foarte multe fenomene fizice aleatorii urmează această lege, purtând
numele celor care au descoperit-o Gauss, respectiv Laplace.
Variabila aleatoare continuă X urmează o repartiţie normală de
parametri m şi σ2 (se notează N(m;σ2)) dacă densitatea sa de
probabilitate este:

Clopotul lui Gauss

9
23.03.2020

Repartiţii ale variabilelor aleatoare continue

Repartiţia normală sau repartiţia Gauss-


Gauss-Laplace
Funcţia de repartiţie normală este dată de:

unde (x) este funcţia integrală a lui Laplace care se găseşte tabelată
în cărţile de specialitate

Valoarea medie şi dispersia repartiţiei N(m, σ2) sunt tocmai cei doi
parametri, adică M(X)=m şi D(X)= σ2.

Repartiţii ale variabilelor aleatoare continue

Repartiţia normală sau repartiţia Gauss-


Gauss-Laplace
Coeficienţii de asimetrie şi boltire ai repartiţiei N(m, σ2) sunt:

deci curba normală este simetrică faţă de x=m. Aceasta este o


condiţie necesară de normalitate a unor legi ce descriu fenomene de
masă, dar nu şi suficientă).

şi excesul: E = β-3 = 0.

Dacă E>0, curba este mai ascuţită (mai bombată) decât cea normală
iar dacă E<0, curba este plată (mai puţin bombată).

10
23.03.2020

Repartiţii ale variabilelor aleatoare continue


Repartiţia normală sau repartiţia Gauss-
Gauss-Laplace
În reprezentarea grafică a funcţiei densitate se observă o serie de
proprietăţi ale repartiţiei normale. Simetrică faţă de axa x=m
(paralelă la Oy) şi având punctul de maxim de coordonate

Punctele de abscisă (m-σ) şi


respectiv (m+σ) sunt puncte de
inflexiune ale curbei. Astfel, curba
este concavă dacă x∈(m-σ, m+σ) şi
convexă în afara intervalului.
Cu cât σ este mai mic, cu atât
ordonata punctului de maxim este
mai mare (m rămânând constant) şi
invers.

Repartiţii ale variabilelor aleatoare continue

Repartiţia normală sau repartiţia Gauss-


Gauss-Laplace
Pentru m=0, funcţia de repartiţie corespunzătoare
este reprezentată în figura de mai jos:

Funcţia de repartiţie pentru repartiţia normală

11
23.03.2020

Bibliografie:

1) Gillich N., Praisach V.I. , Probabilități și fiabilitate. Culegere de probleme,


Editura Eftimie Murgu, Reșița, 1995

2) Gillich G-R., Dinamica mașinilor. Modelarea sistemelor tehnice, Editura


AGIR, București, 2003

3) Popp C-tin., Gillich N., Praisach V.I., Elemente de teoria probabilităţilor şi


statistică matematică, Editura “Eftimie Murgu” Reşiţa, 1998.

12
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

Statistica matematică. Noțiuni și concepte de


bază ale statisticii. Etapele și procedeele
specifice metodei statistice.

Statistica matematică

În acest curs 4 vom face primii pași în înțelegerea statisticii ca știință și disciplină de
studiu.
Etimologic, statistica își are originea în latinescul status care desemnează o stare, o
situație, un fapt, precum și în termenul italian stato cu înțelesul de stat.
În înțelesul original, statistica a însemnat numărarea și socotirea (calcularea)
activităților cerute de dezvoltarea societății în acel moment.
Statistica este știința colectării datelor, a prezentării lor într-o formă sistematică, a
analizării acestora și a interpretării informațiilor numerice obținute.

În cadrul analizei statistice a unui fenomen acționează în primul rând statistica


descriptivă, apoi intervine statistica matematică.
Statistica descriptivă poate fi definită ca totalitatea metodelor de culegere a datelor
asupra fenomenului respectiv, prezentarea, caracterizarea și înregistrarea acestora , în scopul
de a descrie diferitele trăsături principale ale acestui set de date.

Statistica matematică este o parte importantă a matematicii aplicate, care se ocupă cu


gruparea, analiza şi interpretarea datelor provenite din observaţii sau măsurători, date referitoare
la un anumit fenomen, precum și cu unele previziuni privind comportarea viitoare a acestuia.

Noțiuni și concepte de bază ale statisticii

Există câteva concepte comune tuturor cercetărilor statistice, indiferent de domeniu,


concepte ce alcătuiesc vocabularul de bază al statisticii.
O primă noțiune de bază din statistică o reprezintă populația (colectivitatea)
statistică.
Colectivitatea statistică (populație statistică) reprezintă totalitatea elementelor de
aceeași natură, care au trăsături esențiale comune și care sunt supuse unui studiu statistic.
Altfel spus, orice mulțime care formează obiectul unei analize statistice se numește populație
statistică.
Colectivitatea statistică are un caracter obiectiv și finit.
Elementele unei populații statistice se numesc unități statistice.
Aceste unități statistice pot fi:
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

 statice – când compun efectivul masei de fenomene (de produse, de persoane


etc.).
 dinamice – când aparțin aceleași structuri organizatorice, au același conținut
dar se produc în condiții diferite de timp, ceea ce face ca ele să poată fi
considerate ca evenimente ale unui proces economico-social de masă.
Unitățile statistice mai pot fi:
 simple – când reprezintă elementele constitutive ale colectivității (vânzătorul,
locuitorul, persoana etc.).
 complexe – când sunt rezultatul organizării sociale și economice a
colectivității (unitatea economică, familia, echipa, anul de studii etc.).
Se poate întâmpla ca o aceeași unitate statistică să aparțină, simultan, mai multor
populații, astfel: conform unor trăsături ea va aparține unei colectivități, iar conform altor
trăsături ea va aparține altei colectivități.
Exemplu
Un student poate aparține colectivității cunoscătorilor de limbă engleză (după limba
străină cunoscută cel mai bine), sau colectivității locuitorilor județului Caraș-Severin (după
localitatea de domiciliu), sau populației din sectorul de vârstă 15-24 ani (după vârstă) etc.
Aceste criterii pot fi însușiri sau trăsături ale unităților care definesc și delimitează
între ele unitățile colectivității și care urmează să fie înregistrate.
Trăsătura comună tuturor unităților statistice care prezintă interes în cadrul unei
analize statistice se numește caracteristică.
Analiza statistică se poate face după una sau mai multe caracteristici statistice.
Caracteristica statistică se mai numește variabilă statistică sau variabilă aleatoare,
deoarece are proprietatea de a-și modifica valoarea în timp și spațiu, de la o unitate la alta.
Formele concrete de manifestare ale caracteristicilor la nivelul fiecărei unități a
colectivității se numesc variante sau valori.

Numărul de apariții ale unei variante într-o colectivitate se numește pondere,


frecvență.
Cercetarea unor colectivități poate deveni dificilă, C u cât o colectivitate este mai
numeroasă, cu atât cercetarea ei devine mai dificilă. O astfel de cercetare poate fi costisitoare
și consumatoare de timp. Soluția în astfel cazuri este extragerea unei sub-colectivități din
colectivitatea generală (numită și colectivitate parțială, eșantion sau colectivitate de
selecție) pe care să se realizeze cercetarea.
Eșantionul reprezintă un subset de elemente selectate dintr-o colectivitate statistică.

Datele statistice reprezintă caracterizarea numerică obținută de statistică în legătură


cu unitățile, grupele sau colectivitatea studiată.
Datele statistice sunt mărimi concrete, rezultate din studiile efectuate prin numărare,
măsurare sau calcul statistic. Ele pot fi primare, prelucrate, publicate sau stocate în baze sau
bănci de date. Mesajul datelor statistice este informația statistică.
Indicatorii statistici reprezintă expresia numerică a unei determinări calitative
obiective obținută în urma efectuării unei cercetări statistice raportată la condiții specifice de
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

timp și spațiu și organizatorice și se regăsesc cu regularitate în statistica oficială și în


publicațiile de specialitate.

Exemple de caracteristici statistice

① Studiul statistic al hipertensiunii


 populație statistică: mulțimea bolnavilor internați într-o secție de
cardiologie a unui spital într-o perioadă de un an de zile;
 caracteristici statistice: valoarea tensiunii la internare, valoarea tensiunii la
externare.

② Profesiile salariaților dintr-o firmă


 unitate statistică: salariatul;
 variabilă statistică: profesia – calitativă

③ Studiul utilizării medicamentelor pentru tratarea hipertensiunii


 populația statistică: locuitorii unui oraș ce folosesc medicamente
hipertensive cu vârsta mai mare de 40 de ani;
 variabile statistice: 3 medicamente.

④ Studiu asupra nivelului de trai dintr-o localitate


 populația statistică: totalitatea locuitorilor cu domiciliul stabil în localitatea
respectivă;
 variabile statistice: venitul mediu.

⑤ Studiu asupra rezultatelor obținute la disciplina TPSM, de studenții anul 2 Info.


Ind. din UEM Reșița
 populația statistică: studenții anului 2 Info.Ind.
 unitatea statistică: fiecare student din anul 2 Info.Ind.
 caracteristică statistică: nota la disciplina TPSM.

⑥ Studiu privind diametrele unor piese de același fel fabricate într-o întreprindere
 populația statistică : mulțimea pieselor fabricate în acea întreprindere
 unitatea statistică: o piesă.
 caracteristică statistică: diametrul piesei.

Etapele și procedeele specifice metodei statistice

Procesul cercetării statistice presupune organizarea și parcurgerea unor etape distincte


și succesive care includ operațiile de observare sau culegere a datelor, de sistematizare și
prelucrare, de analiză și interpretare a rezultatelor.
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

Etapele cercetării statistice pot fi grupate în:


 Observarea statistică – etapă în care se culeg datele și informațiile statistice de la
unitățile statistice, pentru toate caracteristicile . Calitatea probelor obţinute va
determina în mod esenţial autenticitatea informaţiei statistice.
 Prelucrarea statistică – etapă în care datele sunt sistematizate și sunt calculați
indicatorii statistici primari și derivați, absoluți și sintetici, ce caracterizează
fenomenul studiat. Pentru obținerea acestor indicatori se utilizează următoarele
procedee și tehnici de lucru specifice statisticii, și anume:
1. Sistematizarea probelor obținute în etapa de observare statistică. Aceasta se
poate realiza prin aplicarea procedeelor clasice de centralizare și grupa re
statistică a datelor, având ca rezultat obținerea indicatorilor primari.
2. Prezentarea datelor statistice – se utilizează tabele sau grafice.
3. Calcularea indicatorilor derivaţi (indicatori ai tendinței centrale, ai
împrăștierii sau dispersiei și ai formei de repartiție).
4. Măsurarea gradului de intensitate a legăturilor statistice (covarianţa,
coeficientul de corelaţie şi raportul de corelaţie)
5. Măsurarea influenţei factorilor asupra variaţiei fenomenelor.
6. Aproximarea modelelor de regresie şi de trend (procedeul ajustării statistice).
7. Prognoza fenomenelor (extrapolarea statistică).
8. Estimarea parametrilor şi verificarea ipotezelor statistice (procedeul
inferenţial).
Rezultatul prelucrării statistice se regăseşte în valoarea indicatorilor primari şi
derivaţi.
 Analiza și interpretarea rezultatelor – etapă în care sunt verificate ipotezele,
formulate concluziile și fundamentate procesele decizionale .

Aplicații

Aplicația 1 . Având următoarea distribuție a vânzărilor unui magazin în funcție de valoarea


vânzărilor zilnice realizate, calculați frecvențele absolute cumulate, frecvențele relative
cumulate și centrele de interval.

Intervale
Frecven Frecvențe Frecvențe
de Nr. de absolute relative Centre
țe
variație a vânză de
relative cumulate cumulate(%)
vânzărilor tori interval
(ni*) Crescă Descres Crescă Descres
(zeci mii (ni) (xi)
(%) tor cător tor cător
lei - 104)
0 1 2 3 4 5 6 7
1,00-1,50 10 5 10 200 5 100 1,25
1,50-2,00 20 10 30 190 15 95 1,75
2,00-2,50 120 60 150 170 75 85 2,25
2,50-3,00 30 15 180 50 90 25 2,75
3,00-3,50 20 10 200 20 100 10 3,25
TOTAL 200 100 - - - - -
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

Observație:

Centrul intervalului este determinat ca medie aritmetică simplă a limitelor intervalului și


este considerat reprezentativ pentru datele din acel interval. Se determină cu relația
următoare:

+
=

Frecvența absolută (probabilitatea absolută) – notată ni (i=1,n) reprezintă numărul de


apariții al valorii corespunzătoare xi a caracteristicii statistice.

Frecvența relativă (probabilitatea relativă) – notată ni*- având formula de calcul dată de
relația:


= ∙ = ∙ (%)

Ex. de calcul pentru prima linie a tabelului.

Frecvența relativă se calculează astfel:


= ∙ = ∙ = %

Centrul de interval este:

+ + ,
= = = ,

Bibliografie:

[1] Amariei O., Prelucrarea statistică a datelor, Note de curs, 2019


[2] Ghiță, S.I. (2006) Statistică, Ed. Meteor Press, București;
[2] Mihoc Gh. (acad.), Micu N., Elemente de teoria probabilităților și statistică, Editura
Didactică și Pedagogică, București
[3] Țițan E.(2002) Statistică. Teorie și aplicații în sectorul terțiar, Ed. Meteor Press,
București;
[4] Țițan E., Ghiță S.I., Trandaș C., Statistică economică, curs ASE București;
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

Distribuția normală. Modalitatea. Simetria. Boltirea

Distribuția normală a fost descrisă prima dată de Ch. Fr. Gauss (1777-1855) și de
aceea se mai numește distribuție gaussiană, dar deoarece la demonstrarea acestui concept a
contribuit și P.S. Laplace (1749-1827), în literatura de specialitate se va întâlni și ca
distribuția gauss-laplace.
O distribuție normală este caracterizată de medie, ca indicator al tendinței centrale și
de abaterea standard, ca indicator al dispersiei. Acești doi indicatori poartă numele de
parametri ai repartiției normale.
Pentru ca o distribuție să fie considerată normală, vor trebui îndeplinite simultan
următoarele condiții:
Să fie unimodală – adică să existe un singur mod, o singură categorie cu
frecvență maximă;
Să fie simetrică față de medie – adică să nu fie deplasată spre stânga sau spre
dreapta;
Să fie normal boltită – adică să nu fie nici ascuțită (foarte omogenă) și nici
turtită (foarte eterogenă).
De asemenea, limitele din stânga și din dreapta ale unei distribuții normale tind spre
valoarea zero, pe care, însă, nu o ating niciodată.
O distribuție perfect normală are aceeași valoare pentru toți cei trei indicatori ai
tendinței centrale (media, mediana și modulul), adică media = mediana = mod.

Modalitatea
O distribuție normală este o distribuție unimodală (fig.1a), adică există doar o singură
categorie de frecvență maximă. Prezența a două sau mai multe valori modale determină
distribuții bimodale (fig.1b), trimodale, multimodale, distribuții ce nu pot fi considerate ca
fiind distribuții normale.
Normalitatea distribuției, sub aspectul modalității, se verifică prin calcularea valorii
modale. Atunci când există o singură valoare cu frecvență maximă, distribuția poate fi
considerată normală sub acest aspect, iar atunci când există două sau mai multe valori cu
frecvența maximă, și, evident, egală, distribuția este polimodală și nu poate fi considerată ca
fiind normală.
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

a) Distribuție unimodală b) Distribuție bimodală


Fig.1. Tipuri de distribuții

Simetria
În practica statistică pot apărea serii de repartiție de frecvențe simetrice, ușor
asimetrice sau cu tendință pronunțată de asimetrie.
O distribuție este simetrică dacă valorile sunt egal (simetric) răspândite în jurul
tendinței centrale. Atunci când rezultatele tind către valori mici, sunt aglomerate în partea
stângă a distribuției, avem de-a face cu o distribuție asimetrică spre dreapta (sau distribuție
skewness pozitiv). Când rezultatele tind către valori mari, sunt aglomerate în partea dreaptă a
distribuției, avem de-a face cu o distribuție asimetrică spre stânga (sau distribuție skewness
negativ). Asimetria este dată de panta distribuției și nu de vârful acesteia.

Forma variației în jurul mediei se exprimă statistic prin mai mulți indicatori, dintre
care diferența dintre medie și valoarea modală, care se numește asimetrie:

sau

Stabilirea gradului de asimetrie (notată As) se face pe baza poziției și valorilor celor
trei indicatori ai tendinței centrale: media, mediana și modulul.
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

O serie perfect simetrică are asimetria As=0, iar


x=Me=Mo.

La o serie asimetrică la dreapta


(distribuție skewness pozitiv) predomină
valorile mici ale caracteristicii, iar asimetria
este As=x-M0>0 (deoarece M0<x ), iar la o
serie asimetrică la stânga (distribuție
skewness negativ): As=x-M0<0 (M0>x) în
care predomină valorile mari ale
caracteristicii.

1) Metode simple de analiză a asimetriei


a) metoda vizuală

b) metoda comparării indicatorilor tendinței centrale (x, Me ș i Mo)

2) Metode analitice de abordare

Coeficientul Yule și Kendall


Coeficientul măsoară gradul de asimetrie prin raportul dintre diferența și suma
abaterilor cuartile și se calculează după formula de mai jos.
( − )−( − )
= ∈ [−1, +1]
( − )+( − )
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

Interpretare:

CY = 0 ⇔ simetrie (cuartilele sunt echidistante)

CY < 0 ⇔ asimetrie la stânga

CY > 0 ⇔ asimetrie la dreapta

Quartile sunt acele valori ale caracteristicii ce împart seria ordonată în patru părți
egale. Sunt în număr de trei (Q1, Q2, Q3) și se calculează cu relațiile:

 ni 1
  n pQ1
Q1 = X0 + h 4
n Q1

X0 = limita inferioară a intervalului Q1


h = mărimea intervalului
 ni 1
= locul primei quartile Q1
4

 npQ1 = frecvenţe cumulate precedente ale intervalului Q1


nQ1 = frecvenţa absolută a intervalului Q1
Q2 = Me
3
 n i  1   n pQ3
Q3 = X0 + h 4
n Q3

X0 = limita inferioară a intervalului Q3

 npQ1 = frecvenţe cumulate precedente ale intervalului Q3


nQ1 = frecvenţa absolută a intervalului Q3

Coeficientul de asimetrie al lui Fisher


Coeficientul de asimetrie al lui Fisher nu se bazează pe câteva elemente precum
coeficientul Yule, ci pe toate valorile din distribuție și se calculează folosindu -se momentele
centrate.
∑ ( − )
= =
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

Acest coeficient are valoarea zero pentru distribuții perfect simetrice. Valorile negative
semnifică asimetrie la stânga, iar cele pozitive, asimetriile la dreapta.

Exemplu: Calculul coeficientului de asimetrie


xi xi - x (xi – x)2 (xi – x)3
22 22-24 = -2 (-2)2 = 4 (-2) x 4 = -8
34 34-24=10 102 = 100 10 x 100 = 1000
31
15
33
32
29
10
17
17
∑ 698 -1458

22 + 34 + ⋯ + 17
= = 24
10
∑ ( − ) 698
= = = 69,8 ⇒ = 69,8
10

∑ ( − ) −1458 −1458
= = = = = −0,25
10 √69,8 5831,53

Boltirea sau excesul


Asimetria pe orizontală, presupune o deplasare a tendinței centrale spre stânga sau
spre dreapta, către scoruri mici sau către scoruri mari. Dar, aceasta nu este singura asimetrie
posibilă. Existăși un fel de „asimetrie verticală” sau boltire. Termenul folosit generic pentru
acest concept este termenul de kurtosis (din limba greaca, kurtos = „cocoșat”).
Practic, boltirea se referă la aspectul „cocoașei” distribuției rezultatelor. Cocoașa
poate fi ascuțităși atunci vorbim de o distribuție ascuțită sau leptocurtică, poate fi turtită,
distribuția turtită, plată sau platicurtică sau normală, distribuție mezocurtică. O distribuție
normală este întotdeauna o distribuție mezocurtică.
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

În figura alăturată, distribuția „C” este o


distribuție leptocurtică, ascuțită. Distribuția „B”
este o distribuție platicurtică, turtită, iar distribuția
„A” este o distribuție normală sub aspectul boltirii,
sau mezocurtică.
O distribuție leptocurtică, ascuțită, arată
că datele sunt foarte grupate și apropiate de medie,
lotul de subiecți având un mare grad de
omogenitate a scorurilor. Această distribuție nu
ridică nici un fel de probleme atunci când trebuie
să diferențiem subiecții care obțin scoruri mici sau mari. Avem însă dificultăți atunci când
trebuie să diferențiem subiecții din zona medie a distribuției.
O distribuție platicurtică, plată, este o distribuție în care rezultate le sunt foarte
împrăștiate față de medie și indică un grad ridicat de eterogenitate a scorurilor. Problema
generală a acestei distribuții, în opoziție cu distribuția leptokurtică, este aceea ca diferențiază
greu la extreme și destul de bine în zona mediei. Datorită acestui fapt, o distribuție platicurtică
nu este nici ea o distribuție normală.
O distribuție normală este o distribuție mezocurtică.
Analiza unei distribuții sub aspectul normalității este primul pas pe care îl facem în
orice prelucrare de date. Deoarece, în funcție de rezultatul acestei analize, vom putea alege
tehnicile și procedeele statistice pe care le putem folosi, această etapă o întâlnim, de obicei, la
începutul oricărui raport de cercetare, imediat după descrierea eșantionului.

Se observă că boltirea nu este altceva decât simetria pe axa verticală (OY), spre
deosebire de simetria propriu-zisă, deplasarea valorilor pe axa orizontală (OX). Dacă la
simetrie se vorbește de frecvențe, la boltire se discută de valori, de modul în care aceste valori
se grupeazăîn jurul tendinței centrale (sunt mai grupate valorile în jurul mediei sau, din
contra, foarte împrăș tiate.)
La fel ca și simetria, boltirea nu poate fi apreciată pur „ochiometric” ci avem nevoie și
aici de anumiți coeficienți de boltire. Pearson a discutat despre boltire în termeni de momente,
la fel ca și simetria, rezultând astfel coeficientul de boltire sau coeficientul kurtosis.
Teoria probabilităților și statistică matematică
ș.l.dr.ing. Olga-Ioana Amariei

∑ ( − )
= =

Dacă skewness reprezenta raportul dintre momentul centrat de ordinul trei și


momentul centrat de ordinul doi, coeficientul de boltire reprezintă raportul dintre momentul
centrat de ordinul patru și momentul centrat de ordinul doi.
Cu cât β 2 are o valoare mai mică, cu atât curba de frecvență este ma i platicurtică și
invers (leptocurtică). Pentru β 2 = 3, aplatizarea curbei de frecvență este identică cu cea a
curbei normale.

Exemplu:Calculul coeficientului de asimetrie


Exemplu: Calculul coeficientului de boltire
x x -x (x – x)2 (xi –4 x)3
xi i xi - xi (xi2 – ix)2 (xi – x)
22 22-23 = -1 (-1) = 2 1 (-1) x 1 = -1
22 22-24 = -2 (-2)
2 =4 4 x 4 = 16
34 34-23=11 11 = 121 11 x 121 = 1331
34 34-24=10 102 = 100 100 x 100 = 10.000
31
31
15
15
33
33
32
32
29
29
10
10
17
17
17
17
∑ 698 -1458
∑ 698 73.478

22 + 34 + ⋯ + 17
= 22 + 34 + ⋯ + 17= 24
= 10 = 24
10
∑ ( − ) −1458 −1458
=∑ (= − ) 698= = = −17,45
= = = 69,8 83,54
10 10

∑ ( − ) 73478 73478
= = = = = 1,50
10 × 69,8 48720,4

Bibliografie:
[1]Anghelache C., Niculescu E., Breviar statistic. Indicatori și formule de calcul, Ed. Economică,
București, 2000.
[2]Bolboacă,S., Statistică descriptivă, 2014
[3] Gillich, N., Statistică, Îndrumar de laborator, Ed. Eftimie Murgu Reșița, 2000
[4] Opariuc-Dan C., Statistică aplicată în științele socio-umane. Noțiuni de bază – Statistici univariate,
Ed. ASCR, Colecția psihologului expert, Cluj -Napoca, 2009
5/12/2020

Teoria probabilităților și
statistică matematică

2019-2020

Curs 7
2019-2020

1
5/12/2020

Metode de studiu a legăturilor


statistice. Corelația și regresia

Corelația
 Termenul de corelație este folosit pentru a
sublinia exitența unei anumite forme de
asociere între două variabile studiate,
notate cu X și Y.
 Variabila Y, va fi considerată variabila
dependentă (VD), ce prezintă un anumit
grad de asociere față de variabila X,
variabila independentă (VI).
 Adesea utilizăm termenul de regresie
(liniară), termen ce implică estimarea celei
mai potrivite linii drepte care să reliefeze
asocierea.

2
5/12/2020

Corelația - caracteristici
1.Direcţia
 Pozitivă (+)
 Negativă(-)
2.Gradul de asociere
 Între –1 şi 1
 Valoarea absolută semnifică puterea asocierii
3.Forma
 Lineară
 Nelineară

Corelația – direcția
POZITIVĂ NEGATIVĂ

Valori mari ale lui X se Valori mari ale lui X se


asociază cu valori mari asociază cu valori mici
ale lui Y. ale lui Y.
Valori mici ale lui X se Valori mici ale lui X se
asociază cu valori mici asociază cu valori mari
ale lui Y. ale lui Y.

3
5/12/2020

Corelația – gradul de asociere

PUTERNICĂ SLABĂ

(nor de puncte difuz)

Corelația – forma

LINIARĂ NELINIARĂ

4
5/12/2020

Coeficientul de corelație simplă


■ Coeficientul de corelație “r” propus de Pearson și
Bravais este o măsură a asocierii liniare a două
variabile. Acest coeficient măsoară intensitatea legăturii
dintre două variabile xi și yi.
■ Coeficientul de corelație “r” este un număr calculat
direct din datele observate și poate varia între -1 și +1.
Dacă xi sunt valorile măsurate ale variabilei
independente X și yi sunt valorile măsurate ale variabilei
dependente Y, atunci coeficientul de corelație se
calculează astfel:

Coeficientul de corelație simplă


Putem întâlni următoarele situații:
 Când r = 0, rezultă că nu avem nici o corelație între cele
două variabile;
 Când r = +1, rezultă că avem o corelație pozitivă
perfectă;
 Când r = -1, rezultă că avem o corelație inversă perfectă
 Când r→0, legătura este apreciată ca fiind slabă;
 Când r→1, legătura este apreciată ca fiind puternică;
 Dacă r > 0, legătura este directă;
 Dacă r < 0, legătura este indirectă.

5
5/12/2020

Calcularea coeficientului de corelație r Pearson

Realizăm un studiu
pe studenții anului II Info.
Ind. și analizăm dacă
există o corelație
pozitivă între numărul de
ore alocate studiului și
nota finală la examenul
de TPSM.

Calcularea coeficientului de corelație r Pearson

6
5/12/2020

Calcularea coeficientului de corelație r Pearson,


utilizând instrumentul Data Analysis

După introducerea datelor de intrare, se utilizează succesiunea de


comenzi Date → Analiză date (Data Analysis) →Correlation.

Calcularea coeficientului de corelație r


Pearson, utilizând programul XLSTAT

Odată ce XLSTAT este deschis, se selectează


comanda Correlation /Association tests /
Correlation tests , după cum se arată mai jos.

7
5/12/2020

Calcularea coeficientului de corelație r Pearson

Rezultatele obținute sunt prezentate în continuare.

Calcularea coeficientului de corelație r Pearson

Din tabelul Correlation (Pearson) se poate observa că există


o corelație pozitivă semnificativă între nota la examen și orele
alocate studiului r=0,957.
Corelația dintre două variabile se citește la intersecția
numelor lor pe verticală și orizontală. Desigur, între o
variabilă și ea însăși nu putem avea corelație (de fapt ea există,
dar are valoarea 1, adică corelație perfect pozitivă), deci nu
vom lua în seamă corelațiile de pe această diagonală. Se mai
observă că ceea ce se găsește în dreapta diagonalei este
identic cu ceea ce se află în stânga ei (adică corelația dintre
variabilele A și B este aceeași cu cea dintre variabilele B și A).

8
5/12/2020

Calcularea coeficientului de corelație r Pearson

Prezentarea rezultatelor

Conform rezultatelor obținute, există o corelație


pozitivă între nota obținută la examen și numărul de
ore alocate studiului, r=0,957, p < 0,0001. Acest
lucru înseamnă că acei studenți care obțin scoruri
ridicate la ore alocate studiului, tind să obțină
scoruri ridicate și la nota de examen.

Regresia liniară

Există două tipuri de regresie liniară, în funcție de


numărul de VI:
 regresia liniară simplă sau bivariată (cu o
singură VI);
 regresia liniară multiplă (cu două sau mai
multe VI).
Aplicarea metodei în scop explicativ urmărește
aflarea procentului din varianța VD explicat de
varianța VI, fiindu-ne utilă în acest caz valoarea R2.

9
5/12/2020

Regresia liniară simplă

Ecuația de regresie este dată de formula:


Y = a + b · X,
unde:
Y – variabila dependentă,
X – variabila independentă,
a – punctul de intersecție dintre dreapta de
regresie cu axa OY (constanta),
b – panta de regresie.
Ecuația de regresie în cazul regresiei liniare simple
reprezintă de fapt o dreaptă de regresie.

Regresia liniară multiplă

Studierea efectul a două sau mai multe VI asupra


unei VD.
Ecuația de regresie este următoarea:
Y = a + b1·X1 + b2·X2 +…+bn·Xn

10
5/12/2020

Bibliografie:

[1] Bolboacă S., Corelația și regresia liniară


[2]Labăr, A.V.(2008) SPSS pentru științele sociale; Ed.
Polirom, Iași
[3]Alice Iancu (2010), Informatică aplicată în științele sociale
[4] M. Popa, Aplicații SPSS. Prezentare generală
[5]Virgil Sora, Constanța Mihăescu (2007) Metode
cantitative în demografie și statistică socială, Ed. Oscar
Print, București
[6]Marian Vasile (2014), Introducere în SPSS pentru
cercetarea socială și de piață, Ed. Polirom, Iași
[7] ***https://www.xlstat.com

11
Teoria probabilităților și
statistică matematică

2019-2020
Curs 5
2019-2020
Indicatori statistici. Indicatori
ai tendinței centrale.
Indicatori ai variației.
Indicator statistic
Indicatorul statistic reprezintă expresia numerică
concretă sau dimensiunea unei colectivități sau fenomen.
Poate fi definit ca „rezultat numeric al unei numărări, al
unei măsuri statistice a fenomenelor și proceselor de masă
sau al unui model de calcul statistic pe baza datelor
înregistrate”.

Indicatorii statistici sunt numere reale, care sintetizează


o parte din informația conținută de o serie de valori, dând
posibilitata aprecierii globale a întregii serii, în loc să se
țină cont de fiecare valoare din șir.
Clasificarea indicatorilor statistici

1. După modul de determinare distingem:


Indicatorii primari – se obțin în etapa de sistematizare a datelor
statistice prin centralizarea acestora. Acești indicatori constituie
baza de calcul pentru indicatorii derivați.
Indicatori derivați – reprezintă rezultatul prelucrării
indicatorilor primari prin diferite modele de calcul statistic. Din
categoria indicatorilor derivați fac parte: mărimile relative,
indicatorii tendinței centrale, indicatorii variației și asimetriei,
indicatorii de concentrare, etc.

2. După gradul de cuprindere se disting:


Indicatori sintetici care reprezintă expresii numerice ale
categoriilor economice de sinteză ce caracterizează rezultatele
economice la nivel macroeconomic.
Indicatorii analitici – care exprimă structura unei colectivități și
influența factorilor care acționează asupra acesteia.
Clasificarea indicatorilor statistici

3. După forma de exprimare se disting:


Indicatori exprimați în mărimi absolute adică în
unități concrete de măsură aceleași cu ale
caracteristicii analizate și cu același conținut ca şi
caracteristica analizată.
Indicatori exprimați sub formă de mărimi relative
adică exprimați în coeficienți, procente, promile,
prodecimile, etc. și care s-au obținut prin
raportarea a doi indicatori cu același conținut sau
cu conținut diferit, dar aflați în relație de
interdependență.
Indicatori ai tendinței centrale

Indicatorii tendinței centrale reprezintă o


categorie deosebit de importantă de indicatori
statistici utilizați în analiza variabilelor numerice.
O clasificare a indicatorilor tendinței centrale se
poate face, în funcție de modul de determinare a
lor, în:
indicatori (mărimi) medii de calcul: media
aritmetică, armonică, pătratică, geometrică etc.;
indicatori medii de poziție: modul, mediana.

Indicatorii fundamentali ai tendinței centrale sunt:


media aritmetică, modul și mediana, dar în anumite
cazuri speciale putem apela și la alte tipuri de medii.
Media aritmetică
Media aritmetică ponderată

unde:
xi – valorile caracteristicii (i=1,k) care apar de mai multe
ori,
ni – frecvența absolută (numărul de apariții al valorii x i) .
Media aritmetică ponderată
Media aritmetică ponderată
Media aritmetică ponderată
Mediana

Mediana (Me) – reprezintă acea valoare a


caracteristicii situată în mijlocul seriei după ce termenii
seriei au fost aranjați crescător sau descrescător. Deci
valoarea mediană este aceea care împarte seria statistică
în două părţi egale.

Cazul seriei simple


• număr impar de termeni: 1 5 9 12 16 20 25 ⇒ Me =12
• număr par de termeni: 1 5 8 12 16 20 ⇒ Me = (8+12) /
2 = 10
Mediana

Cazul seriei statistice cu intervale:


Pentru calculul Me se urmăresc etapele:
• cumularea crescătoare a frecvențelor
• determinarea locului Me cu relația:  ni  1
2
- calculul medianei cu formula:

unde:
X0 – limita inferioară a intervalului median
h – mărimea intervalului
∑npMe= suma frecvențelor cumulate, precedente
intervalului median
Valoarea modală

Reprezintă acea valoare a caracteristicii, care are cea mai mare


frecvență de apariție.
Se calculează numai în distribuție de frecvență. Pentru o
repartiție de frecvență pe variate M0 se identifică pe calea simplei
examinări a șirului de frecvențe. M0 = 2
Pentru o serie de frecvență pe intervale, determinarea M0 se face
pe etape:
• determinarea intervalului modal, fiind intervalul de variație al
caracteristicii cu frecvență maximă
• estimarea valorii modale cu relația:
X0 = limita inferioară a intervalului modal
Δ1 = diferența dintre frecvența intervalului modal și frecvența intervalului
precedent
Δ2= diferența dintre frecvența intervalului modal și frecvența intervalului
următor
h = mărimea intervalului.
Indicatorii variației (sau ai împrăștierii)

Indicatori simpli ai variației


Indicatorii variației (sau ai împrăștierii)

Indicatori simpli ai variației


Indicatorii variației (sau ai împrăștierii)

Indicatori sintetici ai variației


Indicatorii variației (sau ai împrăștierii)

Indicatori sintetici ai variației


Indicatorii variației (sau ai împrăștierii)
Indicatori sintetici ai variației
Indicatorii variației (sau ai împrăștierii)
Indicatori sintetici ai variației
Aplicații
Se consideră veniturile nete ale angajaților dintr-o secție a unei
întreprinderi, conform tabelului de mai jos. Să se calculeze indicatorii
simpli și sintetici ai variației.

Număr Centru
Grupe de angajați
după venitul net
angajați interval xi*ni xi  x ni (xi -x )2ni
ni xi
0 1 2 3 4 5 6

800-1000 220 900 198000 595 130900 77885500


1000-1200 311
1200-1400 180
1400-1600 105
1600-1800 136
1800-2000 203
2000-2200 154
2200-2400 33
2400-2600 58
TOTAL 1400 - 2.092.800 - 577.490 308.603.000
Aplicații
Aplicații
Aplicații
Aplicații
Bibliografie:

[1] Amariei O., Prelucrarea statistică a datelor, Note de curs,


2019
[2] Ghiță, S.I. (2006) Statistică, Ed. Meteor Press, București;
[2] Mihoc Gh. (acad.), Micu N., Elemente de teoria probabilităților
și statistică, Editura Didactică și Pedagogică, București
[3] Țițan E.(2002) Statistică. Teorie și aplicații în sectorul terțiar,
Ed. Meteor Press, București;
[4] Țițan E., Ghiță S.I., Trandaș C., Statistică economică, curs
ASE București;

S-ar putea să vă placă și