Documente Academic
Documente Profesional
Documente Cultură
1. Obiectul disciplinei
2. Desfăşurarea disciplinei
Populaţie
statistică-----------------------------------------------------------------2 ore
Reprezentarea datelor
statistice--------------------------------------------------2 ore
Corelaţie şi
regresie---------------------------------------------------------------2 ore
1
Teoria
selecţiei---------------------------------------------------------------------2 ore
Ipoteze
statistice-------------------------------------------------------------------2 ore
Teste
statistice---------------------------------------------------------------------4 ore
4. Tematica laboratorului
Microsoft
Word--------------------------------------------------------------------2 ore
Microsoft
Excel--------------------------------------------------------------------4 ore
Microsoft Power
Point------------------------------------------------------------2 ore
Formule şi scheme clasice de
probabilitate------------------------------------2 ore
Repartiţii clasice
discrete---------------------------------------------------------2 ore
Repartiţii clasice
continue--------------------------------------------------------4 ore
Reprezentarea datelor
statistice--------------------------------------------------2 ore
Corelaţie şi
regresie---------------------------------------------------------------2 ore
Teoria selecţiei.
Aplicaţii---------------------------------------------------------2 ore
Ipoteze
statistice-------------------------------------------------------------------2 ore
Teste statistice.
Aplicaţii---------------------------------------------------------4 ore
5. Bibliografie
2
Drăghicescu I., Probabilităţi – Statistică – Investigaţie, Editura I.N.I.,
Bucureşti, 2000.
Gotelli N., Ellison A., A Primer of Ecological Statistics, Sinauer
Associates, Inc. Publishers Sunderland, Massachusetts U.S.A., 2004.
6. Evaluare
Prezenţă la curs-----------------------------------------------------------------------------10%
Prezenţă şi activitate la laborator--------------------------------------------------------20%
Verificare pe parcurs----------------------------------------------------------------------20%
Temă de casă – proiect-------------------------------------------------------------------20%
Examen final-------------------------------------------------------------------------------30%
Introducere. Generalităţi
Statistica matematică este una din ramurile moderne ale matematicii care se
ocupă cu gruparea, analiza şi interpretarea datelor referitoare la anumite
fenomene, precum şi cu unele previziuni privind producerea lor viitoare.
Utilizarea statisticii matematice este foarte importantă în dezvoltarea unor
metode ştiinţifice adecvate de analiză şi decizie asupra unor situaţii despre care
avem date obţinute fie prin observare, fie prin măsurare.
Ideea de bază a statisticii este aceea a prelungirii (extrapolării) concluziilor trase
din materialul investigat (de obicei limitat) asupra colectivităţii generale din care
a provenit materialul.
Analiza şi decizia se bazează pe datele experimentale obţinute fie prin observare,
fie prin măsurare.
3
Un fenomen de masă nu poate fi cunoscut, în ansamblul său, cercetând fiecare
element al acestuia. De obicei, se extrag un anumit număr de elemente pentru a fi
cercetate, utilizând apoi metode adecvate de obţinere a informaţiilor necesare.
Partea extrasă dintr-un întreg trebuie să fie o „copie micşorată” a întregului, în
sensul conservării la un anumit nivel al proprietăţilor de bază ale acestuia, cu
anumite toleranţe. Aceasta este inferenţa statistică.
Statistica – deşi este privită ca metodă de investigare a unor mari mulţimi de date
– este esenţială tocmai în acele situaţii în care din mulţimea respectivă nu se pot
obţine decât puţine elemente observate.
Statistica operează cu eşantioane extrase aleator din populaţiile supuse
investigării, cu scopul de a modela comportarea unei anumite caracteristici a
populaţiei respective.
Statistica matematică este fundamentată de teoria probabilităţilor.
Teoria probabilităţilor a apărut şi s-a dezvoltat din necesităţi practice.
Cronologic, teoria probabilităţilor nu este nici dintre cele mai vechi şi nici dintre
cele mai noi teorii matematice.
Desigur, jocurile de noroc se practică de mii de ani, dar evaluarea şanselor de
câştig ale unui jucător într-un anumit moment al jocului s-a făcut multă vreme
mai târziu sau sau pe baza experienţei acumulate la masa de joc.
Dezvoltarea jocurilor de noroc, diversificarea şi complexitatea lor au creat tot
mai multe probleme de evaluarea şanselor, probleme a căror rezolvare depăşea
capacitatea de a raţiona a jucătorilor, atrăgând atenţia unor mari matematicieni ca
Pascal, Fermat, Bernoulli şi alţii.
În anul 1654, cavalerul de Mere, om de spirit şi amator de jocuri de noroc, s-a
adresat lui lui Pascal.
În acea perioadă se practica un joc mult mai vechi în care banca paria la mize
egale, cu orice jucător că acesta va obţine cel puţin o dată faţa cu şase puncte în
patru aruncări ale unui zar.
Cavalerul de Mere a observat din propia sa experienţă că sunt mai multe şanse de
câştig dacă se pariază ca din patru aruncări să apară cel puţin una cu şase puncte,
decât dacă se pariază ca din 24 aruncări a două zaruri să apară cel puţin o dată
dubla de şase.
De Mere a constatat că într-o serie lungă de pariuri de acest fel, în primul caz
frecvenţa de câştig este mai mare decât ½, deci numărul jocurilor câştigate este
mai mare decât numărul jocurilor pierdute, rezultatul fiind un câştig pentru
jucător, în timp ce în al dolea caz, rezultatul final este o pierdere pentru jucător.
De Mere a constatat că această observaţie contrazice calculul matematic,
deoarece 4 faţă de 6 (numărul cazurilor posibile când se aruncă un zar) este în
acelaşi raport cu 24 faţă de 36 (numărul cazurilor posibile când se aruncă două
zaruri) şi deci şansele de câştig în ambele cazuri ar trebui să fie egale.
De Mere a pus această problemă lui Pascal (1632 – 1664), care a rezolvat-o
introducând definiţia probabilităţii unui eveniment. Prima probabilitate este mai
4
mare decât ½, în timp ce a doua este mai mică decât ½, ceea ce corespunde exact
cu constatarea lui De Mere. Prima probabilitate este mai mare decât ½, în timp ce
a doua este mai mică decât ½, ceea ce corespunde cu constatarea lui De Mere.
Fie A evenimentul ca aruncând de 4 ori un zar să obţinem cel puţin o dată 6
puncte.
Fie B evenimentul ca aruncând de 24 ori două zaruri să apară cel puţin o dată
dubla şase.
La fiecare aruncare a două zaruri sunt 36 de cazuri posibile. În cele 24 de
aruncări avem (36)24 cazuri posibile.
La fiecare aruncare a celor două zaruri sunt 35 de cazuri din cele 36 posibile în
care nu apare dubla de şase, iar în cele 24 de aruncări avem (35)24.
Probabilitatea ca aruncând de 24 de ori două zaruri să nu apară dubla de şase de
(35/36)24.
Atunci, avem:
5
6
Definiţia clasică a probabilităţii
Definiţie. Se numeşte experienţă în teoria probabilităţilor, orice act care poate fi repetat în
condiţii date.
Definiţie. Se numeşte experienţă aleatoare orice experienţă care fiind repetată în aceleaşi
condiţii conduce la rezultate diferite.
Definiţie. Se numeşte probă, rezultatul unei experienţe aleatoare.
Probele unei experienţe se mai numesc şi cazuri posibile ale experienţei.
Definiţie. Se numeşte eveniment, orice situaţie legată de o experienţă, despre care putem
spune că s-a produs sau nu, după efectuarea experienţei.
Prin eveniment se întelege realizarea sau nerealizarea unei probe (de exemplu, obţinerea
feţei cu numărul 3 la aruncarea unui zar constitue un eveniment).
Definiţie. Se numeşte eveniment aleator, un rezultat posibil al unei experienţe aleatoare.
Exemplu. Să considerăm experienţa aruncării unui zar şi să presupunem că ne punem
întrebarea dacă vom obţine o faţă cu un număr par de puncte. În acest caz, experienţa
constă în aruncarea zarului, proba este rezultatul care se obţine la sfârşitul experienţei, iar
evenimentul care ne interesează constă în apariţia unui număr par de puncte.
Evenimentul se realizează dacă se obţine una din probele 2,4,6 şi nu se realizează în caz
contrar. De aici rezultă că evenimentul se poate realize în trei probe.
Dacă în cazul aceleiaşi experienţe ne interesează apariţia feţei cu un punct, suntem în
prezenţa unui eveniment care se poate realiza printr-o singură probă.
Definiţie. Evenimentul care poate fi realizat printr o singură probă, se numeşte eveniment
elementar.
Definiţie. Evenimentul care poate fi realizat prin două sau mai multe probe se numeşte
eveniment compus.
Definiţie. Se numeşte spaţiu de selecţie, mulţimea evenimentelor elementare asociate
experienţei respective.
Definiţie. Se numeşte eveniment sigur, notat cu Ω, evenimentul care se realizează cu
certitudine la fiecare efectuare a experienţei.
Definiţie. Se numeşte eveniment imposibil, notat cu Ø, evenimentul care nu se realizează
la nici o efectuare a experienţei.
Exemple. La aruncarea unuizar, apariţia uneia din feţele 1,2,3,4,5,6
este evenimentul sigur.
Extragerea unei bile de culoare albă dintr-o urnă cu bile negre este evenimentul
imposibil.
Definiţie. Se numeşte evenimentul contrar evenimentului A şi se notează cu A ,
evenimentul a cărui realizare constă în nerealizarea lui A .
Exemplu. Fie o urnă cu bile albe şi negre. Dacă notăm cu A evenimentul care constă
în extragerea unei bile albe, A este evenimentul care constă în extragerea unei bile
negre. Realizarea unuia este echivalentă cu nerealizarea celuilalt.
Evenimentul sigur constă în nerealizarea evenimentului imposibil şi reciproc.
7
A =A , Ω= A∪A , Ω= Φ
Operaţii cu evenimente.
Reuniunea. Fiind date două evenimente A şi B , numim reuniunea lor,
evenimentul care se realizează atunci când cel puţin unul din evenimentele A
, B se realizează. Notăm: A ∪ B .
8
Intersecţa. Fiind date două evenimente A şi B , numim intersecţia lor,
evenimentul care se realizează atunci când evenimentele A , B se realizează
simultan. Notăm: A ∩ B .
Observaţie. Două evenimente A , B sunt incompatibile dacă A ∩ B = Φ .
Observaţie. Operaţiile de reuniune şi intersecţie se extind pentru orice număr
finit de evenimente.
Fiind date n evenimente A1 , A2 ,...., An putem scrie:
n n
A = A ∪ A ∪ ....∪ A
i=1
i 1 2 n , A = A ∩ A ∩ ....∩ A
i=1
i 1 2 n
3) Φ ∈ K .
Observaţie. Un câmp de evenimente este format din mulţimea tuturor
submulţimilor lui E , la care se adaugă E şi Φ .
Din definiţia de mai sus derivă câteva proprietăţi ale câmpului de evenimente
{E , K } , astfel :
1) E ∈ K
n n
2) Fiind date Ai ,1 ≤ i ≤ n, Ai , Ai verifică legile lui De Morgan.
i =1 i =1
n
3) Dacă Ai ∈ K ,1 ≤ i ≤ n atunci Ai ∈ K .
i =1
9
9) Fiind date A, B ∈K au loc relaţiile :
A ∪ B = A ∪( B ∩ A ), B = ( A ∩ B ) ∪( A ∩ B )
10) Fiind date A, B ∈K , relaţiile A ∩B = Φ, A ⊂ B , B ⊂ A sunt
echivalente.
Fie o experienţăcu n evenimente egal posibile (evenimentele considerate au
aceeaşi şansă de a se realiza) şi A un eveniment oarecare ataşat experienţei,
care se poate realiza prin n probe, m ≤ n .
Definiţie. Se numeşte frecveţa (probabilitatea) evenimentului A , notată cu
P ( A) , numărul :
6) P(B \ A) = P(B) − P( A ∩ B)
Dacă A ⊂ B, P(B \ A) = P(B) − P(A)
Definiţie. Tripletul {E , K , P} se numeşte camp finit de probabilitate.
Observaţie. Dacă A1 , A2 ,....., An sunt evenimente incompatibile, atunci
P ( A1 ∪ A2 ∪.... An ) = P ( A1 ) + P ( A2 ) + ..... + P ( An )
2) Φ∈K
∞
3) Dacă { Aα }, α ∈ N , Aα ∈ K
*
atunci A α ∈K .
α =1
Observaţie. Proprietăţile 1-10 ale câmpului finit de evenimente sunt valabile şi
în cazul câmpului borelian.
Definiţie. Fiind dat un σ -câmp K , se numeşte probabilitate funcţia P : K →
R, cu următoarele proprietăţi :
1) P ( A) ≥ 0 pentru orice A ∈ K
2) Dacă { Aα }, Aα ∈ K este o familie numărabilă de evenimente distincte
∞ ∞
( Ai ∩ A j = Φ, i ≠ j ) atunci P ( A ) = ∑ P( A )
α =1
α
α =1
α
3) P( E ) =1.
Definiţie. Tripletul ( E , K , P) se numeşte câmp infinit de probabilitate.
Observaţie.Proprietăţile 1-6 de la definiţia clasică a probabilităţii sunt valabile
şi în plus avem :
1) P( A ∪ B) ≤ P( A) + P( B)
2) Dacă A ⊂ B atunci P( A) ≤ P ( B )
∞
3) Dacă An ∈ K , n ∈ N , An + 1 ⊂ An , A n = Φ atunci lim P ( An ) = 0 .
n →∞
n=1
11
Cursul nr. 2 Statistică
în ecologie
Probabilităţi condiţionate
P( A ∩ B)
P( A \ B) = dacă P( B) ≠ 0
P( B)
sus.
câte două, iar reuniunea lor este evenimentul sigur. Cu alte cuvinte,
13
din aceste evenimente se realizează cu certitudine unul şi numai
unul.
iar
P( A) = P ( A ∩ A1 ) + P( A ∩ A2 ) + ....... + P ( A ∩ An )
Exemplu. Fie trei urne conţinând bile albe şi negre, după cum
urmează :
U 1 (3a,2n) , U 2 (6 a , 2 n ) , U 3 (3a,7 n)
obţine:
14
P ( A ∩ Ai ) = P ( A) P ( Ai / A)
P ( Ai ∩ A) = P ( Ai ) P ( A / Ai )
De aici rezultă că
P ( Ai ) P ( A / Ai )
P ( Ai / A) =
P ( A)
şi înlocuind, se obţine:
P ( Ai ) P ( A / Ai )
P ( Ai / A) =
P( A1 ) P ( A / A1 ) + P( A2 ) P ( A / A2 ) + .... + P ( An ) P ( A / An )
∑ P( A ) P( A / A )
i =1
i i
Exemplu. Fie două urne care conţin bile albe şi negre: . Din aceste
urne s-a extras o bilă albă. Care este probabilitatea ca bila să fi fost
15
Exemplu. Se aruncă o pereche de zaruri de şase ori. Care este
puncte ?
este
s
n!
P (n; m1 , m 2 ,....., m s ) =
m1!m 2 !...... m s !
p1m1 p 2m2 ....... p sms cu ∑mk = n.
k =1
două ori să obţinem faţa cu un punct, de două ori faţa cu două puncte
între limite mai mici, respectiv mai mari decât cele admisibile sunt
16
Din întreg lotul se extrag la întâmplare 100 piese. Care este
probabilitatea q k =1 − p k , k =1,2,....., n.
unde pi = P ( Ai ), q i = 1 − pi , i = 1,2,..., n .
corespundă.
17
O urnă conţine a bile albe şi b bile negre. Din această urnă se se
, a2 de culoare c2 , …, a de culoare
m cm . Se extrag n bile
deodată sau una câte una fără întoarcerea bilei extrasă din urnă.
piese sunt rebuturi, iar restul sunt piese bune. Din acest lot au fost
18
Cursul nr. 3 Statistică în ecologie
Variabile aleatoare
variabilă aleatoare.
aleatoare.
19
Definiţie. Ovariabilă aleatoare este continuă dacă mulţimea valorilor
influenţate de cauze aleatoare, iar unele valori pot apărea mai des
valoare.
x1 ... x n n
X:
p ... p , unde pi = P(X=xi)≥0, (∀) i =1, n şi ∑ pi =1
1 n i =1
sau
x1 ... x n ... ∞
X:
p ... p ... , unde pi = P(X=xi)≥0, (∀) i ≥1 şi ∑ pi =1
1 n i =1
a + x1 ... a + x n
- a+X :
p
1 ... pn
a ⋅ x1 ... a ⋅ x n
- a∙X :
p ... p
1 n
x1 + y1 ... x n + y m
- X+Y : p nm
, unde pij=P({X=xi} ∩ {Y=yi})
p11 ...
indep
= P({X=xi})∙P({Y=yi}) = pi ∙ qi
x1 ⋅ y1 ... x n ⋅ y m
- X∙Y :
p11 ... p nm
Dispersia sa este
n
D 2 ( X ) = ∑( xi −M [ X ]) 2 pi
i =1
= M[X 2] – M 2[X] ,
funcţia F : R → [0,1],
F ( x) =P( X <x)
= P({ω / X(ω)<x}) = (P◦X-1)(x).
l i m F ( x) = F ( x0 )
b) F este continuă la stânga (adică: (∀) x0 ∈ R : x→ x0 )
x< x0
F(x1)≤F(x2) )
21
Definiţie: Spunem că X are o densitate de repartiţie dacă există f
b)
∞
∫ f ( x) dx =1
−∞
Observaţii:
1) F’(x) = f(x)
2)
b
convergentă)
- dispersia lui X:
22
= R∫( x −M [ X ])
def 2
dF ( x ) prop
D 2 [ X ] = ∫( x −M [ X ])
R
2
f ( x ) dx
= M[X
2
] – M2[X].
repartiţie
1 2 ... n
X:
1 / n 1 / n ... 1 / n
23
M[X2] = 12∙1/n + 22∙1/n + … + n2∙1/n = (12+22+…+n2)/n =
n( n +1)( 2n +1) ( n +1)( 2n +1)
6n
= 6
1 2 ... 6
X:
1 / 6
1/ 6 ...
1/ 6
de repartiţie
k
X: k k n −k
C n p (1 − p) k =0,n
n n
(n −1)! k ' =k −1
= n ∑(k −1)! (n − k )! p k (1 − p) n −k = n ∑C nk −−11 p k (1 − p) n −k =
k =1 k =1
n −1 n −1
= n ∑C nk −' 1 p k '+1 (1 − p) n −1−k ' = np ∑C nk −' 1 p k ' (1 − p) n −1−k ' ;
k ' =0 k ' =0
n
Cum ( a + b) n = ∑C nk a n −k b k rezultă că M[X] = np(1–p+p)n-1 = np.
k =0
n
= ∑(k 2 − k + k ) ⋅ C nk p k (1 − p) n −k =
k =1
n n
= ∑k (k −1) ⋅ C nk p k (1 − p) n −k + ∑k ⋅ C nk p k (1 − p) n −k =
k =1 k =1
n
= ∑k (k −1) ⋅ C nk p k (1 − p) n −k + M[X] =
k =2
n
n!
∑ k (k −1) k!(n − k )! p k (1 − p) n −k + np =
k =2
n
(n − 2)!
= n( n −1) ∑
( k − 2 )! ( n − k )!
p k (1 − p ) n −k + np k ' ==k −2
k =2
n −2
= n( n −1) ∑ C nk −' 2 p k '+2 (1 − p) n −2 −k ' + np =
k ' =0
n −2
n( n −1) p 2 ∑ C nk −' 2 p k ' (1 − p) n −2 −k ' + np =
k ' =0
o urnă cu bile albe şi bile negre. Se extrage pe rând câte o bilă, apoi
Răspuns: C nk p k (1 − p) n−k
Răspuns: C nk p k (1 − p) n−k
repartiţie
k
X: k
(1 − p ) p k∈N
Derivând se obţine
∞ p <1
1
1 + 2 p + ... + np n −1 + ... = ∑kp k −1 =
k =1 (1 − p ) 2
26
Revenind,
p p
M[X] = (1-p) (1 − p) 2 = 1 − p
∞ p <1
p ( p +1)
=> p + 2 2 p 2 +... + n 2 p n +... = ∑k 2 p k =
(1 − p ) 3
k =1
de unde
p ( p +1) p ( p +1)
M[X2] = (1 − p ) =
3
(1 − p ) (1 − p ) 2
Revenind,
2 2 2
p ( p +1) p2 p
D [X] = M[X ] – M [X] = (1 − p ) 2 – (1 − p ) 2 = (1 − p) 2 .
tragere. Atunci
P(X=1) = q = 1–p
tragere da şi
….
P(X=k) = pqk-1
∞
λk −1
λe −λ ∑ =
k =1
( k −1)!
∞
k ' =k −1 λk '
λe −λ ∑
= k '!
k ' =0
28
M[X] = λe–λeλ = λ.
M[X2] – M2[X].
∞ ∞ ∞
λk λk λk
= e −λ ∑k (k −1) ⋅ k! + e −λ ∑k ⋅ k! = e −λ ∑ k (k −1) ⋅ k!
+ M[X] =
k =1 k =1 k =2
∞ ∞
λk λk −2 k ' =k − 2
∞
λk '
= e −λ ∑ (k − 2)! +λ= e −λλ2 ∑ (k − 2)! +λ =
e −λλ2 ∑ k '! +
k =2 k =2 k ' =0
λ=
= e–λλ2eλ + λ = λ2 + λ.
Revenind,
Observaţii.
29
unitatea de timp şi dacă momentele apariţiilor evenimentului sunt
independente.
P(X=k) = C nk p k (1 − p) n−k .
30
1. Repartiţia uniformă pe (a,b) are funcţia de densitate
1
, x ∈ ( a, b)
f(x) = b − a
0, x ∈ (a, b)
M2[X], unde
2 ∞ b 1
M[X2] = R∫x f ( x) dx = ∫−∞x 2 f ( x)dx = ∫a x 2 b − a dx =
b 2
x3 + ab + b 2
1
b −a
⋅
3
a
=a 3
şi deci
2
+ b2 ( a + b) 2 ( a − b) 2
2
D [X] = M[X ] – M [X] 2 2
= a + ab
3
– 4
= 12 .
densitate
λ ⋅ e −λx , x > 0
f(x) =
0, x ≤ 0
31
Media variabilei aleatoare X ce are funcţia de repartiţie f(x)
este
∞ ∞ ∞ ∞
M[X]= ∫−∞xf ( x ) dx = ∫0 x ⋅ λe −λx dx = ∫0 x ( −e −λx )' dx = x ( − λe − λx )
0
∞
– ∫0 ( −e −λx ) dx
Cum
−
∞ ⋅0 x ∞/ ∞ 1
lim x ( −e −λx ) = − lim = − lim = 1/∞ = 0
x →∞ λ>0 x → ∞ e λx L 'Hospital x → ∞ λe λx
rezultă că
∞
∞ e −λx
M[X] = 0 – 0 + λ∫ e −λx dx = − = –0 + 1/λ = 1/λ
0 λ
0
M2[X], unde
2 ∞ 2 ∞ 2
M[X2]= R∫x f ( x ) dx
= ∫0 x ⋅ λe −λx dx = ∫0 x ( −e −λx )' dx =
∞
2 x (−e −λx ) dx
∞
x 2 (−λe−λx
)
0 – ∫0
Cum
−
∞ ⋅0 x2 ∞/ ∞ 2x ∞/ ∞ 1
lim x 2 ( −e −λx ) = − lim = − lim = − lim
x →∞ λ>0 x →∞ e λx L 'Hospital x → ∞ λe λx L 'Hospital x →∞ λ2 e λx
= 1/∞ = 0
rezultă că
∞ 2 ∞ 2 2
M[X2] = 0 – 0 + 2 ∫0 xe −λx dx = ∫ xλe −λx dx = λ M[X] =
λ 0 λ2
Revenind,
2 1 1
D2[X] = M[X2] – M2[X] = − = λ2 .
2 2
λ λ
32
3. Repartiţia normală (Gauss) de parametri m>0 şi σ∈ R
este
( x −m ) 2
∞ ∞ − y = ( x − m) / σ
M[X]= ∫−∞xf ( x ) dx = 1
∫ xe 2σ2 dx =
σ 2π −∞
∞ y2
1 −
∫(σy +m)e
σ 2π −∞
2 σdy =
∞ ∞
σ 2 m −y 2 / 2
= ∫ ye − y / 2 dy + ∫e dy
2π −∞ 2π −∞
∞ ∞ ∞
σ 2 m −y 2 / 2 σ −y 2 / 2
= ∫ ye − y / 2 dy + ∫e dy = ∫(−e )' dy +
2π −∞ 2π −∞ 2π −∞
∞
2m −y 2 / 2
2π
∫e dy =
0
∞
−σe −y
2
/2 2m 2m 2m
= 2π
+ 2π
I =0–0+ 2π
I = 2π
I
−∞
Dar
∞ 2
∞ 2
∞∞ 2
+y 2 ) / 2
I∙I = ∫e −x /2
dx ∙ ∫e −y /2
dy = ∫ ∫e −( x dxdy ,
0 0 00
33
∂x ∂x
cos t −r sin t
J = ∂r ∂t
= =r
∂y ∂y sin t r cos t
∂r ∂t
Deci
π/ 2 ∞ π/ 2 ∞
2 2 π ∞ π
I∙I = ∫ ∫ re −r /2
drdt = ∫dt ∙ ∫re −r /2
dr =2 ∙ −e −r 2 / 2
0 =2
0 0 0 0
De unde
π
I= 2
Revenind,
2m π
M[X] = 2π 2
=m
y2 ∞
1
∞ − σ2 2 −y 2 / 2
= σ 2π −∞
2
∫σ y e
2 2 σdy = 2π −∞
∫y e dy =
∞ ∞ ∞
σ2 σ2
2
−y 2 / 2 −σ2 e −y /2
−y 2 / 2
= 2π −∞
∫ y (−e )' dy = 2π
– 2π −∞
∫−e dy =
−∞
∞
2σ2 −y 2 / 2 2σ2 2σ2 π
=0–0+ 2π
∫e dy = 2π
I = 2π 2
= σ2.
0
34
Cursul nr. 7 Statistică în
ecologie
situaţii despre care avem date obţinute fie prin observare, fie prin
măsurare.
35
număr de elemente pentru a fi cercetate, utilizând apoi metode
statistică.
observate.
statistici:
36
Statistici descriptive, al căror principal scop este
Exemple.
37
colectivităţii din care provine. Concluziile obţinute sunt apoi
dependenţă.
Populaţie statistică
respectiv;
Exemple.
38
1. Mulţimea studenţilor dintr-un an de studiu reprezintă o
studiată.
statistică.
un număr.
39
Din punct de vedere matematic, o populaţie statistică este o parte a
Selecţia
se practică selecţia.
dintre acestea.
40
selecţie;
mai mici;
prezintă interes.
41
Cursul nr. 9 Statistică în ecologie
poligoanele frecvenţe.
42
Definiţie. Mulţimea {( x, f ( x )), x ∈P} ordonată după valorile lui x , se
serie statistică.
se notează cu fk .
femelelor din fiecare specie este de 5, 12, 25, 5, 12, 25, 18, 12, 14, 7,
25,18.
tabelul următor:
43
xk 5 7 12 14 18 25
fk 2 1 3 1 2 3
fk
numărul pk =
n
, k = 1,2,...., m .
xk 5 7 12 14 18 25
fk 2/10 1/10 3/10 1/10 2/10 3/10
44
Clasele de valori sunt utile atunci când volumul de date este mare.
clase.
poligoane de frecvenţă
printr-o histogramă.
4
3
2
1
5 10 15 20 25
claselor corespunzătoare;
poligonală;
46
Presupunând că o clasă are extremităţile xi şi x i +1 ,
x f + x 2 f 2 + ... + x m f m ∑x k fk
x= 1 1 = k =1
f 1 + f 2 + ... + f m n
Observaţie.
seobţine:
m
fk m
x =∑ = ∑ xk p k
k =1 n k =1
x1x2. . .xm. . . . .
p1 p2. . .pm. . . .
47
Observaţie.Tabloul de mai sus reprezintă repartiţia unei variabile
statistice.
Exemplu.
caracteristicii, numărul d i = xi − x .
mediei.
Corelaţie şi regresie
49
Exemplu.Repartiţia a 25 studenţi după notele la informatică şi la
statistice următoare:
50
Nota la informatică 3 4 5 6 7 8 9 10
Frecvenţa 3 3 2 4 7 5 3 3
Nota la statistică 4 5 6 7 8 9 10
Frecvenţa 3 3 5 4 5 3 3
3 4 5 6 7 8 9 10
X:
4 3/30
5 3/30
6 2/30
7 84/30 97/30105/30 3/30 3/30
Y:
3/30 3/30 5/30 4/30 5/30 3/30 3/30
Se poate scrie:
x yj
X : i , i = 1,2,...., m Y : , j = 1,2,...., n
q
pi j
Nota la statistică 1 9 87 6 5 4 3 2 1
0
10 1 2 0 0 0 0 0 0 0 0 3
9 1 00 0 0 0 0 0 0 3
8 2 0 53 1 0 0 0 0 0 9
7 0 04 0 0 0 0 0 0 4
6 0 0 00 3 2 0 0 0 0 5
5 0 0 00 0 0 2 1 0 0 3
4 0 0 00 0 0 1 2 0 0 3
3 0 0 00 0 0 0 0 0 0 0
2 0 0 00 0 0 0 0 0 0 0
1 0 0 00 0 0 0 0 0 0 0
0
Total 3 3 5 7 4 2 3 3 0 0 30
52
În cazul unui studiu statistic după mai multe caracteristici, se
având repartiţia:
Xik
Xi ,: i= 1,2 n . . . , cu condiţia ∑ pi
ml
pi
k =1,2,..., ml
k
=1
k =1
k
Reluând exemplul de mai sus, datele se pot grupa într-un tabel având
informatică şi statistică.
x
y 3 4 5 6 7 8 9 10
4 2* 2*
5 2* * 3*
6 * * * * 4*
7 * 2* * * 5*
8 3* 5* 2* 10*
9 * 2* 3*
10 * 2* 3*
2* 3* 2* 3* 6* 7* 3* 4*
53
Analiza unei populaţii se realizează studiind una sau mai multe
caracteristici.
părinţii scunzi au copii scunzi dar mai puţin scunzi decât părinţii.
de corelaţie.
Regresia liniară
54
curbă etc.) care constituie imaginea grafică a unei funcţii. Problema
∑[ f ( x
k =1
k ) − y k ]2
să fie minimă.
∑[ax
k =1
k + b − y k ] 2 = min
şi rezolvăm sistemul:
55
∂F n
∂ a = 0 ∑ (a xk + b − y k ) xk = 0
k=1
⇒ n
∂F = 0 (a x + b − y ) = 0
∂ b ∑k = 1 k k
echivalent cu
n 2 n n
a ∑ x k + b∑ x k = ∑ x k y k
k=1 k=1 k=1
n n
a x + n b= y
∑k = 1 k ∑k = 1 k
obţine soluţia:
n n n
a = ∑ d k y k / ∑ d k2 , b = (∑ y k ) / n , k =1,2,....., n
k =1 k =1 k =1
Exemplu.
Coeficientul de corelaţie.
populaţie.
56
1 n 1 n
unde x= ∑ xk
n k =1
, y= ∑ yk
n k =1
.
Ipoteze statistice
57
Estimarea parametrilor
estimării acestora.
58
însă este un parametru real a cărui valoare adevărată θ0 este
X 1 = x1 , X 2 = x 2 ,....., X n = x n
Se pune problema găsirii unei funcţii θ( x1 , x 2 ,...., x n ) care să poată fi
sau estimator.
Definiţie. Se spune că θ ( x1 , x 2 ,...., x n ) este un estimator consistent al
lui , dacă θ ( x 1 , x 2 ,...., x n ) converge în probabilitate la θ , adică
lim P (| θ ( x1 , x 2 ,...., x n ) −θ |< ε ) = 1
n →∞
Definiţie.
M [θ ( x1 , x 2 ,....., x n )] = θ + α( n), lim α( n) = 0
n →∞
lim D 2 [θ ( x1 , x 2 ,....., x n )] = 0
n →∞
59
Definiţie. Spunem că θ ( x1 , x 2 ,...., x n ) este o estimaţie absolut corectă
a lui θ , dacă
M [θ( x1 , x 2 ,....., x n )] =θ
lim D 2 [θ ( x1 , x 2 ,....., x n )] = 0
n →∞
Definiţie. Spunem că θ ( x1 , x 2 ,...., x n ) este o estimaţie nedeplasată a
lui θ , dacă
M [θ( x1 , x 2 ,....., x n )] =θ
Intervale de încredere
selecţie x1 , x 2 ,...., x n
60
2) P[θ1 ≤ θ ≤ θ 2 ] = β
despre θ .
În statistică, ipoteza este una din cele mai utilizate tehnici. De regulă
61
ipoteza că pentru întreaga populaţie caracteristica respectivă este
repartizată normal.
Exemple.
alta din albi sunt diferite, rezultatele grupului de negrii fiind mai
bune.
2. Bărbaţii din nordul Europei sunt mai înalţi decât cei din sud.
3. Rezultatele studenţilor din mediul rural sunt mai bune decât ale
nu asupra selecţiei.
62
Să considerăm o repartiţie dată prin funcţia de densitate care depinde
valoarea θ0 .
admisibile.
teste statistice.
63
P ( NH / H ) = P ( X ′ ∈W / H ) = α
P ( H / NH ) = P ( X ′ ∈W / NH ) = β
Probabilitatea π = 1 − β = P ( NH / NH ) = P ( X ′ ∈W / NH ) = P ( X ′ ∈W / NH )
astfel ca P( X ′ ∈ W / H ) ≤ α .
Testul χ2 (hi-pătrat)
l
(ν i − npi (λ )) 2 ˆ ˆ
χ2 = ∑ = min cu pˆ i = pi (λ) = ∆∫ dF ( x, λ)
i =1 npi (λ ) i
pi = ∫ dF ( x ) (ν i − npi ) 2
l
, χ =∑
2
∆i i =1 np i
p k = P ( x k −1 ≤ X < x k ) = F ( x k ; θ ) − F ( x k −1 , θ )
Să presupunem că în intervalul Dk au fost observate nk valori, adică
l
n = ∑ nk .
k =1
l
( ni − np i ) 2
χ calculat
2
=∑
i =1 npi
65
şi n coloane k1 , k 2 ,..., k n , corespunzătoare numărului posibilităţilor de
care sunt susceptibile caracteristicile cărora li se aplică testul.
X k1 k2 kn
Y
lm f 11 f 12 ...... f 1n n
∑f
j =1
1j
l2 f 21 f 22 ...... f 2n n
∑f
j =1
2j
lm f m1 f m2 ...... f mn n
∑f
j =1
mj
m m
...... m m
N = ∑(∑ f ij )
n
∑ f i1
i =1
∑ fi2
i =1
∑ f in
i =1 i =1 j =1
∑ f ik ∑ f lj
i =1 j =1
f lkt =
N
iar numărul gradelor de libertate este r = ( m −1)( n −1) .
m n ( f ij − f ijt ) 2
χ 2
calculat = ∑∑
i =1 j =1 f ijt
Dacă χcalculat
2
< χtabel
2
pentru r grade de libertate, atunci se acceptă ipoteza
H0 , altfel se respinge.
Datele de observaţie sunt consemnate într-un tabel cu trei linii şi două coloane.
Deasupra diagonalei fiecărui dreptunghi se scriu frecvenţele observate, iar sub
diagonala frecvenţele calculate.
Pentru note considerăm caracteristica X, cu trei posibilităţi: note slabe , note
satisfăcătoare şi note bune + foarte bune.
Pentru sex considerăm caracteristica Y cu două variante: sex feminin, sex
masculin.
X fete băieţi
Y
38 32 70
n1
32,9 37,1
24 36 60
n2
28, 31,
2 8
18 22 40
n3 18, 21,2
8
80 90 170
67
Deoarece χ2 =2,73<4,60 se acceptă ipoteza nulă H0 , ceea ce înseamnă că
rezultatele obţinute un sunt dependente de sex.
Testul Student
1 n
s2 = ∑
n − 1 i =1
( xi − x ) 2 , unde x1 , x 2 ,...., x n sunt măsurări asupra caracteristicii
X ;
x − µ0
se calculează statistica testului t calculat = .
s/ n
68
Decizia privind ipoteza H0 se ia astfel: se acceptă H0 dacă
t calculat ≤t t
n −1,1−
2
ε . Valoarea n−1,1−
2
ε se extrage din tabele.
n1 n2
∑ (x
i =1
i − m1 ) + ∑ ( y j − m2 )
2
j =1
s =
2
n1 + n2 − 2
m1 − m 2
Z= ∑(x i − m1 ) 2 ∑ (x i − m2 ) 2
σ 21 σ 2
2
, σ 12 = i , σ 22 = i
+ n1 n2
n1 n2
Şansele ca un studiu statistic să reflecte cât mai bine realitatea sunt cu atât mai
mari cu cât studiul respectiv tinde să cuprindă întreaga populaţie. Acest lucru
este dificil şi uneori chiar imposibil.
Evenimente, procese, fenomene şi activităţi din natură şi societate care
necesită studii statistice sunt de cele mai multe ori aşa de numeroase şi/sau
complexe încât nu pot fi studiate prin examinarea fiecărei unităţi statistice.
Henry Poincare spunea: Slăbiciunea noastră nun e permite să îmbrăţişăm tot
universal şi suntem obligaţi să-l descompunem în bucăţi.
69
De aici rezultă că într-o mulţime de situaţii, studiul lor statistic nu este posibil
decât pentru o parte a acestora, iar pe baza rezultatelor obţinute să putem trage
concluzii pentru tot întregul.
Procedeele prin care pornind de la studierea unui număr restrâns de unităţi ale
unei populaţii statistice se pot obţine rezultate privind întreaga populaţie se
numesc procedee inferenţiale.
Numărul restrâns de unităţi statistice supuse analizei se numeşte eşantion, iar
obţinerea lor din populaţia statistică se numeşte sondaj.
Rezultatele obţinute prin analizarea sondajului respectiv sunt extrapolate la
întreaga populaţie, cu condiţia ca eşantionul să fie reprezentativ.
Un eşantion este reprezentativ pentru o populaţie statistică dacă:
reprezintă la scară redusă structura populaţiei respective ;
păstrează caracteristicile populaţiei din care a fost extras ;
sugerează legea de repartiţie ce caracterizează populaţia ;
poate fi utilizat pentru estimarea sau determinarea diferiţilor parametri ai
legiii respective.
Reprezentativitatea unui eşantion este acceptabifaţă de valorile reale.lă în
determinarea indicatorilor de structură ai populaţiei se înregistrează abateri de
cel mult 5%.
În general, eşantioane diferite conduc la rezultate diferite, ceeace înseamnă o
fluctuaţie a reprezentativităţii lor.
În analiza statistică se recomandă ca eşantioanele să fie aleatorii.
Tipuri de sondaje
70
sondaje dirijate, se utilizează atunci când se au în vedere anumite
criterii prestabilite privind modalităţile de selectare a unităţilor statistice care
compun eşantionul. Pentru anumite populaţii, un eşantion aleatoriu nu ar fi
reprezentativ datorită neomogenităţii caracteristicii studiate.
Un exemplu în acest sens este sondajul de opinie în care pentru asigurarea unei
reprezentativităţi corespunzătoare este necesar să fie incluse toate categoriile
sociale.
Erori de sondaj
72