Documente Academic
Documente Profesional
Documente Cultură
Etimologic, statistica i are rdcina n cuvntul latinesc status care nseamn situaie,
stare social, dar i stat. Analiznd n sintez retrospectiv, procesul evolutiv al dezvoltrii
statisticii, se contureaz distinct urmtoarele etape: evidena statistic statistica descriptiv
aritmetica politic statistica modern. Deci, statistica reprezint o ramur a matematicii
care, folosind calculul probabilitilor, elaboreaz noiunile i metodele specifice studiului
cantitativ al colectivitilor i al fenomenelor de mas.
Folosirea metodelor statistico-matematice ca instrumente practice de investigare i de
analiz socio-economic i mai ales orientarea cercetrilor statistice spre descoperirea
legitilor care guverneaz variabilitatea fenomenelor social-economice de mas, au conferit
statisticii caracterul su tiinific.
Teoria probabilitilor i statistica furnizeaz, astzi, unul dintre cele mai importante
instrumente de cunoatere uman. Putem afirma, fr s greim, c aproape c nu exist
domeniu de activitate cu care s nu aib un contact nemijlocit: fizica, chimia, biologia, geologia,
medicina, economia, sociologia, ingineria, analiza operaional, teoria informaiei, teoria
jocurilor, teoria ateptrii, controlul statistic al proceselor i fiabilitatea.
De aceea, cursul intitulat Statistic aplicat a fost structurat pornind de la consideraiile
prezentate anterior i conine dou pri:
I.
Prima parte este dedicat studiului principalelor noiuni i relaii de calcul utilizate la
calculul probabilitilor.
Teoria probabilitilor reprezint studiul matematic al fenomenelor caracterizate de
incertitudine i de ntmplare. Ea i are originea n anul 1654 cnd doi celebri
matematicieni francezi, Blaise Pascal (16231662) i Pierre de Fermat (16011665), au
purtat o lung coresponden ncercnd s rezolve dou probleme legate de jocurile cu
zaruri, foarte la mod n acea perioad. Antoine Gombaud, Chevalier de Mr un nobil
francez, mptimit al jocurilor de noroc, i cere ajutorul lui Pascal n ncercarea lui de a
rezolva o serie de contradicii aparente cu privire la popularul joc de zaruri.
Jocul const n aruncare unei perechi de zaruri de 24 de ori. Prima problem, formulat
de Antoine Gombaud, a fost de a decide dac este rentabil s parieze o sum de bani pe
reuita obinerii a cel puin unei "duble de ase" n timpul celor 24 de aruncri. O regul
a jocurilor de noroc, aparent bine stabilit, n acea perioad, la condus de Mr s cread
c un astfel de pariu ar fi profitabil, dar calculele lui Pascal au indicat exact opusul.
O partid de zaruri, inclusiv miza pus n joc, era nsuit de juctorul care ctig un
numr de jocuri. Ce-a de-a doua problem s-a referit la modalitatea de a mpri ct
mai corect miza (ntre cei doi juctori), dac din motive de for major jocul trebuie
ntrerupt la un scor intermediar.
1
Calculul erorilor i mecanica statistic sunt exemple ale unora dintre aplicaiile
importante ale teoriei probabilitilor dezvoltate n secolul al XIX-lea.
Ca n multe alte ramuri ale matematicii, dezvoltarea teoriei probabilitilor a fost
stimulat de varietatea de aplicaii ale sale. Fiecare pas realizat n aceast teorie a extins
i mai mult sfera de aplicare. Astfel, statistica matematic este o ramur important a
teoriei probabilitilor aplicate; alte aplicaii apar n domenii foarte diferite cum ar fi:
genetica, psihologia, economia i ingineria.
Muli oameni de tiin i-au adus contribuia la dezvoltarea teoriei publicate de
Laplace, printre cei mai importani putem s-i amintim pe Cebev, Markov, Hincin,
von Mises i Kolmogorov.
Una dintre dificultile majore n dezvoltarea unei teorii matematice a probabilitilor,
a fost aceea de a formula o definiie a probabilitii suficient de precis pentru a fi
utilizat n matematic, dar i suficient de cuprinztoare pentru a fi aplicabil unei game
largi de fenomene.
Cutarea unei definiii larg acceptate a durat aproape trei secole i a fost marcat de
multe controverse. Problema a fost rezolvat n cele din urm n secolul XX prin tratarea
teoriei probabilitilor pe o baz axiomatic. Aceast abordare modern a calculului
probabilitilor, ncadrat ntr-un domeniu mult mai larg al matematicii, teoria msurii,
a aprut n anul 1933, n monografia matematicianului rus Andrey Kolmogorov
(19031987), Grundbegriffe der Wahrscheinlichkeitsrechnun.
Unitile de nvare dedicate acestei prime pri conin principalele noiuni i relaii de
calcul utilizate la calculul probabilitilor i sunt structurate conform figurii 1.
II.
Cea de-a doua parte este dedicat studiului principalelor tehnici i instrumente utilizate
n analiza statistic modern.
Astzi termenul statistica a intrat n limbajul universal al tiinei i al vieii cotidiene. n
decursul timpului, aceast noiune a cptat mai multe accepiuni, care desemneaz
diversele ipostaze parcurse de la simple descrieri i nregistrri pn la statistica
modern, instrument indispensabil n procesul de conducere al oricrui domeniu specific
activitii umane.
Procesul de conturare al statisticii, n accepiunea de astzi, a fost marcat de parcurgerea
mai multor etape semnificative, [TAR 98], [CSI 11], [HIS 11]:
a. Etapa pre-statistic, coincide cu apariia primelor forme de eviden statistic i
dateaz nc din antichitate. Aceast etap se caracterizeaz, n esen, prin aceea
c datele statistice servesc pentru informarea organismelor statului despre nivelul,
sau stadiul atins la un moment dat de fenomenele social-economice subordonate, n
special unor scopuri fiscale, demografice, militare sau administrative. Exemplele
cele mai cunoscute de evidene statistice, din aceast perioad, sunt: inventarierea
Experien Experiment
Probe
Evenimente elementare,
Spaiul de eantionaj,
=
Elemente de algebra
mulimilor
Tipuri de
evenimente,
Definiia
probabilitilor
Probabilitate
condiionat
Regula de nmulire a
probabilitilor;
Formula probabilitii totale;
Teorema lui Bayes.
Evenimente compatibile;
Evenimente incompatibile;
Evenimente compuse - evenimente;
Evenimentul sigur, ;
Evenimentul imposibil, ;
Evenimente independente;
Evenimente dependente.
Definiia clasic;
Definiia statistic;
Probabilitate subiectiv
(opinia unui expert);
Definiia geometric;
Definiia axiomatic Kolmogorov.
Elemente de analiz
combinatorie:
Permutri;
Aranjamente;
Combinri.
Variabile aleatorii:
Discrete;
Continue.
Funcia de
repartiie
Modele de repartiii a
variabilelor aleatorii
Funcia de
probabilitate;
Funcia densitate
de probabilitate.
Astfel, negustorii din Veneia colectau date despre comerul exterior, pentru a putea
s evalueze riscurile transportului maritim.
n secolul al XVI-lea apar primele evidene ale naterilor nregistrate n Frana i
mai apoi registrele de cstorii i nateri din Anglia. Aceste nregistrri erau
realizate de ctre preoi. Totui, progresele fundamentale nregistrate de statistic
vor apare ncepnd cu secolul al XVII-lea.
b. Statistica descriptiv. Aceast etap s-a dezvoltat n secolele XVI XVIII cnd, n
Germania, s-a constituit o adevrat coal cunoscut sub denumirea de coala
descriptiv german. Descrierea statului a devenit, n aceast perioad, disciplin
de predare academic, ncadrat ntr-un sistem construit dup norme teoretice i
practice, cu accent pus pe dezvoltarea mijloacelor de investigare a fenomenelor
sociale i economice, precum i pe mijloacele de informare a organismelor statale.
Statistica descriptiv a fost continuu mbogit, restructurat i perfecionat,
punndu-se din ce n ce mai mult accent pe determinrile numerice i pe limbajul
cifric. Progresele statisticii descriptive sunt n mare msur legate de introducerea
noiunii de coordonate, n geometrie, de ctre Descartes n anul 1637.
Trsturile eseniale ale statisticii descriptive sunt definite de caracterul su analitic;
sunt prezentate descrieri complexe ale statelor, sunt efectuate analize comparative
ale diferitelor situaii socio-economice. Toate erau ns orientate n scopuri
informaionale. Deci, nici statistica descriptiv, cu toate c coala german o
ridicase la rangul de tiin, nu avea drept scop descoperirea i cunoaterea
legitilor statistice.
Cu toate acestea, statistica descriptiv constituie o realizare de seam a domeniului,
fiind o etap foarte bine conturat i integrat n procesul ndelungat al dezvoltrii
statisticii ca tiin.
n rile Romne, prima i cea mai reprezentativ lucrare de acest gen este
Descriptio antiqui et hodierni status Moldaviae, elaborat de Dimitrie Cantemir - o
expunere monografic pe plan geografic, politic, economic, social i cultural.
Lucrarea l-a impus pe autor ateniei contemporanilor, care l-au considerat printre
fruntaii statisticii descriptive europene.
c. Aritmetica politic. n timp ce n Germania, statistica se constituise ca disciplin
descriptiv a statului, n Anglia se ntea, n afara universitilor, o statistic cu totul
deosebit, cunoscut sub numele de aritmetica politic. Caracteristic aritmeticii
politice i este faptul c pentru prima oar analiza datelor nregistrate se face prin
procedee matematice, urmrindu-se desprinderea regularitilor care domin
schimbrile eseniale de ordin calitativ n structura i dezvoltarea raporturilor dintre
fenomenele social-economice. Folosirea metodei analitice, utilizarea unor
instrumente matematice, precum i cutarea legitilor care guverneaz fenomenele
social-economice marcheaz un substanial progres, al statisticii, prefigurnd
apariia elementelor statisticii moderne. Acest salt calitativ n dezvoltarea statisticii
se datoreaz i faptului c n aceast perioad calculul probabilitilor ncepe s se
contureze ca o teorie matematic de sine stttoare, iar diverse elemente, ale ei, sunt
preluate i utilizate n statistic.
prezentului, ci i pentru elaborarea unor ipoteze asupra modului n care se vor comporta, n
viitor, aceleai fenomene.
Noile metode introduse n analiza statistic au fost elaborate, n mare parte, de coala anglosaxon de statistic matematic, fondat de F. Galton (1822 1911) i K. Pearson (1857
1936) i continuat de R. A. Fisher (1890 1962), F. Y. Edgeworth (1845 1926), G. U. Yule
(1871 1951), M. G. Kendall (1907 1983). Contribuiile lor sunt hotrtoare pentru
constituirea statisticii moderne, fiind dezvoltate capitole de baz ca: analiza dispersional,
teoria estimaiei, calculul corelaiilor, verificarea ipotezelor, teoria eantionajului. Sub impulsul
colii create de Pearson i Fischer, statistica a fcut progrese remarcabile gsindu-i
fundamentri foarte precise, ca disciplin tiinific, n toate rile lumii.
Analiznd procesul evolutiv, al dezvoltrii statisticii, se constat c trecerea de la o etap la alta
nu a avut loc prin negarea a tot ceea ce s-a ctigat pn la un moment dat, ci printr-o
perfecionare continu a metodelor de culegere, prelucrare i analiz a datelor, printr-o
extindere i diversificare continu a posibilitilor de valorificare a informaiilor statistice.
Scopul statisticii este acela de dezvolta i aplica metodologiile de obinere a unor informaii
utile pornind de la serii de date colectate, sau de la efectuarea unor experimente. Aceste
activiti presupun colectarea sistematic a datelor, prelucrarea, sistematizarea, sintetizarea,
reprezentarea lor precum i analiza acestora. n plus, un rol important n analiza datelor l au
raionamentul statistic i inferena statistic. Aceste activiti majore implic: proiectarea
experimentelor i a metodelor de eantionaj; modelarea stocastic a fenomenelor; prognoze
bazate pe modele adecvate; dezvoltarea teoriei statistice i aplicarea de noi metode. Deci,
analiza statistic modern a datelor poate fi divizat n dou categorii:
Populaie
Indivizi
Inferen
statistic
Eantionaj
Eantion
reprezentativ
Eantionaj
Eantion
Statistica
descriptiv
Statistica
inferenial
Tehnici i metode de
reprezentate a datelor
Estimarea parametrilor
repartiiilor statistice
Punctual;
Cu interval de
ncredere.
Verificarea caracterului
aleatoriu
Calculul i reprezentarea
histogramei
Eliminarea valorilor
aberante
Verificarea ipotezelor
statistice
Regresie i corelaie
Teste de concordan
Verificarea ipotezelor
statistice referitoare la:
Parametrii
repartiiei;
Indicatorii statistici.
Curs 1.
1.3. SPAIUL DE EANTIONAJ
Metoda de cercetare utilizat n tiin i n inginerie pentru studiul fenomenelor naturale, se
bazeaz pe efectuarea de experiene. Experimentele reprezint un instrument deosebit de util
deoarece se bazeaz pe principiul fundamental c, dac vom efectua experimente n mod
repetat, n condiii aproximativ identice, acestea ne conduc la aceleai rezultate. Astfel, suntem
capabili s controlm valoarea variabilelor care afecteaz rezultatul experienei, [BLU 05].
Cu toate acestea, n unele experimente, nu suntem n msur s verificm sau s controlm
valoarea anumitor variabile, astfel nct rezultatele vor varia de la o realizare a experimentului
la alta, chiar dac condiiile, n care se desfoar experiena, sunt aceleai.
Definiia 1.1:
Acest ultim caz l reprezint experimentele care sunt considerate ca fiind aleatorii.
Definiia 1.2:
Pentru a evita confuziile, ce pot s apar, este necesar s introducem o nou noiune, cea de
prob.
Definiia 1.3:
Prin urmare, proba nu se confund cu experiena nsi ci cu unul din rezultatele sale previzibile
(cazuri posibile ale rezultatelor unui experiment aleatoriu).
Dezvoltarea logic a teoriei probabilitilor trebuie s nceap deci, cu luarea n considerare a
experimentelor aleatorii, deoarece acest tip de experiene genereaz rezultate incerte i la care
va trebui s asociem valori ale probabilitilor.
Caracteristica cea mai important a experimentelor aleatorii o reprezint faptul c rezultatul nu
poate fi determinat cu certitudine, n avans.
nainte de a asocia fiecrui rezultat o valoare numeric, numit probabilitate, este absolut
necesar s cunoatem totalitatea rezultatelor posibile ale experimentului considerat.
Exemplul 1.1:
Considerm o serie de experiene aleatorii simple. La fiecare s se precizeze
totalitatea rezultatelor posibile.
Soluie:
Figura 1.1:
Definiia 1.4:
Din definiia 1.4 rezult c, de fapt, spaiul de eantionaj reprezint o mulime de rezultate ale
experimentului, obinute n urma unei singure probe, iar fiecare rezultat al experimentului
reprezint un punct, sau un element al mulimii totale a probelor.
Din analiza experienelor prezentate anterior, putem constata trei categorii de experiene, i
anume:
Experiene avnd spaiul de eantionaj finit, deoarece conin un numr finit de elemente.
Acestea reprezint cazul exemplului 1.1, punctele 1 5, prezentate anterior;
Experimente cu spaiul de eantionaj infinit numrabil (n cazul exemplului 1.1, punctul
6); Dac intre elementele unei mulimi infinite i mulimea numerelor ntregi se poate
stabili o relaie bijectiv, atunci mulimea poart numele de mulime infinit numrabil.
Experimente cu spaiul de eantionaj infinit nenumrabil (n cazul exemplului 1.1,
punctul 7). Dac ntre elementele unei mulimi infinite nu poate fi stabilit o relaie de
tipul celei prezentate anterior, atunci mulimea poart numele de mulime infinit
nenumrabil.
Vom denumi, n continuare, spaiile de eantionaj finite i infinit numrabile, ca spaii de
eantionaj discrete, iar pe cele infinit nenumrabile ca spaii de eantionaj continue.
Exemplul 1.2:
Considerm un experiment ce const n extragerea a dou bile dintr-o
urn, ce conine 4 bile identice, numerotate cu cifrele de la 1 la 4.
a) S se determine spaiul de eantionaj, n condiiile n care prima bil
extras este reintrodus n urn nainte de cea de-a doua extragere;
b) S se determine spaiul de eantionaj, n condiiile n care prima bil
extras nu mai este reintrodus n urn nainte de cea de-a doua
extragere.
Soluie:
Cazul a.
(1,1)
(2,1)
={
(3,1)
(4,1)
(1,2)
(2,2)
(3,2)
(4,2)
(1,3)
(2,3)
(3,3)
(4,3)
(1,4)
(2,4)
}
(3,4)
(4,4)
Cazul b.
(1,2)
(2,1)
={
(3,1)
(4,1)
(1.3)
(2,3)
(3,2)
(4,2)
(1,4)
(2,4)
}
(3,4)
(4,3)
Chiar i pentru analiza din punct de vedere probabilist a rezultatelor, unui experiment aleatoriu,
spaiul de eantionaj nu este n mod unic determinat. El depinde de obiectivele propuse, ale
studiului.
Exemplul 1.3:
Considerm un experiment ce const n prelevarea unei piese executate din tabl
prin tanare, n cadrul unui atelier i analiza calitii prin evaluarea grosimii.
Soluie:
1.4. EVENIMENTE
Analiza din punct de vedere probabilist al rezultatelor unui experiment aleatoriu presupune, de
cele mai multe ori, calculul probabilitii unor colecii de rezultate ale experienei considerate.
Din acest motiv a fost introdus o nou noiune, cea de eveniment, [CRS 83],[SOO 04].
Definiia 1.5:
Prin eveniment, se nelege producerea sau neproducerea unui fenomen ntro experien oarecare, sau rezultatul unui experiment.
n funcie de ansa de apariie, un eveniment oarecare, asociat unei experiene, poate fi:
Evenimentul sigur () este evenimentul care se produce cu certitudine la efectuarea
unei probe. De fapt, evenimentul sigur reprezint spaiul de eantionaj:
= .
Evenimentul imposibil () este evenimentul care nu se produce cu siguran la
efectuarea de probe. i n acest caz putem concluziona c:
.
Evenimentul aleatoriu, sau ntmpltor (, , . ..): evenimentul care se poate produce, sau
nu, ntr-un experiment.
Analiznd definiia 1.5 putem trage concluzia c n decursul efecturii unui experiment, un
eveniment aleatoriu reprezint, de fapt, o submulime a spaiului de eantionaj asociat unei
experiene aleatorii.
Evenimentele aleatorii, n funcie de modul lor de apariie, se pot clasifica n:
Evenimentele care pot fi realizate de o prob i numai de una, reprezint evenimentele
elementare. Pentru acest tip de evenimente vom utiliza notaia: ,
1, .
Evenimentele compuse. Acestea reprezint o colecie de unul sau mai multe evenimente
elementare.
Rezult deci, c n general, un eveniment poate fi identificat cu o mulime i anume cu mulimea
probelor respective, iar evenimentele compuse, asociate unui spaiu de eantionaj, se pot obine
prin utilizarea operaiilor specifice algebrei mulimilor.
Pornind de la terminologia folosit de teoria mulimilor, n tabelul 1.1 este prezentat dualitatea
Tabelul 1.1
Limbajul evenimentelor
Spaiul de eantionaj,
Evenimentul sigur,
Cmp de evenimente, (, )
Eveniment,
Evenimentul imposibil,
<< sau >>
<< i >>
<< non >>, , S
<< implic >>
<< echivalent cu >>
<< i incompatibile >>
<< i compatibile >>
inclus n ,
=
i disjuncte, =
i nedisjuncte,
Conform tabelului 1.1, observm c este necesar s definim, n continuare, cteva tipuri de noi
evenimente cu proprieti speciale:
Definiia 1.6:
Definiia 1.7:
= ,
i a crui realizare const n realizarea simultan a ambelor evenimente.
Definiia 1.8:
Definiia 1.9:
Definiia 1.10:
Definiia 1.11:
Definiia 1.12:
Evenimente contrare: = \ = .
a) ;
b) ;
c) ( ) ;
( );
d)
e) ( )\;
f) (
);
Soluie:
b)
a)
c)
e)
d)
f)
(1.1)
Exemplul 1.6:
n dulap avem trei cmi, dou cravate i dou costume. n cte moduri
diferite ne putem mbrca?
Soluie:
Pentru a descrie spaiile de eantionaj care se compun din evenimente elementare, alctuite din
mai multe etape sau stadii succesive, putem utiliza arborele de evenimente. Arborele de
evenimente reprezint un instrument grafic ce are la baz principiul multiplicativ i se
construiete reprezentnd sub forma ramurilor unui copac cele modaliti de completare ale
pasului . Fiecare dintre modalitile de completare a etapei poate fi reprezentat ca ramuri
pornind de la capetele ramurii originare, ale evenimentului precedent, , i aa mai departe.
n figura 1.2 este prezentat arbore de evenimente, corespunztor exemplului 1.6.
Ev.
Ev.
2 = 2, r. de cravate
Ev.
1
Figura 1.2
1 = 3, r. de cmi
1 = 2, r. de costume
= + = 3 + 5 = 8.
Determinarea spaiului de eantionaj n unele cazuri, mai complicate, devine mai dificil prin
utilizarea, doar a unor raionamente logice. De asemenea, pentru a asocia probabiliti
evenimentelor din aceste situaii, e nevoie de cunoaterea numrul de evenimente, att pentru
evenimentul analizat ct i pentru spaiul de eantionaj. Astfel de cazuri presupun utilizarea
regulilor simple ale analizei combinatorii pentru a simplifica calculele.
1.5.1. PERMUTRI
Definiia 1.13:
Numrul de permutri a obiecte se poate determina foarte simplu, conform figurii 1.3.
Constatm c primul obiect, ntr-o permutare, l putem alege n moduri. Cel de-al doilea
obiect, se poate alege n 1 feluri, cel de-al treilea n 2 feluri, i aa mai departe, iar
pentru ultimul obiect ne rmne o singur opiune. Deci:
! = 123 ( 1).
( 1)
Figura 1.3
poziii
obiecte
(1.3)
( 4) 1
Soluie:
= 5! = 5 4 3 2 1 = 120 de moduri.
Dac avem, ntre cele obiecte, grupe de elemente identice, atunci numrul de permutri este
mai mic dect n cazul n care toate elementele sunt diferite.
De exemplu, n cazul a patru elemente (, , , ), cele 4! = 24 de permutri care se pot realiza
sunt:
(1 , 2 , 1 , 2 ), (1 , 1 , 2 , 2 ), (1 , 2 , 1 , 2 ), (1 , 1 , 2 , 2 ), (1 , 1 , 2 , 2 ), (1 , 1 , 2 , 2 ),
(2 , 1 , 1 , 2 ), (2 , 1 , 1 , 2 ), (1 , 2 , 2 , 1 ), (1 , 2 , 2 , 1 ), (1 , 2 , 1 , 2 ), (2 , 1 , 2 , 1 ),
(1 , 2 , 2 , 1 ), (1 , 2 , 2 , 1 ), (2 , 1 , 1 , 2 ), (2 , 1 , 1 , 2 ), (2 , 1 , 2 , 1 ), (1 , 2 , 1 , 2 ),
(2 , 1 , 2 , 1 ), (2 , 2 , 1 , 1 ), (2 , 1 , 2 , 1 ), (2 , 2 , 1 , 1 ), (2 , 2 , 1 , 1 ), (2 , 2 , 1 , 1 ).
10
Ordonrile diferite ale elementelor , ca i cele ale elementelor , sunt socotite egale. Deoarece,
acestea reprezint 2! i respectiv 2! permutri, numrul total al permutrilor diferite este egal
cu:
4!
1234
=
= 6,
2! 2! 1 2 1 2
iar acestea sunt:
(, , , ); (, , , ); (, , , ), (, , , ), (, , , ), (, , , ).
Relaia anterioar se poate simplu generaliza pentru elemente, mprite n grupe, formate
din 1 , 2 , , elemente identice, numrul total de permutri rezult, n acest caz, egal cu:
!
,
1 ! 2 ! !
(1.4)
unde: 1 + 2 + + = .
Exemplul 1.9:
La prelucrarea unui reper, executat din tabl, trebuie realizate trei
alezaje de acelai diametru, precum i dou crestturi, de asemenea identice. S
se calculeze numrul de variante posibile, ale succesiunii de operaii, ce trebuie
luate n considerare la stabilirea tehnologiei de prelucrare.
5!
Soluie:
= 3!2! = 10.
1.5.2. ARANJAMENTE
Definiia 1.14:
Numrul de aranjamente obinute din obiecte luate cte se poate determina folosind
raionamentul prezentat n figura 1.4.
Constatm c primul obiect, ntr-un aranjament, l putem alege n moduri. Cel de-al doilea
obiect, se poate alege n 1 feluri, cel de-al treilea n 2 feluri, i aa mai departe, iar
obiectul din poziia , n + 1 moduri. Deci:
= ( 1) ( 2) ( + 1) =
!
.
( )!
(1.5)
Exemplul 1.10:
n cte moduri se pot aeza cinci persoane pe o canapea cu trei locuri?
Soluie:
5!
11
obiecte
poziii
( 1) ( + 1)
Figura 1.4
Dac sunt permise repetiiile de elemente, obinem un nou tip de aranjamente, i anume,
aranjamente cu repetiie, notate: . Numrul de aranjamente cu repetiie de obiecte luate
cte , este, conform figurii 1.5:
(1.6)
= ,
Deoarece, primul element dintr-o grup poate fi ales n moduri, cel de-al doilea element n
moduri, la fel i cel de-al element dintr-o grup.
Figura 1.5
poziii
obiecte
obiecte
obiecte
12
Exemplul 1.11:
Cte autovehicule pot fi nmatriculate ntr-un jude innd cont de faptul
c numerotarea actual presupune, pe lng o abreviere a judeului, un numr
din dou cifre i un cod obinut din trei litere?
3
2
= (10
1) 26
= (102 1) 263 = 1740024.
Soluie:
1.5.3. COMBINRI
Definiia 1.15:
Numrul de combinri a elemente luate cte se noteaz cu . Din tabelul 1.2 se constat
c numrul de combinri este mai mic dect numrul de aranjamente, datorit faptului c numai
inem cont de ordinea n care apar elementele. Deci, dac permutm elementele fiecrei
combinri obinem aranjamente. Relaia de calcul al numrului de combinri este:
!
=
=
.
! ! ( )!
(1.7)
Exemplul 1.12:
La un examen cadrul didactic a pregtit 15 bilete cu subiecte. Fiecare
student trebuie s rspund la 6 subiecte. Calculai cte situaii diferite pot
exista.
15!
Soluie:
6
= 15
= 6!(156)! = 5005.
Tabelul 1.2
Combinri
{, , }, {, , }, {, , }, {, , }, {, , }, {, , }
{, , }
{, , }, {, , }, {, , }, {, , }, {, , }, {, , }
{, , }
{, , }, {, , }, {, , }, {, , }, {, , }, {, , }
{, , }
{, , }, {, , }, {, , }, {, , }, {, , }, {, , }
{, , }
{1 , 2 }
13
{1 , 3 }
{1 , }
{2 , 2 }
{2 , 3 }
{2 , }
{3 , 3 }
{3 , }
{ , }
(1.8)
(1.9)
Exemplul 1.13:
Reconsiderm problema din exemplul 1.2 i dorm s calculm n
continuare numrul de evenimente elementare, distincte ale spaiului de
eantionaj.
Soluie:
5!
2
a) = 42 = 4+21
= 2!(52)! = 10.
4!
14
Curs 2.
2.3 PROBABILITI
Probabilitatea reprezint noiunea central a teoriei matematice a calculului probabilitilor. n
orice experiment aleatoriu exist ntotdeauna o incertitudine cu privire la faptul c un eveniment
particular al spaiului de eantionaj se va realiza, sau nu. Ca o msur a ansei, sau a gradului
de realizare, cu care ne putem atepta ca evenimentul s produc, este convenabil s utilizm o
valoare numeric cuprins ntre 0 i 1. Dac suntem siguri c anumite evenimente vor avea loc,
spunem c probabilitatea lor este de 1, sau 100%. Dac suntem siguri ca evenimentul nu va
avea loc, spunem c probabilitatea este zero. Dac, de exemplu, probabilitatea este 14, vom
spune c exist o ans de 25%, pentru ca acesta s se realizeze i o ans de 75% ca acesta s
nu se produc. Echivalentul afirmaiei anterioare, putem spune ca ansele sunt mpotriva
apariiei evenimentului, cu un scor de 75% la 25%, sau 3 la 1.
Definiia 2.1
Dei probabilitatea reprezint conceptul de baz al acestei teorii matematice, exist mai multe
accepiuni ale acestei noiuni, [MON 03], [KEL 97], [TAR 89]. n continuare, vom prezenta
aceste interpretri diferite, ale noiunii probabilitate, pentru cazul spaiilor de eantionaj
discrete, deoarece acestea ofer o soluie mai simpl din punct de vedere matematic.
Soluie:
8!
1
1
=
= 0.017857,
1,56.
56
n cel de-al doilea caz spaiul de eantionaj este alctuit din = 82 = 82 = 64 evenimente
elementare echiprobabile.
Probabilitatea evenimentelor elementare este, n acest caz:
( ) =
1
1
.
=
= 0.015625, 1,64
64
(2.1)
Exemplul 2.2:
O bil este extras dintr-o urn ce conine 6 bile roii, 4 bile albe i 5 bile
galbene. S se calculeze probabilitatea ca aceasta s fie:
a. roie;
b. alb;
c. galben;
d. s nu fie roie;
Soluie:
= 15 = 5 ;
4
= 15;
5
= 15 = 3 ;
=
4+5
15
= 5;
5
,
( ) =
( )
Figura 2.1
n tabelul 2.1, este prezentat o serie de rezultate obinute n urma aruncrii unei monede i
urmririi apariiei feei cu pajura.
Tabelul 2.1
Buffon
4040
2048
0,507
K. Pearson
12000
6019
0,5016
K. Pearson
24000
12012
0,5005
() = lim
(2.2)
Aceast valoare poart denumirea de probabilitate statistic i face posibil utilizarea teoriei
probabilitilor la analiza statistic a fenomenelor aleatorii.
Exemplul 2.4:
O instalaie pilot a produs diferite loturi de oel cu urmtoarele caracteristici:
Rezistena la
rupere sczut
Rezistenta la
rupere ridicat
43
Nivel sczut de
impuriti
Nivel ridicat de
7
6
impuriti
Considernd c aceste rezultate sunt reprezentative pentru producia firmei,
s se calculeze probabilitatea ca produsele s fie:
a. Cu un nivel sczut de impuriti;
b. Cu rezisten ridicat la rupere;
c. Cu nivel ridicat de impuriti i rezisten la rupere ridicat;
d. Cu nivel sczut de impuriti i rezisten la rupere sczut.
Soluie:
47
a.
() = 60 = 0.7833.
a.
() = 60 = 0.8166
49
6
b. () = 60 = 0.1.
c.
() = 60 = 0.0666.
2.
0
= = 0.
Definiia 2.5
3 + 5 + 6 3 5 6
=
+
+
= Pr(3 ) + Pr(5 ) + Pr(6 ).
() = Pr( ) =
=1
=1
= = 1.
Exemplul 2.5:
Considerm problema din exemplul 2.1. S se calculeze probabilitatea
evenimentului ce const din extragerea primei bile numerotate cu cifra unu, iar
pentru cea de-a doua bil nu conteaz numrul inscripionat pe ea.
Soluie:
Deci, () = 7 56 = 0.125.
Pentru cazul al doilea, cnd reintroducem n urn bila extras, evenimentul
considerat este de forma:
= {(), (), (), (), (), (), (), ()}.
1
Deci, () = 8 64 = 0.125.
Se constat c i aceast definiie prezint o serie de neajunsuri:
a. Nu caracterizeaz ntr-un mod unic ansa de realizare a unui eveniment. Ne d doar
posibilitatea de a compara frecvena apariiei unui eveniment, ntr-o serie de probe, cu
alt serie, pentru care numrul de probe este mai mic sau mai mare;
Acest concept a fost dezvoltat datorit necesitii de a realiza integrri pe mulimi arbitrare, i
nu numai pe intervalele reale, pe care se integra de obicei. Conceptul e important n analiza
matematic i reprezint un fundament riguros pentru teoria probabilitilor i statistic.
Definiia 2.7
()
.
()
(2.3)
()
()
16
1300
1245
1200
Figura 2.2
1300
1215
Cu tot suportul consistent al teoriei msurii i acestei definiii i-au fost aduse numeroase critici,
n special, privind modului arbitrar de alocare al valorii probabilitii, pentru un eveniment
oarecare. Aceast accepiune reprezint, totui, un pas nainte pentru calculul probabilitilor
ntruct permite abordarea probabilitilor i pentru cazul spaiilor de eantionaj infinite.
O bil este extras aleatoriu dintr-o urn ce conine 10 bile roii, 8 bile
albe i 6 bile albastre. Calculai probabilitatea ca aceast bil s fie:
a. Roie;
b. Alb;
c. Albastr;
d. S nu fie alb;
e. S nu fie roie sau alb.
n magazia unei companii se afl un lot de materie prim alctuit din
500 de piese. tiind c 4 dintre ele sunt piese neconforme, calculai
probabilitatea ca extrgnd aleatoriu o pies aceasta s fie conform.
Teoria se bazeaz pe un spaiu de eantionaj S, finit sau infinit i un sistem (), de submulimi
ale lui , vezi tabelul 1.1. Elementele sistemului (, ), adic submulimile lui S sunt denumite
evenimente aleatorii, [BER 00], [MON 03].
Pe baza sistemului (, ), de evenimente aleatorii, n care = ,reprezint evenimentul sigur,
, evenimentul imposibil, iar i evenimente complementare, probabilitatea de apariie a
unui eveniment este definit pe baza sistemului de axiome al lui Kolmogorov:
Axioma 1:
De existen i unicitate
Fiecrui eveniment aleatoriu, , din cmpul de evenimente i este ataat un
numr real nenegativ (), numit probabilitatea lui .
Axioma 2:
A unitii de msur
Probabilitatea evenimentului sigur, , este unu, () = 1.
Axioma 3:
De aditivitate
Dac evenimentele 1 , 2 , . . . , , . . . , sunt incompatibile dou cte dou,
= , , =
1, , atunci:
(1 2 3 ) = ( ).
(2.4)
=1
Fie o mulime nevid, iar () o familie de pri ale lui . Cuplul format
din (, ) se numete cmp finit de evenimente, dac familia verific
condiiile:
1. () i ().
2. A () ().
3. A, B () ()i ().
4. A, B (), dac \ ().
Definiia 2.9:
Fie o mulime nevid, iar () o familie de pri ale lui . Cuplul format
din (, ) se numete cmp infinit de evenimente, dac familia verific
condiiile:
1. () i ().
2. A () ().
3. A, B () ()i ().
4. A, B (), dac \ ().
5. (),
=1 () =1 ().
Avnd la baz operaiile algebrice ale teoriei mulimilor, precum i axiomele enunate mai sus,
pentru un cmp de evenimente finit sau infinit, se pot deduce urmtoarele consecine ale
probabilitilor, ataate acestor evenimente:
1. Probabilitatea evenimentului imposibil este zero:
() = 0.
(2.5)
Figura 2.3
(2.6)
(2.7)
)
Ecuaia anterioar este adevrat doar n situaia n care 0 () 1, i 0 (A
1, deoarece probabilitatea oricrui eveniment este un numr real nenegativ, conform
primei axiome.
3. Considerm un eveniment oarecare , (). Probabilitatea evenimentului contrar,
este:
(2.8)
() = 1 (),
Aceast proprietate rezult din ecuaia (2.7).
10
(2.9)
Figura 2.4
Aplicnd cea de-a treia axiom asupra relaiei anterioare i aranjnd, apoi, termenii se
obine relaia (2.9).
5. Probabilitatea este monoton:
() (),
(2.10)
dac i , ().
Pornind de la ecuaia (2.9) i de la prima axiom a lui Kolmogorov, adic:
0 (\) 1,
rezult tocmai relaia (2.10).
6. Considerm dou evenimente oarecare i , , (). Atunci:
(\) = () ( )
(2.11)
Figura 2.5
(2.12)
(2.13)
Figura 2.6
b. ( ).
d. ( ).
12
e. (
).
Soluie:
f. ( ).
j. (
) = 1 ( ) = 1 0.45 = 0.55;
k. ( ) = Pr() + Pr( ) Pr(A ) = 0.25 + 0.65 0.1 = 0.8,
sau
( ) = 1 (B) + ( ) = 1 0.35 + 0.15 = 0.8.
\
Figura 2.7
( ) = ( ) ( ) +
=1
=1
(2.14)
( ) + + (1)1 (1 2 ).
13
(2.15)
Exemplul 2.8:
Considerm experimentul aruncrii unui zar la care urmrim
evenimentele: = {1,2,3}, = {2,3} i = {2,4}.
S se determine probabilitatea evenimentului: .
Soluie:
Varianta I
{ } = {1,2,3,4}. ntruct evenimentele {1}, {2}, {3}, {4}, sunt
evenimente elementare, deci incompatibile, obinem:
4
() = 6 = 2 , () = 6 = 3i() = 6 = 3 .
2
( ) = {2,3} = 6 = 3 ;( ) = ( ) = {2} = 6
1
i ( ) = {2} = 6.
Rezult, utiliznd ecuaia (2.15):
1
{ } = 2 + 3 + 3 3 6 6 + 6 = 2 + 6 = 3.
9. Considerm evenimente, (),
1, . Probabilitatea interseciei celor n
evenimente este:
( ) = ( ) ( ) +
=1
=1
(2.16)
( ) + + (1)1 (1 2 ).
14
( ) = () + () ( ),
(2.17)
15
Curs 3.
()
Evenimentul
(|)
1
1
1
1
Figura 3.1
Soluie:
() =
() = .
( )
=
=
.
()
( )
.
()
(3.1)
(3.2)
innd cont de proprietatea de comutativitate a interseciei, din ecuaiile (3.1) i (3.2), rezult:
(|) (|)
( )
(3.3)
=
=
.
()
()
() ()
Tot pe baza ecuaiilor (3.1) i (3.2) putem deduce i regula de nmulire a dou evenimente
oarecare, i :
(3.4)
(|) () = (|) () = ( ).
Soluie:
Exemplul 3.3
ntr-un atelier care produce piese de schimb, utilajul de baz
funcioneaz 95% din timpul de lucru n condiii optime de mediu (evenimentul
A). De asemenea, se cunoate c n condiii optime de lucru procentul de
rebuturi este 1%, iar n condiii de lucru neconforme, utilajul produce 10%
rebuturi. S se determine probabilitatea ca o pies realizat n atelier s fie
neconform.
() = 0.95 i () = 0.05.
Dac notm cu evenimentul producerii de rebuturi, putem scrie:
(|) = 0.01 i (|) = 0.1.
Conform figurii 3.2, rezult:
() = ( ) + ( ) = 0.095 + 0.005 = 0.01.
Deoarece, ( ) = () (|) = 0.95 0.01 = 0.0095
i ( ) = () (|) = 0.05 0.1 = 0.005.
() = 0.95
() = 0.05
(|) = 0.99
(|) = 0.9
(|) = 0.1
(|) = 0.01
( )
Condiiile de funcionare
ale utilajului
( )
( )
Calitatea produselor
( )
Figura 3.2
Definiia 3.2
Definiia 3.3
Pentru a putea deduce relaia dintre probabilitile a dou evenimente independente considerm
ecuaiile (3.1) i (3.2).
Conform definiiei 3.3, rezult c:
(|) = ()
i
(|) = ().
Introducnd expresiile anterioare n ecuaiile (3.1) i (3.2), obinem pentru cazul a dou
evenimente independente:
() () = ( ).
(3.5)
Deci, pentru dou evenimente independente probabilitatea interseciei acestor evenimente este
egal cu produsul probabilitilor lor.
Exemplul 3.4
O companie cu 488 de angajai, din care 122 de femei, la finalul anului
trecut a promovat ntr-o clas superioar de salarizare 96 de angajai, din care
24 de femei. Precizai dac decizia de cretere a salariului este
nediscriminatorie ntre brbai i femei.
Soluie:
Promovai:
Nepromovai:
TOTAL:
Brbai:
72
294
366
Femei:
24
98
122
TOTAL:
96
392
488
(1 ) (2 ) ( ) = (1 2 ).
(3.6)
Exemplul 3.5
Considerm ansamblul mecanic prezentat n figura 3.3. S se calculeze
probabilitatea ca ansamblul s funcioneze, tiind c probabilitatea de
funcionare a fiecrui element component este cea prezentat n figur, iar
defectrile componentelor sunt independente.
Soluie:
= 1 ( ) = 1 0.053 = 0.999875.
=1
() = 0.85.
() = 1 (1 2 ) = 1 (1 ) (2 ) = 1 0.12 = 0.99.
(1 ) = 0.95
(2 ) = 0.95
(1 ) = 0.90
() = 0.85
(2 ) = 0.90
(3 ) = 0.95
Figura 3.3
Definiia 3.5
) = Pr(1 ) (2 |1 ) (3 |1 2 )
=1
(3.7)
( |1 2 1).
Ecuaia (3.7) reprezint doar una din cele ! relaii echivalente care pot fi stabilite n acest caz
i se deduce, dup cum urmeaz.
(1 2 )
;
(1 )
(1 2 3 )
;
(1 2 )
(1 |1 2 2 ) =
( |1 2 1 ) =
Pr(1 2 1 )
;
Pr(1 2 2 )
Pr(1 2 )
.
Pr(1 2 1 )
6 14 5
= 0.18206.
25 24 23
3! 16 114 15
= 0.18206.
325
6 14 5
= 0.0304.
25 24 23
() =
( ) (| ).
(3.8)
=1
Figura 3.4
Deoarece { }=1, reprezint un sistem complet de evenimente, putem scrie urmtoarele relaii:
=1 = i = .
De asemenea, conform figurii 3.4, rezult:
= = A (
) =
=1
( ).
=1
( ).
() =
=1
adic:
( ) = ( ) (| ),
n final se obine:
() =
( ) (| ),
=1
(3.9)
Notm:
evenimentul prelevrii pieselor din primul lot, () = 0.5;
evenimentul prelevrii pieselor din cel de-al doilea lot, , ( ) = 0.5;
evenimentul ca din cele 20 piese prelevate 12 sunt conforme i 8
neconforme.
8
8
12
20! 12
88
12
88 12
(|) =
=
= 0.000189;
20
20
12! 8!
100
100
12
8
125
25
(| ) =
= 0.005246.
20
150
Rezult:
() = 0.5 0.000189 + 0.5 0.005246 = 0.002717.
( |) =
=
Pr( ) Pr(| )
.
Pr(1 ) Pr(|1) + Pr(2 ) Pr(|2) + + Pr( ) Pr(| )
(3.10)
( ) (| )
.
()
Dac, n aceast relaie, nlocuim numitorul cu expresia formulei probabilitii totale, relaia
(3.8), se obine:
( ) (| )
( |) =
,
=1 ( ) (| )
formula lui Bayes.
Exemplul 3.8
O anumit Societate comercial se aprovizioneaz cu materiale de la 4
furnizori, conform tabelului alturat.
Presupunnd c procentul de neconformiti realizat de fiecare dintre aceti
furnizori este, respectiv 5%, 3%, 2%8%, s se determine probabilitatea ca
un produs aprovizionat, ales aleatoriu din magazia unde sunt depozitate acestea,
s fie neconform i s provin de la furnizorul .
Soluie:
Furnizorul
Cantitate
60%
20%
5%
15%
Notm cu:
- evenimentul ca un produs aprovizionat s fie neconform;
- evenimentul ca un produs aprovizionat s provin de la furnizorul B.
Conform teoremei lui Bayes, rezult:
{|} =
{|} {}
.
{}
= {|}
Deci,
{|} =
0.03 0.20
= 0.122.
0.05 0.6 + 0.03 0.20 + 0.02 0.05 + 0.08 0.15
Exemplul 3.9
ntr-o anumit comunitate, recensmntul populaiei a evideniat
urmtoarea situaie, referitoare la numrul de copii din cadrul unei familii:
Numrul de copii/familie:
Probabilitatea:
0.20
0.50
0.25
0.05
{1} = {| } { }
=0
( ) 0.25 0.5
=
= 0.3174.
{}
0.39375
10
Curs 4.
Deoarece rezultatul obinut, n urma efecturii de probe n cadrul unui experiment, nu este
cunoscut n avans, valoarea rezultat a variabilei noastre nu este nici ea cunoscut n avans. Din
acest motiv, n teoria probabilitilor a fost introdus un nou concept, de baz, pentru variabila
care asociaz o valoare numeric fiecrui rezultat al unui experiment aleatoriu. Este vorba de
variabila aleatorie, [GIB 76], [MET 76], [SPI 01]:
Definiia 4.1:
Soluie:
=
=
=
=
=
=
=
{, , } {, , } {, , } {, , } {, , } {, , } {, , }
=
{, , }
1 = 0
2 = 1
2 = 1
2 = 1
2 = 2
2 = 2
2 = 2
3 = 3
( ):
1
8
1
8
1
8
1
8
1
8
1
8
1
8
1
8
2 = {, , }
5 = {, , }
8 = {, , }
3 = {, , }
6 = {, , }
1 = {, , }
4 = {, , } 7 = {, , }
:
0
Figura 4.1:
Se poate demonstra c dac i sunt dou variabile aleatorii, n sensul definiiei 4.2, atunci
+ , , , , 1, sau , unde , sunt de asemenea variabile aleatorii.
Variabilele aleatorii le putem clasifica n funcie de tipul spaiului de eantionaj pe care sunt
definite. Distingem astfel:
a. Variabile aleatorii discrete.
n unele experimente, putem nregistra n urma efecturii de probe, serii finite de valori
numerice reale, limitate la valorile discrete ce aparin unui domeniu al axei reale, cum ar
fi cazul exemplului 4.1, punctele a i b. n alte experiene, cum ar fi cazul exemplului 4.1,
punctul c, putem obine un numr infinit de valori numerice distincte.
Definiia 4.3:
2 = {, , } 5 = {, , }
3 = {, , }
( ) = ( = )
8 = {, , }
6 = {, , }
1 = {, , }
4 = {, , } 7 = {, , }
0
Figura 4.2:
(4.2)
i
(4.3)
( ) = { },
atunci, probabilitatea (4.3) definete o nou funcie, : [0.1], numit
funcia de repartiie a variabilei aleatorii , notat cu:
(4.4)
() = { }.
2 = {, , } 5 = {, , }
3 = {, , }
() = ( )
8 = {, , }
6 = {, , }
1 = {, , }
4 = {, , } 7 = {, , }
Figura 4.3:
Exemplul 4.3
Considerm problema din exemplul 4.2. S se calculeze funcia de
repartiie.
Soluie:
1
funciei de repartiie:
(4.5)
(4.6)
(4.7)
= 0 1
Dar:
() = ( ) i (0 ) = (),
=0
De asemenea,
(1 ) = (0 ),
( ) (1 ) = (|() ) (|() 1 ) = ( )
Rezult, c
(0 ) = (1 ) + [(2 ) (1 )] + + [(+1 ) ( )] +
Deci, (0 ) = lim ( ), adic () este continu la stnga n orice punct 0 .
1
Figura 4.4:
+1
11 +1 0
Din relaia (4.4), tragem concluzia c funcia de repartiie ne permite s calculm probabilitile
asociate tuturor valorilor pe care le poate lua variabila aleatorie, utiliznd intervale de forma
(4.2).
S-a preferat definirea funciei de repartiie sub forma ecuaiei (4.4), deoarece ea ne permite s
determinm cu uurin probabiliti de forma: ( = ), ( < ), ( < < ) i
( ).
Cu alte cuvinte, pentru a cunoate probabilitile tuturor evenimentelor de forma { }, unde
reprezint un interval al dreptei reale, este suficient s cunoatem probabilitile
evenimentelor de forma { }, pentru orice .
Pentru a ilustra modul de calcul al probabilitii, pentru cazul n care variabila aleatorie ia valori
cuprinse ntr-un interval al axei reale, delimitat de dou puncte i , vom evidenia
urmtoarele evenimente, conform schiei alturate:
= { < }, = { < }; = { = } i = { = }
ntre cele patru mulimi se pot stabili urmtoarele relaii:
; ( ) ; ( ) i ( ) ( ).
Figura 4.5:
Rezult :
a. ( < ) = [(B D)\(A C)] = ( ) ( ) =
= ( ) ( ) = () ().
b.
c.
( < ) = [B\A] = () () =
= () () ( = ) + ( = ).
d.
( ) = [(B D)\A] = ( ) () =
= () () + ( = ).
e.
( > ) = 1 ( ) = 1 ().
f.
( ) = 1 ( ) + ( = ) = 1 () + ( = ).
Din ecuaia (4.9) se observ c tabloul repartiiei unei variabile aleatorii discrete caracterizeaz
complet evenimentele elementare ce se pot asocia lui , din punctul de vedere al valorilor
variabilei aleatorii, precum i probabilitii lor de apariie. De asemenea:
( ) [0,1]
(4.10)
( ) = 1,
(4.11)
=1
1
Figura 4.6:
() = { } =
0,
dac < < 1
1 ,
dac 1 < 2
1 + 2 ,
dac 2 < 3
1 + 2 + 3 , dac 3 < 4
dac 3 < 4
=1
dac
{ 1,
Mai concis, ecuaia anterioar se poate scrie:
() = { } =
( ).
(4.12)
n cazul unei variabile aleatorii discrete, funcia de repartiie, ecuaia (4.12), trebuie s respecte
8
cele patru proprieti precizate la punctul 4.1. De aceea, alura funciei de repartiie este sub
forma unei scri, vezi figura 4.7.
()
=1 = 1.0
1
Figura 4.7:
Soluie:
13
12
11
22
12
13
12
13
12
12
15
14
13
15
14
13
15
14
13
35
=( )( )( )+( )( )( )+( )( )( )=
( = 2) = (, , ) + (, , ) + (, , ) =
13
13
13
= (15) (14) (13) + (15) (14) (13) + (15) (14) (13) = 35.
0
b) : (22
12
35
35
35
0
22
c) () =
35
34
35
{1
1 );
<0
0<1
1<2
2
d)
0.7
1.2
()
0.6
()
0.5
0.8
0.4
0.6
0.3
0.4
0.2
0.2
0.1
0
0
0
-2
22
(4.13)
Ecuaia (4.13) indic faptul c, n cazul unei variabile aleatorii continue valoarea probabilitii
unui eveniment elementar este zero. Afirmaia anterioar nu presupune faptul c acestea
reprezint evenimentul imposibil. n cazul unei variabile aleatorii continue, evenimentele
elementare, de forma = , unde , reprezint evenimente ale spaiului de eantionaj
avnd probabilitatea de apariie zero.
10
Ca o consecin a ecuaiei (4.13) rezult i urmtoarele relaii adevrate, pentru cazul unei
variabile aleatorii continue:
( ) = ( < ) = ( < ) = ( < < )
(4.14)
De asemenea, observm c n cazul unei variabile aleatorii continue, datorit proprietii (4.13)
nu mai putem utiliza o funcie de tipul celei de probabilitate, ca n cazul variabilelor aleatorii
discrete, pentru a exprima legea de repartiie, indicnd pentru fiecare valoare pe care o poate
lua variabila aleatorie i probabilitatea ei de apariie.
Totui, pentru a pstra analogia cu cazul discret, n situaia unei variabile aleatorii continue
funcia de repartiie se exprim prin intermediul unei noi funcii, numite densitate de
probabilitate, [CRS 81].
Definiia 4.8:
() = () ,
(4.15)
()
Figura 4.8:
Proprietile
11
b.
c.
(4.16)
[ ()] = ().
() 0, , deoarece, conform definiiei 4.8, densitatea de probabilitate
reprezint derivata unei funcii nedescresctoare.
Deoarece,
() = ( ) = () = () = 1,
rezult:
() = () = 1.
(4.17)
d. O funcie, (), ce ndeplinete proprietile precizate prin definiia 4.8 i prin ecuaia
(4.17) are o alur ca cea din figura 4.9, adic este definit pe axa real, sau pe un domeniul
al acestei axe, este pozitiv, iar suprafaa delimitat de curba () i axa are suprafaa
egal cu 1.
e. Conform ecuaiilor de definiie (4.3) i (4.15), rezult:
() = ( ) = ()
(4.18)
0.6
()
0.5
0.4
0.3
0.2
0.1
0
-2
Figura 4.9:
-1
f. Semnificaia geometric a relaiei (4.18) rezult din figura 4.10. i anume, probabilitatea
( ) = () reprezint suprafaa de sub curba densitate de probabilitate cuprins
ntre i verticala trasat n punctul .
g. Valoarea probabilitii ( < ) se calculeaz cu relaia:
( < ) = () () = () ,
12
(4.19)
()
() = ()
Figura 4.10:
= ( < ) = () ,
(4.20)
()
()
() ()
Figura 4.11:
( > ) = 1 () = () ,
(4.21)
() = () + () = 1.
13
()
()
1 ()
Figura 4.12:
(4.22)
()
Probabilitatea elementar
Figura 4.13:
() = 1
(4.23)
Deoarece,
() = () + () + () = 1
14
() = () = 0
, i () = 1, deci:
10
20
+ (20 ) = 1
0
10
Rezult:
=10
=20
2
( 20)2
|
+
|
= 100 = 0.01
2 =0
2
=10
b)
0.12
()
0.1
0.08
0.06
0.04
0.02
0
-20
-10
10
20
30
0.01 ,
dac 0 < 10
() = {0.01 (20 ), dac 10 < 20
0,
dac 0 > > 20
c) Funcia de repartiie are expresia:
15
40
0
dac 0
0.005 2
dac 0 < 10
() = () = {
.
2
0.2 0.005 1.0 dac 10 < < 20
1
dac 20
1.2
()
1
0.8
0.6
0.4
0.2
0
-20
d)
-10
-0.2
10
20
20
30
40
1
, sau
2
10
1
( 10) = 1 0.01 = , sau
2
0
16
Curs 5.
Pentru precizarea, n continuare, a expresiilor analitice ale acestor caracteristici numerice, vom
considera cele dou cazuri distincte:
a. Cazul unei variabile aleatorii discrete, , avnd tabloul repartiiei de probabilitate de
forma:
1 2
: ( ) ,
1, .
1
2
,
=
=1
(5.1)
( ) ,
=
=1
(5.2)
,
() = =
=1
(5.3)
() = =
=1
,
=1
()
{ ()
(5.4)
Din ecuaia (5.4) rezult semnificaia fizic a mediei teoretice. Acesta reprezint de fapt, centrul
de greutate al valorilor variabilei aleatorii.
Definiia 5.4:
Dac X este o variabil aleatorie, atunci noua variabil aleatorie definit prin
relaia:
= ()
(5.5)
mediei teoretice:
(5.6)
(5.7)
Definiia 5.6:
Fie o variabil aleatorie i . Dac valoarea medie a abaterii variabilei
aleatorii, [ ()] exist, atunci aceast valoare medie se numete momentul centrat de
ordinul q al variabilei aleatorii:
= [ ()] = ( ) .
(5.8)
(5.9)
2
2
),
+ : (
, =
1, , i , = Pr{( = ) ( = )},
), unde = 1,
,
iar,
( + ) = ( + ) , = , + , =
,
= , + ,
Dar,
, = {( = ) ( = )} = {[( = ) ( = )]} =
= [( = ) (( = ))] = [( = ) ] = Pr( = ) = .
Analog, rezult i:
, = ( = ) = .
Deci,
( + ) = + = () + ().
3.
(1 + 2 + + ) = ( )
(5.10)
=1
4.
( ) = ()
Demonstraie: Noua variabil aleatorie este de forma:
1 2
: (
2
1
Deci,
(5.11)
).
( ) = = = ()
=1
5.
=1
( + ) = () +
Demonstraie: Noua variabil aleatorie + este de forma:
+ 1 + 2 +
+ : (
1
2
Deci,
(5.12)
+
).
( + ) = ( + ) = + = () +
=1
6.
=1
=1
(1 1 + 2 2 + + ) = ( )
(5.13)
=1
(5.14)
, = Pr{( = ) ( = )} = .
Deci,
( ) = , = = = () ().
,
8.
=1
=1
(5.15)
Dac exist momentele de ordinul doi ale variabilelor aleatorii i , atunci momentul
variabilei aleatorii Y este:
(5.16)
|( Y)| ( 2 ) ( 2 )
Inegalitatea (5.16) poart numele de inegalitatea lui Schwartz.
( ) ,
(()) =
=1
(5.17)
= (1)
(5.18)
=0
= [( ) ] = [(1) ] =
=0
= (1) ( ) = (1) .
=0
=0
Exemplul 5.1
O variabil aleatorie are funcia densitate de probabilitate:
1
() =
i 20 40.
20
S se calculeze:
a. Media i momentul de ordinul doi al variabilei aleatorii ;
b. Momentul centrat de ordinul doi al variabilei aleatorii .
Soluie:
40
40
a. = 20 () = 20
40 2
40
=40
= 40|
20
2 = 20 2 () = 20
20
=20
3 =40
= 60|
=20
40 (30)2
40
c. 2 = 20 ( )2 () = 20
=
20
(30)3 =40
60
1600400
40
56000
60
= 30.
= 933.333.
= 33.333.
=20
= 33.333.
5.4.2 MEDIANA
Definiia 5.7:
(5.19)
1
() = () = .
2
(5.20)
Geometric, mediana reprezint valoarea cea mai probabil a variabilei aleatorii, fiind egal cu
abscisa punctului prin care o paralel la axa mparte n dou pri egale aria delimitat de
curba () i axa absciselor, vezi figura 5.1.
()
0.5
0.5
Figura 5.1:
n cazul unei variabile aleatorii discrete, prin particularizarea ecuaiei (5.19) se obine:
1
( ) =
( ) = .
(5.21)
2
>
Exemplul 5.2
S se determine valoarea mediei i medianei pentru variabila aleatorie:
2
: ( 1
36
Soluie:
2+12
36
3
2
36
2(3+11)
36
4 5
6
3 4
5
36 36 36
+
3(4+10)
36
7 8
6 5
36 36
4(5+9)
36
9 10 11
2
4 3
36 36 36
5(6+8)
36
67
36
252
36
12
1)
36
= 7.
= 7.
Pentru o variabil aleatorie continu mediana este unic determinat de relaia (5.20). n cazul
variabilelor aleatorii discrete, pot exista situaii n care mediana nu este unic determinat.
Exemplul 5.3
S se determine valoarea mediei i medianei pentru variabila aleatorie:
1 2 3 4 5 6
: (1 1 1 1 1 1)
6 6 6 6 6 6
Soluie:
=6+6+6+6+6+6=
21
6
= 3.5.
3+4
2
= 3.5.
5.4.3 MODA
Definiia 5.8:
(5.22)
(5.23)
(5.24)
(5.25)
Figura 5.1:
Exemplul 5.4
Considerm variabila aleatorie din exemplul 5.2. S se determine
valoarea modei pentru variabila aleatorie, .
Soluie:
Rezult, = 7.
( )2 ,
() = 2 =
=1
(5.26)
dispersiei:
(5.27)
Ecuaia (5.27) indic faptul c dispersia unei variabile aleatorii reprezint momentul de
ordinul doi al abaterii variabilei aleatorii.
b. Dispersia unei variabile aleatorii reprezint momentul centrat de ordinul = 2.
() = 2 .
(5.28)
(5.29)
= 2 2 + 2 = 2 2 .
d. Din relaia de definiie a dispersiei, (5.26), rezult:
() 0.
(5.29)
(5.31)
(5.32)
10
( ) = 2 ( ).
=1
(5.33)
=1
n cazul unei variabile aleatorii continue, ecuaia (5.34) se obine pornind de la definiia mediei:
() = () = () + ()
0
() () = () = Pr( ) .
Pentru cazul variabilelor aleatorii discrete, demonstraia este identic, doar c se vor utiliza
sumele n locul integralelor.
11
2
.
2
(5.36)
n cazul unei variabile aleatorii continue, ecuaia (5.36) se deduce pornind de la definiia
dispersiei:
2 = ( )2 () = ( )2 () + ( )2 ()
( )2 () + ( )2 ()
2 () + 2 ().
(5.37)
| | <
()
( )
1 ( + )
Figura 5.3
12
Pentru situaiile n care este necesar s calculm probabilitile ca variabila aleatorie s aparin
unor intervale, ale cror limite sunt exprimate sub forma unor multipli ai dispersiei, vom utiliza
inecuaia lui Cebev scris sub forma:
1
(5.40)
{| | } 2 ,
sau
1
(5.41)
{| | < } 1 2 .
13
Curs 6.
1
= .
=1
Definiia 6.1:
(6.1)
Adic:
1
() = [(1 ) + (2 ) + + ( ) + + ( )] = ,
1
2
() = 2 [(1 ) + (2 ) + + ( ) + + ( )] = .
Dac, aceste rezultate le introducem n inegalitatea lui Cebev, relaia (5.36), obinem:
()
[| ()| > ] 2 ,
sau,
[| | > ]
Trecnd la limit pentru , rezult:
2
.
2
lim [| | > ] = 0.
( )2 ,
=1
= () =
(6.2)
()
= =
()
=1( )2
,
=1
=
( )2 ()
{
()
(6.3)
6.3.4 CUANTILE
Cuantilele (cvantilele) de ordin ( 2), reprezint cele 1 valori reale:
Definiia 6.4:
(6.4)
Ecuaia (6.4) se mai poate scrie, n cazul variabilelor aleatorii continue i sub forma:
1
() = () = () =
1
() = .
(6.5)
Geometric, cuantilele reprezint punctele de pe axa cu ajutorul crora se mparte aria de sub
curba densitate de probabilitate n pri egale, vezi figura 6.1.
Tot din figura 6.1 rezult i metoda de calcul ce trebuie utilizat pentru determinarea valorii
unei cuantile, :
( ) = .
(6.6)
Deci, cuantila de ordinul , , reprezint valoarea variabilei aleatorii pentru care funcia de
repartiie este egal cu (0 1), sau "sare" de la o valoare inferioar lui , la o valoare
superioar a lui , n cazul unei variabile aleatorii discrete:
( )
+1
, ( + 0)
, 1 1.
(6.7)
n acest caz, al variabilelor aleatorii discrete, cuantilele de ordinul nu sunt unic determinate.
0.45
0.4
()
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
1 2 2 1
Figura 6.1
Cuantilele de ordinul
(6.8)
+
, 0 1
() = {
.
2
0,
(, 0) (1, )
a) S se determine ();
b) S se determine coeficientul de variaie;
c) S se calculeze valoare intervalului intercuartilic.
1
1
. () = ( + ) = ( + 2 ) , deci
2
2
0
0,
<0
1
() = { ( + 2 ) , 0 1.
2
1, > 1
1
1
1 =1
7
. = ( + ) = 2 ( + )|
= .
2
3 4 =0 12
0
7 2
7 3
31
=1
=0
11
= = 144
c.
12
7
11
= 144.
= 0.4738.
1
2 )
(0.25 + 0.25
= 0.25 0.25 = 0.3660.
2
1
2 )
(0.75 + 0.75
= 0.75 0.75 = 0.8228.
2
= 0.75 0.25 = 0.8228 0.3660 = 0.4568.
()
0.3
0.25
= =
0.2
0.15
0.1
0.05
0
0
Figura 6.2
Repartiie simetric: = =
10
12
b. Dac valorile clor trei indicatori de poziionare se afl ntr-o relaie de forma:
< < ,
atunci repartiia variabilei aleatorii are asimetrie dreapta, figura 6.3.
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
()
Figura 6.3
c. Dac valorile celor trei indicatori de poziionare se afl ntr-o relaie de forma:
< < ,
atunci repartiia variabilei aleatorii are asimetrie stnga, figura 6.4.
1.2
()
0.8
0.6
0.4
0.2
0
1
Figura 6.4
1.5
2.5
3.5
Definiia 6.5:
=1 ( )3
3 =
3,
2
[=1 ( ) ]2
( )3 ()
3
=
3
(6.9)
[( )2 () ]
{
Asimetria furnizeaz urmtoarele informaii despre repartiia unei variabile aleatorii:
=1 ( )4
,
[=1 ( )2 ]2
( )4 ()
{[( )2 () ]
.
2 , pentru o v.a., , continu
(6.10)
Soluie:
a. = 1 () = 1 (1.5 2 + 1) =
=1
2
= ( 0.375 4 )|
2
=1
= 0.
(1.5 2 + 1) = 3 3 = 0 = 0.
0.2582
1
1
3 = 1( )3 () = 1 3 (1.5 2 + 1) =
4
= ( 4 0.25 6 )|
=1
=1
= 0.
2 = 1( )2 () = 1 3 (1.5 2 + 1) =
3
= ( 3 0.3 5 )|
=1
=1
= 0.0666.
. 4 = ( )4 () = 4 (1.5 2 + 1) =
1
1
=1
5 1.5 7
=(
)|
= 0.02857
5
7
=1
4
0.02857
4 = 4 =
= 6.428, deci repartiia este platicurtic.
0.00443556
0.6
()
0.5
Repartiie
leptocurtic
0.4
Repartiie
platicurtic
Repartiie
mezocurtic
0.3
0.2
0.1
0
0
Figura 6.5
Tipuri de exces
10
(6.11)
Fie i dou variabile aleatorii, astfel nct avem (), (), (), ()
i ( ). Se numete covariana, variabilelor aleatorii i , numrul real
notat cu (, ) i definit de relaia:
(, ) = {[ ()] [ ()]}
(6.12)
Dac particularizm ecuaia (6.12) pentru cazul a dou variabile aleatorii, i , obinem:
(, ) =
( ) ( ) [ = , = ] , pentru v.a. discrete
,
(6.13)
: ( ) , : ( ) , ,
covarianei:
(6.14)
(6.15)
(6.16)
( ) = ( ) + 2 ( , )
=1
=1
(6.17)
( ) = [ ( )] = {[ ( )]} =
=1
=1
=1
=1
= { 2 [( )]2 + 2 [ ( )] [ ( )]} =
= [ ( )]2 + 2 {[ ( )] [ ( )]} =
= ( ) + 2 ( , ).
10
(6.18)
Proprietile
coeficientului de corelaie:
(6.20)
1 (, ) 1.
(6.21)
sau
Demonstraie: Ptratul covarianei, are expresia:
[(, )]2 = {[ ()] [ ()]}2 .
Conform inegalitii lui Schwartz, (aplicat variabilelor aleatorii [ ()]
i [ ()], rezult:
{[ ()] [ ()]}2 [ ()]2 [ ()]2.
Membrul drept al inecuaiei anterioare reprezint, de fapt, () (). Deci:
[(, )]2 () (),
iar, ptratul coeficientului de corelaie, rezult:
2 (,
[(, )]2 () ()
) =
= 1.
() ()
() ()
b. (, ) = 1
Demonstraie: Pentru a demonstra aceast proprietate, calculm expresia (, ):
(, ) = {[ ()] [ ()]} = {[ ()]2 } = ().
Deci,
(, ) =
(, )
() ()
11
()
= 1.
()
c. (, ) = 1
Demonstraie: Demonstraia acestei proprieti este similar cazului anterior:
(, ) =
()
= 1.
()
d. Dac (, ) exist, atunci ntre dou variabile aleatorii i este o relaie liniar, adic
, , 0, astfel nct = + , dac i numai dac 2 (, ) = 1.
Demonstraie: Dac = + , atunci:
{[ ()] [ + () ]}2
2 (, ) =
=
() () ||
{[ ()] [ ()]}2
=
=
= 1.
||
() () ||
Aceast proprietate indic faptul c att covariana ct i coeficientul de corelaie reprezint
dou msuri relevante ale unei relaii liniare dintre dou variabile aleatorii.
Dac, relaia dintre cele dou variabile aleatorii este neliniar, aceti doi indicatori nu pot
oferi informaii consistente.
e. Dac: (, ) = 0, atunci (, ) = 0.
n acest caz, cele dou variabile aleatorii se numesc necorelate, vezi figura 6.6.
Demonstraie: Dac, (, ) = 0, atunci din ecuaia de definiie a coeficientului de
corelaie, (6.19), rezult: (, ) = 0.
Figura 6.6
f. Dac: (, ) > 0, cele dou variabile au o corelaie pozitiv, vezi figura 6.7a.
Demonstraie: Similar cazului e dac, (, ) > 0, atunci (, ) > 0, deoarece:
() () > 0.
g. Dac: (, ) < 0, cele dou variabile au o corelaie negativ, vezi figura 6.7b.
Demonstraie: Similar cazului f dac, (, ) < 0, atunci (, ) < 0.
12
b. corelaie negativ
a. corelaie pozitiv
Figura 6.7
=1
=2
=3
=4
1
, dac 1 = 2
4
1
, dac 2 = 4
Pr( = ) = 8
.
1
, dac 3 = 6
2
1
{8 , dac 4 = 8
S se calculeze (, ).
S se calculeze (, ).
Soluie:
1
1
1
1
1
1+ 2+ 3+ 4= 2 ;
4
8
2
8
2
1
1
1
1
() = 2 + 4 + 6 + 8 = 5;
4
8
2
8
2
1
1
1 2 1
1 2 1
1 2 1
() = (1 2 ) + (2 2 ) + (3 2 ) + (4 2 ) = 1;
2
4
2
8
2
2
2
8
1
1
1
1
() = (2 5)2 + (4 5)2 + (6 5)2 + (8 5)2 = 4;
4
8
2
8
(, ) = {[ ()] [ ()]} =
1
1
= (1 2.5) (2 5) + (2 2.5) (4 5)
4
8
1
1
+(3 2.5) (6 5) + (4 2.5) (8 5) = 2;
2
8
(, )
2
(, ) =
=
= 1.
() () 1 4
() =
13
Curs 7.
, = ( ) = i evident + = 1
de ori
Dac reprezint evenimentul ca din cele bile extrase exact s fie albe, vezi figura 7.1,
obinem:
() = (, ) = =
!
! ( )!
(7.1)
=1
=3
= 3
= 2
= 2
= 2
= 3
Figura 7.1
(3,3 ):
=2
( + ) =
= () ,
=0
=0
() = = ( + ) = 1,
=0
=0
=0
deoarece + = 1.
Exemplul 7.1
n urma realizrii unui studiu de pia, pentru promovarea unui nou tip
de produs electrocasnic, s-a stabilit c din zece persoane, care ncearc acest
produs, dou se decid s cumpere. S se determine probabilitatea ca din opt
persoane crora li se prezint noul produs:
a. jumtate s cumpere acest produs;
b. exact trei s nu cumpere;
Soluie:
1
1 1
2 2 2
),
(7.3)
0.3
( = )
( = )
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
0
10
a) = 10 i = 0.3
Figura 7.2
0
1
b) = 10 i = 0.5
10
0.3
( = )
0.25
0.2
0.15
0.1
0.05
0
0
10
c) = 10 i = 0.7
Figura 7.2
(7.4)
1, dac
Alura funciei de repartiie, a modelului statistic binomial, pentru diferite valori ale parametrului
p, este prezentat n figura 7.3.
1.2
1.2
()
()
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
-2
10
-2
12
a) = 10 i = 0.3
b) = 10 i = 0.5
1.2
()
1
0.8
0.6
0.4
0.2
0
-2
c) = 10 i = 0.7
Figura 7.3.
10
12
10
12
n anexa II, de la finalul crii, se afl calculate valorile funciei de repartiie binomiale, pentru
parametrul n = 5 25 i pentru p = 0.01 0.99.
Valorile tipice
ale variabilei aleatorii binomial repartizate, [GIB 76], [HAS 75], [WIK 10]:
1. Media teoretic:
= () = (1 ) = .
(7.5)
=0
2. Mediana:
1
(7.6)
( + 1) 1 ( + 1)
(7.7)
2 = () = ( )2 (1 ) = (1 ).
(7.8)
3. Moda:
4. Dispersia:
=0
(7.9)
Exemplul 7.2
Dintr-un lot de piese, ce conine 10 % produse neconforme, sunt extrase
aleator 4 piese. Dup fiecare extragere piesa este reintrodus n lot. S se
calculeze probabilitatea ca:
a) exact dou piese extrase s fie neconforme.
b) cel puin dou piese s fie neconforme.
Soluie:
Observaii:
Exemplul 7.3
Statisticile existente ntr-un magazine de piese auto arat c 40% dintre
clieni achiziioneaz produse folosind cardul de credit. tiind c ntr-o
diminea magazinul a avut 15 de clieni, s se determine:
a. Probabilitatea ca maxim 5 clieni s foloseasc cardul de credit;
b. Probabilitatea ca cel puin 13 clieni s utilizeze cardul de credit;
c. Probabilitatea ca cel puin 3 i maxim 8 clieni s utilizeze cardul de credit;
Soluie:
215( )
13 13
2 2
213( ) 22()
15 15
13
0.4
0.6 +
215( )
14 14
1 1
214( ) 21()
0.414 0.61 +
(7.12)
( = ) =
Alura funciei de probabilitate, a repartiiei Poisson, pentru diferite valori ale parametrului ,
este prezentat n figura 7.4.
( = )
( = )
0.7
0.4
0.6
0.35
0.3
0.5
0.25
0.4
0.2
0.3
0.15
0.2
0.1
0.1
0.05
a) = 0.5
b) = 1.0
( = )
( = )
0.3
0.16
0.14
0.25
0.12
0.2
0.1
0.15
0.08
0.1
0.06
0.04
0.05
0.02
0
0
10
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
c) = 2.0
Figura 7.4
c) = 8.0
n teoria probabilitilor i statistic, repartiia Poisson, sau repartiia evenimentelor rare, este
un model statistic discret care exprim probabilitatea ca o serie de evenimente s apar ntr-o
perioad fixat de timp, dac aceste evenimente apar cu o rata medie cunoscut i independent
de timp, de la ultimul eveniment nregistrat. Repartiia Poisson poate fi utilizat, de asemenea
i pentru numrul de evenimente n alte tipuri de intervale specificate, cum ar fi distant,
suprafa sau de volum.
Deci, valorile, , pe care le poate lua variabila aleatorie , reprezint numrul de evenimente
care apar ntr-un anumit interval.
Funcia de repartiie, a modelului statistic Poisson este de forma:
0, dac < 0
F() = Pr( ) =
=0
, dac 0 <
!
(7.13)
{1, dac
Alura funciei de repartiie, a modelului statistic Poisson, pentru diferite valori ale parametrului
, este prezentat n figura 7.5.
1.2
()
1.2
()
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
-5
10
-5
a) = 0.1
()
0.8
0.8
0.6
0.6
0.4
0.4
0.2
10
-10
c) = 2.0
Figura 7.5
10
1.2
0.2
-5
b) = 1.0
1.2
()
10
c) = 8.0
20
30
n anexa III, de la finalul crii, se afl valorile funciei de repartiie Poisson, calculate pentru
parametrul = 0.1 15.0.
Valorile tipice
ale variabilei aleatorii Poisson repartizate, [GIB 76], [HAS 75], [WIK 10]:
1. Media teoretic:
= () =
=0
= .
!
(7.14)
2. Mediana:
+
1 0.02
(7.15)
3. Moda:
Dac valoarea parametrului este un numr natural, atunci:
1 = 1 i 2 =
Dac valoarea parametrului nu este un numr natural, atunci:
=
n ecuaia (7.15) i (7.17), prin , s-a notat partea ntreag a valorii .
(7.16)
(7.17)
4. Dispersia:
= () = ( )2
=0
= .
!
(7.18)
(7.19)
Exemplul 7.4
Numrul de defecte de material constatate ntr-un atelier de estorie
este Poisson repartizat cu media de 0.1 defecte/m2. S se determine
probabilitatea ca:
a) ntr-un m2 s determinm 2 defecte de material?
b) n 10 m2 s avem doar un defect?
c) n 20 m2 s nu existe nici un defect?
Soluie:
a)
= 0.1 ( = 2) =
0.1 0.12
2!
b) = 0.1 10 = 1 ( = 1) =
= 0.0045.
1 11
1!
2
c) = 0.1 20 = 2 ( = 0) =
Observaii:
= 1 = 0.3679.
= 0.1353.
(7.20)
Pr( = ) =
( ) (1 )
=
( 1) ( 1) ( + 1)
=
(1 ) (1 )
!
( 1) ( 1) ( + 1)
=
(1 )
(1 )
!
1 [1 (1)] [1 ( 1)]
=
(1 )
.
[1 ()]
!
i
1 [1 (1)] [1 ( 1)]
= 1.
[1 ()]
Rezult:
Pr( = ) =
.
!
lim
(7.21)
Exemplul 7.5
O firm realizeaz filtre de ulei n condiiile n care 2% din produse sunt
neconforme. S se determine probabilitatea ca ntr-un container, conine 100 de
produse, s existe maxim trei filtre neconforme.
Soluie:
2 2
( 3) = (3) =
= 0.857,
!
=0
( 3) = (3) = 100
0.02 0.98100 = 0.859.
=0
10
Prima aplicaie a repartiiei Poisson se refer la numrul de decese din armata Prusac,
cauzate de loviturile cailor;
Teoria ateptrii;
Calcul aproximativ al probabilitilor evenimentelor binomial repartizate;
Controlul statistic de recepie i n metodele de inspecie prin atribute;
Calculul i construcia fielor de control pentru numrul de neconformiti/unitatea de
produs i pentru numrul de neconformiti, n cadrul controlului statistic al proceselor.
Modelarea apariiei bolilor rare (de exemplu leucemia), cu excepia celor infecioase, la
care apariia mbolnvirilor nu este independent;
Accidente de main i modelarea distanei optime dintre autovehicule n trafic;
Rspndirea animalelor pe cale de dispariie;
Defectarea mainilor-unelte.
11
(, ) =
!
!
=
,
! ( )! +
! ( )! +
+
(7.22)
unde , i + .
7.3.3.2 REPARTIIA HIPERGEOMETRIC
Definiia 7.3:
( = ) =
, pentru = 0,1, , i , , + .
(7.23)
Forma cea mai utilizat a repartiiei hipergeometrice se obine pornind de la ecuaia (7.23), prin
utilizarea notaiilor:
=+
{
.
=
Rezult:
( = ) =
, pentru = 0,1, ,
(7.24)
i , , , < , < .
i se noteaz, ~(, , , ).
Semnificaia valorilor variabilei aleatorii hipergeometric repartizate este:
( = )
( = )
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
a) = 5, = 5 i = 10
Figura 7.6
b) = 30, = 5 i = 50
12
( = )
0.7
0.6
0.5
0.4
0.3
0.2
0.1
c) = 5, = 5 i = 50
Figura 7.6
F() = Pr( ) =
, dac 0 < .
(7.25)
=0
{ 1, dac
Alura funciei de repartiie, a modelului statistic hipergeometric, pentru diferite valori ale
parametrilor , i , este prezentat n figura 7.7.
1.2
1.2
()
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
-4
-2
-4
-2
()
1
0.8
0.6
0.4
0.2
0
-4
-2
c) = 5, = 5 i = 50
Figura 7.7
b) = 30, = 5 i = 50
a) = 5, = 5 i = 10
1.2
()
13
Valorile tipice
1. Media teoretic:
= () =
=0
=
= .
(7.26)
(7.27)
2. Moda:
=
( + 1) ( + 1)
+2
(7.28)
3. Dispersia:
= () = ( )2
=0
=
.
(7.29)
i = .
(7.30)
.
1
(7.31)
Exemplul 7.6
Dintr-un lot avnd = 100 de piese, ce conine 5% produse
neconforme, este extras aleator un eantion de = 5 piese. S se calculeze
probabilitatea ca eantionul s conin exact o pies neconform:
Soluie:
= 100, = 5, = 0.05 = 5 i = = 95
51
1 1 51 95
5! 95! 5! 95!
Pr( = 1) =
=
=
= 0.2114.
4! 1! 4! 91! 100!
100
Observaii:
(7.32)
lim 2 = lim (
) = .
1
n aplicaiile practice se recomand utilizarea acestei aproximri, pentru:
(7.33)
< 0.1.
14
(7.34)
Exemplul 7.7
Un eantion de trei produse este extras, fr nlocuire, dintr-o populaie
de = 50 de produse, din care 6 sunt neconforme. S se calculeze
probabilitatea ca n acest eantion s existe maxim un produs neconform:
a. Utiliznd repartiia hipergeometric;
b. Utiliznd repartiia binomial.
Soluie:
( 1) = (1) =
=0
3
6 506
= 0.9653,
3
50
6
15
Curs 8.
1
2
1 2
)
2(
i se noteaz, ~(, , ).
Aceast repartiie statistic mai poate fi ntlnit i sub denumirea de repartiia Gauss Laplace.
Alura funciei densitate de probabilitate, a repartiiei normale, pentru diferite valori ale celor
doi parametri, este prezentat n figura 8.1.
Din analiza acestui model statistic se poate concluziona c:
()
0.9
0.8
0.7
= 2.0, 2 = 0.5
= 0, 2 = 0.2
0.6
0.5
0.4
= 0, 2 = 1
0.3
0.2
= 0, 2 = 5
0.1
0
-5
Figura 8.1
-4
-3
-2
-1
() = ( ) =
1 2
(
2 )
1
2
(8.2)
Alura funciei de repartiie, pentru diferite valori ale celor doi parametri, este prezentat n
figura 8.2.
1.2
()
1
= 2.0, 2 = 0.5
= 0, 2 = 5
0.8
0.6
= 0, 2 = 1
0.4
0.2
= 0, 2 = 0.2
0
-5
Figura 8.2
-4
-3
-2
-1
Calculul valorilor probabilitilor, prin utilizarea relaiei (8.2), reprezint o operaie destul de
dificil deoarece prin integrare nu se poate ajunge la o expresie explicit. Pentru a nltura acest
neajuns, este nevoie s apelm la schimbarea de variabil aleatorie:
=
Rezult:
(8.3)
+
1
( ) = (
) = ( + ) =
2 .
Variabila aleatorie Z, definit prin relaia (8.3), poart numele de variabil aleatorie normal
normat i are funcia densitate de probabilitate:
2
1
(8.4)
() =
2 .
2
Ecuaia (8.4) reprezint densitatea de probabilitate pentru o variabil aleatorie normal
repartizat cu = 0 i = 1. ntr-adevr:
1
() = (
) = [() ] = 0.
De asemenea
1
1
( 2 ) = 2 ( 2 2 + 2 ) = 2 [ 2 + 2 2 2 + 2 ] = 1.
1
2
(8.5)
Funcia (), definit prin ecuaia (8.5), poart numele de funcia integral Laplace. Aceast
funcie, mpreun cu ecuaia (8.3) permite calculul probabilitilor pentru diferite valori ale unei
variabile aleatorii normal repartizate, indiferent de combinaia de valori ale celor doi parametri,
i .
De asemenea, dac considerm dou valori reale, i , < , atunci:
( < < ) = (
) (
)
(8.6)
n anexa IV, de la finalul crii, tabelele IV.1 i IV.2 se gsesc calculate valorile funciei
integrale Laplace.
Exemplul 8.1
n cadrul unui atelier, pe un strung se realizeaz o pies cilindric cu
diametrul de 15+0.05
0.05 . Care este probabilitatea producerii de rebuturi tiind
c diametrul piesei este normal repartizat cu = 15.02 i = 0.02 .
Soluie:
()
14.95
15
= 15.02 15.05
Figura 8.3
Valorile tipice
ale variabilei aleatorii normal repartizate, [GIB 76], [HAS 75], [KEC 93]:
1. Media teoretic:
= () =
1
2
1 2
)
2(
(8.7)
2. Mediana:
= .
(8.8)
= .
(8.9)
3. Moda:
4. Dispersia:
2 = () =
1
2
( )2
1 2
(
)
2
= 2 .
(8.10)
(8.11)
Exemplul 8.2
Fie variabila aleatorie , normal repartizat, avnd funcia densitate de
probabilitate:
1 8 2
1
(
() =
2 2 ) .
2 2
S se determine:
a. Media i dispersia variabilei aleatorii, ;
b. S se determine cuantilele 0.05 i 0.95 .
Soluie:
a. = 8 i 2 = 22 = 4.
b. Cuantilele variabilei aleatorii normale normate sunt, conform anexei IV:
0.05 = 1.64 i 0.95 = 1.64.
Rezult:
0.05 = 0.05 + = 2 (1.64) + 8 = 4.72 ;
0.95 = 0.95 + = 2 1.64 + 8 = 11.28.
Observaii:
1 2
(
2 )
= 1.
= ,
=1
( < < + ) = ( ) ( ).
( ) = 1 ( ).
Deci:
(| | < ) = 2 ( ) 1.
(8.12)
(8.13)
()
68.3%
95.5%
99.7%
Figura 8.4
+ 2 + 3
Exemplul 8.3
O ferm ambaleaz cartofi n saci. Presupunem c greutatea unui sac de
cartofi este normal repartizat cu = 30 i abaterea medie ptratic =
2 . S se determine numrul de saci, ce trebuie ncrcai la o livrare de 6 ,
astfel nct greutatea transportului s nu depeasc cantitatea nominal cu mai
mult de 10%.
Soluie:
() = 0.10 1 (
600030
2
0.90 = 1.28
6000 30
2
6000 30
2
) = 0.10.
Media valorilor a observaii din orice tip de repartiie statistic, sau din repartiii
diferite avnd o medie i o abatere standard finite, aproximeaz o repartiie normal i nu
depinde de forma repartiiei iniiale;
Este utilizat n fizica statistic: vectorul vitez al moleculelor unui gaz are componentele
variabile aleatorii independente, normal repartizate;
= lim ( + + ) =
(8.14)
=
1
2
2
2
= ,
=1
100
= = = 100 0.5 = 50 i
=1
= 2 = 2 = 25
=1
60 50
( > 60) = 1 ( 60) = 1 (60) = 1 (
)=
25
= 1 (2) = 1 0.97725 = 0.02275.
Definiia 8.2, reprezint de fapt, un caz particular al teoremei limit central. Versiunea cu un
grad mai mare de generalitate, a teoremei limit central, aplicabil n anumite condiii iniiale,
atunci cnd variabilele aleatorii sunt independente, dar nu sunt identic repartizate, este:
Definiia 8.3:
( )
( )
) =
1
2
(8.15)
= ,
=1
=1
= = =
Rezult:
() = ( ) = ( ) = ( ) =
=
1
2
2 = (
(8.17)
).
Alura funciei densitate de probabilitate, a repartiiei lognormale, pentru diferite valori ale celor
doi parametri, este prezentat n figura 8.5.
1.6
()
=0
= 0.3
1.4
1.2
=0
= 1.0
=0
= 0.5
0.8
=0
= 0.3
0.6
0.4
=0
= 0.3
0.2
0
0
0.5
1.5
2.5
3.5
4.5
Figura 8.5
1 2
1
2( )
2
(8.18)
Alura funciei de repartiie, pentru diferite valori ale celor doi parametri, este prezentat n
figura 8.6.
Valorile tipice
ale variabilei aleatorii lognormal repartizate, [GIB 76], [KEC 93], [WIK 10]:
1. Media teoretic:
= () =
1
2
1 2
(
2 )
1 2
= +2
(8.19)
2. Mediana:
= .
3. Moda:
(8.20)
= .
(8.21)
4. Dispersia:
2
= () =
1
2
1 2 2
( +2 )
1 2
(
2 )
=
2
(8.22)
= 2+ ( 1).
5. Abaterea medie ptratic:
2
= () = 2+ ( 1).
(8.23)
1.2
()
1
0.8
=0
= 0.3
0.6
=0
= 0.3
=0
= 0.3
0.4
=0
= 0.3
=0
= 0.3
0.2
0
0
0.5
1.5
2.5
3.5
4.5
Figura 8.6
Observaii:
~ (, , 2 ).
=1
=1
10
Exemplul 8.5
Fie variabila aleatorie , lognormal repartizat, avnd = 5 i = 3.
S se determine:
a. ( 500);
b. ( > 1000);
c. (300 9000);
d. 0.50 ;
5005
a. ( 500) = (
) = (0.405) = 0.6554217
10005
)=
3005
c. (300 9000) = (
) 1 + (
)=
e. () = +2 = 5+2 = 13364.73.
2
2
() = 2+ ( 1) = 25+9 ( 9 1) = 1446078581990.51.
Domeniile de utilizare ale repartiiei lognormale:
11
() =
1
, pentru , , > i [, ].
(8.24)
i se noteaz, ~(, , ).
Alura funciei densitate de probabilitate, a repartiiei uniforme, pentru = 2 i = 6, este
prezentat n figura 8.7. Se constat c cei doi parametri ai repartiiei sunt:
- , reprezint un parametru de poziionare;
- , reprezint un parametru de scal;
- , reprezint amplitudinea domeniului de definiie al variabilei aleatorii .
Repartiia uniform continu, datorit formei sale, mai poate fi ntlnit i sub denumirea de
repartiia dreptunghiular sau rectangular.
0.3
()
0.25
0.2
0.15
0.1
0.05
0
0
Figura 8.7
() = ( ) =
=
,
(8.25)
pentru , , > i [, ].
ntr-adevr:
() = ( ) =
1
=
=
|
=
.
Reprezentat grafic, funcia de repartiie, a modelului uniform continuu, are alura din figura
8.8, dac = 2 i = 6.
Valorile tipice
ale variabilei aleatorii uniforme continue, [GIB 76], [KEC 94], [WIK 10]:
1. Media teoretic:
1
+
= () =
=
.
12
(8.26)
2. Mediana:
+
.
2
(8.27)
(8.28)
=
3. Moda:
4. Dispersia:
( )2
+ 2
= () = (
)
=
.
2
12
(8.29)
.
2 3
(8.30)
1.2
()
1
0.8
0.6
0.4
0.2
0
0
Figura 8.8
Observaii:
( ) =
=
.
13
() = () = 1 = .
Rezult:
() = ( ) = [ 1 () ] = [ ()] = ().
d. Generarea valorilor unei variabile aleatorii , provenind dintr-o repartiie
(), se realizeaz prin intermediul funciei inverse de repartiie i prin
utilizarea numerelor aleatorii uniform repartizate n intervalul [0, 1],
(, 0,1), vezi figura 8.9:
= 1 [( , 0,1)].
()
1.0
Figura 8.9
1 [(
, 0,1)]
Soluie:
= 0 i = 100.
60 0
= 1 0.6 = 0.4;
100 0
40
20
b. (20 40) = (40) (20) =
= 0.2.
100 100
a. ( > 60) = 1 (60) = 1
14
15
Curs 9.
9.3 STATISTICA
Atunci cnd omul nu a mai putut intui a nceput s msoare. Msurtorile i observaiile au
devenit prima treapt spre nelegerea legilor naturii. Dar, n acest fel, omul nu mai poate s
cunoasc direct realitatea, el poate numai s o aproximeze succesiv prin modele fizice si apoi
prin modele matematice. Dar aceste modele nu descriu exact realitatea. Ele o aproximeaz i
apar aa numitele erori. Unele erori sunt previzibile, altele ns sunt ntmpltoare (aleatorii).
Acest ultim tip de erori (aleatorii) au si ele legile lor de manifestare. Apar deci, fenomenele
aleatorii descrise prin variabilele aleatorii.
Teoria probabilitilor pleac de la ipoteza c se cunosc exact aceste variabile aleatorii (prin
funciile de probabilitate, funciile de repartiie, funciile caracteristice, etc.). Statistica pleac
de la msurtorile brute i caut s regseasc modelul probabilist, teoretic exact, care se afl
n spatele acestor msurtori.
Exemplul 9.1
Pentru determinarea expresiei ale funciei de probabilitate a repartiiei
hipergeometrice, raionamentul matematic a pornit de la o urn ce conine un
numr de N bile, din care a sunt bile albe i b sunt bile negre. Apoi, s-a stabilit
semnificaia variabilei aleatorii binomial repartizate: se extrag bile din urn,
una cte una, fiecare bil nu este reintrodus n urn dup constatarea culorii.
Valorile variabilei aleatorii astfel obinute reprezint evenimentele ca din n bile
extrase, k s fie de culoare alb.
Soluie:
Partea empiric a statisticii care se ocup de prelucrarea datelor obinute prin msurtori sau
observaii se numete statistic descriptiv. Aparatul matematic al teoriei probabilitilor, pus
n funciune pentru a studia i interpreta aceste date, n dorina de a specifica modelul
probabilistic real, care guverneaz fenomenul msurat sau observat, formeaz inferena
statistic. Dup ce cercettorul capt informaii suficient de clare despre fenomenul
probabilistic studiat, el va trebui s acioneze optim potrivit acestor informaii. Apare deci teoria
deciziei statistice, care este o ramur important a statisticii.
Definiia 9.1:
Definiia 9.2:
Identificarea i descrierea
problemei studiate;
Identificarea factorilor de influen
Delimitarea populaiei i a
caracteristicii statistice;
Stabilirea volumului de eantionaj
i a metodei de prelevare;
Prelevarea datelor de eantionaj
Sintetizarea i
structurarea informaiei
obinute;
Reprezentarea datelor de
eantionaj;
Calculul principalilor
parametri i indicatori
statistici.
1.
OBSERVAREA
STATISTIC
2.
PRELUCRAREA
STATISTIC
3.
ANALIZA I
INTERPRETAREA
REZULTATELOR
METODA STATISTICII
Figura 9.1:
scopul observrii;
stabilirea caracteristicilor ce vor fi nregistrate;
alegerea formularelor de nregistrare;
delimitarea timpului i locului observrii;
stabilirea msurilor organizatorice;
prelevarea datelor de eantionaj.
prelucrarea statistic, etap n care datele sunt sistematizate, reprezentate grafic i sunt
calculai principalii indicatorii statistici ce caracterizeaz fenomenul studiat;
analiza i interpretarea rezultatelor, etap n care sunt alese modele statistice, estimai
parametrii acestor modele, verificate ipotezele, formulate concluzii sau recomandri
bazate pe soluia problemei i fundamentate procesele decizionale.
populaia statistic;
unitatea statistic;
caracteristic statistic;
valoare observat;
eantion;
inferen statistic.
pentru o ramur a economiei naionale, populaia statistic este format din ansamblul
salariailor care lucreaz, n luna respectiv, n acea ramur). n schimb, dac se cerceteaz
evoluia n timp a unui fenomen, elementele populaiei statistice trebuie s reflecte dinamica
manifestrii fenomenului n perioada de timp studiat (de exemplu, pentru a se analiza evoluia
unei dimensiuni a unei piese, pe parcursul unei serii de fabricaie, populaia statistic poate fi
format din valorile cotei respective, nregistrate pe toat durata de fabricaie, a seriei
respective).
Definiia 9.3:
Cu variaie continu, care pot lua orice valoare din scala lor de variaie (exemple:
nlime, greutate, cifr de afaceri etc.);
Cu variaie discret, care nu pot lua dect anumite valori pe scala lor de variaie, de
regul numere ntregi (exemple: numrul de copii dintr-o familie, numrul de sate
dintr-un jude etc.).
Definiia 9.7:
Totalitatea valorilor diferite ale unei caracteristici, sau intervalul n care sunt
coninute acestea (domeniu de valori observate ale variabilei), se numete
scal.
Calitatea valorilor observate este un factor important care condiioneaz calitatea informaiilor
ce rezult dintr-un studiu statistic, realismul cunoaterii i eficienta deciziilor de aciune.
Prin urmare, veridicitatea (autenticitatea) valorilor observate printr-o metod oarecare
(specific cercetrii) concordanta acestora cu datele reale ale fenomenelor investigate
constituie un obiectiv fundamental (int) a oricrei metode de nregistrare (observare)
statistic. Acest obiectiv este, ns, greu de realizat deoarece chiar i prin respectarea tuturor
principiilor tiinifice de pregtire i de organizare a colectrii datelor nu se obin ntotdeauna
date absolut reale, n concordan cu manifestrile reale ale fenomenului investigat.
Aceasta nseamn ca n observarea statistica se nregistreaz i erori.
n general, prin eroare de nregistrare (observare) statistic, exprimat absolut sau relativ, se
nelege diferena dintre rezultatul obinut prin nregistrare si mrimea reala a caracteristicilor
(variabilelor) observate.
Aceste diferene (erori) sunt determinate de volumul nregistrrilor, de precizia mijloacelor de
msurare a datelor provenite din diverse surse (cunoscute sau necunoscute).
Sursele de erori se regsesc i n activitile care vizeaz nregistrarea i metodele de
nregistrare. Dintre acestea exemplificam:
Exemplele de mai sus sugereaz faptul c sunt factori obiectivi i subiectivi care conduc la erori
de nregistrare ntmpltoare, sistematice i de asemenea, la greeli de nregistrare.
Principale tipuri de erori statistice n etapa de observare sunt:
-
Erorile ntmpltoare sunt cele care provoac abateri n sensul mririi sau micorrii
nivelului real al fenomenului. Acestea pot surveni din neatenie i nu au un caracter
premeditat. n cazul populaiilor mari, acest tip de erori au un caracter redus.
Erorile sistematice sunt cele care produc abateri semnificative, de regul ntr-un singur
sens, de la realitatea observat. Sunt generate din nenelegere sau din rea credin.
Mrimea absolut a acestor erori este necunoscut, deoarece necunoscut este valoarea
adevrat a valorilor observate.
Erorile grosiere (greelile) se datoreaz fie lipsei de experien, fie incompetentei, fie
altor cauze. Diferena esenial dintre erori i greeli este aceea c acestea din urm pot fi
depistat i eliminat. Acest lucru presupune analiza sistematic (aprofundat) a datelor
nregistrate i un studiu detaliat a cazurilor n care valorile observate depesc limitele
admisibile.
n multe situaii practice, fenomenul pe care l analizm poate fi caracterizat printr-o mulime
de date care fie sunt greu de obinut, fie obinerea acestor date cost prea mult sau dureaz un
timp prea ndelungat. n aceste cazuri, din mulimea de date se extrag eantioane i informaiile
asupra eantioanelor se utilizeaz pentru inferena statistic. Un eantion este o submulime de
date extrase dintr-o populaie.
Definiia 9.8:
Definiia 9.9:
Definiia 9.10:
Definiia 9.11:
reprezint o valoare observat pentru o variabil aleatorie, iar observaiile din populaie
determin repartiia de probabilitate a variabilei aleatorii ce modeleaz fenomenul studiat.
Pentru a defini un eantion aleatoriu, se consider o variabil aleatorie care reprezint
rezultatul prelevrii unui element al populaiei. Presupunem, de asemenea, c cele valori ce
compun eantionul se obin independent, fr schimbarea condiiilor, sau a ansei de extragere
(extrageri independente). n aceste condiii, valorile de eantionaj pot fi considerate ca fiind
realizrile a variabile aleatorii independente:
1 , 2 , , , ,
n afara tipologiei de erori prezentat, mai pot fi amintite erorile de reprezentativitate (efective
sau poteniale ntlnite n cercetarea statistic).
Definiia 9.12:
Frecvena absolut este numrul de realizri (apariii) ale unui tip dat de
evenimente, sau numrul de observaii care aparin unei clase.
Frecvena absolut se noteaz cu , unde reprezint indicele categoriei, sau clasei respective,
1, .
Conform definiiei 9.13, rezult:
= ,
(9.1)
=1
Rezult,
(9.2)
= ,
1, .
= 1.0.
(9.3)
=1
Frecvena relativ a unei categorii este deci, proporia din numrul total de observaii, al
numrului de observaii care aparin acelei categorii.
Cele mai uzuale metode de descriere i reprezentare grafic a mulimilor de date calitative sunt
graficele (diagramele) cu bare, graficele circulare i graficele liniare.
Graficele cu bare constau din reprezentarea frecvenei absolute (sau a frecvenei relative),
corespunztoare fiecrei categorii, ntr-un sistem de axe de coordonate, n care pe o ax
figureaz categoriile, iar pe cealalt se traseaz proporional, prin bare sau dreptunghiuri,
valorile de frecven absolut (sau frecven relativ), ale fiecrei categorii.
Graficele circulare se obin prin mprirea unui cerc ntr-un numr de sectoare de cerc egal
cu numrul de categorii, unghiurile la centru ale acestor sectoare fiind proporionale cu
frecvena absolut (sau frecvena relativ) a fiecrei categorii.
Graficele liniare se utilizeaz mai ales pentru a descrie evoluia unui anumit fenomen i se
obin prin reprezentarea prin linii (drepte sau curbe) a dinamicii parametrilor statistici pe care
i reprezentm n sistemul de axe de coordonate.
Exemplul 9.2
Repartizarea angajailor pe departamente ntr-o societate comercial
este dat n tabelul de mai jos:
Departamentul
Numrul de angajai
Frecvena relativ
1120
0.56
540
0.27
200
0.10
140
0.07
2000
1.0
Total:
Soluie:
Figura 9.2:
Grafic cu bare
Figura 9.3:
Grafic circular
Etapa 2:
Definiia 9.15:
Funcie care depinde de variabilele aleatorii ale unui eantion poart numele
de statistic
Definiia 9.16:
Cnd observaiile asupra unui eantion sunt ordonate cresctor, dup valorile
lor:
(1) (2) (3) () () ,
fiecare dintre aceste observaii ordonate, este o valoare a unei variabile
aleatorii numit statistic de ordine.
Etapa 3:
Etapa 4:
Definiia 9.17:
Diferena dintre cea mai mare valoare i cea mai mic valoare, observate la o
caracteristic cantitativ, poat numele de amplitudine.
Etapa 5:
Definiia 9.18:
Definiia 9.19:
10
3
10 (),
(9.4)
sau cu relaia:
(9.5)
= ,
n general se recomand ca numrul de clase s fie .
Valorile obinute cu relaiile (9.4) i (9.5) se rotunjesc la valoarea ntreag cea
apropiat.
Etapa 6:
Etapa 7:
+1
= (1)
+1
= ()
Clasa j
Figura 9.4:
10
Etapa 9:
Definiia 9.20:
+ +1
,
1,
2
(9.6)
Etapa 11:
Etapa 12:
Definiia 9.21:
Repartiia de frecvene poate fi reprezentat grafic sub form de histogram, grafic cu bare
sau poligon al frecvenelor cumulate.
Definiia 9.22:
Definiia 9.23:
Definiia 9.24:
1
Figura 9.5:
+1
Histograma
11
1
Figura 9.6:
+1
Diagrama cu bare
+1
Figura 9.7:
Definiia 9.25:
1, .
Cu datele grupate n clase, frecvena absolut cumulat este definit numai de limitele clasei
i are expresia:
0
dac X<1
dac +1
(9.7)
=1
{ 1
Definiia 9.26:
dac > +1
dac +1
=1
{1
dac > +1
12
(9.8)
Exemplul 9.3
Se consider urmtorul eantion reprezentativ:
49.14, 48.19, 48.83, 49.74, 53.14, 50.37, 50.30, 48.89, 52.11, 50.25, 49.09,
51.42, 49.68, 48.11, 49.36, 48.38, 48.65, 49.92, 49.82, 49.00, 50.23, 49.75,
50.49, 49.18, 49.24, 51.93, 47.93, 48.36, 50.06, 50.32, 49.33, 51.27, 50.02,
50.45, 52.41, 51.64, 50.54, 49.30, 50.47, 50.40, 49.01, 51.92, 50.42, 48.77,
50.17, 52.89, 49.58, 50.66, 50.10, 50.26, 50.50, 49.83, 46.49, 50.08, 49.66,
50.90, 50.60, 50.71, 50.57, 49.14.
S se determine i s se reprezinte grafic repartiia de frecvene a datelor de
eantionaj.
Soluie:
(1) = 46.49
() = 53.14
= 60
= () (1) = 53.14 46.49 = 6.65
10
=1+
log(60) = 1 + 5.927 7
3
6.65
= =
= 0.95
7
Clasa
Limita
inferioar
Limita
superioar
Valoarea
central
1
2
3
4
5
6
7
46.49
47.44
48.39
49.34
50.29
51.24
52.19
47.44
48.39
49.34
50.29
51.24
52.19
53.14
46.965
47.915
48.865
49.815
50.765
51.715
52.665
1
5
13
17
15
6
3
0.017
0.083
0.217
0.283
0.250
0.100
0.050
1
6
19
36
51
57
60
0.017
0.100
0.317
0.600
0.850
0.950
1.000
Diagrama cu bare
Histograma
0.3
18
16
14
12
10
8
6
4
2
0
0.25
0.2
0.15
0.1
0.05
0
46.965 47.915 48.865 49.815 50.765 51.715 52.665
13
1.2
1
0.8
0.6
0.4
0.2
0
45
47
49
51
14
53
55
57
Curs 10.
Deci, la fel ca i n cazul valorilor tipice ale variabilelor aleatorii, dezvoltate la calculul
probabilitilor, cu ajutorul datelor de eantionaj este necesar s se determine trei tipuri de
indicatori statistici de eantionaj:
Deoarece, valorile observate ale caracteristicilor statistice cantitative se pot prezenta sub dou
forme:
Serie statistic n care valorile sunt distincte ntre ele;
Serie statistic la care valorile sunt grupate n clase, fiecare clas avnd centrele
clasei yj i frecvenele absolute/relative, Nj /fj , i
1, k,
metodele de calcul al indicatorilor statistici de eantionaj au fost dezvoltate pentru aceste dou
situaii.
-
(10.1)
obinute prin msurarea caracteristicii unui eantion de volum . Aceste valori reprezint
realizrile a variabile aleatorii:
1 , 2 , 3 , , , , ,
(10.2)
identic repartizate.
Principalii indicatori statistici de eantionaj sunt cazuri particulare, ca i n cazul valorilor tipice
ale unei variabile aleatorii, a momentelor de ordinul sau a momentelor centrate de ordinul .
Definiia 10.1:
1 + 2 + 3 + +
.
(10.3)
Deci, pe baza datelor de eantionaj (10.1) i pe baza notaiilor (10.2), din ecuaia (10.3), rezult:
1 + 2 + 3 + + =1
=
=
.
Definiia 10.2:
(10.4)
(1 ) + (2 ) + (3 ) + + ( )
.
(10.5)
Deci, pe baza datelor de eantionaj (10.1) i pe baza notaiilor (10.2), din ecuaia (10.5), rezult:
(1 ) + (2 ) + + ( ) =1( )
=
=
,
(10.6)
Definiia 10.3:
(10.7)
= =
Observaii:
1 + 2 + 3 + + =1
=
,
(10.8)
(10.9)
2
,
(10.10)
unde, prin 2 s-a notat dispersia populaiei din care a fost prelevat eantionul.
Demonstraie:
=
+ + + ,
rezult:
(1 ) (2 )
( )
1
2
2
() =
+
+
+
=
)
=
,
2
2
2
2
,
poart numele de eroare standard.
1
2
2 .
= {() + (+1)
2
(10.11)
1.2533
=
=
.
2
Definiia 10.5:
(10.12)
Moda (modul, sau dominanta) este dat de valoarea eantionului care se repet de cel mai mare
numr de ori.
Deoarece datele de eantionaj, n marea majoritate a situaiilor. sunt valori individuale, definiia
10.5 nu poate fi aplicat n aceast situaie. De aceea, pentru astfel de cazuri se recomand
utilizarea relaiei aproximative, [MIH 80]:
= 3 ( ).
(10.13)
= = () (1) ,
(10.14)
unde:
- = max { },
1
= min { },
Definiia 10.7:
(1 )2 + (2 )2 + + ( )2 =1( )2
=
=
,
Observaii:
(10.16)
=1( )2
.
(10.17)
(10.18)
adic:
(1 )2 + (2 )2 + + ( )2
( 2 ) = 2 =
.
1
Demonstraie:
1 + 2 + 3 + +
=
1
[( 1) 1 2 ] =
1
= [( 1) (1 ) (2 ) ( )],
iar:
(1 )2 =
1
[( 1)2 (1 )2 + (2 )2 + + ( )2 +
2
+2 ( 1) (1 ) (2 ) + ].
1
= 2 [( 1)2 2 + 2 + + 2 ] =
1
1 2
= 2 [( 1)2 2 + ( 1) 2 ] =
.
Rezult,
1 1 2
1 2
1 2
( 2 ) = 2 = [
+ +
]=
.
22 =
normal.
d. Dac se preleveaz un eantion de volum dintr-o populaie normal,
atunci variabila aleatorie:
( 1) 2 (1 )2 + (2 )2 + + ( )2
=
2
2
este hi-ptrat repartizat cu 1 grade de libertate.
e. O variabil aleatorie , este repartizat hi-ptrat cu grade de libertate,
dac funcia densitate de probabilitate are forma:
2 () =
2
2
22 ( )
2
Repartiia variabilei aleatorii se noteaz simplificat, sub forma:
(10.20)
~ 2 (, ).
Repartiia hi-ptrat reprezint modelul statistic al sumei ptratelor a
variabile aleatorii normale normate:
2
=1
2
= (
)
(10.21)
=1
() = 1 ,
(10.22)
1
( 2 ) = 2 = (
)(
) 2.
1
Definiia 10.8:
Observaii:
(10.23)
2 =
, dac populaia din care se preleveaz eantionul este normal
2
repartizat, sau:
4
4
2 = 4
2 , dac populaia din care se preleveaz eantionul nu este
normal.
Exemplul 10.1
Fie o populaie alctuit din elementele: 2, 3, 6, 8, 11. Considernd toate
eantioanele de volum = 2, ce pot fi obinute cu cele = 5 elemente ale
populaiei, s se determine media i dispersia populaiei, repartiia de
eantionaj a mediei i cea a dispersiei, dac:
a) Extragerea eantioanelor se realizeaz cu revenire.
b) Extragerea eantioanelor se realizeaz fr revenire.
Soluie:
a) Cu revenire:
2 + 3 + 6 + 8 + 11 30
=
= 6.0
5
5
(2 6)2 + (3 6)2 + (6 6)2 + (8 6)2 + (11 6)2
2 =
= 10.8
5
Numrul total de eantioane ce pot fi prelevate cu revenire, este:
52 = 52 = 25
=
Es.
14
2.5
0.25
15
11
8.5
6.25
16
17
5.5
6.25
11
6.5
20.25
18
2.5
0.25
19
20
11
9.5
2.25
4.5
2.25
21
11
6.5
20.25
5.5
6.25
22
11
16
10
11
16
23
11
8.5
6.25
11
24
11
9.5
2.25
12
4.5
2.25
25
11
11
11
13
150
135
2 10.8
=
= 5.4
2
Repartiia de eantionaj a dispersiei:
2 =
2
25
135
=1
=
= 5.4
25
25
La acelai rezultat ajungem dac utilizm relaia:
1
21
2 = (
) 2 = (
) 10.8 = 5.4
2
2
2
25
975.75
=1( 2 )
22 =
=
= 39.03.
25
25
2 =
2
2
25
=1( 2 )
= 39.03 = 6.2474
25
b) Fr revenire:
Numrul total de eantioane ce pot fi prelevate cu revenire, este: 25 = 20.
Repartiia de eantionaj a mediei:
25
120
=1
=
= 6.0
20
20
2
25
81
=1( )
2
=
=
= 4.05
20
20
La acelai rezultat ajungem dac utilizm relaia:
=
2
10.8 5 2
(
)=
(
) = 4.05
1
2
51
2 =
Aceste eantioane sunt:
Es.
Es.
2.5
0.25
11
12
11
8.5
6.25
13
11
6.5
20.25
14
5.5
6.25
2.5
0.25
15
4.5
2.25
16
11
9.5
2.25
5.5
6.25
17
11
6.5
20.25
11
16
18
11
16
19
11
8.5
6.25
10
4.5
2.25
20
11
9.5
2.25
120
135
2
25
135
=1
2 =
=
= 6.75
20
20
La acelai rezultat ajungem dac utilizm relaia:
1
5
21
2 = (
)(
) 2 = (
)(
) 10.8 =
1
51
2
= 6.75.
22 =
2
2
2
25
733.5
=1( 2 )
=
= 39.675.
20
20
2
2
25
=1( 2 )
= 39.675 = 6.23
20
Definiia 10.9:
1
=
= =
,
=1
(10.24)
Definiia 10.10: Dac considerm irul statisticilor de ordine pentru un eantion de volum :
(1) (2) (3) () ()
atunci, cuantila de ordinul , , a acestor valori este statistica de ordine:
= ((+1)) ,
Observaii:
(10.25)
(10.26)
Exemplul 10.2
S se determine cuantilele 0.25 , 0.50 i 0.75 , pe baza urmtoarelor date
de eantionaj:
107, 98. 119, 76, 95, 87, 101, 122, 103, 112.
Soluie:
10
3 = 3 =
3,
(10.27)
2
=1( ) 2
(
)
1
Observaii:
( 1)
3
3 =
3 =
(
)
( 1) ( 2)
2
=1
4 = 4 3 =
3.
(10.28)
=1( )2 2
(
)
1
Observaii:
( + 1)
4
3 ( 1)2
4 =
(
)
.
( 1) ( 2) ( 3)
( 2) ( 3)
=1
Exemplul 10.3
S se determine principalii indicatori statistici de eantionaj folosind
urmtorul eantion:
49.14, 48.19, 48.83, 49.74, 53.14,
51.42, 49.68, 48.11, 49.36, 48.38,
50.49, 49.18, 49.24, 51.93, 47.93,
50.45, 52.41, 51.64, 50.54, 49.30,
50.17, 52.89, 49.58, 50.66, 50.10,
50.90, 50.60, 50.71, 50.57, 49.14.
Soluie:
50.37,
48.65,
48.36,
50.47,
50.26,
50.30,
49.92,
50.06,
50.40,
50.50,
48.89,
49.82,
50.32,
49.01,
49.83,
52.11,
49.00,
49.33,
51.92,
46.49,
50.25,
50.23,
51.27,
50.42,
50.08,
49.09,
49.75,
50.02,
48.77,
49.66,
Volumul eantionului: = 60
irul statisticilor de ordine:
46.49 47.93 48.11 48.19 48.36 48.38 48.65 48.77 48.78
48.83 48.89 49.00 49.01 49.09 49.14 49.18 49.24 49.30
11
=1
49.82
50.25
50.49
51.42
49.83
50.26
50.50
51.64
=49.994
Mediana:
=
() + (+1)
2
2
Moda:
= 3 ( ) =50.223
Dispersia:
=1( )2
2 =
= 1.520
1
Abaterea standard:
( )2
= =1
= 1.233
1
Eroarea standard:
=
= 0.159153627
Coeficientul de variaie:
= = 0.025
Asimetria:
3
3 =
(
) = 0.173
( 1) ( 2)
=1
Coeficient de boltire:
( + 1)
4 =
( 1) ( 2) ( 3)
(
=1
4
3 ( 1)2
)
= 0.803
( 2) ( 3)
12
=1 ( )
= ( ) ,
1, ,
(10.29)
=1
unde:
reprezint valorile centrale ale claselor;
reprezint frecvena relativ;
reprezint frecvena absolut;
reprezint volumul de eantion.
Definiia 10.14: Momentul centrat de ordinul , a unui eantion cu un efectiv de valori,
grupate n clase, este prin definiie:
=1 ( )
= ( ) ,
1, ,
(10.30)
=1
unde:
reprezint valorile centrale ale claselor;
reprezint frecvena relativ;
reprezint frecvena absolut;
reprezint volumul de eantion;
reprezint media de eantion, respectiv momentul de ordinul = 1, ecuaia (10.31).
Analiznd ecuaiile (10.29) i (10.30), constatm c datorit modului de grupare a datelor,
respectiv a modalitii de alegere a numrului de clase i a calculului intervalelor de clas, am
nlocuit valorile efective de eantionaj, , cu mijloacele intervalelor de clas , iar frecvenele
relative i/sau absolute corespunztoare unei clase se consider concentrate n centrul clasei, nu
uniform repartizate pe limea unei clase, ca n cazul histogramei. Aceste ipoteze
simplificatoare introduc o serie de aproximaii care induc erori de calcul semnificative pentru
13
=1
= ,
1, ,
(10.31)
=1
Definiia 10.16: Mediana este valoarea pentru care ariile delimitate de histograma frecvenei
relative situate la dreapta i la stnga acestei valori sunt egale, fig. 10.1:
= +
1
=1
2
= +
(10.32)
Deci, pentru a determina valoarea medianei trebuie s identificm clasa median. Acesta
reprezint clasa ce conine frecvena relativ cumulat egal cu 0.50. n ecuaia (10.32) s-au
folosit urmtoarele notaii:
- reprezint limita inferioar a clasei mediane;
+1- reprezint limita superioar a clasei mediane;
- reprezint frecvena absolut a clasei mediane;
- reprezint distana dintre limita inferioar a clasei mediane i median;
+1
Figura 10.1
14
Moda reprezint valoarea de eantionaj cu frecvena de apariie maxim. Deci, pentru date
grupate n clase, valoarea modei se poate determina aproximativ, ca fiind valoarea central a
clasei cu frecvena relativ/absolut maxim:
+ +1
(10.33)
=
,
2
unde:
= = .
1
Mai precis, mediana se poate determina, n situaia valorilor de eantionaj grupate n clase,
conform schiei din figura 10.2.
Figura 10.2
+1
+1
Schema de calculul a modei
pentru date grupate
Deci, pentru a determina valoarea modei trebuie s identificm clasa modal. Acesta reprezint
clasa cu frecvena relativ/absolut maxim. Pentru calculul valorii modale se utilizeaz
ecuaia:
1
1
(10.34)
= +
= +
,
1 + 2
2 1 +1
n ecuaia (10.34) s-au folosit urmtoarele notaii:
- reprezint limita inferioar a clasei modale;
+1- reprezint limita superioar a clasei modale;
- reprezint frecvena relativ a clasei modale;
1- reprezint frecvena relativ a clasei anterioare celei modale;
+1- reprezint frecvena relativ a clasei posterioare celei modale i
1 = 1
2 = +1
Indicatorii statistici de eantionaj ai tendinei de mprtiere (sau de variaie) sunt:
amplitudinea, dispersia de eantionaj, abaterea medie ptratic i coeficientul de variaie de
eantionaj.
15
Definiia 4.42:
unde:
-
=1 ( )
= ( ) ,
1, ,
(10.36)
=1
unde:
- reprezint valorile centrale ale claselor;
-
Observaii:
=1 ( )
= ( ) ,
1, ,.
(10.37)
=1
=1 ( )
2
=
( ) ,
1, .
1
(10.38)
=1
=1 ( )
1
2
=
( ) ,
1, .
1
=1
16
(10.39)
= =
=1 ( )
1
( )
2
2
1 =1 ( )
,
=1
(10.40)
=1
Prin intermediul repartiiei empirice obinut prin determinarea histogramei se pot calcula
valori ale probabilitilor, de forma:
( ).
Se procedeaz, astfel:
a) n funcie de valoarea variabilei aleatorii, se determin clasa n care se situeaz aceast
valoare. Vom nota cu i +1 limitele acestei clase i cu frecvena relativ
corespunztoare a clasei.
b) Valoarea probabilitii se determin cu relaia:
( ) = + = +
<
<
(10.41)
+1
Figura 10.3
17
Curs 11.
Definiia 11.2
Estimaia este, la rndul su, o variabil aleatorie dependent de eantion. Estimaiile pot fi:
a) Estimaii neparametrice - dac estimaia se refer la probabilitatea necunoscut de apariie
a fenomenului sau la valoarea unui indicator statistic i a crei aplicare nu necesit
identificarea legii de repartiie.
b) Estimaie parametric - dac estimaia se refer la un parametru necunoscut al modelului
statistic utilizat.
c) Estimaie punctual - dac parametrul necunoscut al populaiei se estimeaz printr-o
valoare numeric, calculat pe baza unui estimator de forma:
(11.1)
= (1 , 2 , , , , , ).
b) Estimaie cu interval de ncredere - dac se stabilete un interval care s includ, cu o
probabilitate dat (1 ), valoarea adevrat a parametrului necunoscut.
Construcia acestor intervale de ncredere presupune cunoaterea repartiiei statistice a
estimaiei punctuale, pentru parametrul estimat: (|).
Intervalele de ncredere pot fi:
a. Unilaterale cu o limit superioar. Acestea se obin ca soluie a ecuaiei, vezi figura 11.1:
(11.2)
( ) = 1 ,
1
Figura 11.1
b. Unilaterale cu o limit inferioar. Acestea se obin ca soluie a ecuaiei, vezi figura 11.2:
( ) = 1 ,
iar intervalul unilateral cu limit superioar rezult sub forma:
<
unde:
reprezint limita inferioar a intervalului de ncredere;
< ,
( |)
(11.3)
Figura 11.2
( ) = 1 ,
iar intervalul bilateral simetric rezult sub forma:
unde:
reprezint limita superioar a intervalului de ncredere;
reprezint limita inferioar a intervalului de ncredere;
(11.4)
( |)
Figura 11.3
S-au pus la punct mai multe metode, pentru estimarea parametrilor, care caracterizeaz
diferitele modele statistice:
A. Metode grafice;
B. Metode analitice:
- metoda celor mai mici ptrate;
- metoda momentelor;
- metoda verosimilitii maxime;
C. Metode bayesiene de estimare.
Aprecierea calitii estimatorilor se realizeaz, de regul, pe baza unor criterii statistice, definite
ca proprieti ale estimatorilor:
1. Nedeplasarea. Estimaia se numete nedeplasat, dac valoarea medie teoretic coincide
cu valoarea adevrat a parametrului:
( ) = .
Deplasarea estimaiei - (), se definete ca fiind:
() = |() |.
2. Consistena. O estimaie se numete consistent, dac ea converge n probabilitate ctre
valoarea adevrat a parametrului, adic:
(| | < ) = 1, > 0.
3. Eroarea medie ptratic MSE , (Mean Squared Eror). Aceast proprietate definit ca:
2
2
() = [( ) ] = () + [()] ,
unde:
2
() = {[ ()] },
reflect discrepana dintre valoarea real a parametrului i estimaia lui, cuantificat prin
dispersie i deplasare.
4. Eficiena. O estimaie a parametrului se numete eficient, dac este nedeplasat i are
dispersia minim.
0.3
+ 0.4
(11.5)
sau,
0.5
(11.6)
.
Printre punctele astfel obinute, se traseaz o dreapt. Valorile estimate ale parametrilor
repartiiei se obin prin intermediul acestei drepte, direct de pe reeaua de probabilitate n funcie
de proprietile modelului statistic estimat.
(() ) =
i o serie de dezavantaje:
nu este aplicabil la volume mari de eantion;
prezint un grad mare de subiectivism la trasarea dreptei printre puncte, ceea ce conduce
la diferene ntre valorile estimate ale parametrilor.
(() )
(() )
Repartiie cu
asimetrie negativ
Repartiie
normal
Z
(() )
(() )
Repartiia
uniform
Repartiie cu
asimetrie pozitiv
Z
Z
Figura 11.4
2 =
=1
( + )2 = .
=1
(11.8)
=0
{
,
=0
se obine:
2 ( + ) = 0
=1
(11.9)
2 ( + ) = 0
{ =1
Prin rezolvarea sistemul de ecuaii (11.9), se obin estimaiile i ale parametrilor dreptei:
=1 =1 =1
=1 2 (=1 )2
.
=1 =1 2 =1 =1
=
=1 2 (=1 )2
{
=
(11.10)
y
yn
Pn(xn,yn)
Pi1(xi,yi)
Pn-1(xn-1,yn-1)
yi
=
Pi2(xi,A+Bxi)
P2(x2,y2)
y2
= +
P3(x3,y3
)
y1
P1(x1,y1)
x1
x2
xi
xn
Fig. 11.5 Utilizarea principiului celor mai mici ptrate n cazul regresiei liniare
Aceste relaii, (11.10), mpreun cu ecuaiile rezultate din liniarizarea modelului statistic permit
estimarea parametrilor repartiiilor.
Se obine astfel un sistem de ecuaii a crui rezolvare furnizeaz valorile estimate ale
parametrilor, , =
1, .
Observaii:
1. Acest procedeu de estimare este o metoda intuitiv, avnd o slab
justificare teoretic.
2. Metoda nu se poate utiliza la estimarea parametrilor n cazul eantioanelor
incomplete.
3. Nu se recomand utilizarea acestei metode pentru modele statistice care
prezint asimetrie pronunat.
4. Nu se recomand utilizarea acestei metode pentru modele statistice care au
mai mult de doi parametri necunoscui, ntruct erorile introduse sunt, adesea,
foarte mari.
5. Estimaiile obinute prin metoda momentelor nu prezint proprietatea
numit eficient. De aceea, nu se recomand utilizarea lor dect n absena
altor estimatori.
(1 , , , ) = ( , ).
(11.12)
=1
(11.13)
+ +
(1 , )
( , ) ( , )
(11.14)
=
1, i =
1, .
Funcia de verosimilitate pentru un eantion de observaii independente, dat de ecuaia
(11.11) este valabil doar pentru cazul variabilelor aleatorii continue. n cazul variabilelor
aleatorii discrete, aceast ecuaie devine:
(1 , , , ) = ( = , ),
(11.15)
=1
1
rezult:
= .
(11.16)
=
=
(1 ) (1 )
(11.17)
(1 )
=1
i
(1 )
(1 )
( +
+1
) = 1 ,
2
2
iar intervalul de ncredere bilateral simetric, al parametrului , corespunztor unui nivel de
ncredere (1 ), este:
+
2
(1 )
(1 )
+1
.
Exemplul 11.1
Din procesul de fabricaie al unei piese se extrag = 85 de repere. n
urma analizei, rezult c un numr de = 10 prezint defecte de suprafa. S
se determine intervalul de ncredere 95% pentru procentul de repere
neconforme.
Soluie:
0.12 (1 0.12)
0.12 (1 0.12)
0.12 + 1.96
85
85
0.05 0.19.
() = (
),
(11.18)
Ecuaia (11.18) reprezint ecuaia unei drepte, (11.7), dac considerm urmtoarele relaii de
echivalen:
= 1 [()]
=
(11.19)
.
1
{ =
Ultimele dou relaii din sistemul (11.19) ne furnizeaz i regulile pentru trasarea reelei de
probabilitate normal.
n anexa VII, se afl un model pentru reeaua de probabilitate normal.
Dup ce sunt parcurse etapele prezentate la punctul 11.4.1, valorile estimate ale parametrilor
repartiiei normale se obin folosindu-ne de proprietile repartiiei normale:
datorit faptului c acest model este simetric, iar axa de simetric este valoarea medie,
rezult:
= 0.50 .
(11.20)
conform fig. 8.4, estimaia abaterii standard se poate obine cu una din relaiile:
= 0.841
= 0.159
(11.21)
{
0.841 0.159 .
=
2
b. Estimarea punctual a parametrilor prin metoda celor mai mici ptrate:
Deoarece i aceast metod utilizeaz liniarizarea modelului statistic, valorile probabilitilor
10
=
c. Estimarea punctual a parametrilor prin metoda momentelor
Pe baza unui eantion de volum , prelevat dintr-o populaie normal repartizat:
1 , , ,
estimaiile prin metoda momentelor se obin prin aplicarea principiului ce st la baza acestei
metode:
=
(11.22)
{ = ,
2
2
adic egalarea primelor dou momente teoretice cu cele de eantionaj.
Dar:
2 = 2 2
2 = 2 2 ,
iar ecuaiile (11.22), devin:
=
(11.23)
{ 2
,
= 2
i expresiile estimaiilor punctuale prin metoda momentelor, sunt:
1
=
=1
1
2 =
( )2
1
{
=1
(11.24)
( , , ) = ( , , ) =
=1
1
2
(11.25)
1 1 2
2( )
1
2
1 2
2( )
11
1
2
1 2
2( )
2)2
(2
1
( )2
22 =1
1
( , , ) = (2 2 )
( )2 .
2
2
2
=1
( , , )
1
= 2 ( ) = 0
=1
( , , )
1
=
+
( )2 = 0
2
2
4
)
(
2
{
=1
Rezolvnd acest sistem de ecuaii, obinem:
1
=
=1
1
2 = ( )2
{
=1
(11.26)
()
1
2
3
4
5
6
30
66
72
81
102
114
(() ) =
0.3
0.109375
0.265625
0.421875
0.578125
0.734375
0.890625
12
+0.4
()
78
47
109
Figura 11.6
()
(() ) = +0.4.
() = 1 [(() )]
1
2
3
4
5
6
30
66
72
81
102
114
0.109375
0.265625
0.421875
0.578125
0.734375
0.890625
-1.230
-0.626
-0.197
0.197
0.626
1.230
-0.1345
-0.1663
-0.0832
0.1139
0.4598
1.0953
465
1.2851
= 77.5
{ = 2.26668
{
= 34.19
= 0.02924
c. Prin metoda momentelor, se obin:
{
= 77.5
.
= 29.54
13
() ()
14
Curs 12.
1
= ,
=1
(12.1)
dar:
= 1 .
2
(12.3)
(12.4)
[ ].
(12.5)
Exemplul 12.1
S se determine intervalul de ncredere bilateral simetric pentru medie,
cu un nivel de ncredere 95%, folosind urmtoarele date de eantionaj:
29.4, 27.5, 30.5, 32.6, 32.4, 33.5, 25.6, 29.5, 32.2, 27.8,
prelevate dintr-o populaie normal repartizat avnd = 1.6.
Soluie:
= 10
1
301
= = =
= 30.1
10
=1
= 0.05
= 1.96
2
~(, 0,1),
(12.6)
unde:
1
=
( )2 .
1
2
=1
(12.7)
(12.8)
(12.9)
Cazul 3 valoarea dispersiei este necunoscut, dar este estimat, 2 , pe baza datelor de
eantionaj.
Considerm un eantion de volum , prelevat dintr-o populaie normal repartizat:
1 , , ,
cu parametrii i necunoscui, atunci variabila aleatorie:
=
,
(12.10)
2
( 2 )
2
(12.11)
() =
(
+
1)
, pentru < < , > 0.
(2)
n anexa VI, de la finalul crii, tabelul VI.1, se gsesc calculate, pentru diferite
grade de libertate, valorile cuantilelor repartiiei Student t.
Intervalul de ncredere, [ , ] ce conine valoarea adevrat a parametrului , cu
o probabilitate (1 ), reprezint soluia ecuaiei:
( ) = 1 .
(12.12)
1,1 ) = 1 .
2
deoarece:
,1 = 1,1 .
2
(12.13)
(12.14)
[ + 1,1 ].
(12.15)
( 1) 2
,
2
(12.16)
(12.17)
2
,1
2
2
Prelucrnd ecuaia anterioar, rezult:
( 1) 2
( 1) 2
2
( 2
) = 1 .
2
1 2 ,1
2 ,1
( 1) 2
2
( 1) 2
2
1 2 ,1
].
(12.18)
2 ,1
( 1) 2
2
2 ].
(12.19)
1 2 ,1
( 1) 2
2
2 ,1
].
(12.20)
Pentru a determina intervalele de ncredere pentru abaterea standard se utilizeaz relaia care
exist ntre dispersie i abaterea standard:
= 2 .
Rezult:
( 1) 2
2
1 2 ,1
( 1) 2
2
].
(12.21)
2 ,1
(12.22)
1 2 ,1
( 1) 2
2
].
(12.23)
2 ,1
Exemplul 12.2
S se determine intervalul de ncredere bilateral simetric pentru medie,
dispersie i abaterea standard, cu un nivel de ncredere 90%, folosind
urmtoarele date de eantionaj:
51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1
51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1
51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1
51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1
51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1
54.0
54.0
54.0
54.0
54.0
= 50.
1
2524.6
= = =
= 50.49
50
=1
1
808.99
= =
( )2 =
= 16.51
1
49
2
=1
1
= =
( )2 = 16.51 = 4.064
1
=1
= 0.10 = 1.64485
2
,1
2
2
= 0.95,49
= 67.505
49 16.51
49 16.51
2
67.505
34.764
11.984 2 23.271
3.461 4.824
Ipoteza nul, H0 ipoteza statistic iniial asupra repartiiei populaiei studiate, care
trebuie respins, sau acceptat pe baza rezultatului unui test.
Eroare de genul nti eroarea comis cnd se decide respingerea ipotezei nule, atunci cnd
ipoteza nul este adevrat.
Riscul de genul nti probabilitatea , de a comite eroarea de genul nti:
= (respinge 0 |0 este adevrat)
Eroare de genul al doilea eroarea comis cnd se decide s nu se resping ipoteza nul, atunci
cnd ipoteza nul este fals.
Riscul de genul doi probabilitatea , de a comite eroarea de genul al doilea:
= (accept 0 |0 este fals)
Valori estimate
Valori reale
0
adevrat
0
fals
0
adevrat
0
fals
Decizie corect;
Probabilitatea = 1
Eroare de tip II
Probabilitatea =
Eroare de tip I
Probabilitatea =
Decizie corect;
Probabilitatea = 1
| ()
| ()
Figura 12.1
( (1 , 2 , , , , , ) (1 , 2 , , , , , )) = 1 .
S considerm ipoteza nul:
: = 0 .
Atunci, pentru o probabilitate dat, , se poate construi un test statistic, bazat pe o regiune
critic:
(1 , 2 , , , , , 1 ) > 0 ,
sau:
(1 , 2 , , , , , 1 ) < 0 ,
la pragul de semnificaie .
Rezult deci, c putem construi teste de verificare a ipotezelor statistice referitoare la parametrii
repartiiilor statistice utiliznd intervalele de ncredere construite anterior, vezi fig. 6.1.
Modalitatea de calcul a erorii de tip II, , este prezentat n figura 6.2.
Valori estimate:
Valori reale:
| ()
Figura 6.2
Se respinge H0 dac:
| 0 | >
12
0
< 0 +
0
> 0 +
1
1 0
1 < 0
1 > 0
Exemplul 12.3
S se testeze, cu un nivel de semnificaie = 5%, ipoteza, H0: = 50,
cu altenativa H1: 50, dac prin prelevarea unui eantion de volum = 25
s-au obinut n urma prelucrrii datelor de eantionaj 1 = 51.3. Se cunoate,
de asemenea, abaterea standard a populaiei, 0 = 2.
Soluie:
2 = 0.025% i 1 2 = 0.975.
12 = 1.96 i 2 = 1.96
0
0
0 +
2 > > 0 +
12 49.216 > = 51.3 > 50.784
Se respinge H0.
10
2 = 1 =1( )2 reprezint estimaia dispersiei pentru populaia din care sa prelevat eantionul.
Decizia statistic:
Ipotezele alternative
H1: = 1 ,
unde:
Se respinge H0 dac:
| 0 | >
12,1
< 0
,1
< 0 +
1,1
1 0
1 < 0
1 > 0
Exemplul 12.4
S se testeze, cu un nivel de semnificaie = 10%, ipoteza, H0: = 25,
cu alternativa H1: < 25, dac prin prelevarea unui eantion de volum = 36
s-au obinut n urma prelucrrii datelor de eantionaj 1 = 25.7 = 3.
Soluie:
Se accept H0.
11
2 = 1 =1( )2 reprezint estimaia dispersiei pentru populaia din care sa prelevat eantionul.
Decizia statistic:
Ipotezele alternative
H1: 2 = 12 ,
unde:
Se respinge H0 dac:
12 02
( 1) 2
< 22,1
02
( 1) 2
2
> 1
2,1
02
( 1) 2
2
> 1,1
2
0
( 1) 2
2
< ,1
02
12 > 02
12 < 02
Exemplul 12.5
S se testeze, cu un nivel de semnificaie = 0.05%, ipoteza, H0: = 3,
cu alternativa H1: > 3, dac prin prelevarea unui eantion de volum = 46
s-au obinut n urma prelucrrii datelor de eantionaj 1 = 25 = 3.15.
Soluie:
( 1) 2
2
> 1,1
49.6125 < 61.6562
02
Se accept H0.
12