Documente Academic
Documente Profesional
Documente Cultură
3 REPARTIIA EXPONENIAL
Definiia 3.13: O variabil aleatorie continu , este exponenial repartizat cu parametrul , dac funcia densitate de probabilitatea este de forma: ( ) i se noteaz, ( ) pentru (3.140)
Alura funciei densitate de probabilitate, a repartiiei exponeniale, pentru diferite valori ale parametrului , este prezentat n figura 3.22. Se constat c pentru valoarea variabilei aleatorii , valoarea funciei densitate de ( ) probabilitate este, Funcia de repartiie, a modelului statistic exponenial, rezult de forma: ( ) ntr-adevr: ( ) ( ) | ( ) . (3.141)
Reprezentat grafic, funcia de repartiie, a modelului exponenial, are alura din figura 3.23.
( )
1.6 1.4
1.2
1 0.8
0.6
0.4 0.2 0 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
Figura 3.22
Valorile tipice ale variabilei aleatorii exponenial repartizate, [GIB 76], [KEC 94], [WIK 10]: 1. Media teoretic: 137
(3.142)
(3.145)
( )
1.2 1 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 2
(3.146)
( )
2.5
3.5
4.5
Figura 3.23
Exemplul 3.22 Considerm c durata de funcionare a bateriilor de autovehicule este repartizat exponenial, cu parametrul zile. S se determine: a. Probabilitatea ca o baterie s funcioneze mai mult de 1200 de zile; b. Probabilitatea ca bateria s funcioneze mai mult de 1200 de zile, tiind c acesta a mai funcionat anterior 1000 de zile; c. Durata medie de funcionare a bateriei. Soluie: a. b. c. ( ( ) ( ) ( ) ) ( ) ( )
( ) i se noteaz, (
pentru )
(3.154)
Alura funciei densitate de probabilitate, a repartiiei uniforme, pentru i , este prezentat n figura 3.25. Se constat c cei doi parametri ai repartiiei sunt: , reprezint un parametru de poziionare; reprezint un parametru de scal; reprezint amplitudinea domeniului de definiie al variabilei aleatorii .
Repartiia uniform continu, datorit formei sale, mai poate fi ntlnit i sub denumirea de repartiia dreptunghiular sau rectangular.
0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8
( )
Figura 3.25
Funcia densitate de probabilitate a repartiiei uniforme continue Funcia de repartiie, a modelului statistic uniform continuu, rezult de forma: ( ) ( ) i |
(3.155)
pentru ntr-adevr: ( ) ( )
Reprezentat grafic, funcia de repartiie, a modelului uniform continuu, are alura din figura 3.26, dac i . Valorile tipice ale variabilei aleatorii uniforme continue, [GIB 76], [KEC 94], [WIK 10]: 1. Media teoretic: ( ) (3.156)
139 |
( )
Figura 3.26
Funcia de repartiie uniform continu 2. Mediana: (3.157) Mediana rezult ca soluie a ecuaiei:
5. Abaterea medie ptratic: ( ) Exemplul 3.23 Considerm o variabil aleatorie probabilitate: ( ) S se determine: | 140 (3.160)
a. b. Soluie: a. b.
( ( i ( (
); )
) )
( (
) ) ( )
4. STATISTICA
Atunci cnd omul nu a mai putut intui a nceput s msoare. Msurtorile i observaiile au devenit prima treapt spre nelegerea legilor naturii. Dar, n acest fel, omul nu mai poate s cunoasc direct realitatea, el poate numai s o aproximeze succesiv prin modele fizice si apoi prin modele matematice. Dar aceste modele nu descriu exact realitatea. Ele o aproximeaz i apar aa numitele erori. Unele erori sunt previzibile, altele ns sunt ntmpltoare (aleatorii). Aceste ultime erori (aleatorii) au si ele legile lor de manifestare. Apar deci fenomenele aleatorii descrise prin variabilele aleatorii. Teoria probabilitilor pleac de la ipoteza c se cunosc exact aceste variabile aleatorii (prin funciile de probabilitate, funciile de repartiie, funciile caracteristice, etc.). Statistica pleac de la msurtorile brute i caut s regseasc modelul probabilist, teoretic exact, care se afl n spatele acestor msurtori. Exemplul 4.1: Pentru determinarea expresiei ale funciei de probabilitate a repartiiei hipergeometrice, raionamentul matematic a pornit de la o urn ce conine un numr de bile, din care sunt bile albe i sunt bile negre. Apoi, s-a stabilit semnificaia variabilei aleatorii binomial repartizate: se extrag bile din urn, una cte una, fiecare bil nu este reintrodus n urn dup constatarea culorii. Valorile variabilei aleatorii astfel obinute reprezint evenimentele ca din bile extrase, s fie de culoare alb. n cazul utilizrii statisticii se pornete de la o urn ce cuprinde un numr oarecare de bile, albe i negre, dar configuraia exact nu se cunoate. Prin extrageri succesive de n bile, fr revenire i prelucrarea statistic a rezultatelor obinute se ncearc determinarea, ct mai exact a configuraiei iniiale a urnei, precum i expresia matematic a modelului statistic ce poate fi utilizat n astfel de situaii. Partea empiric a statisticii care se ocup de prelucrarea datelor obinute prin msurtori sau observaii se numete statistic descriptiv. Aparatul matematic al teoriei probabilitilor, pus n funciune pentru a studia i interpreta aceste date, n dorina de a recupera modelul probabilistic real, care guverneaz fenomenul msurat sau observat, formeaz inferena statistic. Dup ce 141 |
cercettorul capt informaii suficient de clare despre fenomenul probabilistic studiat, el va trebui s acioneze optim potrivit acestor informaii. Apare deci teoria deciziei statistice, care este o ramur important a statisticii. Definiia 4.1: Statistica este disciplina care se ocup cu culegerea, nregistrarea, gruparea, analiza i interpretarea datelor referitoare la un anumit fenomen precum i cu formularea unor previziuni privind comportarea viitoare a acestuia. Statistica, de asemenea, este alctuit din dou pri distincte: Statistica descriptiv, avnd ca scop principal i specific sintetizarea i structurarea, ntr-o manier ct mai direct i mai intuitiv, datele de observaie i informaia coninut n acestea. n acest sens utilizeaz, de regul, tabele, grafice, indicatori numerici etc. Statistica inferenial, creia i revine rolul de a extinde rezultatele obinute pe baza datelor din eantion la nivelul populaiei generale i de a confirma sau invalida ipotezele emise apriori sau formulate dup faza exploratorie. Metoda utilizat n cercetarea statistic presupune parcurgerea unor etape, vezi fig. 4.1: 1. Identificarea i descrierea clar i concis a problemei studiate. 2. Identificarea, cel puin cu titlu de ncercare, a factorilor importani care afecteaz aceast problem sau, care poate juca un rol n soluie sale.
Identificarea i descrierea clar a problemei studiate Identificarea principalilor factori de influen
Testrea concordanei
Figura 4.1:
3. Delimitarea populaiei i identificarea caracteristicii /caracteristicilor statistice de studiat. 4. Stabilirea volumului de eantion i a metodei de prelevare a datelor de eantionaj. 5. Formarea eantionului i obinerea datelor de eantionaj 6. Verificarea omogenitii statistice. Aceast etap presupune verificarea caracterului aleatoriu i eliminarea valorilor aberante 7. Sintetizarea i structurarea informaiei obinute folosind instrumentele statisticii descriptive: reprezentarea datelor de eantionaj i calculul principalilor indicatori statistici. 8. n funcie de rezultatele obinute n etapa precedent se propune un model statistic pentru problem folosind cunotinele tiinifice sau tehnice ale fenomenului studiat. De asemenea, n aceast etap trebuie indicate orice limitri sau ipotezele modelului utilizat. 9. Urmeaz o etap de decizie statistic cu privire la posibilitatea utilizrii n continuare a modelului statistic ales i pentru a confirma c soluia propus a problemei este fezabil. Dac decizia nu este corespunztoare, urmeaz o etap de rafinare a modelului pe baza de date observate pentru a confirma c soluia propus a problemei este eficient i efectiv. 10. Cercetarea statistic se ncheie cu realizarea inferenelor statistice privind parametrii i indicatorii statistici ai fenomenului analizat, precum i cu concluzii sau recomandri bazate pe soluia problemei.
moment dat, elementele populaiei statistice reflect manifestarea din acel moment a fenomenului (de exemplu, dac se analizeaz salariul mediu, ntr-o anumit lun, pentru o ramur a economiei naionale, populaia statistic este format din ansamblul salariailor care lucreaz, n luna respectiv, n acea ramur). n schimb, dac se cerceteaz evoluia n timp a unui fenomen, elementele populaiei statistice trebuie s reflecte dinamica manifestrii fenomenului n perioada de timp studiat (de exemplu, pentru a se analiza evoluia unei dimensiuni a unei piese, pe parcursul unei serii de fabricaie, populaia statistic poate fi format din valorile cotei respective, nregistrate pe toat durata de fabricaie a seriei respective). Definiia 4.2: Totalitatea indivizilor care se iau n considerare poart numele de populaie. De asemenea, n cazul unei variabile aleatorii, se consider c repartiia de probabilitate a acesteia definete populaia variabilei. O unitate statistic este o component a mulimii care formeaz o populaie statistic. n funcie de metodele i scopurile cercetrii, o unitate statistic poate corespunde unui element indivizibil al populaiei statistice, fiind numit, n acest caz, unitate simpl, sau poate consta dintr-un grup de astfel de elemente, situaie n care este numit unitate compus. De exemplu, dac populaia statistic este reprezentat de ansamblul studenilor de la o anumit specializare, pot fi stabilite uniti simple, fiecare dintre acestea corespunznd unui student, sau pot fi definite uniti compuse, constnd n grupe, ani de studiu etc. Definiia 4.3: Entitate (unitate statistic sau individ) reprezint ceea ce poate fi descris i considerat n mod individual. Numrul total al unitilor statistice care compun populaia se noteaz cu: .
Definiia 4.4:
Caracteristicile statistice reprezint nsuirile prin care sunt descrise, n cadrul unei cercetri, unitile statistice. Caracteristica statistic reprezint proprietatea care permite identificarea sau diferenierea entitilor unei populaii date. n raport cu modul de descriere, pot fi delimitate dou tipuri de caracteristici statistice: caracteristici calitative, care descriu unitile statistice prin atribute; caracteristici cantitative, care descriu unitile statistice prin variabile, sau prin valori numerice. Caracteristicile statistice pot fi difereniate dup mai multe criterii si anume: 1. Dup coninut, pot fi: de timp: exprim apartenena unitii n timp; de spaiu; atributive: exprima trsturi specifice unitilor (vrsta, sex, profit, fonduri fixe). 2. Dup natura variaiei, pot fi: | 144
Valoare observat reprezint valoarea unei caracteristici, obinut ca rezultat al unei singure observaii. Totalitatea valorilor diferite ale unei caracteristici sau intervalul n care sunt coninute acestea (domeniu de valori observate ale variabilei) se numete scal. Calitatea valorilor observate este un factor important care condiioneaz calitatea informaiilor ce rezult dintr-un studiu statistic, realismul cunoaterii i eficienta deciziilor de aciune. Prin urmare, veridicitatea (autenticitatea) valorilor observate printr-o metod oarecare (specific cercetrii) concordanta acestora cu datele reale ale fenomenelor investigate constituie un obiectiv fundamental (int) a oricrei metode de nregistrare (observare) statistic. Acest obiectiv este, ns, greu de realizat deoarece chiar i prin respectarea tuturor principiilor tiinifice de pregtire i de organizare a colectrii datelor nu se obin ntotdeauna date absolut reale, n concordan cu manifestrile reale ale fenomenului investigat. Aceasta nseamn ca n observarea statistica se nregistreaz i erori. n general, prin eroare de nregistrare (observare) statistic, exprimat absolut sau relativ, se nelege diferena dintre rezultatul obinut prin nregistrare si mrimea reala a caracteristicilor (variabilelor) observate. Aceste diferene (erori) sunt determinate de volumul nregistrrilor, de precizia mijloacelor de nregistrare a datelor provenite din diverse surse (cunoscute sau necunoscute). Sursele de erori se regsesc n domenii care vizeaz nregistrarea, metodele de nregistrare. Dintre acestea exemplificam: Mobilitatea (inconstana) n timp a unitii observate (determinat de factori conduc la rspunsuri inexacte sau aproximative); Puterea uman limitat de nregistrare (observare), de exemplu, perceperea eronat a rspunsurilor, transcrierea greit a acestora etc.; Neclaritatea definirii unitilor de observare i a variabilelor de nregistrat; Imperfeciunea metodelor i mijloacelor de observare (nregistrare); Factori subiectivi etc. Exemplele de mai sus sugereaz faptul c sunt factori obiectivi i subiectivi care conduc la erori de nregistrare ntmpltoare, sistematice i, de asemenea, la greeli de nregistrare. Principale tipuri de erori statistice n etapa de observare sunt: - Erorile ntmpltoare care provoac abateri n sensul mririi sau micorrii nivelului real al fenomenului. Acestea pot surveni din neatenie i nu au un caracter premeditat. n cazul populaiilor mari, acest tip de erori au un caracter redus. 145 |
Erorile sistematice care produc abateri semnificative de regul ntr-un singur sens de la realitatea observat. Sunt generate din nenelegere sau din rea credin. Mrimea absolut a acestor erori este necunoscut, deoarece necunoscut este valoarea adevrat a valorilor observate. - Erorile grosiere (greelile) se datoreaz fie lipsei de experien, fie incompetentei, fie altor cauze. Diferena esenial dintre erori i greeli, acestea din urm trebuie depistate i eliminate. Acest lucru presupune analiza sistematic (aprofundat) a datelor nregistrate, un studiu detaliat a cazurilor n care valorile observate depesc limitele admisibile. Fr a fi o regul general, prevenirea erorilor se poate realiza prin aciuni suplimentare de genul: - testrii tehnicilor i formularelor de nregistrare; - selectarea optim si pregtirea profesional a persoanelor care efectueaz nregistrarea; - inspectarea (controlul), pe teren, a nregistrrilor de date; - pregtirea psihologica a persoanelor care efectueaz nregistrarea; - popularizarea scopului nregistrrii i formarea convingerilor pentru exprimarea datelor reale, etc. n multe situaii practice, fenomenul pe care l analizm poate fi caracterizat printr-o mulime de date care fie sunt greu de obinut, fie obinerea acestor date cost prea mult sau dureaz un timp prea ndelungat. n aceste cazuri, din mulimea de date se extrag eantioane i informaiile asupra eantioanelor se utilizeaz pentru inferen. Un eantion este o submulime de date extrase dintro populaie. Definiia 4.7: Una sau mai multe uniti de eantionare prelevate dintr-o populaie i destinate s furnizeze informaii despre aceast populaie poart numele de eantion. Definiia 4.8: Procesul de prelevare sau de constituire a eantionului poart numele de eantionaj. S remarcm faptul c n literatura de specialitate, pentru noiunea de eantion se mai folosesc termenii de selecie sau sondaj. Definiia 4.9: Numrul unitilor de eantionare care compun eantionul poart numele de efectivul eantionului sau de volumul eantionului. Volumul eantionului se noteaz cu Definiia 4.10: Reprezentativitatea (eantionului) reprezint proprietatea eantionului de a reprezenta fidel populaia. Pentru ca metodele statistice s conduc la concluzii valabile, eantionul trebuie s fie reprezentativ pentru populaia analizat. Pentru a realiza acest obiectiv, este de dorit ca pentru fiecare unitate statistic ce compune eantionul s i se asigure aceeai ans de extragere din cadrul populaiei. Prin urmare, obinerea unui eantion este un experiment aleatoriu i fiecare valoare colectat reprezint o valoare observat pentru o variabil aleatorie, iar | 146
observaiile din populaie determin repartiia de probabilitate a variabilei aleatorii ce modeleaz fenomenul studiat. Pentru a defini un eantion aleatoriu, se consider o variabil aleatorie care reprezint rezultatul prelevrii unui element al populaiei. Presupunem, de asemenea, c cele valori ce compun eantionul se obin independent, fr schimbarea condiiilor sau a ansei de extragere (extrageri independente). n aceste condiii valorile de eantionaj pot fi considerate ca fiind realizrile a variabile aleatorii independente: n afara tipologiei de erori prezentat, mai pot fi amintite erorile de reprezentativitate (efective sau poteniale ntlnite n cercetarea statistic). Definiia 4.11: Inferena statistic reprezint procedeul de a obine informaii privind ntreaga populaie, pornind de la date incomplete.
Frecvena relativ a unei categorii este deci, proporia din numrul total de observaii al numrului de observaii care aparin acelei categorii. 147 |
Cele mai uzuale metode de descriere i reprezentare grafic a mulimilor de date calitative sunt graficele (diagramele) cu bare, graficele circulare i graficele liniare. Graficele cu bare constau din reprezentarea frecvenei absolute (sau a frecvenei relative) corespunztoare fiecrei categorii ntr-un sistem de axe de coordonate, n care pe o ax figureaz categoriile, iar pe cealalt se traseaz proporional, prin bare sau dreptunghiuri, valorile de frecven absolut (sau frecven relativ) ale fiecrei categorii. Graficele circulare se obin prin mprirea unui cerc ntr-un numr de sectoare de cerc egal cu numrul de categorii, unghiurile la centru ale acestor sectoare fiind proporionale cu frecvena absolut (sau frecvena relativ) a fiecrei categorii. Graficele liniare se utilizeaz mai ales pentru a descrie evoluia unui anumit fenomen i se obin prin reprezentarea prin linii (drepte sau curbe) a dinamicii parametrilor statistici pe care i reprezentm n sistemul de axe de coordonate. Exemplul 4.2 : Repartizarea angajailor pe departamente ntr-o societate comercial este dat n tabelul de mai jos:
Departamentul A B C D Total:
n tabelul de mai sus, categoriile sunt date de cele 4 departamente denumite iar frecvena absolut a fiecrei categorii este dat de numrul de salariai din fiecare departament. Frecvena relativ a fiecrei clase din ultima coloan a tabelului de mai sus se obine prin mprirea numrului de angajai din fiecare departament la numrul total de angajai. Graficul cu bare corespunztor frecvenei absolute este reprezentat n Figura 4.2.
Figura 4.2:
Graficul circular corespunztor pentru datele anterioare, este reprezentat n Figura 4.3.
Figura 4.3:
Grafic circular
149 |