Sunteți pe pagina 1din 9

1.

INTRODUCERE

Cursul se adresează celor puşi în situaţia de a analiza,


prelucra şi interpreta date obţinute pe cale experimentală.

Datele respective pot să provină


- fie din experienţe dirijate asupra unui anumit subiect / proces
de interes,
- fie din măsurători / înregistrări sistematice, efectuate în
timp, asupra unor mărimi ce caracterizează evoluţia
sistemelor fizice, economice, sociale etc.

Obiectivele vizate s-au concentrat pe următoarele aspecte:


1. Să se treacă în revistă noţiunile teoretice de bază, specifice
capitolelor principale din teoria probabilităţilor şi statistica
matematică;

2. Să se ilustreze aceste noţiuni prin exemple cu rezolvare


integrală, culese din domenii cât mai diverse – nu numai de natură
tehnică, ci inspirate şi de fapte / situaţii din viaţa cotidiană

3. Să se exemplifice maniera de rezolvare a unor probleme de


statistică prin programe de calcul proprii, construite în acord cu
necesităţile şi opţiunile celui care abordează problema şi alcătuieşte
programul.

Referitor la primul obiectiv - s-a evitat încărcarea cu


demonstraţii matematice, limitând expunerea la strictul necesar pentru
înţelegerea noţiunilor teoretice de bază şi utilizarea lor în practică.

Referitor la al doilea obiectiv- sperăm că diversitate de exemple


propuse va face prezentarea mai atractivă, mai apropiată de
preocupările voastre şcolare şi extraşcolare şi va fi un stimulent pentru
a face mai uşor analogii între probleme din domenii diferite.

9
Al treilea obiectiv - încercarea de a vă încuraja să nu fiţi
neapărat interesaţi de utilizarea unor soft-uri de statistică accesibile
din diverse surse, ci să doriţi să faceţi singuri programe de calcul.

Un obiectiv care nu s-a urmărit a fost aprofundarea sau


canalizarea formulărilor teoretice şi a aplicaţiilor practice către
analiza statistică dedicată unei anumite discipline tehnice.
Din cauza multitudinii de aspecte specifice fiecărei discipline –
în contextul abordării statistice – au apărut numeroase lucrări orientate
pe tratarea datelor şi, mai ales, pe valorificarea ulterioară a rezultatelor
modelelor probabiliste dintr-o disciplină sau alta.
Evident, noţiunile şi metodele statistice din proiectarea şi
analiza de fiabilitate şi siguranţă în funcţionare a sistemelor din
ingineria mecanică, diferă destul de mult de cele din ingineria
electronică.
Chiar şi natura problemelor analizate diferă în
- domeniul medical,
- faţă de cele din domeniul ingineresc,
- de cele din domeniul hidrologiei,
- climatologiei,
- ştiinţelor de mediu,
- managementului etc.
Din motivele enumerate, nu voi insista la curs pe
detalierea abordărilor dintr-un anumit domeniu, dar la
aplicaţii veţi primi teme cu un conţinut apropiat specializării
fiecăruia

Atât statistica descriptivă, cât şi statistica deductivă (sau


de inferenţă / raţionament) sunt definite ca un ansamblu de
metode de calcul.
Multe dintre acestea sunt comune celor două categorii. De
exemplu, o metodă poate fi reprezentată de formula de calcul a unei
medii şi
– dacă se foloseşte media unui set de valori pentru a caracteriza
setul respectiv, această operaţie aparţine statisticii descriptive, iar

10
– dacă aceeaşi medie este utilizată pentru a face supoziţii privind
media unui set mai mare de valori, operaţia aparţine statisticii
deductive.

În termeni statistici observaţie = orice înregistrare a unei


informaţii de natură numerică sau categorială.

Setul tuturor observaţiilor posibile asupra informaţiei


considerate, formează o populaţie.

De regulă nu se dispune de întreaga populaţie despre informaţia


monitorizată, ci doar de un subset al ei, numit eşantion.

Când elaborăm predicţii asupra unei populaţii doar cu date


numerice obţinute pe baza unui eşantion, se speră că eşantionul
disponibil este reprezentativ pentru acea populaţie.
Pentru a asigura reprezentativitatea, se apelează la aleatorism
(întâmplare) în selecţia datelor din eşantion.
Caracterul aleatoriu poate fi imprimat
- fie de metoda de selecţie (parametrul observat este o
dimensiune geometrică, măsurată la mii de piese de acelaşi tip
realizate pe o maşină unealtă şi se pune problema alcătuirii unui
eşantion mai redus),
- fie de natura probabilistă a parametrului observat însuşi
(debitul maxim anual înregistrat pe un anumit râu, într-o secţiune de
măsură dată).

Prin urmare, un eşantion aleator / probabilist este alcătuit din


observaţii care, fiecare, are aceeaşi şansă (în cadrul populaţiei) de a
fi selectată sau de a apare în eşantionul respectiv,

iar statistica deductivă include acele metode care, prin


analiza unui eşantion aleator, conduce la predicţii /
inferenţe asupra întregii populaţii.

11
În Capitolul 2 voi introduce unele noţiuni şi metode
generale de analiză şi descriere statistică a seturilor
(eşantioanelor) de date experimentale. Ele aparţin statisticii
descriptive , dar sunt esenţiale şi pentru dezvoltarea metodelor de
predicţie.
Se descriu operaţiunile preliminare de ordonare, clasare şi
reprezentare grafică a datelor, acestea facilitând analiza lor şi
formarea unei viziuni sintetice de natură statistică.
Apoi se vor defini principalele caracteristici descriptive (sau
măsuri statistice) de poziţie, de dispersie şi de formă – care se
pot calcula pe baza setului de date analizat şi se comentează legătura
dintre valorile lor şi alura reprezentărilor grafice.

Capitolul 3 va prezenta noţiuni specifice teoriei


probabilităţilor importante în raţionamentele statistice. Se vor defini
conceptele de
- variabilă aleatoare,
- experiment aleator,
- spaţiu de selecţie,
- eveniment,
- probabilitate,
- probabilitate condiţionată ş.a.
Se enunţă axiomele fundamentale şi se detaliază noţiunile de
- distribuţie de probabilitate,
- funcţie de densitate şi
- funcţie de repartiţie.
În final se descriu principalele caracteristici
- medie,
- varianţă,
- momente,
- coeficienţi adimensionali
deduse pe baza legilor de probabilitate a variabilelor aleatoare şi se
fac unele generalizări la cazul variabilelor aleatoare multiple.

12
În Capitolul 4 vor fi trecute în revistă legile de probabilitate
cel mai frecvent folosite,
- atât pentru cazul variabilelor aleatoare discrete (binomială,
multinomială, hipergeometrică, binomială negativă,
geometrică, Poisson),
- cât şi pentru cazul variabilelor continue (normală,
normală standard, log-normală, hi-pătrat, Student-t,
Fisher-Snedecor, exponenţială, Weibull, gamma, beta, legi
ale valorilor extreme)
majoritatea fiind ilustrate prin diverse aplicaţii.

Capitolul 5 va prezenta elemente de teoria eşantionării, cu


exemple de distribuţii de eşantionare pentru statisticile importante
- medie,
- varianţă,
- momente,
- diferenţă a două medii de eşantion,
în funcţie de
- tipul populaţiei originare şi de
- talia eşantioanelor.

Capitolul 6 va dezvolta primele noţiuni concrete despre


statistica deductivă prezentând unele elemente de teoria
estimaţiei.
Se introduc conceptele de
- estimator şi estimaţie,
- interval de încredere,
- nivel de încredere şi
- prag de semnificaţie.
Se specifică intervalele de încredere pentru
- medie,
- diferenţa mediilor,
- proporţia de succes a distribuţiei binomiale,
- varianţă,
- raportul varianţelor etc.

13
în diferite ipoteze privind dimensiunea eşantioanelor folosite şi
informaţiile cunoscute despre populaţiile originare.
Capitolul se va încheia cu metodele de estimare utilizate
pentru calculul parametrilor legilor teoretice de probabilitate,
pornind de la datele de eşantion
- verosimilitate maximă,
- momente,
- cele mai mici pătrate etc..

Capitolul 7 aprofundează aspecte de statistică deductivă prin


prezentarea elementelor generale privind testarea ipotezelor
statistice - în legătură cu populaţii de variabile aleatoare.
Se defineşte ipoteza statistică şi se clasifică tipurile de teste.
Se vor descrie aspectele de bază ale unui test parametric
incluzând:
- ipoteza nulă şi cea alternativă,
- nivelul de semnificaţie,
- regiunea critică,
- estimatorul de test şi
- calculul valorii lui,
- probabilitatea critică etc.
În continuare se prezintă
- teste de conformitate şi respectiv de
- omogenitate pentru
- variabile aleatoare continue (medie, varianţă, diferenţa
mediilor) şi pentru
- variabile discrete.
Capitolul se încheie cu unele exemple de teste neparametrice.

14
În Capitolul 8 vor fi tratate separat principalele teste de
concordanţă (ajustare), având în vedere importanţa lor practică în
inferenţa statistică.
Se dau detalii suficiente şi exemple de utilizare pentru testele
- hi-pătrat şi respectiv
- Kolmogorov-Smirnov,
dar mai sunt prezentate şi alte teste din această categorie (Cramer-von
Mises, Anderson-Darling, Watson, Kuipert).

Capitolul 9 este dedicat analizei variaţiilor (dispersională).


Metodele ANOVA sunt procedee statistice speciale, de tipul
testelor de omogenitate, dar care se aplică în cazul a mai mult decât
două populaţii de variabile aleatoare.
Pentru testarea mediilor se prezintă modul de analiză a
situaţiilor
- cu un factor de influenţă, precum şi a celor
- cu doi factori de influenţă, fără sau cu interacţiune între
aceştia.
Pentru testarea varianţelor se descriu şi se ilustrează unele teste
specifice (Hartley, Bartlett, Levene).

Capitolul 10 abordează problema regresiilor şi corelaţiilor.


Sunt prezentate aspectele de calcul implicate de regresia
lineară simplă,
dar şi aspectele de statistică ale analizei de regresie lineară
(cu intervalele de încredere pentru coeficienţii ecuaţiei de regresie şi
pentru valorile variabilei explicate).
În continuare se dau detalii despre
- cazul regresiei lineare multiple, precum şi despre
- regresiile nelineare folosite frecvent în aplicaţii (polinomială,
geometrică, exponeţiale ş.a.)

Un capitol special ar putea fi analiza şi modelarea seriilor


temporale, cu importanţă în
- condensarea datelor experimentale şi
- elaborarea prognozelor pe termen scurt şi mediu

15
Pentru Aplicaţii veţi putea primi o serie de programe de calcul
(scrise în Turbo Pascal ca fişier sursă).

Ele pot fi folosite în soluţionarea problemelor primite ca teme la


diverse capitole şi ca sursă de inspiraţie pentru a vă elabora propriile
instrumente soft.

Unele servesc la calculul cuantilelor distribuţiilor hi-


pătrat, Student-t şi respectiv Fisher-Snedecor. Pentru fiecare
distribuţie s-au considerat niveluri de semnificaţie frecvent folosite la
calculul intervalelor de încredere sau verificarea ipotezelor statistice,
precum şi numere de grade de libertate din domeniul de interes, iar
programele generează tabele cu valorile cuantilelor corespunzătoare.

Alte exemple:

- Setdate – analizează un set de date experimentale pe care le


ordonează şi clasează după opţiunea utilizatorului şi apoi
calculează caracteristicile descriptive ale setului respectiv;

- Gauss – efectuează calcule de probabilitate pentru


distribuţiile normală şi normală standard;

- Regresie – face analiza de regresie lineară simplă,


determinând coeficienţii ecuaţiei de regresie, intervalele lor
de încredere şi banda de încredere pentru media condiţionată

- Test_Hi2 – efectuează testul hi-pătrat pentru legi teoretice de


tip normal, log-normal, gamma cu doi parametri sau Weibull;

- Test_K_S1 – execută testul Kolmogorov-Smirnov, bilateral


sau unilateral, pentru distribuţii gamma, normală, log-
normală, Weibull sau exponenţială, prelucrând şiruri de date
neclasate;

16
- Test S_F_H – evaluează cuantilele distribuţiilor hi-pătrat,
Student-t sau Fisher-Snedecor, la nivel de semnificaţie dorit;

- GenerVA - generează numere aleatoare cu diverse legi de


repartiţie, în ideea de a oferi utilizatorului posibilitatea să-şi
construiască eşantioane de date pentru exerciţii proprii.

17

S-ar putea să vă placă și