Sunteți pe pagina 1din 84

SUPORT DE CURS

ANUL I

Semestrul 1











CLUJ-NAPOCA,
2012

UNIVERSITATEA BABE-BOLYAI, CLUJ-NAPOCA
Centrul de Formare Continu i nvmnt la Distan
Facultatea de Geografie

Specializarea: Geografia turismului
Disciplina: STATISTIC APLICAT N TURISM























Cuprins
I Introducere 3
Suportul de curs propriu-zis
I
Modului I
1. Reprezentarea datelor statistice. Indicatorii statistici;


II
Modulul II
2.Sondajul statistic;


III
Modulul III
3.Corelaia statistic;


IV
Modulul IV
4.Noiuni de teoria probabilitilor;


V Bibliografie




I. Date de identificare ale titularului de curs i a cursului

Date de contact ale titularului de curs
Nume: Conf. univ. dr. Imbroane Alexandru Mircea
Birou: sala M3, str. Clinicilor nr 5-7
Telefon: 0264-597988
Fax: 0264-597988
Consultaii: se vor afia la nceputul semestrului
Date de identificare a cursului i datele de
contact ale tutorilor
Numele cursului: Statistic aplicat n turism
Codul cursului: GLR2104
Anul, Semestrul: anul I, semestrul 1
Tipul cursului: obligatoriu
Pagina web a cursului: www.geografie.ubbcluj.ro
https://portal.portalid.ubbcluj.ro/

Tutori: Conf. univ. dr. Alexandru Mircea Imbroane; E-mail: alex@geografie.ubbcluj.ro


II. Condiionri i cunotine prerechizite
Participarea la cursul de STATISTIC APLICAT N TURISM nu este condiionat
de parcurgerea i promovarea vreunei discipline din cadrul specializrii Geografia Turismului
(sistem Bologna). Cunotinele de matematic din liceu sunt suficiente.
Prin intermediul acestui curs ne propunem s dezvoltm abilitile, practice i de
raionament, ale studenilor n sfera cercetrilor statistice n domeniul turismului. ntr-o ar cu
potenial turistic, cercetarea statistic (prin sondaj) poate avea o contribuie important n
mbuntirea activitilor de turism a ageniilor. Avnd n vedere structura, coninutul i
abordrile didactice aferente acestei discipline, recomandm participarea oricrui student,
indiferent de tipologia i caracterul pregtirii academice anterioare.

III. Descrierea cursului
Disciplina Statistic aplicat n turism se adreseaz studenilor nscrii n programele de
pregtire la nivel licen, nvtmnt la distan (ID) i are ca scop principal dezvoltarea
3
cunotiinelor, raionamentului profesional i a abilitilor practice pentru studenii care particip
la acest curs.
Coninutul disciplinei se axeaz pe urmtoarele aspecte definitorii: obiectul i
metodele statisticii, analiza seriilor statistice, modaliti de reprezentare i
clasificare a datelor statistice, indicatorii statistici, repartiii de frecven,
sondajul statistic, estimarea parametrilor statistici, corelaia statistic, noiuni
generale de teoria probabilitilor.
Avnd n vedere coninutul acestei discipline, precum i abordrile de natur didactic
suntem n msur s preconizm c studenii participani la acest curs vor dobndi dup
absolvirea discipline urmtoarele competene:
nsuirea metodologiei de construire a modelelor statistice cu aplicaii n turism;
Abilitatea de a aplica un raionament statistic n analiza datelor cu caracter
turistic;
Capacitatea de a ntocmi, prezenta i analiza date provenite din sondaje cu
caracter turistic;
Realizarea unei analize statistice de complexitate medie;
Capacitatea de a interpreta corect rezultatele unei analize statistice.


IV. Organizarea temelor n cadrul cursului
a) Cursul deSTATISTIC APLICAT N TURISM este structurat pe 4 module de
nvare, n concordan cu obiectivele urmrite:
1. Reprezentarea datelor statistice. Indicatorii statistici;
2. Sondajul statistic;
3. Corelaia statistic;
4. Noiuni de teoria probabilitilor.
Fiecare din temele de mai sus este dublat de o serie de aplicaii practice referitoare la
analiza, nelegerea i interpretarea corect a principalelor noiuni.
Temele majore propuse, acompaniate de aplicaiile practice aferente fiecrei teme sunt o
modalitate extrem de util i facil pentru nelegerea corect a noinilor de baz ale statisticii.
b) Fiecare tem/modul (coninuturile cursului i aplicaiile practice aferente) vor putea fi
consultate pe site-ul Facultii de Geografie, la adresa www.econ.ubbcluj.ro, precum i pe CD-
urile ce vor fi oferite studenilor de la specializarea Geografia Turismului, varianta ID.
Descrierea conceptelor majore pentru fiecare tem/modul i pentru fiecare aplicaie
practic aferent fiecrei teme/modul pot fi gsite n syllabusul cursului.
c) Obiectivele generale ale cursului i Organizarea
Obiectivele cursului STATISTIC APLICAT N TURISM pot fi structurate pe dou
mari categorii, aferente activitilor vizate, astfel:
Obiective generale:
Consolidarea bazei tiinifice a studenilor n domeniul statisticii;
Dezvoltarea unui raionament profesional autentic i real;
Dezvoltarea capacitii de analiz i a datelor statistice.
Obiective specifice:
Introducerea studenilor n tainele statisticii;
Formarea abilitilor necesare pentru reflectarea n activitatea unei agenii de
turism a datelor preluate prin sondaj (chestionare);
Fundamentarea bazei tiinifice a studenilor pentru formarea unui raionament
profesional autentic;
Crearea de condiii permisive studiului individual al studentului;
4
Implicarea studenilor n activitatea de analiz statistic;
Capacitatea de a interpreta rezultatul unei analize statistice n profitul unei
agenii de turism;
Crearea de condiii permisive studiului individual al studentului.
Cursul va fi structurat n patru pri, aferente celor patru module prezentate mai sus:
o Noiunile de baz ale statisticii. Reprezentarea datelor. Scheme clasice de
clasificare. Indicatorii tendinei centrale. Indicatorii variaiei. Repartiii de
frecven. Legea normal;
o Sondajul statistic. Estimarea parametrilor provenii din sondaj;
o Corelaii statistice. Corelaia liniar. Coeficientul de corelaie. Dreapta de
regresie. Corelaia multipl i corelaia neliniar. Corelaia rangurilor;
o Noiuni de teoria probabilitilor.

V. Formatul i tipul activitilor implicate de curs (sarcinile practice ale
studentului)
Disciplina Statistic aplicat n turism are la baz trei abordri discincte privind
procesul de predare-nvare-asimilare a cunotinelor de ctre studenii participani. Prima
dintre aceste abordri este cea aferent procesului de transmitere, comunicare a informaiilor de
specialitate, pe axa cadru didactic student, i are n vedere realizarea unor expuneri sub form
de prelegeri, att teoretice, ct i aplicativ-exemplificative, pe o tematic specific, clar
delimitat de ctre titularul de curs.
Cea de-a doua abordare are la baz participarea activ i direct a studenilor la
expunerea i soluionarea studiilor de caz selectate n prealabil de ctre titularul de curs, ori
propuse de ctre studeni, conform tematicii anunate pentru fiecare curs n parte.

a) Sarcini
La acest curs vei avea de realizat mai multe sarcini (rezolvarea unor aplicaii practice) a
cror pondere total n nota final va fi de 50%; restul de 50% constituie evaluarea cunotinelor
finale dobndite n cadrul cursului.
Vei fi anunai (prin e-mail) cnd o nou sarcin a fost afiat on-line. Este n avantajul
dumneavoastr s realizai sarcinile propuse la scurt timp dup ce ele au fost afiate, deoarece
termenele limit trebuie respectate strict. Datele limit de evaluare a sarcinilor propuse anterior
vor fi, de asemenea comunicate iniial (atenie: unele sarcini vor avea termen limit n decursul
primelor trei sptmni de la nceperea cursului!!!).
b) Teme de cas
Pentru fiecare modul citii seciunea aferent din suportul de curs. Luai notie pentru a
nelege mai bine informaiile i pentru a studia mai trziu.
Temele de cas vor fi prezentate cu ocazia fiecrei ntlniri modulare, sau trimise pe una
din adresele de mail menionate mai sus; ponderea lor n nota final de promovare a examenului
va fi de 50%.
c) Examenul
Dup ce ai rezolvat toate aplicaiile practice aferente pregtirii preliminare (a cror
pondere n nota final va fi de 50%) este momentul s studiai pentru examenul final (cu pondere
de 50% n nota final). Pentru examenul final vei nva din suportul de curs i din notiele luate
cu ocazia fiecrei ntlniri modulare.
d) Comunicarea on-line: Anunuri, E-mailuri i Forum de discuii
Majoritatea informaiilor v vor fi transmise prin intermediul seciunii Anunuri de pe
site-ul Facultii de Geografie, la adresa http://geografie.ubbcluj.ro/,
https://portal.portalid.ubbcluj.ro/, precum i prin intermediul e-mail-ului. n consecin, consultarea
5
zilnic a e-mail-ului i a site-ului Facultii de Geografie este o sarcin absolut necesar. Suntei
responsabili de a lua la cunotin toate informaiile pe care vi le trimitem prin intermedioul
celor dou surse de informaie deja menionate. Este responsabilitatea dumneavoastr s v
pstrai la zi adresa de e-mail.

VI. Bibliografie obligatorie
Sursele bibliografice obligatorii sunt:
1. Bot E., Leonhard W, 2002, Microsoft Office XP, Ed. Teora.
2. Baron T., Korka M., Pecican E., 1981, Stnescu Maria, Statistic pentru comer
i turism, Ed. Did. i Ped. Bucureti
3. Ciucu B., Craiu V., 1971, Introducere n teoria probabilitilor i statistic
matematic, Ed. Didactic i Pedagogic, Bucureti.
4. Ebdon D., 1989, Statistics in Geography, Blackwell Inc., New-York .
5. Person R., 1997, Utilizare Excel, Ed. Teora
6. Petcu Nicoleta, 2000, Statistic n turism. Teorie i aplicaii, Ed. Albastr
(Grupul Microinformatica), Cluj-Napoca.
7. Rotaru T., Bdescu G., Culic Irina, Mezei E., Murean Cornelia, 1999, Metode
statistice aplicate n tiine sociale, Ed. Polirom, Iai.

Lucrrile menionate se gsesc la Biblioteca Facultii de Geografie i la
Biblioteca Central Universitar Lucian Blaga Cluj-Napoca. Lucrrile menionate la
bibliografia obligatorie prin caractere aldine, reprezint lucrrile de referin pe care s-a
fundamentat elaborarea suportului de curs i ele pot fi gsite la bibliotecile menionate.
n suportul de curs, la finele fiecrui modul sunt precizate att referinele
bibliografice obligatorii, ct i cele facultative. Sursele bibliografice au fost astfel
stabilite nct s ofere posibilitatea adncirii nivelului de analiz i, implicit
comprehensiunea fiecrei teorii.


VII. Materiale i instrumente necesare
Optimizarea secvenelor de nvare/formare reclam accesul studenilor de la
specializarea Geografia Turimului, forma de nvmnt nvmnt la Distan la urmtoarele
resurse:
computer conectat la internet (pentru a putea accesa bazele de date i resursele
electronice suplimentare dar i pentru a putea participa la secvenele de formare
interactiv on-line care necesit respectarea termenelor i consultarea
suporturilor de lucru, etc.);
imprimant (pentru tiprirea materialelor-suport, a temelor redactate, a studiilor
de caz);
acces la resursele bibliografice;
acces la echipamente de fotocopiere.

VIII. Calendarul cursului
Pe parcursul semestrului 1, de-a lungul cruia se studiaz disciplina de fa, sunt
programate 3 ntlniri fa n fa; acestea sunt destinate soluionrii nemediate a oricror
nelmuriri de coninut sau a celor privind sarcinile individuale practice (aplicaiile din caietul de
lucrri practice).
6
Pentru fiecare din aceste ntlniri se recomand parcurgerea poriunilor din suportul de
curs i din caietul de lucrri practice, aferente tematicii modulului/modulelor ce urmeaz a fi
dezbtute, dup cum urmeaz:
prima ntlnire: lecturarea modulelor 1, i 2 i parcurgerea aplicaiilor practice
de la modulele 1, i 2;
a doua ntlnire: lecturarea modulului 3 i parcurgerea aplicaiilor practice de la
modulul 3;
a treia ntlnire: lecturarea modulului 4 i parcurgerea aplicaiilor practice de la
modulul 4;.
la patra ntlnire este obligatorie pregtirea tuturor coninuturilor de
examen i rezolvarea aplicaiilor de la modulul 4; se vor preda aplicaiile
aferente modulului 4 i se va derula examenul final

Pentru a utiliza raional timpul alocat ntlnirilor, studenii sunt atenionai asupra
necesitii suplimentrii lecturii din suportul de curs cu capitolele/seciunile relevante din sursele
bibliografice de referin.
La finalul semestrului, n sesiunea de examinare, se va derula examenul final cu pondere
de 50% din nota final i se va comunica cursanilor numrul de puncte obinute pe baza
rezolvrii aplicaiilor practice (50% din nota final).
Datele celor patru ntlniri sunt precizate n calendarul sintetic al disciplinei i n tabelul
de mai jos.

Calendarul sintetic al disciplinei
Nr.
crt.
ntlniri
directe
Activiti Data
Pondere
aplicaii
practice/examen
final
1 ntlnirea 1
- discutarea temelor de curs de la modulele 1 i 2
- discutarea aplicaiilor practice de la modulele 1 i 2
12 noiembrie 2012
orele 08,00 10,00
(sala C1)
15 puncte
2 ntlnirea 2
- discutarea temelor de curs de la modulul 3
- discutarea aplicaiilor practice de la modulul 3

08 decembrie 2012
orele 08,00 10,00
(sala C1)
10 puncte
3 ntlnirea 3
- discutarea temelor de curs de la modulul 4
- discutarea aplicaiilor practice de la modulul 4

12 ianuarie 2013
2013
orele 08,00 10,00
(sala C1)
15 puncte
4 ntlnirea 4 - derularea examenului final
ianuarie 2013
(sala C1)
50 puncte
(examenul final)


Calendarul activitilor este unul orientativ, fiind susceptibil unor modificri ulterioare,
acestea urmnd s fie comunicate studenilor.
Studenii participani la aceast disciplin trebuie s aib n vedere faptul c silabusul de
fa reprezint un suport minimal, a crui simpl parcurgere nu este suficient pentru
promovarea examenului la disciplina Statistic aplicat n turism. n vederea promovrii
examenului cu rezultate cel puin satisfctoare, studenii vor trebui s parcurg bibliografie
indicat n cadrul acestui silabus i s posede abilitile de factur practic, dezvoltate pe
parcursul semestrului.


7
IX. Politica de evaluare i notare
Procesul de evaluare i stabilirea notei finale la acest curs va avea dou componente:
1. nsumarea punctajelor obinute pentru rezolvarea sarcinilor de lucru (aplicaiilor
practice existente n fiecare din cele patru module): 50 puncte maxim;
2. nota obinut la examenul final, care const n verificarea cunotinelor
teoretice: 50 puncte maxim.
Astfel, rezult un punctaj total maxim de 100 puncte, aferent notei finale 10.
Fiecare modul cuprinde un numr de 5-10 aplicaii practice, care vor fi puse la dispoziia
tutorilor i a cursantului, prin intermediului suportului de curs i a materialelor bibliografice
obligatorii. De asemenea, fiecare aplicaie practic va fi discutat n cadrul ntlnirilor cu
studenii, urmnd ca ulterior, ele s fie rezolvate i transmise titularului de curs. Pentru predarea
temelor, se vor respecta cu strictee cerinele titularului de curs, orice abatere de la acestea
aducnd dup sine penalizri sau pierderea punctajului corespunztor acelui set de sarcini
practice. Evaluarea aplicaiilor practice se va face imediat dup primirea lor, iar afiarea pe site-
ul facultii a punctajelor obinute de ctre fiecare student se va realiza n cel mult dou
sptmni de la data depunerii/primirii aplicaiilor. Dac studentul consider c activitatea sa
practic a fost subapreciat de ctre evaluator, atunci poate solicita feed-back suplimentar prin
contactarea direct a evaluatorului, prin e-mail sau direct.
Nota final la acest curs va fi bazat pe procentele cumulate din ntreg, iar notele vor
avea la baz criterii de performan.
Pentru obinerea unui punctaj complet este nevoie de rezolvarea tuturor aplicaiilor
practice existente i de prezena la examenul final, punctele fiind cumulate din aceste dou
forme de evaluare; lipsa uneia dintre aceste dou componente se soldeaz cu lipsa notei finale
din ecuaia de notare i, implicit nepromovarea examenului la disciplina STATISTIC
APLICAT N TURISM.

X. Elemente de deontologie academic
Se vor avea n vedere urmtoarele detalii de natur organizatoric:
Orice material elaborat de ctre studeni pe parcursul activitilor va face dovada
originalitii. Studenii ale cror lucrri se dovedesc a fi plagiat nu vor fi
acceptai la examinarea final;
Orice tentativ de fraud sau fraud depistat va fi sancionat prin acordarea
notei minime sau, n anumite condiii, prin propunere de exmatriculare;
Rezultatele finale vor fi puse la dispoziia studenilor prin afiaj electronic;
Contestaiile pot fi adresate n maxim 24 de ore de la afiarea rezultatelor, iar
soluionarea lor nu va depi 48 de ore de la momentul depunerii.
Plagiatul este o problem serioas i este pedepsit cu asprime. Orice student care este
prins c plagiaz se poate atepta s i fie anulat munca i s se ntreprind msuri disciplinare
din partea organismelor de conducere ale facultii.
Pentru eventuale explicaii suplimentare v stau la dispoziie.

XI. Studeni cu nevoi speciale
Nevoile speciale se refer la o serie de dizabiliti fizice, dizabiliti de
nvare/receptare, cele datorate lipsei de deprinderi i prerechizite aferente acestui curs.
Studenii care se afl ntr-una dintre aceste situaii, sunt rugai s m contacteze la nceputul
cursului pentru a putea interveni i ajusta situaia (spaii special amenajate, examen oral, examen
on-line etc.) pentru ca rezultatele la final s fie cele scontate, facilitnd accesul egal al tuturor
cursanilor la activitile didactice i de evaluare.


8
XII. Strategii de lucru recomandate
nvmntul la distan presupune mult efort din partea cursantului, ca atare mi permit
s v fac cteva recomandri pentru a parcurge i nelege mai uor temele parcurse. Astfel, v
recomand s v alocai cel puin la fel de mult timp pentru studiul fiecrei teme/modul i pentru
realizarea sarcinilor practice, ca i cum ai studia acest curs n formula nvmnt la zi. n
plus, este bine s v stabilii un orar sptmnal pe care s l rezervai studiului la aceast
disciplin.
ncercai pe ct posibil s v ncadrai n urmtoarele rigori:
pregtii-v pentru sarcinile pe care le avei de rezolvat, citind din timp prile
relevante din suportul de curs, rezolvai exemplele oferite, rezolvai aplicaiile
din suportul de curs;
ncercai s rezolvai toate aplicaiile existente; dac ntmpinai dificulti, e-
mailul meu v st la dispoziie pentru explicaii suplimentare; trimitei-mi un e-
mail cu problema la care v-ai blocat pentru a v oferi soluia corect;
citii cu atenie instruciunile de urmat pentru rezolvarea fiecrei aplicaii
practice; de cele
v rog s punei ntrebri; curiozitatea i ntrebrile diverse (la obiect) constituie
un element esenial pentru nvare);
ncercai s contactai un student, coleg cu dumneavoastr la aceeai
specializare, forma la zi, pentru a v consulta n cazul unor dificulti.
Respectnd cerinele i rigorile impuse de ctre acest curs, el v poate oferi participarea
activ la fenomenul turistic n continu expansiune n ara noastr i o orientare clar n viaa
profesional i anume dobndirea cunotinelor necesare pentru ndeplinirea activitilor
specifice oricrei agenii de turism, detailist sau touroperatoare, precum i cele necesare
conducerii unei agenii de turism.


CLUJ-NAPOCA, Conf univ. dr.
01.10. 2012 Alexandru Mircea Imbroane
















9
Calendar al cursului

Activiti Tematica abordat Responsabilitile
studenilor
Locul de
desfurare

ntlnire I:
Activiti
didactice
n cadrul cursului vor fi
prezentate i analizate probleme
legate de: noiunile introductive
n statistic, analiza seriilor i a
repariilor statistice, modaliti
i scheme de clasificare a
datelor, se va discuta analiza
indicatorilor variaiei, i
problemele ridicate n cadrul
sondajului statistic.
n cadrul lucrrilor practice se
va avea n vedere explicarea i
nsuirea softului Excel, care va
fi utilizat ulterior n exerciii.
Parcurgerea referinelor
bibliografice indicate.
Va fi
comunicat la
nceputul
semestrului.
ntlnire II:
Activiti
didactice
n cadrul cursului se va prezenta
i explica importana corelaiei
statistice n analiza fenomenului
turistic, materializat prin
constucia dreptei de regresie i
corelaia rangurilor.
n cadrul lucrrilor practice se
vor realiza aplicaii ce vizeaz
modalitatea de calcul a ecuaiei
de regresie i construirea
dreptei de regresie.
Parcurgerea referinelor
bibliografice indicate.
Realizarea unui proiect de
cercetare conform tematicii
alese de ctre student.
Va fi
comunicat la
nceputul
semestrului.
ntlnirea III. n cadrul cursului se vor
prezenta i problemele legate de
teoria probabilitilor, se vor
analiza schemele lui Bernoulli,
schema bilei nerevenite, schema

10
lui Poisson, precum i distribuii
clasice de probabilitate.
n cadrul lucrrilor practice se
vor analiza n detaliu fiecare
schem n parte i se vor realiza
aplicaii practice pe fenomenul
turistic folosind aceste scheme.
Examen final Verificarea cunotinelor
teoretice i practice abordate
pe parcursul semestrului.
Va fi
comunicat la
nceputul
semestrului.

Calendarul activitilor este unul orientativ, fiind susceptibil unor modificri ulterioare,
acestea urmnd s fie comunicate studenilor.


11

SUPORTUL DE CURS


MODULUL 1

REPREZENTAREA DATELOR STATISTICE. INDICATORII STATISTICI.

a. Scopul modulului: Modulul este destinat nelegerii suporturilor
conceptuale majore pe care se fundamenteaz Statistica.

b. Obiectivele modulului:
nsuirea noiunilor de baz i a conceptelor pe care se fundamenteaz
Statistica.
analiza comparativ a metodelor de cercetare i privind obiectul i scopurile
Statisticii.
nelegerea i posibilitatea folosirii indicatorilor statistici n cadrul analizei
bazelor de date.

c. Schema logic a modulului:
Noiunile de baz ale statisticii.
Reprezentarea datelor.
Scheme clasice de clasificare.
Indicatorii tendinei centrale.
Repartiii de frecven.
Legea normal.

d. Coninutul informaional detaliat
Coninutul informaional detaliat se gsete n bibliografia indicat.



12
Scurt istoric
ntr-o prim concepie, statistica echivala cu descrierea statului, expunerea
situaiei geografice, economice i politice. Acest gen de statistic a fost cultivat mai
nti de italieni. nc din sec. XIII - XIV n Republica Veneia se elaborau diferite
rapoarte care conineau informaii privitoare la partenerii si comerciali i au fost
utilizate n politica comercial oficial.
Curentul "descrierea statului" a atins apogeul n sec. XVII- XVII cnd, n
Germania, s-a constituit o adevrat coal cunoscut sub denumirea de coala
descriptiv german.
Descrierea statului a devenit disciplin de predare acadamic, ncadrat ntr-un
sistem construit dup norme teoretice i practice, care s-au elaborat i dezvoltat n
universitile germane. Noua disciplin (Staatskunde), a primit numele de statistic
(Statistik).
Pe vremea constituirii statisticii ca disciplin descriptiv a statului, se ntea n
Anglia, n afara universitilor, o statistic cunoscut sub numele de aritmetica
politic, a crui scop era: analiza datelor de observaie prin procedee matematice,
desprinderea regularitilor n fenomenul social i chiar formularea de previziuni.
Studiile demografice lsau s se ntrevad c previziunea fenomenelor colective ar
putea avea o nsemntate practic; dealtfel tabelele de mortalitate, ntocmite n sec.
XVIII au constituit punctul de plecare al nfloritoarei industrii de asigurri. Folosirea
metodei statistice, recurgerea la instrumentul matematic i cutarea legitilor marcau
un substanial progres, prefigurnd statistica modern.
Este dificil s se dea o definiie satisfctoare statisticii. n limbaj uzual
termenul este folosit pentru a desemna o colecie de numere referitoare la un anumit
domeniu (demografie, precipitaii, debite). n sens tehnic (mai precis matematic)
statistica este un instrument al matematicii utilizat pentru prelucrarea i interpretarea
informaiilor numerice.
Scopul statisticii
Statistica poate fi clasificat n dou mari categorii:
- statistica descriptiv
- statistica analitic.
13
Statistica descriptiv se ocup de prezentarea, clasificarea i sintetizarea
datelor de observaie. Aceasta concentreaz informaia existent n datele respective
cu ajutorul anumitor indicatori statistici care, n fond, sunt nite numere ce exprim
caracteristici sau tendine ale fenomenului studiat.
Statistica analitic folosete metode matematice (teoria probabilitilor) pentru
extragerea i prelucrea informaiei statistice; n multe cazuri aceste metode pun n
eviden legiti statistice.
Depirea stadiului descriptiv, al simplei metode cantitative, a nsemnat, istoric
vorbind, deplasarea gndirii statistice spre interpretarea analitic a fenomenului i
obinerea de concluzii inductive, pe baza observaiilor empirice. Aceast schimbare de
coninut a fcut ca statistica s se ntreptrund n mod constant cu matematica, n
cutarea de metode corespunztoare obiectivelor sale.
Transpus ntr-un limbaj matematic statistica s-a construit ntr-o teorie numit
teoria corelaiei statistice, ale crei aplicaii au permis identificarea unor noi legi de
dependen, specific statistice i adaptate la formele complexe i variate pe care le
ofer natura n diferitele sale manifestri.
n cercetrile moderne se pornete de la ipoteze statistice asupra fenomenului
sau procesului observat, consecinele lor logic deduse se compar apoi cu datele
disponibile i dac sunt n concordan, ipotezele sunt justificate, cel puin pn la noi
observaii mai riguroase.
Unul din obiectivele eseniale ale statisticii se consider tocmai msurarea
incertitudinii concluziilor inductive. De la un timp ns, gndirea statistic tinde s se
preocupe mai puin de msurarea incertitudinii i mai mult de determinarea riscului de
eroare i a pierderilor implicate de orice decizie ntemeiat pe o informaie care, prin
natura sa, nu poate fi exhaustiv.
Aplicarea calculelor statistice la datele empirice, oferite de observarea
fenomenului, permite desprinderea de legiti statistice.
Fenomenele sunt n interconexiune unele cu altele, n sensul c se genereaz i
se influeneaz reciproc. Acest fapt conduce la noiunea de cauzalitate care exprim
interaciunea dintre cauz i efect astfel nct ntotdeauna cauza s precead efectul.
Desfurarea fenomenelor const astfel ntr-un ir nentrerupt de momente, ntr-o
14
succesiune cauz-efect, efectul fiind la rndul lui cauz pentru un alt efect .a.m.d.
Astfel se formeaz un lan cauzal. Orice ntrerupere a lanului cauzal nseamn de fapt
existena unui efect care s nu aib cauz. Nici un fenomen nu se abate de la acest
principiu care poart numele de principiul cauzalitii. Cunoaterea desfurrii
evenimentelor este asigurat de cunoaterea legilor care guverneaz fenomenul i a
ansamblului de condiii n care se desfoar acesta. Deci legea este un element
primordial n cunoaterea fenomenelor deoarece exprim raporturile eseniale,
necesare, generale, relativ stabile i repetabile ale fenomenelor i ale desfurrii lor.
Putem deosebi dou mari categorii de legi:
- legi fizice, care se aplic fenomenelor i proceselor individuale luate n parte
(ex. legea atraciei universale, legile I, II, III ale dinamicii etc.) i
- legi statistice, care se aplic numai fenomenelor de mas, ansamblurilor de
obiecte (ex. legea gazelor perfecte, legea dezintegrrii radioactive, etc.) i care
exprim anumite caracteristici ale ansamblului considerat.
Legile fizice permit cunoaterea perfect a desfurrii viitoare a fenomenelor
pe baza cunoaterii la momentul iniial a unor mrimi. Astfel, n mecanic, legea a II-a
a lui Newton permite cunoaterea perfect a micrii unui obiect atunci cnd se cunosc
la momentul iniial poziia (trei coordonate) i viteza sau impulsul (trei proiecii)
obiectului.
Legile statistice permit cunoaterea desfurrii viitoare a fenomenelor doar n
termeni probabilistici (probabiliti, valori medii, erori statistice etc.). Acest lucru
indic de la nceput c informaia pe care o d o lege statistic este mai srac dect
cea dat de legea dinamic. Cu toate acestea, legea statistic permite cunoaterea
desfurrii viitoare a fenomenelor i poate fi tot att de determinist ca i cea
dinamic.
Particularitatea esenial a legilor statistice izvort din faptul c ele acioneaz
n fenomenele de mas, unde ntregul este determinat de unitatea prilor componente,
o constituie exprimarea comportrii ansamblului de uniti omogene i nu a fiecrei
uniti n parte. n mod corespunztor, legea statistic se realizeaz ca o tendin
predominant, ca o necesitate care i croiete drum printr-un numr foarte mare de
contingene i care se manifest n aceste contingene ca media unui numr mare de
15
abateri ntmpltoare. De aici i principiul verificat deseori n practic: legea statistic
poate fi evideniat dac i numai dac este considerat i supus observrii un numr
mare sau suficient de mare de uniti elementare ale ansamblului considerat.

Noiuni elementare
Investigarea statistic presupune, prin definiie, considerarea fenomenelor n
multiplicitatea i variabilitatea lor. Un ansamblu de fenomene formeaz un fenomen
de mas, sau, ceea ce numim populaie statistic, n msura n care elementele
componente (indivizi) sunt de aceai natur, adic au toate o proprietate comun i se
deosebesc unele de altele n raport cu aspectele sau valorile caracteristice luate n
studiu. Populaia cu care lucreaz statistica trebuie s fie global omogen - s includ
doar elementele similare, aparinnd de aceeai "categorie" i intern structurat -
elementele ei s poat fi ordonate potrivit unui sistem de clasificare.
Aa cum rezult din cele de mai sus, o nsuire specific statisticii este aceea c
statistica nu se ocup cu un element (individ) luat ca atare, ci cu colectiviti, cu
grupuri de elemente ce posed o anumit trstur comun. Aceast trstur se
numete caracteristic. Denumirea de "populaie" s-a pstrat din timpurile n care
statistica se ocupa cu precdere de populaii n sensul propriu al cuvntului. O
populaie poate fi mpit n subpopulaii sau populaii pariale, care sunt: clase,
grupe i eantioane.
O clas este un subansamblu de elemente ale unei populaii care conin o
variabli determinat de aceeai msur.
Un grup este un subansamblu de elemente ale unei populaii care se distinge
printr-o manier de tratare comun.
Un eantion este un subansamblu de elemente ale unei populaii ales la
ntmplare. Se apeleaz la acest gen de populaie parial atunci cnd populaia n
studiu este prea mare pentru a fi tratat n ansamblul ei. Studiul asupra eantionului va
fi atribuit ntregii populaii.
Indivizii unei populaii statistice sunt cercetai pentru una sau mai multe
caracteristici. Caracteristicile ntlnite se clasific n caracteristici cantitative i
calitative. Caracteristicile cantitative sunt cele care se a cror msur au o exprimare
16
numeric (nlime, greutate, lungimea unui ru etc.) i se mai numesc variabile
statistice. Caracteristicile calitative nu se msoar numeric (culoare, sexul unei
persoane etc.). Ele nu reprezint o msur a unei entiti. Dac se convine s se
reprezinte unele din ele prin numere ataate la categoriile ce le determin, nu este
vorba dect de o "codificare", procedeul nejustificnd operaiile aritmetice. Aceste
caracteristici se mai numesc atribute.
La rndul lor, caracteristicile cantitative pot fi discrete sau continue.
Variabilele discrete sunt cele care pot lua un numr finit (sau cel mult numrabil) de
valori distincte (ntregi, fracionare), cum ar fi numrul membrilor unei familii, nr. de
staii hidrologice etc. Variabilele continue sunt cele care pot lua orice valoare dintr-un
anumit interval (nlimea unui individ, nivelul unui ru etc.). Totui, n practic nu se
ntlnete o informaie privind adncimea unui ru de forma: 1m, 3 cm, 17 microni.
Acest lucru nu se va ntmpla fie c precizia aparatelor cu care efectum msurtorile
este limitat, fie c o precizie exagerat nu este ntotdeauna folositoare pentru ceea ce
urmrim n investigaie. Astfel, msurtorile sau datele de observaie se grupeaz n
cadrul unei anumite uniti i deci din punct de vedere practic se lucreaz cu forma
discret chiar dac variabilele sunt de tip continuu. Distincia ntre caracterul cantitativ
i cel calitativ, precum i ntre variabilele discrete i variabilele continue este
fundamental deoarece ele recurg la tehnici de analiz foarte diferite.
Aici trebuie s lmurim un lucru care d deseori natere la confuzii: muli sunt
nclinai s cread c variabilele discrete trebuie s ia numai valori ntregi i c
numerele fracionare sunt tipice pentru variabilele continue; cu alte cuvinte diferena
dintre continuu i discret se confund cu diferena dintre msurtorile cu numere
ntregi i cele fracionare. S lum exemplul urmtor: o variabil ia valorile: 1,041;
1,065; 1,077. Aceasta este o variabil discret deoarece trecerea de la o valoare la alta
se face fr vreo alt valoare intermediar.
Cercetarea statistic a unei colectiviti poate fi:
-exhaustiv (total), cnd fiecare individ este analizat, de exemplu n cazul
recensmintelor;
-parial (selectiv), cnd sunt examinai numai anumii indivizi, alei aleator.
Ea este cea mai frecvent folosit, n majoritatea cazurilor fiind i singura posibil.
17
Partea examinat din colectivitate se numete selecie sau eantion. Numrul
indivizilor examinai se numete volumul seleciei.

Analiza seriilor statistice
Evaluarea anumitor indicatori (parametri) statistici implic stabilirea
caracteristicilor (proprietilor) principale ale seriilor statistice. Acestea sunt:
variabilitatea, omogenitatea, independena i concentrarea/mprtierea (dispersia)
ctre/fa de un una sau mai multe valori ale seriei.
Variabilitatea termenilor unei serii statistice este determinat de faptul c
fenomenul pe care l reprezint nu este univoc determinat, ci apare ca un rezultat al
aciunii combinate a mai multor cauze (permanente sau ntmpltoare). Cu ct
aciunea cauzelor ntmpltoare este mai mare, cu att variabilitatea este mai mare i
gradul de omogenitate mai mic.
Omogenitatea presupune o variaie minim ntre termeni. Dac n urma
analizei se constat c o serie nu prezint omogenitate, nseamn c n acest caz
colectivitatea este format din mai multe tipuri calitative i seria trebuie descompus
n subserii componente.
Independena termenilor unei serii provine din faptul c fiecare valoare
individual reprezint un element distinct i obiectiv al unei populaii statistice.
Termenii ce aparin aceleiai colectiviti se supun acelorai legi care se manifest sub
form de tendin.
Concentrarea/mprtierea (dispersia) ctre/fa de un una sau mai multe
valori ale seriei apare ca rezultat al intensitii unui efect produs de cauze eseniale i
ntmpltoare. Acest lucru determin frecvenele diferite de apariie a diferitelor valori
din serie. Dac intensitatea factorilor este uniform, frecvenele de apariie sunt
apropiate. n caz contrar, frecvenele de apariie se concentreaz fie la un singur capt
al seriei, fie ctre o valoare central.

Repartiii de frecvene
Exist diferene ntre analiza seriilor dinamice i problemele legate de gruparea
i analizarea materialelor pentru care factorul timp nu are importan. La cercetarea
18
seriilor dinamice problema de baz o reprezint analiza variabilei timp.
Metodele de analiz folosite n aceste dou cazuri se deosebesc sensibil. n cele
ce urmeaz ne vom ocupa de problemele gruprii i analizei prealabile a datelor
numerice pentru care ordinea de aezare n timp nu conteaz.
Datele statistice n stare brut reprezint o mas dezordonat de materiale.
Prima problem este aceea de a face o asemenea grupare a datelor cu ajutorul creia s
se poat aprecia valoarea lor n legtur cu problema propus, s se poat nlesni
comparaia cu alte date de acelai gen i s se poat obine posibilitatea unei analize
ulterioare. nainte ca materialul statistic s fie supus analizei ulterioare i
generalizrilor care vor permite s se fac anumite deducii, el trebuie s capete o
anumit form i o structur clar. Cu alte cuvinte n cadrul analizei datelor statistice
trebuie s se ia n considerare att valorile individuale ct i frecvenele de apariie ale
acestora.
n urma observrii caracteristicii cantitative X n n probe se obin urmtoarele
date primare:

x
1
, x
2
,..., x
n
(1)

n cazul n care volumul seleciei este mic aceste date sunt uor de manipulat i nu este
nevoie de o grupare a lor. Dac ns avem o selecie de volum mare este greu de lucrat
cu aceste date. n plus tabelele de date primare nu sugereaz nimic referitor la referitor
la repartiia variabilei X. De aceea este nevoie de o grupare (centralizare) a datelor.
Gruparea datelor se face n funcie de tipul caracteristicii X. Astfel, dac X
este o variabil discret ce poate lua valorile distincte v
1
, v
2
,..., v
n
, atunci n locul
datelor iniiale se va reine repartiia empiric:


|
|
.
|

\
|
m
m
n n n
v v v
... .
... .
2 1
2 1
(2)

Unde n
i
, (i=1, m) reprezint frecvena apariiei (numrul de apariii) valorii v
i
, iar n
19
reprezint numrul valorilor din irul iniial (1) i se numete frecven absolut a
valorii v. Valoare m reprezint numrul de clase.
Raportul f
j
=n
j
/n dintre frecvena absolut i numrul total de probe se numete
frecven relativ. Se observ c

f
1
+f
2
++f
m
=1 ntruct n
1
+n
2
+... +n
m
=n.

Frecvenele relative, numite impropriu i probabiliti de apariie, stau la baza
calculrii densitii de repartiie a frecvenelor i a indicatorilor care exprim gradul de
concentrare. De asemenea permit compararea a dou repartiii construite pe aceeai
variabil, care difer numai prin numrul unitilor pe grupe.

Dac X este o variabil continu care poate lua valori ntr-un interval [a,b]
atunci acest interval este mprit n m subintervale [a
j
, a
j+1
], j=1, m , cu a
1
=a i a
m+1

=b. Pentru fiecare din aceste subintervale se determin numrul n al valorilor din irul
(1) care se afl n acest interval numit frecven absolut a subintervalului.
Subintervalele [a
j
, a
j+1
] se pot lua arbitrar. De cele mai multe ori extremitile
se iau echidistante, deci subintervalele au lungimi egale. ns numrul m al
subintervalelor nu se alege la ntmplare. Este important ca prin gruparea datelor s nu
se piard caracterul global al repartiiei (dac m este prea mic se poate denatura
repartiia real a variabilei X). Astfel, dup unii autori numrul subintervalelor, m,
trebuie alese n conformitate cu formula lui Sturges:

m=[1 +3,322logn]

Mrimea intervalului va fi dat de formula:


m
x x
i
min max

=


Reprezentarea grafic a repartiiilor statistice
20
Exist mai multe tipuri de reprezentri grafice a datelor statistice. Dintre
acestea prezentm histograma, poligonul frecvenelor i graficul frecvenelor
cumulate.
Histograma este o figur ntr-un sistem de coordonate rectangualre care
reprezint distribuia empiric prin dreptunghiuri. Bazele acestor dreptunghiuri,
construite pe axa absciselor, reprezint subintervalele folosite n centralizarea datelor.
nlimea h
j
a dreptunghiului cu baza (a
j
, a
j+1
) este proporional cu raportul dintre
frecvena relativ a intervalului i lungimea sa:


j j
j
j
a a
f
C h

=
+1

constanta C fiind un factor de scar. n cazul cnd subintervalele gruprii au lungimi
egale, nlimea h
j
va fi proporional cu frecvena relativ, deci h
j
=C*f
j
.

Poligonul frecvenelor este o diagram n care pe axa absciselor se iau
mijloacele v
j
ale intervalelor (a
j
, a
j+1
) folosite n grupare, iar pe axa ordonatelor
valorile h
j
definite n construirea histogramei. Linia frnt care unete punctele de
coordonate (v
j
, h
j
) se numete poligonul frecvenelor. El se poate obine din
histogram unind mijloacele laturilor superioare ale drptunghiurilor. n fig 1 poligonul
frecvenelor este trasat printr-o linie punctat.
Mrimile c
1
, c
2
, ..., c
m
definite prin:

=
=
j
i
i j
f c
1


se numesc frecvene cumulate.
Linia frnt obinut prin unirea punctelor de coordonate (a
j+1
, c
j
] se numete graficul
frecvenelor cumulate.

Modaliti de clasificare a datelor
21

Modul de stabilire a claselor determinarea pragurilor minime i maxime ale
fiecrei clase determin maniera n care sunt atribuite valorile fiecrei clase i deci
felul n care va arta distribuia. Prin schimbarea claselor se creaz diagrame cu aspect
diferit. n general se urmrete ca valori similare s fie n aceeai clas.
Exist doi factori cheie n clasificarea datelor: schema de clasificare utilizat i
numrul de clase ce se dorete a fi creat. Dac datele sunt bine cunoscute se poate
predetermina manual numrul de clase. n caz contrar se utilizeaz schemele clasice.
Cele mai frecvente scheme de clasificare sunt: natural breaks, quantile, intervale
egale i deviaia standard. Acestea sunt descrise n cele ce urmeaz.


Scheme standard de clasificare

Natural breaks (Jenks)

Datele se clasific pe baza gruprii naturale a valorilor. Se identific punctele
de ruptur cutnd acele modele de grupare implicite ale datelor. Valorile sunt
mprite n clase acolo unde graniele sunt marcate prin salturi mari de la o valoare la
alta.


22

Quantile

Fiecare clas conine un numr egal de valori. O astfel de clasificare este foarte
potrivit n cazul datelor liniare. Din cauz c datele sunt grupate dup numr n
fiecare clas, diagrama rezultat poate fi neltoare. Datele similare pot fi plasate n
clase diferite, sau valori foarte diferite pot fi grupate mpreun. Aceast distorsiune
poate fi evitat mrind numrul de clase.


Intervale egale

Aceast schem de clasificare divide irul de valori atribut n subiruri egale.
Spre exemplu n cazul unui ir de valori de la 1 la 300 i a trei clase, fiecare clas
reprezint un ir de 100 ( 1-100, 101-200, 201-300). Aceast metod accentueaz
cantitatea de valori atribut relativ la celelalte valori, spre exemplu pentru arta c un
magazin este parte a unui lan de magazine care a realizat o treime din vnzri. Cel
mai bine se utilizeaz pentru iruri de date dintr-un anumit domeniu cum ar fi
temperatura i procentele.

23




Deviaia standard

Aceast schem de clasificare arat cu ct variaz o valoare de la medie. Se
calculeaz media i apoi se genereaz clasele adugnd sau scznd din ea deviaia
standard.



Caracterizarea repartiiilor de frecven

Datele (care se refer la diferite domenii ale cunoaterii) odat aranjate ntr-o
24
repartiie de frecvene, scot n eviden trsturile commune ale tuturor curbelor de
repartiie i care se supun unor legi generale. Acest lucru ne permite ca experiena
ctigat ntr-un anumit domeniu al cunoaterii s poat fi extins i n alt domeniu.
La toate curbele ns trebuie s observm variabilitatea mrimilor care se obin
ca rezultat al unor msurtori. Cu toate c exist variabilitate, se observ o tendin a
datelor de a se grupa n centrul curbei (tendina central). Dac se msoar mrimea
abaterii de la punctul de concentrare maxim a frecvenelor, se constat c sunt mai
frecvente abaterile mici dect cele mari, c abaterile n ambele pri fa de punctul de
concentrare maxim se echilibreaz aproape complet i c abaterile foarte mari sunt
foarte rare. Deoarece frecvena variaz, vom alege acea mrime care se ntlnete cel
mai des. Ea va fi msura tendinei centrale a repartiiei. Aceast mrime, ca i altele
asemntoare se numesc indicatori (sau parametrii) de poziie, deoarece arat poziia
elementelor principale ale repartiiei pe axa absciselor.
Caracterul reprezentativ al oricrui indicator de poziie depinde de ct de strns
i se altur celelalte valori, sau cu alte cuvinte, de gradul de concentrare a datelor n
jurul tendinei centrale.
Indicatorii tendinei centrale

Atenuarea datelor, care accidental sunt prea mari sau prea mici dintr-o
populaie statistic se face prin calcularea unor medii, n felul acesta fcndu-se o
compensare a valorilor individuale. Acest calcul ne arat o anumit tendin a
fenomenului studiat, media statistic fiind o valoare ce sintetizeaz ntr-o singur
expresie numeric toate valorile din seria msurtori sau observaii. Termenii seriei
difer de medie deoarece au fost influenai de diferii factori.

Media aritmetic
Media aritmetic simpl exprim un nivel mediu, anihilnd abaterile
individuale, netipice. Ea este cuprins ntre valoraea cea mai mare i cea mai mic.
Definiia 1. Dac n urma unei selecii apar valorile distincte x
1
, x
2
,..., x
n
, atunci media
aritmetic este dat de formula:

25

=
=
+ + +
=
n
i
i
n
x
n n
x x x
x
1
2 1
1 ...


n cazul datelor centralizate (n care avem repartiia de frecven (2)):

=
=
+ + +
=
n
i
i i
n n
v n
n n
v n v n v n
x
1
2 2 1 1
1 ...


care se mai numete medie aritmetic ponderat. Numrul care arat de cte ori se
repet fiecare valoare (n
j
) este "ponderea" valorii respective.
Observaia 1. Media aritmetic are dezavantajul c este sensibil la valori
extreme, iar dac termenii sunt prea "mprtiai", tinde s devin o valoare
nereprezentativ. Media aritmetic este o valoare lipsit de coninut dac elementele
sunt deosebite din punct de vedere calitativ, caz n care este mai util s se fac medii
pariale pentru fiecare tip de colectivitate.
Observaia 2. Dac avem mai multe medii, fiecare referindu-se la o anumit
categorie, fiecare medie va fi ponderat n funcie de importana categoriei sale.

Media geometric
Media geometric este mai puin sensibil la valorile extreme dect celelalte
medii, deci se ntrebuineaz cnd dorim s atenum divergenele mari dintr-o serie de
determinri cu frecvene egale, fiind dup o expresie "cea mai exact medie". Se
utilizeaz cnd valorile au o evoluie (de cretere sau scdere) permanent,
nentrerupt, sau o raie din ce n ce mai mare, termenii fiind legai ntre ei printr-o
relaie de produs. De asemenea se mai ntrebuineaz cnd vrem s dm o importan
mai mare termenilor mai mici, n valoare absolut, sau cnd diferenele ntre termeni
sunt foarte mari. Are dezavantajul c nu se poate ntrebuina cnd avem valori nule sau
negative.



26
Definiia 2. Dac x
1
, x
2
,..., x
n
sunt n valori, media geometric se definete prin


n
n g
x x x M ...
2 1
=

Calculul se face mai uor cu ajutorul logaritmilor:

=
=
n
i
i g
x
n
M
1
lg
1
lg

Datorit faptului c se calculeaz mai uor cu ajutorul logarimilor, se mai
numete "medie logaritmic". Ea se utilizeaz i la calcularea ritmului (de cretere sau
descretere) numindu-se astfel i "medie de ritm". n rezumat, se ntrebuineaz cnd:
- seria are o mare dinamicitate;
- termenii au variaii mari;
- distribuia are un caracter pronunat de asimetrie.

Observaia 3. Media geometric se folosete atunci cnd prezint importan
variaiile relative. De asemenea media geometric poate fi folositoare pentru calculul
unor rapoarte.

Media ptratica se ntrebuineaz cnd valorile prezint creteri din ce n ce
mai mari. Ea constituie modelul matematic pentru abaterea medie ptratic. Media
este sensibil la valori extreme, din care cauz este ntotdeauna mai mare dect
celelalte medii. Are avantajul c se poate aplica i n cazul valorilor nule sau negative
(care prin ridicare la ptrat devin pozitive). Se ntrebuinzeaz cnd dm importan
valorilor mari.
Definiia 3. Media ptratic este definit prin formula:

=
=
n
i
i s patr
x
n
x
1
2
,
1

27

sau n cazul datelor centralizate (media ponerat):

=
=
n
i
i i p patr
v n
n
x
1
2
,
1


Media Armonic
Definiia 4. Media armonic este valoarea invers a mediei aritmetice ale
valorilor inverse datelor de observaie:

=
=
n
i i
h
x
n
M
1
1


Exprim caracterul sintetic al unor valori ce se afl n raport invers. Se
utilizeaz cnd frecvenele sunt egale. Pentru o repartiie de frecven, media armonic
se folosete rar. Se utilizeaz cu predilecie n economie.

Media glisant numit i "medie mobil", se utilizeaz n cazul n care irul
valorilor prezint fluctuaii mari, brute i e greu de apreciat tendina (trendul). Se
presupune c media glisant corespunde mijlocului intervalului sintetic. Calculul se
face mediind 3 sau 5 valori alturate.
Definiia 5. Media glisant pentru 3, respectiv 5 valori alturate sunt date de formulele


3
1 1
3 ,
+
+ +
=
i i i
glis
x x x
x

5
2 1 1 2
5 ,
+ +
+ + + +
=
i i i i i
glis
x x x x x
x



28
Mediana
Definiia 6. Mediana este elementul dintr-un ir de date statistice care ar mpri
intervalul n dou grupe egale ca numr, dup ce acestea au fost ordonate dup
mrimea lor. Dac seria are 2n+1 elemente, atunci mediana este elementul n+1, iar
dac are 2n elemente mediana este media aritmetic a celor doi termeni din mijloc.

Indicatorii variaiei
O medie este reprezentativ numai atunci cnd se calculeaz din valori
omogene ntre ele. Cu ct fenomenele sunt mai complexe (dependente de mai multi
factori), cu att variaia este mai mare i utilizarea mrimilor medii devine
insuficient. De aceea este important de cunoscut ct de departe sunt valorile sumei
statistice fa de medie. Comparaia se face cu media seriei, considerat ca fiind
valoarea cea mai reprezentativ pentru populaia statistic.
Analiza statistic a unei repartiii poate fi aprofundat prin calculul indicatorilor de
variaie. Aceti indicatori trebuie s serveasc la:
-verificarea reprezentativitii mediei ca valoare tipic a unei populaii statistice;
-verificarea gradului de omogenitate a seriei;
-caracterizarea statistic a formei i gradului de variaie a unui indicator;
-cunoasterea gradului de influen a factorilor dup care s-a facut gruparea
unitilor observate.

Indicatorii simpli ai variaiei
Indicatorii simpli ai variaiei servesc la caracterizarea gradului de mpratiere a
mrimilor seriei statistice. Se pot exprima att n mrimi absolute ct i n mrimi
relative.
Din aceasta grup fac parte:
-amplitudinea variaiei (absolut i relativ);
-abaterile individuale (absolute i relative).

29


Amplitudinea absolut se calculeaza ca diferena dintre valoarea maxim i valoarea
minim al caracteristicii:
A
a
=x
max
x
min
Amplitudinea relativ se exprima de regul n procente i se calculeaz ca un raport
ntre amplitudinea absolut i media aritmetic:
A
r
= 100
x
A
a

Abaterile individuale absolute (d
i
) se calculeaz ca diferena ntre fiecare valoare i
media aritmetic:
d
i
=x
i
- x , i =1,...,n

Abaterile individuale relative (d
r
) se calculeaz ca raportul dintre abaterile
individuale absolute i media aritmetic (se exprima n procente):
d
r
= 100
x
d
i
, i =1,...,n
Gradul de variaie al unei caracteristici depinde de toate abaterile variantelor
nregistrate i de frecvena lor de apariie i prin urmare indicatorii simpli ai variaiei
nu pot exprima ntreaga variaie a unei populaii statistice. De aceea a fost necesar
introducerea indicatorilor sintetici ai variaiei.


Indicatorii sintetici ai variaiei
Indicatorii sintetici ai variaiei, la fel ca i indicatorii tendintei centrale trebuie
s se bazeze pe toate observaiile, sa fie uor de calculat, uor de nteles i s fie ct
mai puin afectai de fluctuaiile de selecie.
Indicatorii sintetici ai variaiei sunt:
-abaterea medie liniar ;
-abaterea medie patratic;
-dispersia;
30
-coeficientul de variaie.

Abaterea medie liniar se calculeaz ca o medie aritmetic simpl sau
ponderat, luate n valoare absolut:
Pentru o serie simpl

n
x x
d
n
i
i
=

=
1
| |


Abaterea medie liniar prezint dezavantajul c nu ine seama de faptul c
abaterile mai mari n valoare absolut influenteaz n mai mare masur gradul de
variaie a unei caracteristici, n comparaie cu abaterile mici. n plus, nu este indicat s
se renune n mod arbitrar la semnul valorilor din care se calculeaz o valoare medie.
Din aceste considerente se folosete ca principal indicator sintetic al variaiei abaterea
medie patratic.

Abaterea medie patratic sau abaterea standard () se calculeaz ca o medie
patratic din abaterile tuturor elementelor seriei de la media lor aritmetic:
=
n
x x
n
i
i
=

1
2
) (


Acest indicator este mai concludent dect abaterea medie liniar. Prin ridicarea la
ptrat se d o importan mai mare abaterilor mari n valoare absolut, acestea
influennd ntr-o msura mai mare gradul de variaie al variabilelor analizate.
n literatura de specialitate se apreciaz ca pentru o serie de distribuie normal
abaterea medie liniar este egal cu 4/5 din valoarea abaterii medii ptratice.
Abaterea medie ptratic este un indicator de baz, care se folosete la analiza
variaiei, la estimarea erorilor de selecie n calculul de corelaie.
La fel ca abaterea medie liniar, abaterea medie ptratic se exprim n
31
unitatea de masur a variabilei a crei variaie o caracterizeaz. Prin urmare cei doi
indicatori nu se pot folosi pentru compararea gradului de variaie i n aceasta situaie
se recurge la un alt indicator de variaie: coeficientul de variaie.

Coeficientul de variaie (v) se calculeaza ca un raport ntre abaterea medie
ptratic i media aritmetic. De obicei se exprim sub form de procente:
v = 100
x


Semnificaie. Cu ct valoarea lui v este mai aproape de zero cu att variaia este mai
slab, colectivitatea este mai omogen, media avnd un grad ridicat de
reprezentativitate. Cu ct valoarea lui v este mai mare cu att variaia este mai intens,
colectivitatea este mai eterogen, iar media are un nivel de semnificaie sczut.
Se apreciaz c la un coeficient de peste 35-40%, media nu mai este
reprezentativ i datele trebuie separate n serii de componente, pe grupe, n funcie de
variaia unei alte caracteristici de grupare.
Se poate afirma c acest indicator poate fi folosit ca un test n aplicarea
metodei gruprii. Dac media aritmetic este aproape de zero, coeficientul de variaie
nu are semnificaie.

Dispersia (
2
) este media ptratelor abaterilor de la media aritmetic:
( )
2
2
1

= x x
n
i
.

Msura dispersiei se refer la mprtierea valorilor dintr-un set de date.
Media nu are semnificaie dac se aplic pe un set de date foarte dispersate. De
exemplu dac lum valoarea medie a oraelor mari (peste 200.000 locuitori) va da o
valoare de peste 400.000 datorit Bucuretiului care are 2.000.000. ns rezultatul nu
are nici o semnificaie (nici un ora nu area aceast valoare).
Msurile dispersiei, exprimate sub forma unitilor de msur ale fenomenului
cercetat, nu sunt ntotdeauna utile atunci cnd se compar dispersiile a dou sau mai
multe serii. Compararea dispersiilor a dou sau mai multe serii d rezultate n
32
urmtoarele 2 situaii:
a) irurile care se compar pot fi exprimate n aceleai uniti, iar mediile pot fi
aceleai sau au dimensiuni aproape egale.
b) irurile care se compar pot fi exprimate n aceleai uniti, ns mediile
difer.
Dac seriile se exprim n uniti diferite, dispersiile nu pot fi comparate direct. De
aceea de multe ori se folosete abaterea medie ptratic n loc de dispersie.

n unele lucrri aceast mrime se numete varian (din l. engl. variance). Variana
este o msur important n special cnd se studiaz variaia a dou sau mai multe
eantioane. O tehnic statistic foarte puternic este cunoscut sub numele de analiza
de varian i utilizeaz dispersia pentru a decide dac un numr de eantioane difer
semnificativ unul de altul.

Skewness i kurtosis
Skewness
Abaterea medie ptratic i dispersia sunt indicatori care dau o msur a
mprtierii valorilor ntr-o distribuie de frecven. ntr-un anume sens ele ofer o
msur a limii distribuiei. Aceasta ns nu ofer nici o informaie privind
caracteristicile formei distribuiei de frecven. Figura de mai jos nfieaz 6
distribuii utiliznd histograma. Aceasta reprezint un set de date care au acelai
numr de valori. Pe orizontal avem o unitate de msur exprimat n abateri medii
patratice (), iar pe vertical avem media aritmetic. Dup cum se observ, se poate
face o comparaie direct.
Aparent cele ase distribuii de frecven sunt foarte diferite. Cele din partea
dreapt (b, d, i f) sunt similare dintr-un singur punct de vedere, anume ele sunt
asimetrice, vrful este plasat n stnga sau dreapta mediei. Spunem c avem o
distribuie distorsionat sau asimetric (skewed). Cele din stnga (a, c, e) au un grad
mic de distorsiune (asimetrie). n toate cazurile vrful este n apropierea mediei. Toate
33
acestea sunt distribuite simetric.
Pe de alt parte cele dou distribuii de pe fiecare rnd pot fi considerate similare, n
sensul c au un anumit grad de ascuire sau kurtosis. Cele din primul rnd sunt
foarte ascuite; ele au aceleai grad de kurtosis. Cele din al doilea rnd au ascuimea
mai moderat, iar cele din al treilea rnd sunt relative plate.
Distorsiunea msoar, deci, volumul de valori din distribuia concentrat de o
parte i de alta a mediei. Dac acest volum de valori este mai mic dect media,
spunem c distribuia este pozitiv distorsionat (b). Dac exist mai multe valori mai
mari dect media, spunem c distribuia este negativ distorsionat (d).




O distribuie perfect simetric nu are distorsiune (skewness=0).
Exist mai multe metode de msurare a distorsiunii. Cea mai uzitat este formula:


3
3
) (
n
x x
S


=
unde la numrtor avem deviaia cubic a valorilor fa de medie, iar este abaterea
medie ptratic.
n rezumat, avem urmtoarele situaii:
34
-dac S <0 avem distorsiune negativ;
-dac S >0 avem distorsiune pozitiv.
Skewness este un concept cu aplicaii importante n geografie deoarece foarte
multe variabile n geografie au o distribuie accentuat distorsionat. Cu alte cuvinte
distribuia de frecven seamn foarte mult cu cele nfiate n b, d sau f.
n al doilea rnd ali indicatori cum ar fi media sau dispersia pot conduce la
interpretri greite dac se folosesc izolat.

Kurtosis
Kurtosis d o msur a extinderii nspre valorile care sunt concentrate ntr-o
parte a distribuiei de frecven. Dac o clas ntr-o distribuie de frecven conine o
foarte mare parte din valorile din distribuie, atunci distribuia prezint un mare grad
de kurtosis, iar forma este mai ascuit.
ntr-o distribuie cu un grad mic de kurtosis (distribuie plat) fiecare clas
conine o proporie similar din toate valorile.
Formula folosit pentru Kurtosis (K) este:

4
4
) (
n
x x
K


=
Pentru distribuia normal avem K=3, pentru o distribuie ascuita K>3, iar
pentru o distribuie plat K<3.
Din pcate acest indicator nu este folosit n studii geografice asa cum ar fi de
dorit. Ca i skewness kurtosis ofer informaii preioase asupra distribuiei unui set de
date suplimentare celor date de medie i dispersie.
Trebuie remarcat faptul ca multe variabile statistice ntlnite n geografie au o
distorsiune mare dar i un K mare (>3). Cnd se aplic acestor variabile media
aritmetica i dispersia, acestea pot conduce la informaii eronate. Mai mult n aceste
condiii datele nu prezint o distribuie normal astfel c nu pot fi aplicate testele
parametrice.

35
Repartiii de frecven

Asocierea dintre distribuia observat i cea teoretic a fost mult timp neglijat
n geografie. Un studiu statistic nu poate fi fcut (nu are sens) fr aceast asociere.
Forma unei distribuii permite gsirea parametrilor descriptivi cei mai potrivii pentru
fenomenul urmrit. Recunoaterea formei unei distribuii este un indiciu pentru
procedurile de transformare a datelor n mod corespunztor. Totodat ncadrarea ntr-o
lege de distribuie teoretic permite att operaii de interpolare ct i de extrapolare.
Ajustarea unei distribuii observate la o distribuie teoretic-adic la modele
probabiliste propriu-zise-implic acceptarea a priori c legile se ncadreaz n
repartiia observat/msurat a fenomenului n cauz.
O cantitate msurabila care poate varia de la un element la altul se numete
caracteristic cantitativ. Uneori se mai folosete termenul de variabil. Ansamblul
noiunilor consacrate acestor caracteristici poart numele generic de teoria
caracteristicilor cantitative.
Reamintim c, caracteristicile care pot lua orice valoare numeric ntre anumite
limite sunt numite caracteristici cantitative (variabile) continue. Caracteristicile care
pot lua numai anumite valori se numesc caracteristici cantitative (variabile) discrete
(discontinue).
Dac mai multe sute sau mii de valori ale unei variabile au fost notate ntr-o
ordine cu totul arbitrar n care au aprut ele n realitate, va fi dificil s tragem vreo
concluzie cu privire la semnificaia acestor date. De aceea va trebui s condensm
datele cu ajutorul unor anumite metode de ordonare sau grupare astfel ca proprietaile
datelor s poat fi uor evideniate. De regul valorile alese pentru a defini grupele
succesive vor fi echidistante, astfel ca numerele provenite din observaii i care aparin
la diferite grupe s poat fi comparabile.
Modul n care frecvenele de grup sunt repartizate n intervale succesive se
numete repartiia de frecven a variabilei.


36
Reprezentarea grafica: poligonul frecvenelor i histograma.
Deseori este convenabil s reprezentm o repartiie de frecven cu ajutorul
unei diagrame care s sugereze configuraia observaiilor.

Histograma



-poligonul frecvenei: unirea punctelor marcate pe vertical pe mijlocul intervalului.




De observat c oricare ar fi aceste diagrame (orice form ar avea), o anumit arie
reprezint un numr de observaii.

37


Numarul de observaii care cad n intervalul [x
1
, x
2
] este proporional cu aria
delimitat de curb i cele dou drepte.



Dac intervalele de grup sunt micorate, n acelai timp numrul de observaii
crete, astfel nct frecvenele de grup s rmn finite, poligonul i histograma se
apropie din ce n ce mai mult de o curb neted.
O astfel de linie ideal a poligonului i histogramei se numete curb de
frecven. Este un concept esenial n statistic.
Cnd vom aborda teoria seleciei va trebui s privim curba de frecven ca
reprezentnd o populaie din care datele reale reprezint un eantion. Poligonul
frecvenelor i histograma vor fi aproximate cu o curb, dar se vor ndeprta de ea n
anumite poriuni, datorit fluctuaiilor seleciei. Atunci cnd numrul de observaii
este considerabil, s zicem 1000, poligonul frecvenelor este suficient de neted pentru
38
a da o bun imagine a formei repartiiei ideale.

Cteva tipuri uzuale de repartiii de frecven.
Formele histogramelor corespunzatoare diferitelor date statistice sunt aproape
fr sfrit n varietatea lor, dar printre ele putem distinge un numr relativ mic de
tipuri fundamentale.
1) Repartiia simetric. Valoarea medie este valoarea maxim i centrat, iar
extremele descresc i tind spre zero (distribuia normal) ideal.



2) Repartiia moderat-asimetric (oblic). Frecvenele de grup descresc cu
mare rapiditate ntr-o parte i mai lent n cealalt parte. Este cazul cel mai frecvent.



39
3) Repartiia n forma de U. Frecvenele maxime sunt la capetele intervalului
de variaie. Este rar.






4) Repartiia extrem asimetric.



40
Repartiii teoretice importante

Repartiia binomial
Legea binomial permite descrierea probabilitilor asociate cu privire la dou
experimente exclusive.
Pentru evitarea unor exemple particulare (monede, zaruri), vom folosi termenul
de succes pentru apariia unui eveniment (probabilitatea_1=p) i insucces pentru
neapariia sa (probabilitatea_2=q). Evident vom avea p+q=1.
Considerm c toate evenimentele ntr-un numr de ncercri sunt
independente, adic probabilitile p i q sunt aceleai pentru fiecare eveniment i
rmn constante de-a lungul ncercrilor.
Presupunem c efectum un numar de N serii n care efectum cte n ncercri
n fiecare din cele N serii i determinm numrul de succese din fiecare serie (ex.
aruncm o moneda de 10 ori pentru fiecare serie, observnd de cte ori apare stema la
fiecare serie).
n general, vor exista unele serii la care nu vom observa succese, altele la care
vom observa un succes, altele cu dou succese .a.m.d. Prin urmare dac grupm
seriile n raport cu numrul de succese vom obine o repartiie de frecven.

Ex. 12 zaruri aruncate de 4096 de ori, apariia lui 6 fiind considerat un succes,
conduce la urmtorul rezultat.

Nr. succese 0 1 2 3 4 5 6 7 i mai mult.
Nr. aruncri 447 1145 1181 796 380 115 24 8

Vom arta c, folosind ipotezele de independen a experienelor succesive
vom putea determina teoretic natura acestei repartiii.
n cazul seriilor cu o singur ncercare, estimm ca n N astfel de serii s
obinem Np succese i Nq insuccese.
41
Cnd avem dou ncercri, posibilitile sunt:


SS SI IS II
p
2
+2pq+q
2
de N ori

Cnd avem trei ncercri:

SSS SSI ISS IIS ISI SII III

Deoarece nu conteaz ordinea n care au aprut succesele i insuccesele, putem scrie

SSS 3SSI 3SII III
p
3
+ 3p
2
q + 3pq
2
+q
3
sau
p
3
+C
3
1
p
2
q +C
3
2
pq
2
+q
3


Pentru n ncercri, obinem formula general (dezvoltarea binomial):

N{p
n
+
1
n
C p
n-1
q+...+
k
n
C p
n-k
q
k
+...+
1 n
n
C pq
n-1
+q
n
}

Exmplul1.Dac lum 100 de serii cu cte10 aruncri ale unei monezi perfecte,
n cte cazuri ne ateptm s obinem de 7 ori stema i de 3 ori valoarea?
R. Aici avem p=
2
1
, q=
2
1
.
Frecvenele a celor 0,1,...,10 succese sunt termenii din dezvoltarea binomial,

100 .
2
1
2
1
10
|
.
|

\
|
+ Termenul care d frecvena a 7 succese i a 3 insuccese este:
42
100 12
2
1
2
1
3 7
7
10
|
.
|

\
|
|
.
|

\
|
C


E Exemplul 2. Acelai text cu ntrebarea: n cte cazuri ne ateptm s obinem
cel puin de 7 ori stema.

R. Cutm suma termenilor corespunzatori la 7,8,9 i 10 succese:
{ } 17
2
100
10
10
9
10
8
10
7
10 10
+ + + C C C C

Forma general a repartiiei binomial depinde de valorile lui p i q i de
valorile exponentului n (numrul de ncercri din fiecare serie).
Dac p i q sunt egali, repartiia este evident simetric, deoarece p i q pot fi
permutai ntre ei, fr a schimba valoarea vreunui termen i prin urmare termenii
echidistani de la cele dou capete ale seriei sunt egali. Dac p i q nu sunt egali,
repartiia este asimetric.



Forma limit a repartiiei binomial. Cnd n crete, fiecare termen al
repartiiei binomial scade. ns suma unor termeni care cad ntre anumite limite nu va
43
fi mic.
Chiar dac p nu este egal cu q, cnd n devine din ce n ce mai mare, repartiia
binomial tinde ctre forma unei curbe continue simetrice. n figura de mai jos am
exemplificat (Yule, Kendal, 1969) tendina spre simetrie pe care o are repartiia
binomial (0,9+0,1)
n
pentru diferite valori ale lui n.



Se demonstreaz c valoarea maxim este atins ntr-un anumit punct pe care l
vom nota cu p
k
i care este dat de


npq
p
k

=
2
1


Astfel funcia care aproximeaz foarte bine valorile repartiiei binomiale este


npq
np x
e
npq
x f
2
) (
2
2
1
) (



unde

np=valoarea mediei
npq = =abaterea medie patratic
44
Astfel la modul general putem scrie funcia sub forma
2
2
2
0

x
e y y

=

Aceast funcie se numete curba normal. De parametri m i i se noteaz
N(m,). Reprezentarea grafic a acestei distribuii este o curb n form de clopot
simetric fa de axa Oy i a crei forme este determinat de valoarea lui . Aceast
curb mai este numit i curba lui Gauss. n figura de mai jos sunt prezentate dou
curbe normale pentru diferite valori ale lui m i .



Proprieti ale curbei normale.
Curba normal este simetric n jurul punctului x=0, n acest punct i atinge
valoarea maxim. Curba normal este complet specificat dac se definete media
(originea lui x), abaterea standard i valoarea
0
y . n practic, dac dorim s
obinem o curb normal cu ajutorul unor date cunoscute, valoarea lui
0
y nu se d
direct, ci se calculeaz folosind faptul c aria curbei trebuie s fie egal pe scala
aleas, cu numarul total de observaii.
Aria determinat de curba normal i axa Ox este:

2
0
2
0
2
2
y dx e y
x
=


45
Dac lum
2
1
0
= y , aria este egal cu unitatea.
n aceast situaie putem obine imediat forma corespunztoare unei repartiii
de orice frecven dat. Astfel, dac frecvena este N, curba normal corespunzatoare
este:
2
2
2
2


x
e
N
y

= .
Media curbei normale, aa cum am vzut, este localizat n origine. Dac
dorim s scriem expresia curbei, n raport cu un alt punct ca origine, obinem forma:
( )
2
2
2
1
2
1
m x
e y

=


,
Unde m este abaterea de la medie a valorii alese ca origine.
2
este dispersia;
este abaterea medie ptratic (abaterea standard).

Proprietile curbei normale.
Curba normal este evident simetric n jurul punctului x=0, deoarece ecuaia
ei este independent de semnul lui x. n acest punct ordonata i atinge valoarea
maxim. Valoarea medie, mediana i modulul coincid. Este considerat o curba
simetric ideal.
Curba normal este complet specificat dac se definete media (originea lui
x), abaterea medie ptratic i valoarea
0
y . n practic, dac dorim s obinem o
curb normal cu ajutorul unor date cunoscute, valoarea lui
0
y nu se d direct, ci se
calculeaz folosind faptul c aria curbei trebuie sa fie egal, pe scara aleas, cu
numrul total de observaii.





46
Lucrare de verificare 1
INSTRUCIUNI
Lucrarea de verificare solicitat activiti care necesit cunoaterea materialului
prezentat n cadrul modulului 1. Materialele vor fi transmise prin pot (electronic)
tutorelui pentru comentarii, corectare i evaluare.
Pe prima pagin a lucrrii se vor scrie urmtoarele:
- Titulatura acestui curs;
- Numrul lucrrii de verificare;
- Numele i prenumele cursantului (acestea se vor meniona pe fiecare pagin);
- Adresa cursantului.

Tema lucrrii de verificare are ca subiect Analiza seriilor statistice a unei bazei de
date reale (care va fi oferit cursanilor de ctre tutore n cadrul orelor de curs).
Operaiuni:
1. Clasificarea prin intermediul histogramei a dispunerii categoriilor: nr. persoane;
nopti petrecute; sume cheltuite etc (4 puncte).
2. Repartiiile de frecven, i aplicarea schemelor standard de clasificare (5 puncte).













47
MODULUL 2

SONDAJUL STATISTIC
a. Scopul modulului: Modulul este destinat nelegerii modalitilor de realizare a
unui sondaj statistic i de interpretare a parametrilor rezultai din prelucrarea
datelor acestuia.

b. Obiectivele modulului:
nsuirea modalitilor de investigaie a unei colectiviti.
nelegerea i controlul erorilor ce pot rezulta din analiza datelor statistice ale
unui sondaj.
nsuirea procedeelor clasice de eantionare.
Modalitile de estimare a parametrilor sondajului.

c. Schema logic a modulului:
Sondajul statistic
Estimarea parametrilor provenii din sondaj;

d. Coninutul informaional detaliat
Coninutul informaional detaliat se gsete n bibliografia indicat.


Una dintre cele mai importante probleme este investigarea unei populaii mari
ntr-un timp redus i cu rezultate de cunoatere imediat. Din ansamblul populaiei se
alege o parte, numit colectivitate de selecie sau eantion, parte care va fi supus n
mod nemijlocit investigaiei. Alegerea trebuie fcut de aa manier nct prin
intermediul acestui studiu redus s se obin concluzii cu valabilitate general asupra
ntregii populaii. Eantionul trebuie s aib capacitatea de a reproduce ct mai fidel
structurile i caracteristicile populaiei din care este extras.
n cele mai multe situaii, studiile selective constituie o soluie necesar
deoarece o investigare complet a ntregii populaii este imposibil de fcut. Cu alte
cuvinte, n loc s se culeag informaii de la toi indivizii din populaie, se face o
prelevare de la o mic parte a ei. Acest gen de studiu, aa cum vom vedea, asigur un
control mai bun al activitii conducnd la o anumit superioritate pe planul
cunoaterii. Dei pare paradoxal, o investigare selectiv poate conine mai multe
caracteristici, spre deosebire de abordarea unei populaii mari care implic o
investigare simplificat. Pe de alt parte studiile arat c dac eantionul este ales
48
corespunztor acesta se va confunda cu populaia. Un exemplu de anchet naional
exhaustiv este recensmntul.
n studiul statistic al fenomenelor se folosete foarte frecvent perechea de
noiuni valoare calculat i valoare estimat. Valorile calculate sunt rezultatul unei
cercetri empirice. Acestea sunt folosite pentru a evalua indicatorii din eantioane care
vor deveni estimatori ai colectivitii generale.
Pentru ca cercetarea selectiv s fie eficient eantionul trebuie s posede o calitate
numit reprezentativitate, care const n capacitatea lui de a reproduce ct mai fidel
structurile i carcateristicile populaiei din care a fost extras. Aceast definiie este
destul de imprecis, dar ea capt o semnificaie exact prin aplicarea tehnicilor teoriei
probabilitilor. n acest context exprimarea cantitativ a gradului de reprezentativitate
a unui eantion se face prin dou mrimi:
Eroarea maxim (E) care exprim diferena dintre valoarea calculat din eantion
(v
e
) i valoarea corespunztoare v a populaiei totale (necunoscut).
E=|v-v
e
|
Nivelul de ncredere sau nivelul de probabilitate (P) care exprim o msur a
ansei ca eroarea comis s nu depeasc valoarea E.

Pentru a evalua eroarea E trebuie s avem n vedere o caracteristic a populaiei ce
urmeaz a fi estimat. Aceasta poate fi de exemplu vrsta, iar valoarea poate fi media
aritmetic. n acest caz eroarea E ne spune cu ct se abate vrsta medie a indivizilor
din populaia general de la vrsta medie a indivizilor din populaia de selecie. Cu alte
cuvinte, cu ajutorul erorii E se construiete un interval (v
e
-E, v
e
+E) n interiorul cruia
se afl valoarea cutat v.
Ali indicatori statistici care mai pot fi evaluai sunt abaterea medie ptratic,
coeficientul de corelaie, dar mai pot fi evaluate i proporii, diferene etc.
Pentru nelegerea corect a reprezentatitivitii unui eantion vom detalia cteva
aspecte privind aceast noiune.
1. Niciodat nu putem fi siguri c eroarea de eantionare este mai mic de o valoare
E, sau altfel spus plasarea lui v pe intervalul menionat nu este niciodat cert. Aceasta
49
nseamn c trebuie evaluat att eroarea E ct i nivelul de probabilitate P. Deci
nivelul de reprezentatitivitate este dat de cuplul (E,P).
2. Nu se poate vorbi de o reprezentativitate a unui eantion n general, ci numai n raport cu
o caracteristic dat. Aadar un eantion are o reprezentativitate n raport cu vrsta, (adic un
cuplu (E,P)), o alt reprezentativitate n raport cu numrul de turiti, (adic un alt cuplu (E,P))
.a.m.d.
3. Reprezentativitatea este o noiune relativ, n sensul c un eantion este mai mult
sau mai puin reprezentativ i nu reprezentativ sau nereprezentativ. De exemplu,
pentru o aceeai caracteristic i un nivel de probabilitate dat avem o eroare mic E
ntr-un eantion dect n alt eantion. Atunci primul eantion este mai reprezentativ.
Dac la o aceeai eroare, P este mai mare ntr-un eantion acesta este din nou mai
reprezentativ. Dac pentru un eantion avem o eroare mic i o probabilitate mare
acesta va fi mai reprezentativ fa de cel cu care se compar. Desigur c pot s existe
situaii care nu pot fi comparate cum ar fi o eroare mare i o probabilitate mare. Aceste
situaii va determina cercettorul s aduc lucrurile la acelai numitor, pentru
uniformizarea idicatorilor.
4. Cele dou mrimi E i P nu sunt independente, astfel c nu se poate spune direct
ce nivel de probabilitate i corespunde unei erori date. Fixnd una din ele, cealalt
rezult din calcul. n condiii egale scderea erorii antreneaz scderea probabilitii,
adic un ctig dobndit pe de o parte constituie o pierdere de cealalt parte. Nu putem
ameliora simultan i precizia estimrii i sigurana acesteia, pstrnd totodat restul
condiiilor identice.
5. n activitatea practic se folosete expresia eantion reprezentativ sau
eantion nereprezentativ chiar dac, aa cum am precizat este vorba de o nsuire
gradual a reprezentativitii. n conformitate cu exigenele studiului se accept c o
anumit eroare este suficient de mic iar o anumit probabilitate este este suficient
de mare. Pentru nivelul de probabilitate valoarea minim acceptat este de obicei
0,95 ceea ce nseamn c ansa de a grei estimarea trebuie s fie mai mare sau egal
cu 5%.
n majoritea studiilor se obinuiete s se evidenieze aceast probabilitate de a
grei notat cu p care este complementar adic p=1-P.
50
n consecin folosirea expresiei eantion reprezentativ este justificat dac prin
aceasta se nelege c, n raport cu toate caracteristicile cercetate eroarea E este sub o
limit acceptabil, iar mrimea p se afl sub pragul de 5%.
Gradul de reprezentativitate al eantionului depinde de: caracteristicile populaiei,
mrimea eantionului i procedura de eantionare.
Pentru a caracteriza nivelul de omogenitate (eterogenitate) a unei populaii se
folosete indicatorul abaterea medie ptratic (). Majoritatea formulelor prin care se
exprim eroarea de eantionare arat c aceasta este direct proporional cu , deci cu
nivelul de mprtiere fa de medie.
n ceea ce privete mrimea eantionului reprezentativitatea crete odat cu
creterea numrului de indivizi din eantion. Numai c sporul de reprezentativitate nu
este direct proporional cu creterea volumului eantionului, adic dependena nu este
liniar. S-au fcut numeroase studii i s-a ajuns la concluzia c dependena dintre
reprezentativitatea i mrimea eantionului este o curb (vezi figura de mai jos)



Dup cum se vede n figur reprezentativitatea atinge foarte repede un nivel
suficient de ridicat, aa nct o cretere suplimentar a numrului de indivizi din
eantion nu mai aduce un spor notabil de reprezentativitate. Cu alte cuvinte valorile
calculate nu se mai schimb aproape deloc.
Trebuie fcut remarca important: eantionul format din n indivizi are aceeai
reprezentativitate indiferent de mrimea populaiei din care el a fost extras. De aceea
expresii de genul ce proporie din populaie trebuie s reprezinte un eantion bun
51
sunt lipsite de sens. Mrimea absolut a eantionului este deciziv.

Procee clasice de eantionare
Exist dou metode de eantionare: aleatoare (probabilist) i seleciile
subiectiv organizate sau seleciile dirijate (nealeatoare).
Reprezentativitatea se poate calcula numai pentru eantioane strict
probabilistice i fiecare tehnic de eantionare aleatoare presupune formule specifice
de estimare a erorii.

1.Eantionarea aleatoare simpl.
Indivizii sunt alei cu o probabilitate identic. Procedura tipic este tragerea la
sori. Acest luru se face atunci cnd avem la dispoziie ntreaga populaie i putem
stabili o regula pentru tragerea la sori.
Procedeul tragerii la sori este bazat pe schemele de probabilitate: al bilei
revenite i cel al bilei nerevenite. Schema bilei revenite presupune o urn cu N bile de
N culori, evenimentul constnd din extragerea unei bile. Probabilitatea de a extrage o
bil de o anumita culoare este 1/N. dup ce s-a efectuat evenimentul, se introduce bila
napoi i experimentul se repet. ntotdeauna vom avea probabiliti 1/N. n cazul
schemei cu bila nerevenit, experimentul const n extragerea unei bile
(probabilitatea_1 este =1/N), nu mai punem bila napoi i repetm experimentul
(probabilitatea_2=1/(N-1)). La al treilea experiment vom avea probabilitatea_3=1/(N-
3). Datorit faptului c n cazul seleciei nerepetate este exclus posibilitatea extragerii
de mai multe ori a aceleai unitai, erorile sunt mai mici.
O alt tehnic este generarea de numere aleatoare care se asociaz cu populaia
n studiu. Se presupune c exist o list cu toi indivizii din populaie i fiecruia i se
atribuie un numr de ordine i apoi se face asocierea cu tabelul generat automat.


52

2.Eantionarea prin stratificare. Procedeul, n forma sa cea mai simpl, are
la baz urmtoarea idee: se efectueaz o diviziune a populaiei dup caracteristici, n s
clase: N
1
, N
2
, ..., N
s
(N
i
=N). Alegerea eantionului de volum n se va face n s etape
selectnd cu o procedur aleatoare simpl s subeatioane de mrime n
1
, n
2
, ..., n
s
,
fiecare provenind din cte o clas, fiind proporional cu mrimea clasei respective:

n
1
/N
1
=n
2
/N
2
=... =n
s
/N
s


3.Eantionarea multistadial.
Acest procedeu este asociat cu statistica spaial adic o statistic ale cror
elemente au referin spaial. Esena procedeului se bazeaz pe urmtoarea idee.
ntreaga populaie poate fi privit ca fiind format din grupuri repartizate pe un
teritoriu. ntr-un prim stadiu se alege (probabilistic) un eantion de grupuri de cel mai
nalt rang (1), apoi din fiecare din acestea se alege un eantion de grupuri de rang 2
.a.m.d. n final se va ajunge la un eantion de indivizi. Denumirea multisadial
provine de la faptul c exist mai multe stadii n alegerea eantionului final
corespunztor fiecrui nivel de eantionare.
Exemplu. Dac populaia studiat este ntreaga ar, primul pas este alegerea unuiu
eantion de judee, apoi de comune etc.
De remarcat este faptul c dintr-o anumit populaie pot fi extrase mai multe
eantioane, care difer ntre ele att ca volum ct i ca structur. Din aceast cauz indicatorii
statistici cu care caracterizm colectivitatea de sondaj pot fi considerai de forma unor
variabile aleatoare pentru care se pot stabili distribuii de frecven cunoscute, spre deosebire
de media i dispersia din colectivitatea general, pentru care exist o singur valoare.
Cercetarea selectiv se face pe baza unui plan care trebuie s cuprind:
- delimitarea n timp i spaiu a colectivitii generale prin identificarea tuturor
cazurilor individuale sub care se manifest fenomenul respectiv;
- verificarea gradului de omogenitate al colectivitii generale (se utilizeaz studii
vechi);
- alegerea sau stabilirea bazei de sondaj;
53
(Prin baz de sondaj se ntelege orice sistematizare a unitilor - liste, hri- astfel
nct s permit alegerea ntmpltoare a unitilor ce vor fi supuse prelucrrii n
eantion).
- alegerea tipului i a procedeului de selecie;
- stabilirea periodicitii efecturii sondajului;
- stabilirea planului observrii;
- stabilirea planului de prelucrare a datelor de selecie din punct de vedere
metodologic i organizatoric;
- alegerea procedeelor de verificare a semnificaiei indicatorilor de selecie i de
extindere a rezultatelor seleciei asupra ntregului ansamblu.

Etapele importante n cercetarea prin sondaj sunt.
Etapa 1. Se stabilete modul de eantionare.
Etapa 2. Se culeg i se prelucreaz date statistice din eantioane din care rezult
indicatori derivai: mrimi relative, medii, indici etc. care descriu statistic eantionul
folosit.
Etapa 3. Indicatorii obinui se extind, cu o anumit probabilitate P i o eroare E,
asupra ntregii colectiviti.

Estimarea parametrilor

Parametrii calculai pentru o colectivitate de selecie pot fi generalizai la
ntreaga colectivitate n anumite condiii. Aceast generalizare se refer, n particular,
la estimarea parametrilor necunoscui ai colectivitii iniiale (generale). Determinnd
un anumit parametru, ne propunem s obinem o mrime, care ntr-o msur oarecare
s fie ct mai apropiat de valoarea real a parametrului necunoscut. n caz contrar
cutm nite limite n interiorul crora, cu o anumit probabilitate, putem afirma c se
afl mrimea real a parametrului necunoscut. n acest caz avem de-a face cu un
interval de ncredere pentru parametrul necunoscut.
Considerm c populaia statistic satisface legea normal. Astfel toi
54
parametri estimai fac referire la o distribuie normal de frecven.



Estimarea mediei
Vom nota cu
2
dispersia colectivitii generale, cu s
2
dispersia colectivitii
de selecie (a eantionului).
Msura erorii standard pentru medie este

n
s
E
m
=


Unde n este mrimea eantionului (nr. elementelor care formez eantionul).
n aceast situaie estimarea pentru media colectivitii generale este:

m
E x X = cu o probabilitate de 0,682

m
E x X 2 = cu o probabilitate de 0,954

m
E x X 3 = cu o probabilitate de 0,997

Estimarea pentru abaterea medie ptratic ()
Limitele de confiden pentru o abatere medie ptratic pot fi estimate ntr-o
manier similar. Pentru aceasta introducem noiunea de eroare standard a abaterii
55
medii ptratice


n
s
E
s
2
=


n mod analog intervalele de ncredere sunt date de

s
E s = cu o probabilitate de 0,682

s
E s 2 = cu o probabilitate de 0,954

s
E s 3 = cu o probabilitate de 0,997

Estimarea proporiilor
Formulele pentru erorile standard pot fi aplicate doar pentru a estima media i
abaterea medie ptratic. Sunt situaii cnd avem exprimri procentuale, cum ar fi
procentul de persoane care au optat pentru o anumit situaie (care au votat pentru un
partid). Astfel eroarea standard pentru estimarea procentelor este:

n
pq
E =
%


unde p este procentul din eantion care posed un anumit atribut, q este procentul din
eantion care nu posed acel atribut, iar n este numarul de indivizi din eantion.
Exemplu. Pe un eantion de 50 indivizi s-a evaluat c 86% dintre acetia au
televizoare (p). Procentul pentru cei care nu au televizoare (q) este de 100 86 =14
(nu au fost numrai ci dedui). Avem:
91 , 4 08 , 24
50
14 86
%
= =

= E
56
Aa cum am procedat la celelalte estimri aceast eroare standard pote fi folosit
pentru a stabili limitele de confiden a procentului estimat al colectivitii generale. Astfel
avem :
Populaia gen % = eantion % E% cu probabilitate 0,682
Populaia gen % = eantion % 2

E% cu probabilitate 0,954
Populaia gen % = eantion % 3 E% cu probabilitate 0,997
Pentru exemplul de mai sus semnificaia este urmtoarea. Avem o probabilitate
de 0,682 ca deintorii de aparate TV s fie undeva ntre 81,09% i 90,91% (adic 86-
4,91 i 86 + 4,91). La un nivel de confiden de 0,954, procentele vor fi ntre 76,18%
i 95,82% (86-24,91 i 86+24,91).

Mrimea eantionului
n cele expuse mai sus am introdus erorile standard pentru anumite mrimi
estimate. Acestea permit evaluarea limitelor de confiden pe baza unor ipoteze
(distribuia normal a populaiei i un eantion obinut ntr-o manier aleatoare).
Pentru evaluarea efectiv a acestora trebuie s tim doar dou lucruri : mrimea (n) i
abaterea medie ptratic (s) a eantionului. n cele ce urmeaz vom revedea problema
invers : ct de mic trebuie s fie eantionul (n) astfel nct media i abaterea medie
ptratic s aibe nite limite de confiden specificate.
Din formula erorii pentru medie
n
s
E
m
=

explicitm pe n:


2
|
|
.
|

\
|
=
m
E
s
n

Ex. Dac vrem s avem o eroare pentru medie de 0,25 i o dispersie de 2 => n =64

57
Estimri provenite din eantioane mici
n general cel care face estimri pe baz de eantioane este o persoan
prudent. Dac eantioanele sunt mici aceast pruden trebuie mrit. Aa cum am
vzut pn acum abaterea medie ptratic a eantionului (s) este foarte important
pentru stabilirea limitelor de confiden ale mediei i abaterii medii ptratice pentru
colectivitatea general. Cnd se lucreaz cu eantioane mici, de 10 sau mai mici,
trebuie s adoptm nite limite de confiden mai mari.
Astfel estimarea abaterii standard va fi nlocuit cu cea mai bun estimare a
abaterii notat cu i care se calculeaz din formula

1

=
n
n
s

sau dac calculm direct din eantion

1
) (

1
2

=

=
n
x x
n
i
i


Se observ c pentru eantioane mari aceast valoare nu difer prea mult de s,
dar pentru valori mici ale lui n aceast diferen poate fi semnificativ. Valoarea lui


este ceva mai mare dect s i astfel limitele de confiden vor fi mai largi. Toate
calculele privitoare la erori se vor face cu

i nu cu s.







58
Lucrare de verificare 2
INSTRUCIUNI
Lucrarea de verificare solicitat activiti care necesit cunoaterea materialului
prezentat n cadrul modulului 2. Materialele vor fi transmise prin pot (electronic)
tutorelui pentru comentarii, corectare i evaluare.
Pe prima pagin a lucrrii se vor scrie urmtoarele:
- Titulatura acestui curs;
- Numrul lucrrii de verificare;
- Numele i prenumele cursantului (acestea se vor meniona pe fiecare pagin);
- Adresa cursantului.

Tema lucrrii de verificare are ca subiect Realizarea unui chestionar pe baza cruia
s fie analizat fluxul turistic local. Se va analiza statistic pe baza indicatorilor
variaiei; se va discuta relevanta rezultatelor. Chestionarul va fi efectuat de fiecare
cursant.














59
Modulul 3

CORELAIA STATISTIC

a. Scopul modulului:Modulul este destinat nelegerii legturilor cauzale
existente ntre fenomenele naturale i stabilirea relaiilor posibile ntre
diferii factori, evenimente, atribute sau caracteristici care ar putea avea o
influen, cel puin parial asupra datelor experimentale.

b. Obiectivele modulului:

identificarea existenei legturilor cauzale existente ntre fenomenele
naturale;
cunoatrea temeinic a noiunilor analizei statistice implicate;
nsuirea aplicrii corecte a metodelor corelaiei statistice;
interpretarea corect a rezultatelor.

c. Schema logic a modulului:
Corelaii statistice.
Corelaia liniar.
Coeficientul de corelaie.
Dreapta de regresie.
Corelaia multipl i corelaia neliniar.
Corelaia rangurilor;

d. Coninutul informaional detaliat
Coninutul informaional detaliat se gsete n bibliografia indicat






n procesul de cercetare a legturilor cauzale existente ntre fenomenele naturale
avem de-a face cu contopirea aciunilor unei multitudini de factori (cauze), dintre care
unii eseniali, alii neeseniali, unii pot fi determinai, alii nu. Tocmai de aceea, n
cercetarea legturii reciproce dintre dou fenomene apar dificulti mari deoarece pot s
existe cauze necunoscute. n astfel de situaii este util s determinm gradul de corelare
i apoi s analizm separat unele din aceste cauze. Cu alte cuvinte, trebuie s definim
relaii posibile ntre diferii factori, evenimente, atribute sau caracteristici care ar putea
avea o influen, cel puin parial asupra datelor experimentale. n acest mod este
60
posibil stabilirea unui tablou al condiiilor n care se desfoar un anumit fenomen
natural, fapt care duce la modelarea matematic a sa. Astfel de probleme se cerceteaz
cu mult succes prin metodele statisticii, unde teoria corelaiei are o pondere nsemnat.
Eficiena aplicrii metodei corelaiei depinde de punerea (enunarea) corect a
problemei n studiu precum i de aplicarea corect a statisticii matematice.
Caracterul complex al dependenei statistice pune pe primul plan problema
identificrii existenei legturilor. Calculul indicatorilor de corelaie este admis cu
condiia stabilirii anticipate a unei legturi cauzale reale ntre fenomenele cercetate.
Statistica nu poate s rezolve o astfel de problem fr ajutorul tiinei din domeniul
creia face parte fenomenul studiat. Cu alte cuvinte, specialistul din domeniul respectiv
trebuie s cunoasc temeinic noiunile analizei statistice implicate pentru a da o
interpretare corect a rezultatelor. Pentru a asigura deducii suficient de ntemeiate, este
necesar includerea n cercetare, dac este posibil, a tuturor factorilor cu aciune esenial.
n multe procese naturale, pe lng complexa ntreptrundere cu alte fenomene
(procese), acestea mai sunt supuse unor evoluii care la prima vedere pot fi considerate
probabiliste (aleatoare). De aceea, pentru cunoaterea modului de evoluie probabil n
viitor - prognoza unui anumit fenomen - trebuie s ne bazm pe cunoaterea evoluiei
trecute, precum i pe situaia prezent. Experiena unui mare numr de observaii (probe)
au dus la concluzia c ntre diferitele mrimi variabile pot exista urmtoarele tipuri de
relaii:
a) Relaia de dependen, Y depinde de X sau invers. O modificare a unei
variabile duce la o modificare a celei de-a doua. n cazul unei astfel de relaii s-ar putea
aminti existena relaiei cauzale n care o variabil este cauza, iar cealalt este efectul,
cauza fiind un fenomen sau un complex de fenomene care provoac, genereaz sau
determin un alt fenomen - efectul. Operaia logic prin care efectul este dedus din cauz
se numete inferen cauzal.
b) Relaia de interdependen, Y depinde de X i X depinde de Y. n acest caz
modificarea unei variabile provoac modificarea celei de-a doua variabile, iar
modificarea acesteia din urm are influen asupra primei variabile.
c) Relaia de tranziie, X se transform parial sau total n Y i invers.
61
d) Corelaia statistic sau covariana. Pentru X exist ntotdeauna Y i invers.
Este o relaie reciproc dintre dou variabile, dintre care una n mod logic apeleaz la
alta i pe baza analizei datelor experimentale se poate pune n evidenz o asociere ntre
ele.
e) Relaia stochastic; dac se realizeaz X atunci cu o anumit probabilitate se
realizeaz i Y, sau invers.
n cele ce urmeaz vom analiza cu precdere corelaia statistic.
O problem important pentru cercetarea corelaiilor este problema determinrii
funciei de regresie, care s exprime relaia cantitativ dintre fenomenul efect i
fenomenul cauz. Forma legturii dintre fenomene i descrierea printr-o ecuaie
analitic, pe baza crora se definesc valorile fenomenului efect, n funcie numai de
factorul sau factorii luai n considerare (cauze).
Pentru ajustarea seriei de valori empirice trebuie s se aleag acea ecuaie care
oglindete n modul cel mai corespunztor caracterul legturii cercetate. De buna alegere
a funciei de regresie depinde rezultatele analizei de corelaie, valoarea estimaiilor
variabilei dependente. Stabilirea formei legturii ine seama de natura dependenei
fenomenului cercetat (de obicei se reprezint grafic).
La fenomenele simple, unde cauzele acioneaz separat, relaia dintre fenomenul-
efect i fenomenul-cauz se reprezint sub forma:
y=f(x)

unde x reprezint cauza, iar y efectul.
La fenomenele complexe, dependena se exprim sub forma general:
y =f(x
1
, x
2
,..., x
n
)

Fenomenul y este generat de aciunea comun a factorilor x
1
,x
2
,.., x
n
(cauze), din
care lum ns n calcul numai o parte.
S admitem c am luat n calcul factorul x
1
. ntrebarea care se pune este
urmtoarea: n ce condiii indicatorii corelaiei obinui exprim msura real a influenei
variabilei x
1
asupra variabilei y? Numai cu condiia ca factorul x
1
s fie hotrtor n
determinarea lui y, ceilali fiind nesemnificativi. n cazul n care fenomenul este sub
62
aciunea unui complex de factori eseniali i aceasta este situaia obinuit, pentru a
exprima influena i gradul de intensitate a legturilor n raport cu un singur factor
trebuie s eliminm influena celorlai.
S considerm o colectivitate statistic caracterizat prin mrimile X i Y.
Efectund o serie de determinri experimentale (sau observaii) asupra acestei
colectiviti, putem ntocmi tabela datelor respective:
X | x
1
, x
2
, ..., x
n
Y | y
1
, y
2
, ..., y
n
Repartiia empiric a celor dou variabile se poate afia grafic, ntr-un sistem de
axe XOY, unde vom reprezenta punctele de coordonate x
i
i y
i
. Un ansamblu de astfel de
puncte se numete cmp de corelaie, tabel de corelaie sau nor statistic.
Dac punctele M
i
(x
i
,y
i
) sunt distribuite de-a lungul unei fii, care n general,
urmeaz o curb determinat, spunem c ntre mrimile respective exist o dependen
funcional. Dac punctele M
i
(x
i
,y
i
) nu arat o dependen funcional strict, dar exist
o tendin ca valorile lui Y s depind de cele ale lui X dei nu n mod riguros, ntre
mrimile X i Y exist o corelaie Aceasta poate s fie liniar (fig. 1) sau neliniar (fig.
2). n cazul cnd ntre X i Y nu exist nici un fel de dependen, cmpul de distribuie
se va prezenta asemntor cu acela artat n fig. 3, 4. Cele dou caracteristici sunt
independente.












Figura 1 Distribuie liniar
Figura 2 Distribuie neliniar
63










ntr-un caz particular, dependena corelaionar se poate transforma ntr-o
dependen funcional, dar cu un anumit grad de certitudine. Apare problema de stabili
cantitativ (numeric) n ce msur dependena corelaional se apropie sau se deprteaz
de dependena funcional.
n foarte multe cazuri, din observarea fenomenelor naturale sau a proceselor
sociale, fr a cunoate natura exact a acestora i nici cauzele prin care este pus n
eviden o anumit caracteristic, se pot trage concluzii foarte importante prin
examinarea corelaiei dintre aceste trsturi i alte evenimente. n acest mod se poate
aprecia existena unei relaii statistice ntre dou sau mai multe variabile, adic, n astfel
de cazuri se vorbete despre corelaii dintre mrimile care indic o dependen reciproc.
n cazul cnd se consider numai dou variabile, se pot stabili corelaii simple,
iar cnd numrul variabilelor este mai mare de doi, avem corelaii multiple.
Din punct de vedere al formei unei relaii statistice, spunem c ea este direct
atunci cnd creterea unei variabile, duce la o cretere a celeilalte variabile, i o
denumim invers cnd o cretere a unei variabile duce la o descretere a celeilalte.
Relaiile statistice definite prin corelaii pot avea aspect liniar sau neliniar; prin
urmare vom distinge corelaii liniare i corelaii neliniare sau curbilinii.
n cazul n care sunt implicate mai multe variabile vom avea corelaie parial
cnd se consider constante unele variabile i corelaie parial cnd se iau n
considerare variaiile tuturor mrimilor.

Figura 3 Distribuie aleatoare


Figura 4 Distribuie grupat
64
Metoda celor mai mici ptrate.
Dependena funcional a unei variabile y fa de alt variabil x poate fi studiat
empiric, pe cale experimental, efectundu-se o serie de msurtori asupra variabilei y
pentru diferite valori ale lui x. Rezultatele se pot prezenta sub form de tabel sau grafic.
Problema care se pune n acest caz este de a gsi reprezentarea analitic a
dependenei funcionale cutate, adic de a alege o formul care s descrie rezultatele
experimentului.
Formula se alege dintr-o mulime de formule de tip determinat, de exemplu.
y =ax +b , y =ax
2
+bx +c , y =ae
bx
+c , y =a +h sin( t + )


Cu alte cuvinte, problema const n a determina parametrii a, b, c, ai formulei, n
timp ce tipul formulei este cunoscut dinainte ca urmare a unor considerente teoretice sau
dup forma prezentrii grafice a materialului empiric.
S notm, la modul general cnd avem n parametrii, dependena funcional prin:
y =f(x; a
0
,a
1
,...,a
n
)
Parametrii a
0
, a
1
,..., a
n
nu se pot determina exact pe baza valorilor empirice y
1
,
y
2
,...,y
n
ale funciei, deoarece acestea din urm conin erori aleatoare. Este vorba de
obinerea unei estimaii "suficient de bune".
Formularea problemei
Dac toate msurtorile valorilor funciei sunt y
1
, y
2
,...,y
n
atunci estimaiile
parametrilor a
0
, a
1
,..., a
n
se determin din condiia ca suma ptratelor abaterilor valorilor
msurate y
k
de la cele calculate f(x
k
; a
0
, a
1
,..., a
n
), adic expresia

=
=
n
k
n k k
a a a x f y S
1
2
1 0
)] ,..., , ; ( [
s ia valoarea minim.
Consideraia formulat se pstreaz i pentru determinarea estimaiilor
parametrilor unei funcii de mai multe variabile. Adic un efect i dou cauze. De
exemplu, pentru funcia z de dou variabile x i y, estimaiile parametrilor a
0
, a
1
,..., a
n

se determin din condiia ca expresia:
65

=
=
n
k
n k k k
a a a y x f z S
1
2
1 0
)] ,..., , ; , ( [
s fie minim.
Aflarea valorilor parametrilor a
0
, a
1
,..., a
n
, care conduc la cea mai mic valoare a
funciei
) ,..., , (
1 0 n
a a a s s =
revine la rezolvarea sistemului de ecuaii
0
0
=

a
S
, 0
1
=

a
S
,, 0 =

n
a
S

Dac formula empiric depinde liniar de parametrii necunoscui atunci sistemul de mai
sus va fi de asemenea liniar.
Dreapta de regresie.
n cazul cel mai simplu se studiaz numai dou variabile X, Y i se dorete
gsirea dependenei:
Y =aX +b
n ipoteza c X este cauza i Y este efectul.
n urma celor n probe se cunosc datele (x
i
,y
i
), i=1,..., n i trebuie s determinm
coeficienii a i b astfel nct suma

=
+ =
n
i
i i
y b ax b a S
1
2
) ( ) , (
s fie minim. Se obine
xy
x
y
y x
xy
x
y
x
xy
r
c c
a = = =

2
x a y b =
unde
x
2
este dispersia variabilei x, iar
y
2
este dispersia variabilei y.
Mrimea
y x y x c
xy
=
se mumete corelaia variabilelor X i Y. Raportul
y x xy xy
c r / = se numete
coeficient de corelaie a variabilelor X, Y i msoar intensitatea dependenei liniare
dintre variabilele X i Y.
n n final se va obine ecuaia de regresie:
66
) ( x X r y Y
xy
x
y
=


Aceast dependen reprezint o dreapt numit dreapt de regresie a variabilei Y n
raport cu variabila X.

Dreapta de regresie
Observaie. Se poate vorbi i de dependena variabilei X n funcie de Y. Urmnd un
calcul asemntor se ajunge la dreapta de regresie a variabilei X n raport cu Y:
) ( y Y r x X
xy
y
x
=


Se observ c cele dou drepte de regresie coincid dac i numai dac 1
2
=
xy
r .
Observaii.
1. Trebuie s facem observaia c, indiferent de gradul de mprtiere al
punctelor, ntotdeauna se poate gsi o dreapt de regresie, dar n cazul unei dispersii
mari aceasta devine inutil. De aceea un studiu preliminar a distribuiei punctelor n plan
sau spaiu se impune cu necesitate.
2. Coeficientul de corelaie este o mrime foarte important n cadrul regresiei
liniare. El msoar gradul de dependen liniar ntre cauz i efect i are o valoare
cuprins ntre 1 i 1. Apropierea de 1 implic o dependen liniar puternic ntre
mrimi, iar apropierea de zero indic o lips a corelatiei. Valorile negative semnific o
corelaie invers.
EXEMPLE
67
n cele ce urmeaz vom lua dou exemple. n primul exemplu vom determina o
dreapt de regresie, corespunztoare debitului i al pH-ului, msurate n perioada
ianuarie -decembrie 1993 pe rul Arie. Datele au fost obinute de la R.A. Apele
Romne.
PH 8.7 7.8 6.6 7.9 7.3 7.5 7.5 7.3 6 7.6 7.8 7 6.8 6.6 6.4
Debit 13 40 80 23 50 30 25 60 10 28 15 74 45 59 68
Figura 45 Dreapta de regresie

Se observ c pH-ul scade odat cu creterea debitului. La debite mai mari procesele
hidrice (dizolvare, diluie etc) fiind mai accentuate. La valori mai mici ale debitului, pH-
ul crete devenind uor acid (7,6 7,9) sau acid (8,7). Coeficientul de corelaie este r=-
0,87946; avem astfel o corelaie invers strns.
n al doilea exemplu am determinat curba de regresie corespunztoare variaiei
debitului i suspensiilor. Datele au fost obinute n urma analizelor fizico-chimice
efectuate pe Valea Zalului, de pe teritoriul municipiului Zalu n anul 1995.
debit 251 190 308 375 165 357 369 280 469 640 215 150 169 550 460
susp. 75 68 157 200 69 134 125 67 205 270 48 90 88 125 145
Variatia debit-pH
y =-32.633x +284.03
0
20
40
60
80
100
120
0 5 10
debit
Linear (debit)
Variatia debit-suspensii
y =46.436e
0.0026x
0
50
100
150
200
250
300
0 500 1000
susp.
Expon. (susp.)
68
Figura 46 Curba exponenial de regresie

n figura 46 se distinge faptul c odat cu creterea debitului cantitatea de
suspensii din ap crete exponenial. Datorit curentului, particulele de dimensiuni mari
de pe fundul albiei sunt antrenate n micare, devenind suspensii. n cazul unor debite
mai mici, cnd scurgerea este mai lin, doar particulele de dimesiuni mici sunt antrenate
n micare. Facem observaia c acest lege nu este att de reprezentativ ca i cea din
exemplul precedent.
Calculele au fost fcute cu programul de calcul tabelar Excel.

Regresia multipl.
Considerm cazul n care variabila Z depinde de dou variabile X i Y. Se
dorete obinerea dependenei
Z =a X +b Y +c
astfel nct suma

=
+ + =
n
i
i i i
z c by ax c b a S
1
2
) ( ) , , ( s fie minim. Se obine

x
z
xy
yz xy xy
xy y x
yz xy xz y
s
s
r
r r r
c s s
c c c s
a


=
2 2 2 2
2
1


x
z
xy
zx xy xy
xy y x
yz xy yz x
s
s
r
r r r
c s s
c c c s
b


=
2 2 2 2
2
1

i ecuaia de regresie:
) ( ) ( y Y b x X a z Z + =
Reprezentat geometric aceast ecuaie este un plan n spaiul oxyz. Interpretarea
este urmtoatrea: acest plan este planul care ajusteaz cel mai bine irurile x
i
i y
i
, i=1,...,
n. Cu alte cuvinte, dac Z reprezint efectul, X i Y reprezint cauzele, n consecin, Z
arat dependena liniar de cele dou variabile X i Y luate mpreun.
69
Corelaia rangurilor
Exist cazuri n care ne intereseaz gradul de corelaie dintre dou serii de
mrimi, dar cnd nu putem efectua msurtorile respective. n anumite tipuri de
probleme avem de-a face cu caracteristici care nu pot fi exprimate prin cifre, dar pot fi
ordonate dup un aumit criteriu. n astfel de cazuri vom lua n considerare ordinea lor i
nu evaluarea numeric.
n cazul n care rangul anumitor caracteristici este mai accesibil dect
msurtorile efective, pentru examinarea legturilor dintre anumii parametrii, putem
cerceta corelaia rangurilor respective. Prezentm mai jos cteva procedee de evaluare a
anumitor corelaii n care se ine seama de ordonarea mrimilor caracteristice, adic n
care se utilizeaz rangul sau poziia pe care le au anumite mrimi, una n raport cu alta.
Vom determina deci coeficientul de corelaie al rangurilor.

Coeficientul lui Spearman
Fie n numrul de elemnte ale unei mulimi ordonate dup caracteristici calitativ
diferite. Pentru c avem n uniti statistice A
1
, A
2
, ... , A
n
, fiecare dintre ele avnd dou
caracteristici
(x
1
, y
1)
, (x
2
, y
2)
,...,(x
n
, y
n
)
Pentru caracteristica x dispunem de ordonarea: x
1
, x
2
,...,x
n
, iar pentru
caracteristica y avem: y
1
, y
2
,...,y
n
, unde x i y sunt simple permutari ale celor n numere
naturale. Notm:
d
i
=x
i
y
i
(k=1, 2,...,n)
unde vectorul de componente d
i
este o mrime a gradului de apropiere pe care o poate
avea corespondena dintre x i y. Dac d=0, nseamn c toi indivizii considerai au cele
dou caracteristici n aceeai ordine, avem deci o coresponden perfect. Cu ct
diferenele d
i
sunt mai mari, cu att mai mare este discordana ntre cele dou
caracteristici.
Pentru o cercetare a corelaiei rangurilor, vom considera scrise n ordine
cresctoare sau descresctoare toate valorile lui x
i
iar alturi scriem valorile
corespunztoare ale lui y
i
, acestea din urm putnd fi sau nu n vreo anumit ordine. Prin
70
urmare, n cadrul ordonrii dup rang, x ia valorile: 1,2,3,..., n ntr-o anumit ordine, pe
cnd y ia aceleai numere dar ordonate dup aceast caracteristic. Pentru ca s nu existe
compensri ntre valorile d
i
se va lua ptratul acestor valori. Astfel se definete
coefficient de corelaie al rangurilor (coeficientul lui Spearman) ca fiind expresia:


) 1 (
6
1
2
2

=

n n
d
i

Dac =1 avem concordan maxim, iar dac =-1 avem discordan maxim.
Pentru o ilustrare mai sugestiv vom lua un exeplu. Considerm c A
1
, A
2
, ... ,
A
n
reprezint n persoane, caracteristicile x
1
, x
2
,...,x
n
, fiind nlimea lor msurat n cm,
iar caracteristicile y
1
, y
2
,...,y
n
greutatea lor msura n kg. Se pune problema dac exist
o corelaie ntre aceste dou caracteristici. Pentru simplificare vom lua n=10. Aceast
clasificare are urmtorul rezultat.
A
1
A
2
A
3
A
4
A
5
A
6
A
7
A
8
A
9
A
10


3 1 10 6 2 5 7 8 4 9
1 2 9 7 4 3 6 10 5 8
n prima linie sunt cele 10 persoane, n linia a doua ordinea pe care o ocup
fiecare persoan dup nlime (cresctoare), iar n linia a treia ordinea lor dup greutate.
Aceast ordonare ne permite s dm un criteriu privind legtura ntre aceste dou
caracteristici.
Vom deosebi dou situaii extreme. Situaia cea mai strns legat (cel mai nalt
este cel mai mare n greutate):
A
1
A
2
A
3
A
4
A
5
A
6
A
7
A
8
A
9
A
10


3 1 10 6 2 5 7 8 4 9
3 1 10 6 2 5 7 8 4 9
i situaia cu legtura cea mai slab (cel mai nalt este cel mai mic n greutate).
A
1
A
2
A
3
A
4
A
5
A
6
A
7
A
8
A
9
A
10


71
3 1 10 6 2 5 7 8 4 9
8 10 1 5 9 6 4 3 7 2
Rangurile obinute n cele dou clasificri pot oferi o indicaie asupra corelaiei dintre
cele dou caracteristici. Diferenele dintre cele dou valori sunt (primul ir minus al
doilea ir):

2 -1 1 -1 -2 2 1 -2 -1 1

iar suma ptratelor diferenelor este dat de
22
10
1
2
=

= i
i
d iar coeficientul lui Spearman =0,862
Apropierea de 1 lui indic o corelaie destul de mare ntre caracteristicile luate n
considerare.

Lucrare de verificare 3.
INSTRUCIUNI
Lucrarea de verificare solicitat activiti care necesit cunoaterea materialului
prezentat n cadrul modulului 3. Materialele vor fi transmise prin pot (electronic)
tutorelui pentru comentarii, corectare i evaluare.
Pe prima pagin a lucrrii se vor scrie urmtoarele:
- Titulatura acestui curs;
- Numrul lucrrii de verificare;
- Numele i prenumele cursantului (acestea se vor meniona pe fiecare pagin);
- Adresa cursantului.

Tema lucrrii de verificare are ca subiect Calculul corelaiei liniare i a dreptei de
regresie pentru variabilele statistice obinute pe baza valorilor din chestionarul de la
tema practic 2.


72
Modulul 4

NOIUNI DE TEORIA PROBABILITAILOR

a. Scopul modulului: Modulul este destinat nelegerii i nsuirii raionamentelor
probabilistice care conduc la explicarea evenimentelor fundamentale i care
stau la baza oricrei analize de tip statistic.

b. Obiectivele modulului:
nelegerea noiunii de probabilitate n statistic;
Dezvoltarea deprinderii de a gndi logic i deductiv n analiza statistic;
Familiarizarea cu noiunile i metodele probabilistice specifice analizei
statistice;

c. Schema logic a modulului:
Noiuni de baz de probabiliti;
Evenimente; definiia clasic a probabilitii;
Scheme clasice de probabilitate; noiunea de variabil aleatoare
repartiii de frecven (repartiii simetrice, asimetrice, repartiia
binomial, repartiia Poisson, repartiia normal.
d. Coninutul informaional detaliat:
Coninutul informaional detaliat se gsete n bibliografia indicat.


Noiunea de probabilitate este un concept fundamental n statistic. Toate testele
statistice implic calculul probabilitilor, fie direct, fie indirect. Statistica nu lucreaz cu
certitudini, ci cu probabiliti. Ipotezele statistice nu pot fi considerate n totalitate
adevrate sau false.
Raionamentul probabilist explic evenimentele fundamentale ale universului
fizic n care trim precum i o mare parte din evenimentele petrecute n lumea fiinelor
vii. Utilitatea aproape nelimitat a raionamentului probabilist este unul din aspectele
73
cele mai importante i mai izbitoare ale tiinei moderne. Acest punct de vedere a fost
dezvoltat i acceptat mai ales n ultimii 80 de ani, cu toate c teoria probabilitilor s-a
nscut cu peste trei secole n urm.
Vom examina n acest capitol numai acel tip de raionament, n care un pas
conduce n mod ordonat la pasul urmtor, ntregul proces succesiv conducnd n final la
o concluzie. Acest gen de gndire ajunge la un nivel foarte rafinat n matematic,
precizia sa depinznd de mai muli factori: modul precis n care sunt definii termenii,
rigoarea cu care definiiile sunt respectate i atenia cu care toate regulile de aciune sunt
puse n eviden i clar exprimate. Acest mod de a gndi constituie gndirea logic, iar
logica nsi poate fi definit astfel drept studiul sistematic al condiiilor i procedeelor
care permit o judecare valabil, cu alte cuvinte care permit s se porneasc de la una sau
mai multe afirmaii i s se deduc din aceasta una sau mai multe concluzii, sau
propoziii noi care s fie valabile, n sensul justificrii lor de ctre propoziiile iniiale ale
cror consecine sunt de fapt. Este extrem de important faptul c logica nu afirm ceva
din nimic ci scoate la iveal afirmaii, propoziii i relaii cuprinse n propoziiile iniiale.
Ceea ce are importan, prin urmare, ntr-o ntr-o astfel de gndire logic nu este
adevrul, ci mai degrab valabilitatea sa. O concluzie logic poate s merite pe drept
cuvnt adjectivele : corect, sntoas sau precis, toate acestea nsemnnd c ea a fost
dedus n mod riguros din materialul iniial. Dar faptul c a fost dedus prin metode
logice corecte nu nseamn ctui de puin c ea este n mod necesar adevrat. Dac
afirmaiile (ipotezele) iniiale sunt adevrate, atunci consecinele logice deduse trebuie
s fie adevrate.

Logica probabilist ia n considerare o serie ntreag de afirmaii, dintre care nici
una nu este total fals sau total adevrat, ordonndu-le n raport cu gradul lor de adevr,
spunnd cu ct este mai plauzibil sau mai puin plauzibil una fa de cealalt. Logica
probabilist nu se limiteaz numai la dou valori de adevr 0 i 1, ci utilizeaz o
infinitate de valori exprimate ca numere situate ntre 0 i 1.
Teoria probabilitilor poate s analizeze acele situaii n care nu avem suficiente
informaii care s permit aplicarea logicii clasice; ea este capabil s ne dea un cel mai
bun tip de rspuns pe care-l justific o informaie incomplet. ntr-un mare numr de
74
cazuri, teoria probabilitilor nu ne spune numai "sfatul meu este aa i aa", ci poate s
ne indice gradul de ncredere pe care suntem ndreptii s-l acordm sfatului dat.
n diferite stadii ale dezvoltrii tiinei se poate considera un ansamblu de
fenomene reale i se poate cuta pentru el un model matematic. De exemplu o familie de
ipoteze plus teoria pur care rezult pe baza acestora i care se aplic cu strict precizie
unui sistem fizic idealizat - suficient de asemntor sistemului fizic real - n aa fel nct
teoria sistemului idealizat va "explica" sau mcar va organiza i simplifica fenomenele
reale.
Primii experi n teoria probabilitilor vorbeau despre extragerea de bile colorate
din urne. Aceasta nu pentru c lumea ar fi ntr-adevr interesat n urne cu bile ci pentru
c deseori acestea puteau fi folosite ca modele utile ale unor situaii reale. Calculele
probabilistice se aplic strict la modele fictive pe care ele sunt bazate. Dac ele se aplic
sau nu n mod util situaiilor reale este o chestiune la care trebuie s reflectm cu grij.

Cmp de evenimente
n teoria probabilitilor sunt studiate experienele cu rezultat ntmpltor, numite
experiene aleatoare; pe scurt experiene (experimente).
Definiie. Prin experien n teoria probabilitilor se nelege orice act care poate fi
repetat n condiii date.
Nu se poate preciza rezultatul exact al unei experiene. De exemplu la aruncarea
unei monede nu se poate ti dinainte ce fa a monedei va apare. De asemenea la
aruncarea unui zar nu se poate ti dinainte ce fa a zarului va apare. Orice eveniment
aleator depinde de aciunea combinat a mai multor factori ntmpltori.

Rezultatele posibile ale experienei se numete prob.
Definiie. Orice situaie legate de experien i despre care putem spune c s-a
produs sau nu, dup efectuarea experienei, poart numele de eveniment. aleator
Cu alte cuvinte, un eveniment aleator sau pe scurt eveniment (ataat experienei) este
orice situaie care se poate realiza prin una sau mai multe probe.
75
Deci un eveniment este determinat prin mulimea probelor prin care se
realizeaz, prin urmare l putem interpreta ca o submulime a mulimii tuturor probelor
experienei.
Exemple
1. Aruncarea unei monezi este un experiment. Apartiia oricrei fee o prob.
Apariia unei anumite fee este un eveniment.
2. Aruncarea zar este un experiment. Apartiia oricrei fee o prob. Apariia unei
anumite fee este un eveniment. Apariia feelor 2, 3, 4, este de asemenea un eveniment.
Evenimentele aleatoare se supun unor legi, cunoscute sub numele de legi
statistitice, teoria probabilitilor stabilind forma lor de manifestare i permind s se
prevad desfurarea lor.
Evenimentele care se realizeaz printr-o singur prob se numesc evenimente
elementare, celelalte se numesc evenimente compuse.
Evenimentul care se realizeaz prin oricare din probe se numete eveniment
sigur (notat prin E).
Exemplu. Apariia oricrei fee la o moned sau la un zar.
Evenimentul care nu se realizeaz prin nici o prob se numete eveniment
imposibil, notat cu .
Exemplu. Apariia niciunei fee la o moned sau la un zar.
Evenimentul contrar lui A sau non-A (sau ) este evenimentul care se realizeaz
atunci i numai atunci cnd nu se realizeaz A.
Exemplu. Apariia unei fee cu numr par la un zar i apariia unei fee cu numr
impar sunt evenimente contrare.
ntotdeauna unui eveniment i corespunde un eveniment contrar, a crui
producere nseamn nerealizarea primului.
Definiie. Spaiul de selecie asociat cu o expereien este mulimea de elemente
cu proprietatea c orice eveniment rezultat n urma experienei corespunde unui singur
element al acestei mulimi.
76
Definiie. Fie mulimea E={E
1
, E
2
,...,E
n
} mulimea tuturor evenimentelor
elementare corespunztoare unei experiene. Se numete cmp finit de evenimente,
mulimea tuturor submulimilor lui E, la care se adaug mulimea E nsi i .
Exemple: La aruncarea unei monezi avem urmtoarele situaii (evenimente):
apariia unei fee, apariia celeilalte fee, apariia oricrei fee (E) i apariia nici uneia
din fee (). n total sunt 4 evenimente
Un cmp de evenimente se noteaz cu {E,K} unde prin E nelegem
evenimentele, iar K semnific numrul evenimentelor.
Observaie: Ori de cte ori ntr-o relaie vor intra mai multe evenimente, vom
presupune c ele aparin aceluiai cmp i nu vom mai specifica acest lucru.
Operaii cu evenimente.
Cnd n cadrul unei experiene ne fixm atenia asupra unui eveniment, de fapt, ne fixm
atenia asupra unei pri din mulimea rezultatelor experienei.
Exemplu. La aruncarea unui zar ne intereseaz evenimentul A care const n
apariia uneia din feele 2, 4 sau 6. Evenimentul A este perfect determinat de mulimea
format din aceste dou rezultate i deci l putem identifica cu aceasta. Vom scrie
A={2,4,6}
Considerm c evenimentul B const numai din apariia feei 2 i 4.
Se observ c evenimentul A se produce ori de cte ori se produce evenimentul B. Astfel
putem scrie:
BA
Definiie. Fiind date dou evenimente A i B, numim reuniunea lor, AB,
evenimentul a crei producere const n producerea a cel puin unul din cele dou
evenimente.
Exemplu. La aruncarea unui zar se consider evenimentele:
A={1,2,4}, B={2,4,5}
Evenimentul A se produce dac obinem unul din rezultatele {1}, {2} sau {4},
iar B dac se obine unul din rezultatele {2}, {4} sau {5}
AB={1,2,4,5}
77
Definiia 3. Intersecia evenimentelor A i B const n producerea simultan a
evenimentelor A i B.

Pentru exemplul de mai sus, avem urmtoarea expresie:
AB={2,4}
Definiia 4. Spunem c dou evenimente sunt compatibile dac se pot produce
simultan.
Exemplu. Apariia feei {1} i apariia feelor impare.
Definiia 5. Spunem c dou evenimente sunt incompatibile dac nu se pot
produce simultan.
Exemplu. Apariia unei fee pare i apariia unei feelor impare.
Se folosete expresia
AB=
Definiie. Fie A un eveniment; dac ntr-o serie de n probe, evenimentul A s-a
realizat de n
A
ori, numim frecven relativ a evenimentului A numrul f(A) =n
A
/n.

Cmp de probabilitate
Considerm o experien cu n evenimente elementare (deci n probe) egal posibile i fie
A un eveniment oarecare, care se poate realiza prin m probe; m n.
Definiie (definiia clasic a probabilitii). Se numete probabilitatea
evenimentului A, numrul P(A)=m/n, adic raportul dintre numrul cazurilor favorabile
i numrul cazurilor egal posibile.
Probabilitatea unui eveniment elementar este 1/n (n fiind numrul probelor).
Proprieti:
1) 0 P(A) 1
2) P()=0
3) P(E)=1, m=n
4) P() = 1-P(A)
5) P(AB) = P(A)+P(B), dac AB= (evenimente incompatibile)
6) P(A)P(B) dac AB.
78
Definiie (definiia axiomatic aprobabilitii). O probabilitate P definit pe
cmpul de evenimente {E,K} este o funcie care asociaz fiecrui eveniment A{E,K}
un numr real P(A) care satisface urmtoarele axiome:
1) P(A)0 , A{E,K}
2) P(E)=1, E fiind elementul sigur
3) P(AB)=P(A)+P(B), A,B{E,K}, AB=
Observaie. Definiia clasic a probabilitii satisface toate axiomele definiiei
de mai sus.
Definiia 8. Numim cmp finit de probabilitate un cmp finit de evenimente
{E,K} nzestrat cu o probabilitate; se noteaz {E,K,P}.
Evenimente independente. Dou evenimente A, B sunt independente dac:
P(AB) =P(A) P(B)
Evenimente incompatibile. Dou evenimente se numesc incompatibile dac
AB= deci P(AB) =P() =0
Scheme calsice de probabilitate.
Calculul probabilitilor de apariie a unor evenimente este acelai pentru o clas
larg de experimente. Din acest motiv se construiete un model matematic pentru o
astfel de clas, care se numete schem de probabilitate. Pentru o astfel de schem se
determin formulele corespunztoare de calcul, ce depind de anumii parametri, formule
care se aplic pentru fiecare experiment din clasa respectiv, prin particularizarea
acestor parametri. n cele ce urmeaz vom prezenta principalele scheme de probabilitate
cele mai de ntlnite.
1. Schema lui Bernoulli (schema binomial sau schema bilei revenite)
n urma efecturii unei experiene poate aprea evenimentul A cu probabilitatea
p, sau evenimentul contrar () cu probabilitatea q=1-p. Se repet experiena de n ori n
condiii identice. Probabilitatea P(n;m) ca n cele n experiene evenimentul A s apa de
m ori este

m n m m
n
q p C m n P

= ) ; (
Deoarece probabilitatea P(n;m) este coeficientul lui x
m
din dezvoltarea (q+px)
n

acesat schem se mai numete schema binomial.
79
Schema lui Bernoulli mai poate fi realizat printr-o urn cu bile de dou culori (albe i
negre), se extrage pe rnd cte o bil din urn, dar de fiecare dat bila se pune napoi,
motiv pentru care se mai numete schema bilei revenite (ntoarse).
2. Schema bilei nerevenite
Dintr-o urn cu a bile albe i b bile negre se extrag n bile, na+b. Probabilitatea
P
a,b
(,) ca din bilele extrase s fie albe i negre, +=n, este





+
+
=
b a
b a
b a
C
C C
P ) , (
,


3. Schema lui Poisson
Se fac n experiene independente. n urma experienei de rang k poate aprea
evenimentul A cu probabilitile p
k
sau evenimentul cu probabilitatea q
k
=1- p
k
. Probabilitatea
p
m
ca n cele n experiene evenimentul A s apar de m ori este coeficientul lui x
m
din polinomul
P(x)=(p
1
x+q
1
) (p
2
x+q
2
)(p
n
x+q
n
), P(A)=p
1
p
2
p
l
q
1
q
2
q
m
, l+m=n
Variabil aleatoare.
Pn acum ne-am ocupat de apariia sau neapariia unor evenimente, aadar de
latura calitativ a fenomenului aleator. Pentru studiul matematic al fenomenelor
aleatoare este necesar ca descrierea acestora s aib expresii cantitative, care s poat fi
tratate din punct de vedere matematic. Aceast expresie cantitativ este dat de variabila
aleatoare. Deoarece noiunea de variabil aleatoare este foarte important trebuie s-i
acordm o atenie deosebit. Pentru a se nelege mai bine aceast noiune i vom da, la
nceput, o definiie intuitiv.
Numim variabil aleatoare o mrime care drept rezultat al unui experiment-
poate lua o valoare oarecare, fr s se poat preciza dinainte care anume. Adic
mulimea de evenimente este discret (avem un numr finit de evenimente) vom avea o
variabil aleatoare discret, iar n caz contrar o variabil aleatoare continu. Valorile
posibile ale variabilelor aleatoare disrete pot fi enumerate dinainte, spre deosebire de
variabilelor aleatoare continue, care pot lua orice valoare ntr-un anumit interval.
Definiia riguroas a variabilei aleatoare este urmtoarea.
80
Definiie. O variabil aleatoare este o funcie (msurabil) definit pe mulimea
evenimentelor E cu valori n mulimea numerelor reale.
Aa cum am amintit, dac E={A
1
, A
2
, , A
n
} avem o variabil aleatoare
discret i ea, notat cu X, ia valoarea x
1
dac se verific evenimentu A
1
, ia valoarea x
2

dac se verific evenimentu A
2
.a.m.d. Fiecare din valorile x
1
, x
2
,, x
n
este posibil
dar nici una sigur. De aceea se spune c probabilitatea ca variabila aleatoare X s ia
valoarea x
i
este p
i
=P(X=x
i
), unde P este funcia de probabilitate definit mai sus
axiomatic.

Variabila aleatoare va fi mult mai bine precizat atunci cnd se cunoate
probabilitatea cu care este luat fiecare valoare.
Definiie. Numim distribuia sau repartiia variabilei aleatoare X, tabloul

|
|
.
|

\
|
n
n
p p p
x x x
X
...
...
2 1
2 1

Unde p
i
sunt probabilitile de apariie ale vaorilor x
i
, i=1,n i se mai scrie p
i
=
P(X=x
i
) ; deci X=x
i
este un eveniment.
Distribuia unei variabile aleatoare X poate fi reprezentat grafic n plan, prin
poligonul de repartiie, care se obine unind printr-o linie poligonal punctele de
coordonate (x
i
, p
i
), i=1,n ; n general pe cele dou axe se iau msuri diferite.
Distribuii clasice de probabilitate
1. Distribuia corespunztoare schemei lui Bernoulli (binomial).
Se ataeaz schemei lui Bernoulli o variabil aleatoare X care reprezint numrul
de apariii ale evenimentului A atunci cnd se efectueaz n experiene. X are urmtorul
tablou de distribuie

|
|
.
|

\
|


n k n k k
k
n
n
n
n
n
p q p C q p C pq C q
n k
X
2 2 2 1 1
2 1 0

= + =
n
k
n k n k k
n
q p q p C
1
1 ) (
2. Distribuia corespunztoare schemei bilei nentoarse
Se ataeaz schemei bilei nentoarse variabila aleatoare X care reprezint
numrul de bile albe din cele n bile extrase din urn. X are repartiia :
81

|
|
|
.
|

\
|


+ +

+
n
b a
b
n
a
n
b a
k n
b
k
a
n
b a
n
b a
n
b a
n
b a
C
C C
C
C C
C
C C
C
C C
n k
X
0 1 1 0
1 0

= +

=
n
k
n
b a
k n
b
k
a
C
C C
1
1
3. Distribuia corespunztoare schemei lui Poisson
Se ataeaz schemei lui Poisson variabila aleatoare X care reprezint numrul numrul
de apariii ale evenimentului A, atunci cnd se efectueaz n experiene. X are distribuia

|
|
.
|

\
|


n k
p p p p p
n k
X
2 1 0
2 1 0

unde p
k
este coeficientul lui x
m
din polinomul
P(x)=(p
1
x+q
1
) (p
2
x+q
2
)(p
n
x+q
n
), p
n
=1



Funcia de repartiie.
Definiie. Fie X o variabil aleatoare i F(x) probabilitatea ca X s ia valori mai
mici dect x, adic F(x) =P(Xx). Funcia F(x) se numete funcie de repartiie a
variabilei aleatoare X.
n cazul n care variabila aleatoare X este o variabil aleatoare discret i are repartiia
|
|
.
|

\
|
n
n
p p p
x x x
X
...
...
2 1
2 1


funcia de repartiie F este o funcie n scar definit prin:

>
< + + +
< + + +
<
<
<
=

+
i
n n n
i i i
x a
x a x p p p
x a x p p p
x a x p
x a x p
x a
a F
, 1
, ...
...
, ...
...
,
,
, 0
) (
1 1 2 1
1 2 1
3 2 2
2 1 1
1


82
Lucrare de verificare 4
INSTRUCIUNI
Lucrarea de verificare solicitat activiti care necesit cunoaterea materialului
prezentat n cadrul modulului 1. Materialele vor fi transmise prin pot (electronic)
tutorelui pentru comentarii, corectare i evaluare.
Pe prima pagin a lucrrii se vor scrie urmtoarele:
- Titulatura acestui curs;
- Numrul lucrrii de verificare;
- Numele i prenumele cursantului (acestea se vor meniona pe fiecare pagin);
- Adresa cursantului.

Tema lucrrii de verificare are ca subiect Aplicarea schemelor clasice de
probabilitate asupra bazei de date folosite in cadrul lucrrii de verificare nr. 1

Operaiuni:
1. Schema lui Bernouli (3 puncte);
2. Schema bilei nerevenite (3 puncte);
3. Schema lui Poisson (3 puncte).












83
Lucrri practice. Produsul sofware Excel
Comenzi i aplicaii Excel necesare spre a fi nsuite de ctre studeni

1. Creerea/tergere de directoare; creerea unui fiier n cadrul directorului;
salvarea/tergerea unui fiier.
2. Inserarea, tergerea, redenumirea, copierea, selectarea/deselectarea paginilor de
lucru n cadrul unui fiier; formatarea celulelor n cadrul unei pagini de lucru
3. Inserarea, tergerea, selectarea de noi linii/coloane; sortarea pe linii/coloane
4. Generarea unei baze de date; cutarea/nlocuirea de valori; operaia Paste
Special; filtrarea bazei de date; salvare fiiere n late formate (dbf condiii
specifice).
5. Activarea i folosirea funciilor matematice (adunare scdere, nmulire,
mprire, medii aritmetice, etc.) pe linii i pe coloane; operaii ntre celule
(formule de calcul)
6. Realizarea unui tabel i gestionarea datelor din cadrul acestuia (organizarea i
modificarea datelor numerice, modificarea fonturilor, aliniamentul acestora, etc)
7. Gestionarea unui grafic; generarea unei diagrame (chart). Tipuri de diagrame
8. Prezentarea funciilor statistice; aplicarea pe tabel a funciilor statistice (medie,
max., min., median)
9. Calculul coeficientului de corelaie liniar ntre dou linii/coloane i apoi pe
ntreg tabelul
10. Funcia TREND. Aplicarea ei pe dou linii/coloane (dreapta de corelaie)


Bibliografie
1. Bot E., Leonhard W, 2002, Microsoft Office XP, Ed. Teora.
2. Baron T., Korka M., Pecican E., 1981, Stnescu Maria, Statistic pentru
comer i turism, Ed. Did. i Ped. Bucureti
3. Ciucu B., Craiu V., 1971, Introducere n teoria probabilitilor i
statistic matematic, Ed. Didactic i Pedagogic, Bucureti.
4. Ebdon D., 1989, Statistics in Geography, Blackwell Inc., New-York .
84
5. Person R., 1997, Utilizare Excel, Ed. Teora
6. Petcu Nicoleta, 2000, Stastistic n turism. Teorie i aplicaii, Ed.
Albastr (Grupul Microinformatica), Cluj-Napoca.
7. Rotaru T., Bdescu G., Culic Irina, Mezei E., Murean Cornelia, 1999,
Metode statistice aplicate n tiine sociale, Ed. Polirom, Iai.
8. Yule G.U., Kendall M.G., 1969, Introducere n teoria statisticii, Ed. St.,
Bucureti.

S-ar putea să vă placă și