100% au considerat acest document util (1 vot)
143 vizualizări92 pagini

Statistica Curs

Documentul prezintă noțiuni de bază din statistica aplicată în științele politice. Abordează motivele utilizării statisticii în cercetare, dezvoltarea istorică a statisticii și clasificarea variabilelor în funcție de modul de măsurare.

Încărcat de

pussycatt
Drepturi de autor
© © All Rights Reserved
Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.
Formate disponibile
Descărcați ca DOC, PDF, TXT sau citiți online pe Scribd
100% au considerat acest document util (1 vot)
143 vizualizări92 pagini

Statistica Curs

Documentul prezintă noțiuni de bază din statistica aplicată în științele politice. Abordează motivele utilizării statisticii în cercetare, dezvoltarea istorică a statisticii și clasificarea variabilelor în funcție de modul de măsurare.

Încărcat de

pussycatt
Drepturi de autor
© © All Rights Reserved
Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.
Formate disponibile
Descărcați ca DOC, PDF, TXT sau citiți online pe Scribd

Conf. dr.

Virgil Stoica
Statistic aplicat n tiinele politice
Introducere
De ce avem nevoie de statistic?
n ultimele decenii, se poate observa o cretere a utilizrii metodelor statistice n toate tiinele
sociale. Eist mai multe motive pentru acest lucru. Cercetarea n tiinele sociale a cptat o orientare tot
mai cantitativ. !evoluia produs de calculatoarele personale la sf"ritul secolului ## a fcut ca at"t
cercettorii c"t i indivizii obinuii s aib acces la o cantitate foarte mare de informaii. n plus,
calculatoarele au fcut ca metodele statistice s fie mai uor de folosit. $tilizarea tot mai frecvent a
statisticii este evident pentru cineva care urmrete coninutul articolelor unor %urnale tiinifice prestigioase
&'merican (olitical Science !evie), 'merican *ournal of (olitical Science sau 'merican Sociological
!evie)+. 'nunurile de anga%ri pentru specialiti n tiinele sociale enumer statistica printre cunotinele
absolut necesare. ,in aceste motive, un student care se pregtete n domeniul tiinelor sociale trebuie s fie
familiarizat mcar cu noiuni de baz de statistic.
Str"ngerea informaiilor se afl n centrul oricrei tiine. -tiinele sociale utilizeaz o larg varietate
de [Link] de culegere a informaiilor care s fie utilizate n analiza statistic/ eperimente, [Link] de
diferite tipuri, analiza de coninut a unor documente, etc. n plus, sunt analizate informaii produse pentru
alte scopuri, cum ar fi rapoarte ale poliiei, date din recensminte sau informaii medicale. $n cercettor
folosete metodele statistice pentru/
0 proiectarea unei cercetri,
0 descrierea, rezumarea i eplorarea datelor,
0 producerea de inferene &predicii sau generalizri pornind de la un set de date+.
n secolul ##1, nu doar un analist politic, ci orice persoan cu funcie de conducere are acces la o
mare cantitate de informaii. (roblema ma%or const n modul n care este utilizat aceast cantitate enorm
de informaii pentru a lua cele mai bune decizii. ,in aceast perspectiv orice persoan care are o funcie de
rspundere ar trebui s neleag statistica din umtoarele motive/
2. pentru a ti cum s prezinte i s descrie informaiile ntr0un mod corespunztor
2
3. pentru a ti cum s trag concluzii despre o populaie pornind doar de la informaiile obinute de
la un eantion
4. pentru a ti cum s mbuntesc procesul de producie
5. pentru a ti cum s obin previziuni de ncredere
6etodele statistice sunt utilizate nu doar n cercetrile sociale ci i n domeniul afacerilor, in
contabilitate, finane, magement i mar7eting. ,e aceea, acest curs va oferi eemple nu doar din tiinele
sociale ci i din alte domenii n care statistica este absolut necesar i n special din management.
Dezvoltarea statisticii moderne
Eist trei motive principale care au dus la dezvoltarea statisticii/ nevoia guvernelor de a colecta
informaii despre cetenii lor, dezvoltarea matematicii i a teoriei probabilitii i evoluia calculului
electronic.
Culegerea informaiilor despre ceteni este o activitate specific oricrei civilizaii. n Egiptul antic,
in cetile0stat greceti sau n 1mperiul !oman, astfel de informaii erau utilizate n special pentru impozitare
i pentru recrutarea militar. n evul mediu, biserica inea registre despre cstorii, nateri i decese. n epoca
modern &S$', 289:+ a aprut ideea recensm"ntului populaiei la fiecare 2: ani. ;evoia de informaii la
nivelul unui stat a fost str"ns legat de dezvoltarea statisticii descriptive, metod care se concentreaz pe
colectarea, prezentarea i caracterizarea unui set de date, cu scopul de a descrie diferitele trsturi ale acelui
set de informaii.
n paralel cu aceast evoluie s0a desfurat i dezvoltarea matematicii despre
teoria probabilitilor. 'ceasta a pornit de la studierea %ocurilor de noroc n perioada
!enaterii, bazele teoriei probabilitilor fiind puse la mi%locul secolului al #V110lea
de corespondena dintre matematicianul (ascal i %uctorul [Link] de 6ere.
mbuntirile aduse de matematicieni ca <ernoulli, ,e6oivre i =auss au pregtit
apariia statisticii infereniale. 'ceasta face posibil estimarea caracteristicilor unei
populaii doar pe informaiile culese de la un eantion. Statisticieni precum (earson,
>[Link], =osset, ;e?man, @ald i Au7e? au dezvoltat statistica inferenial care este
astzi larg rsp"ndit n orice domeniu. ;evoia unor astfel de metode a provenit din
nevoia de eantionare. Cu c"t o populaie devine mai mare, cu at"t este mai dificil i
mai costisitor s se str"ng informaii despre ea, luat ca ntreg. ,eciziile despre
caracteristicile populaiei trebuie luate pe baza informaiilor culese de la un eantion.
Aeoria probabilitii prezint ansele ca anumite informaii etrase din eantion s
reflecte n mod corect caracterisiticile ntregii populaii.
3
Populaie B
totalitatea itemilor
sau elementelor
luate n consideraie
Parametru B
o msur care
descrie
caracteristicile unei
populaii
Eantion B
o poriune dintr0o
populaie, care este
selecta pentru
analiz
Informaie
statistic B o
msur calculat pe
baza unui eantion,
care este utilizat
pentru a descrie sau
pentru a estima
ntreaga populaie
'ceste dezvoltri au fost puternic susinute de evoluia calculatoarelor, care asigur astzi posibiliti
de calcul la care primii statisticieni nici mcar nu visau. ncep"nd cu anii CD: i C8: au nceput s apar
programe de statistic. n anii CE: au aprut programele statistice utilizate i astzi, cum ar fi S'S, S(SS sau
6initab. 'lte programe, utilizate iniial n scopuri diferite &6icrosoft Eel+, au cptat abiliti statistice.
,isponibilitatea actual a softului statististic a dus la o rsp"ndire fr precedent a utilizrii metodelor
statistice n cercetare, n afaceri sau n luare deciziilor.
1. Msurare i eantionare
1.1. ipuri de varia!ile
6etodele statistice asigur o modalitate de a gestiona variabilitatea. Variaia apare ntre oameni, ntre
coli, ntre orae, ntre diverse obiecte care ar putea s constituie obiectul nostru de interes n viaa de zi cu
zi. ,e eemplu, variaia apare de la o persoan la alta n funcie de caracteristici precum venitul, inteligena,
preferina politic, credina religioas, statusul marital, etc. ;atura i mrimea variabilitii au consecine
importante at"t pentru statistica descriptiv, c"t i pentru cea inferenial.
F varia!il este o caracteristic ce poate varia ntre subiecii unui eantion sau a unei populaii.
>iecare subiect are anumite valori pentru o variabil, ns subieci diferii pot avea valori diferite. Eemple
de variabile/ gen &cu valorile masculin i feminin+, v"rsta &cu valorile :, 2, 3, 4, etc+, religia &cu valorile/
ortodo, catolic, protestant, mozaic, musulman, etc+, numrul de copii n familie &:, 2, 3, etc+, preferina
politic &(;G, (,, (S,, (!6, ((C,, etc+
6odul de analiz a unei variabile depinde de modul n care acea variabil este msurat. Variabilele
numerice, cum ar fi venitul, trebuie tratate n mod diferit de variabilele care sunt msurate prin intermediul
unor [Link], cum ar fi preferina pentru un anumit partid. ,ac n primul caz putem discuta despre medie
ca o msur a venitului, n al doilea caz, acest lucru este absurd. 6ai departe vor fi introduse dou metode de
clasificare a variabileleor.
"aria!ile calitative i varia!ile cantitative
1nformaiile sunt numite calitative atunci c"nd pentru msurarea lor se folosete un set de categorii
care nu sunt ordonate n nici un fel. Eemple de date calitative/ statusul marital &necstorit, cstorit,
divorat, vduv+, localitatea de reedin, apartenena religioas, preferina politic, etc. (entru variabilele
calitative, categoriile difer ntre ele prin calitate i nu prin cantitate sau magnitudine.
'tunci c"nd posibilele valori ale unei variabile difer difer n magnitudine, variabila este numit
cantitativ. >iecare valoare posibil a unei variabile cantitative este mai mare sau mai mic dec"t orice alt
4
valoare posibil. 'stfel de comparaii sunt cu putin pentru variabile msurate pe o scal numeric.
Eemple de variabile cantitative/ venitul anual, numrul de ani de educaie, numrul de frai, de c"te o ori o
persoan a fost condamnat, etc.
Setul de categorii pentru o variabil calitativ este numit scal nominal, iar setul de valori numerice
pentru o variabil cantitativ se numete scal interval. Scalele interval au o anumit distan sau un anumit
HintervalI ntre fiecare perec.e de niveluri. Venitul lunar este msurat pe o astfel de scal intervalJ intervalul
dintre [Link] si [Link] !F;, de eemplu, este de [Link] !F;. 'stfel se pot face comparaii ntre niveluri
diferite ale venitului, comparaii care nu au nici un sens pentru o scal nominal. ntr0un anumit sens eist
i un al treilea tip de scal, situat ntre scala nominal i cea interval. Este vorba despre o scal categoric,
av"nd o ordine natural a valorilor, dar fr a putea identifica distana dintre valori. 'ceasta este scala
ordinal. ,e eemplu/ poziia n spectrul politic &st"nga, centru0st"nga, centru, centru0dreapta, dreapta+,
opinia fa de mrimea [Link] cu protecia social &prea mici, normale, prea mari+, etc.
(rincipalul motiv pentru care se face distincia dintre datele cantitative i cele calitative este c, aa
cum s0a mai spus, pentru fiecare tip de date se aplic metode statistice diferite.
"aria!ile discrete i varia!ile continue
F alt modalitate de a clasifica variabilele ine cont numrul de valori cuprinse n scala de msurare.
F variabil este numit discret dac ea poate lua doar un numr finit de valori i este numit continu dac
poate lua ca valori un numr infinit de numere reale.
Eemple de variabile discrete/ numrul de copii ai fiecrei familii, numrul de infraciuni ntr0un an,
numrul de vizite la medic n ultimul an, etc. Fricare dintre variabilele anterioare numite Hnumrul de...I
este o variabil discret, ntruc"t poate lua doar valori din mulimea K:, 2, 3, 4, 5, LM.
Eemple de variabile continue/ nlimea, greutatea, v"rsta, venitul, etc. Este imposibil de precizat
toate valorile posibile ale unei variabile continue. =reutatea unei persoane poate fi 84,E3:4N... 7g, funcie de
precizia cu care este fcut msurtoarea.
n cazul variabilelor discrete nu se poate subdiviza unitatea de msur. ;umrul de copii ntr0o
familie poate fi 3 sau 4, dar n nici un caz, 3,N8. (e de alt parte, o colecie de valori ale unei variabile
continue poate fi oric"nd redefinit ntre dou valori posibile. Frice v"rst cuprins ntre 3: i 3:,N ani, de
eemplu, poate fi rotun%it la 3: de ani, iar orice v"rst cuprins ntre 3:,N i 32 de ani poate fi rotun%it la 32
de ani.
Variabilele calitative sunt discrete, ele av"nd un set finit de categorii. Variabilele cantitative pot fi
at"t discrete c"t i continue.
5
1.#. Eantionare i tipuri de eantioane
Statistica inferenial utilizeaz eantioanele pentru a face predicii despre parametrii populaiilor din
care acestea au fost etrase. Calitatea inferenei depinde n mod esenial de modul n care eantionul
reprezint populaia.
(rocesul de eantionare ncepe prin definirea cadrului de eantionare. 'cesta cuprinde o list
complet sau parial a itemilor care compun populaia. Cadrul de eantionare poate fi o list de un anumit
tip a populaiei/ lista alegtorilor, lista abonailor telefonici dintr0o localitate sau cea a locuinelor conectate
la reeaua de electricitate. Subiecii unei populaii pot fi indivizi, familii, coli, locuine, orae, spitale, etc.
,ac anumite grupuri din populaie nu sunt incluse n cadrul de eantionare, atunci eantionul nu va fi
corect.
Eist dou mari grupuri de eantioane/ probabilistice i neprobabilistice.
$n eantion pro!a!ilistic este acela n care subiecii sunt alei pe baza unei
probabiliti cunoscute. $n eantion nepro!a!ilistic este acela n care elemen0
tele componente sunt alese fr s se in cont de probabilitatea apariiei lor.
(entru anumite studii, eantioanele neprobabilistice, aa cum sunt cele pe cote,
cele intenionate sau cele convenabile, sunt suficiente. 'ceste eantioane au unele
avanta%e fa de cele probabilistice, cum ar fi uurina i viteza cu care pot fi
construite, precum i costul sczut. (e de alt parte, ele au dou dezavanta%e ma%ore/ lipsa de acuratee i
imposibilitatea generalizrii. ,in aceste motive, eantioanele neprobabilistice pot fi utilizate doar atunci
c"nd dorim o aproimare grosier la un cost sczut pentru a ne satisface o curiozitate personal sau atunci
c"nd dorim s realizm un studiu pilot, care va fi urmat mai t"rziu de o cercetare mult mai riguroas.
Eantioanele probabilistice trebuie utilizate ori de c"te ori este posibil, deoarece doar ele asigur o
corect inferen statistic de la eantion la populaie. Eist patru tipuri de eantioane probabilistice/
eantionul aleatoriu simplu, eantionul sistematic, cel startificat i cel de tip cluster. 'ceste tipuri difer ntre
ele prin cost, acuratee i compleitate.
$n eantion aleator simplu este acela n care fiecare element din cadrul de eantionare are aceeai
ans de a fi selectat. (entru a putea utiliza un astfel de eantion este necesar, n primul r"nd, s eiste o list
complet a populaiei. 'poi de pe aceast list se poate etrage eantionul dorit utiliz"nd metoda loteriei sau
un tabel cu numere aleatoare sau un calculator care s genereze numere aleatoare.
n cazul unui eantion sistematic, cei N indivizi care formeaz cadrul de eantionare &populaia+ sunt
mprii n k grupuri, prin mprirea populaiei la mrimea dorit a eantionului n. 'poi este ales, n mod
aleator, un individ din primul grup, iar restul eantionului este obinut prin selecia al fiecrui k element din
fiecare grup. ,e eemplu, dac vrem s etragem un eantion sistematic de 5: de indivizi dintr0o populaie
N
6otive pentru a
utiliza un eantion n
locul unui
recensm"nt al
ntregii populaii/
2. necesit mai puin
timp
3. cost mai puin
4. este mai uor de
administrat
de ; O E::, populaia va fi mprit n E::P5: O 3: de grupuri. Este ales n mod aleator un numr din primul
grup, s spunem 9, apoi fiecare al 3:0lea de dup acesta/ 39, 59, D9,..., 8D9 i 8E9.
,ei sunt uor de utilizat, eantionarea aleatorie simpl i eantionarea sistematic sunt n general
mai puin eficiente dec"t alte metode mai sofisticate i nu se poate ti dac eantionul este ntr0adevr
reprezentativ. n cazul eantioanelor sistematice, posibilitatea de eroare este [Link] mai mare, n cazul n care
cadrul de eantionare este organizat dup un anumit model.
n cazul unui eantion stratificat, cei N indivizi ai populaiei sunt mprii n c"teva subpopulaii,
sau straturi, n conformitate cu anumite caracteristici. Este etras c"te un eantion aleator simplu din fiecare
strat, iar eantioanele rezultate sunt combinate. 'ceast metod de eantionare este mai eficient dec"t cele
anterioare, deoarece asigur reprezentarea indivizilor din ntreaga populaie, ceea ce ofer o mai mare
precizie n estimarea parametrilor populaiei.
(entru a construi un eantion de tip cluster, cei N indivizi care formeaz populaia sunt mprii n
c"iva clusteri, astfel nc"t fiecare dintre acetia este reprezentativ pentru ntreaga populaie. 'poi este etras
un eantion aleator simplu din fiecare cluster. Clusterele sunt zone n care populia este grupat n mod
natural, cum ar fi %udee, localiti, cartiere, strzi, etc. 'ceast metod poate fi mai eficace i mai puin
costisitoare dec"t cea a eantionrii simple aleatoare, mai ales c"nd populaia este rsp"ndit peste o arie
geografic larg.
E$erciii
2. $rmtoarele variabile sunt cantitative sau calitativeQ
a. ;umrul de animale de cas
b. *udeul de reedin
c. 'utoturismul ales &de producie intern sau de import+
d. ,istana &n 7m+ p"n la locul de munc
e. ,ieta &vegetarian sau nevegetarian+
f. Aimpul petrecut sptm"na trecut pe internet
g. ,einerea unui calculator personal &da, nu+
.. ;umrul de persoane bolnave de S1,' pe care le cunoatei personal
3. Care din scalele de msur &nominl, ordinal sau interval+ este mai potrivit pentru/
a. 'titudinea fa de interzicerea avortului
b. ;umrul de frai
c. =enul
d. 'filierea partinic
D
e. !eligia
f. 1deologia politic &de st"nga,..., de dreapta+
g. ;umrul de ani de coal terminai
.. Cea mai nalt diplom obinut
4. Care din scalele de msur este mai potrivit pentru urmtoarele variabileQ
a. Fcupaia
b. Statusul ocupaional &muncitor, ran, intelectual,...+
c. !ata infracionalitii &nr. de infraciuni la [Link] de locuitori+
d. (opulaia localitii
e. !ata de cretere a populaiei &n R+
f. Aipul de localitate &comun, ora, municipiu+
g. Venitul anual
.. 'titudinea fa minoritile seuale &favorabil, neutr, nefavorabil+
5. Care dintre urmtoarele variabile pot fi considerate continueQ
a. V"rsta
b. ;umrul de copii din familie
c. Venitul souluiPsoiei
d. (opulaia localitii
e. 6etoda de contracepie utilizat
f. Gatitudinea i longitudinea localitii
g. ,istana p"n la locul de munc
.. *udeul de reedin
N. S presupunem c urmtoarele informaii sunt culese de la studenii care cumpr cri de la o
librrie.
a. Suma de bani [Link] pe cri
b. ;umrul de cri cumprate
c. Aimpul petrecut n librrie
d. Specializarea
e. =enul
f. ,einerea unui calculator personal
g. ,einerea unui videoP,V, pla?er
.. 6etoda de plat
8
1dentificai tipurile de variabile. ,ac variabila este numeric, detrerminai dac este discret sau
continu.
D. (entru un studiu care const n interviuri cu participanii, eplicai de ce un eantion simplu aleator
poate fi mai puin practic dec"t alte metode.
8. !ectorul unei universiti cu ;O[Link] de studeni solicit biroului de evaluare academic s efectueze
o [Link] prin care s msoare satisfacia studenilor. $rmtorul tabel conine o clasificare a
studenilor, funcie de gen i de anul de studii.
=enul 'nul 2 'nul 3 'nul 4 'nul 5 Aotal
>emeie 8:: N3: N:: 5E: 33::
<rbat ND: 5D: 5:: 4E: 2E::
Aotal 23D: 9E: 9:: ED: [Link]
<iroul de evaluare intenioneaz s etrag un eantion de nO3:: de studeni.
a. ,ac universitatea dispune de o list alfabetic a celor [Link] de studeni &ceea ce
reprezint cadrul de eantionare+, ce tip de eantionare poate fi folositQ ,iscutai.
b. Care este avanta%ul utilizrii unui eantion aleator simplu la punctul aQ
c. Care este avanta%ul utilizrii unui eantion sistematic la punctul aQ
d. n cazul n care cadrul de eantionare este reprezentat de opt liste separate, n ordine
alfabetic, pe gen i an de studiu, ce tip de eantion ar trebui folositQ ,iscutai.
e. S presupunem c toi studenii respectivei universiti locuiesc n 3: de cmine. >iecare
cmin are patru niveluri, cu N: de paturi pe nivel, deci poate primi 3:: de studeni. S
presupunem n continuare c politica universitii este de a integra studenii, deci pe
fiecare eta% al fiecrui cmin vor fi camere de biei i camere de fete, de la specializari
diferite i din ani diferii. ,ac biroul de evaluare reuete s construieasc un cadru de
eantionare const"nd ntr0o list cu toi studenii aa cum sunt ei dispui n fiecare cmin
i pe fiecare eta%, ce tip de eantion ar trebui utilizat. ,iscutai.
#. Statistic descriptiv. a!ele i %rafice
E
#.1. &r%anizarea datelor numerice
,ac pentru un set de date compus doar din c"teva observaii nu este o problem observarea
trsturilor ma%ore, acest lucru devine tot mai dificil pe msur ce numrul de observaii devine mai mare.
,e aceea este nevoie de organizarea informaiilor. (entru acest lucru sunt folosite dou metode/ irul ordonat
i dispunerea sub form de Hcreang i frunzeI.
$n ir ordonat reprezint o secven ordonat de informaii, aran%ate de la cea mai mic la cea mai
mare. ,e eemplu, s presupunem c durata de edere, n zile, a unor pacieni ntr0un centru de
dezalcoolizare este urmtoarea/ 22, 48, 33, D, 3:, 9, D2, 2E, 35, 2D, 24, 5, 49, 24, 55, 29 i 8. -irul ordonat
va fi n acest caz/ 5, D, 8, 9, 22, 24, 24, 2D, 2E, 29, 3:, 33, 35, 48, 49, 55, D2. $n astfel de ir face mai uoar
observarea etremelor, a valorilor tipice i a zonelor n care valorile se concentreaz.
,ispunerea sub form de 'crean% i frunze( este o unealt util pentru organizarea unui set de date
i pentru nelegerea modului n care valorile sunt distribuite i grupate. F astfel de dispunere separ n
cifraPcifrele de intrare &HcreangaI+ i celelalte cifre &HfrunzeleI+, fiecare n ordine cresctoare. ,ac ne
referim la eemplul anterior, atunci o distribuie creang i frunze arat aa/
Creanga >runzele
:
2
3
4
5
N
D
5, D, 8, 9
2, 4, 4, D, E, 9
:, 3, 5
8, 9
5
2
#.#. a!ele i %rafice pentru date numerice
Distri!uia frecvenelor
1ndiferent de modul n care sunt ordonate datele, fie n ir cresctor, fie sub form de Hcreng i
frunzeI, atunci c"nd numrul de cazuri crete, informaia trebuie s fie condensat i mai mult pentru a putea
fi prezentat, analizat i interpretat n mod corespunztor. 'stfel, informaiile pot fi grupate n categorii ale
cror limite sunt stabilite funcie de mprtierea observaiilor. F astfel de aran%are a datelor sub form de
tabel se numete distri!uia frecvenelor.
'tunci c"nd observaiile sunt grupate ntr0o distribuie de frecvene, procesul de analiz i
interpretare a datelor devine mai uor. (rincipalele caracteristici ale datelor pot fi aproimate, ceea ce
compenseaz faptul ca prin grupare informaia iniial, legat de fiecare observaie individual, este pierdut.
'tunci c"nd se construiete o distribuie de frecvene sunt c"teva etape care trebuie parcurse/ punerea
datelor n ordine, stabilirea numrului de categorii, de clase, n care sunt grupate datele, stabilirea mrimii
9
fiecrei clase, stabilirea frontierelor fiecrei categorii i, n final, punerea fiecrei observaii n categoria
corespunztoare.
'legerea numrului de clase n care se va grupa informaia depinde n primul r"nd de numrul de
observaii. $n numr mai mare de obdervaii permite un numr mai mare de categorii. n general, o
distribuie de frecvene are ntre N i 2N clase. ,ac sunt prea puine clase nu se poate observa nici o
distribuie iar dac sunt prea multe clase, unele dintre ele nu vor avea nici o observaie. ntr0o distribuie de
frecvene, limile claselor trebuie s fie egale. (entru a determina limea unei clase se mparte
amplitudinea variaiei observaiilor &din cea mai mare valoare se scade cea mai mic+ la numrul dorit de
clase. >rontierele fiecrei categorii categorii trebuie s fie foarte clare, astfel nc"t s nu rm"n date
neacoperite sau suprapuneri.
Eemplu/ trebuie construit o distribuie a frecvenelor pentru urmtoarele date obinute la un test de
cunotine/ 2D, 3, 2D, 39, 2N, 8, 3N, 2D, N, 29, 2, 23, 33, 2:, 39, 3:.
2. (unerea datelor n ordine/ 2, 3, N, 8, 2:, 23, 2N, 2D, 2D, 2D, 29, 3:, 33, 3N, 39, 39.
3. Stabilirea numrului de categorii/ 4
4. Calcularea limii fiecrei categorii/ &3902+P4 O9,444J se poate aproima la 2:.
5. Stabilirea frontierelor fiecrei categorii/ : B 9J 2: B 29J 3: B 39.
N. (unerea fiecrei observaii n categoria corespunztoare/
Categoria >recvena
: B 9
2: B 29
3: B 39
5
8
N
Ao
tal
2D
(rincipalul avanta% al unui astfel de tabel l reprezint faptul c principalele caracteristici ale
informaiei devin clare foarte uor/ scorurile variaz ntre : i 39, dar cele mai multe sunt n categoria de
mi%loc. (e de alt parte, dezavanta%ul ma%or al distribuiei frecvenelor este c, fr acces la datele originale,
nu se poate cunoate distribuia valorilor n interiorul unei anumite clase.
Distri!uia frecvenelor relative i distri!uia procentual
(entru a mbunti analiza, se pot utiliza fie distribuia frecvenelor relative, fie distribuia
procentual. Distri!uia frecvenelor relative este format prin mprirea frecvenelor din fiecare clas la
numrul total de observaii. Distri!uia procentual rezult prin nmulirea fiecrei frecvene relative cu
2::.
Categoria
>recvena >recvena
relativ
(rocentul
2:
: B 9
2: B 29
3: B 39
5
8
N
:,3N
:,548N
:,423N
3N
54,8N
42,3N
Aotal 2D 2 2::
$tilizarea proporiei sau a procenta%ului are mai mult sens dec"t utilizarea doar a frecvenelor. ,e
fapt, utilizarea distribuiei frecvenelor relative i a distribuiei procentuale devine esenial atunci c"nd se
compar dou seturi de date, i mai ales c"nd numrul observaiilor din cele dou seturi de date difer.
)isto%rama
(lec"nd de la epresia foarte cunoscut n %urnalism c Ho imagine face c"t [Link] de cuvinteI i
transfer"nd0o n statistic, a%ungem la [Link] grafice. 'cestea sunt deseori utilizate n locul tabelelor,
pentru a avea o descriere mai vie a seturilor de date. $nul dintrte graficele cele mai utilizate este .istograma.
F *isto%ram este un grafic n care pe graniele fiecrei clase sunt construite [Link] a cror nlime
este proporional cu frecvena, frecvena relativ sau procenta%ul.
'tunci c"nd se construiete o .istogram, variabila de interes se amplaseaz pe orizontal, iar pe
vertical se noteaz frecvena, proporia sau procenta%ul observaiilor din fiecare clas.
Histograma
0
1
2
3
4
5
6
7
8
9 19 29
categoria
F
r
e
c
v
e
n
t
a
Poli%onul frecvenelor sau procenta+elor
(unctul de mi%loc al unei clase reprezint punctul aflat la %umtatea distanei dintre frontierele
fiecrei clase i este reprezentativ pentru datele din acea clas. (oligonul frecvenelor sau procenta%elor este
format prin unirea tuturor punctelor de mi%loc ale claselor analizate. Ga fel ca i la .istogram, variabila de
interes este amplast pe orizontal.
22
#.,. a!ele i %rafice pentru varia!ile nominale
a!elul rezumativ
$n tabel rezumativ pentru variabile nominale este similar, ca form, cu un tabel pentru date
numerice. $rmtorul tabel prezint rezultatele primului tur de scrutin al alegerilor prezideniale desfurate
pe 3E noiembrie 3::5.
Candidatul ;umrul de voturi (rocenta%ul
'drain ;stase
Araian <sescu
Corneliu Vadim Audor
6ar7o <ela
!estul candidailor
538EED5
4N5N34D
2424825
N4455D
8E:95N
5:,95
44,93
23,N8
N,2:
8,58
-raficul !ar
(entru a eprima informaia prezentat ntr0un tabel ca cel anterior se utilizeaz graficul bar al
frecvenelor, al frecvenelor relative sau al procenta%elor. ntr0un astfel de grafic, fiecare categorie este
reprezentat de o bar a crei lungime este proporional cu frecvena sau procenta%ul observaiilor din acea
categorie. n general, variabila de interes este amplast pe aa vertical, iar valorile pe aa orizontal. n
cazul variabilelor nominale nu conteaz ordinea n care sunt amplasate categoriile. n plus, spre deosebire de
.istograme, barele sunt separate ntre ele, tocmai pentru a sublinia faptul c variabila este nominal
&calitativ+ i nu interval &cantitativ+.
Procentajul
40,94
33,92
12,57
5,1
7,47
0 10 20 30 40 50
Adrain Nstase
Traian Bsescu
orneliu !adi" Tudor
#ar$o Bela
%estul candida&ilor
Procentajul
-raficul tort
=raficul tort se bazeaz pe faptul c un cerc are 4D: de grade. 'cesta este mprit n felii a cror
mrime este proporional cu fiecare categorie.
23
Procentajul
40,94
33,92
12,57
5,1
7,47
Adrain Nstase
Traian Bsescu
orneliu !adi" Tudor
#ar$o Bela
%estul candida&ilor
Scopul unui grafic este s prezinte datele cu precizie. $nele cercetri asupra percepiei umane au
a%uns la concluzia c graficele tort au performane mai slabe dec"t graficele bar. 'ceasta deoarece s0a
observat c [Link] uman apreciaz mai uor o lungime n raport cu o scal, ca n cazul graficelor bar, i mai
greu un ung.i, ca n cazul graficelor tort. 'stfel, un grafic bar permite o comparare mai uoar a
categoriilor. (e de alt parte, graficele tort arat cu claritate faptul c suma tuturor categoriilor este 2::R. n
consecin, alegerea tipului de grafic este subiectiv i depinde de scopurile utilizatorului/ dac este mai
important comparaia, atunci este mai bine s se utilizeze un grafic barJ dac este mai important
observarea unei poriuni n raport cu ntregul, atunci este mai bine s se utilizeze un grafic tort.
E$erciii
2. >ormai un ir ordonat din urmtorul eantion de 2: note la un eamen de statistic/ E,EJ 8,EJ 8,EJ 8,4J
9,2J 8,EJ E,NJ D,5J D,3J 8,N. Construii o dispunere Hcreang i frunzeI.
3. >ormai un ir ordonat din urmtorul eantion de 2: salarii &n !F;+ din cadrul unei companii/ 8NN, 59:,
D5E, E43, 82:, N9:, N8D, D38, 92N, E49. Construii o dispunere Hcreang i frunzeI.
4. $rmtoarele date reprezint un eantion de 34 de sume de bani etrase de la un bancomat/ 3D:, 3E:, 3::,
3::, 32:, 33:, 3N:, 3N:, 2E:, 3N:, 2N:, 3::, 2E:, 3::, 3N:, 3N:, 33:, 4::, 4::, 4::, 2N:, 3::, 39:.
a. (unei datele ntrt0un ir ordonat.
b. (unei datele sub form Hcreang i frunzeI.
c. Care dintre cele dou forme de prezentare ofer mai multe informaiiQ. ,iscutai.
d. n %urul crei valori par s se concentreze sumele retraseQ Eplicai.
24
5. $rmtoarea distribuie Screang i frunzeI reprezint cantitatea de motorin cumprat &n litri+,
de un eantion de 3N de camioane de la o staie de alimentare de la periferia <ucuretiului.
9
2:
22
23
24
2,5,8
:,3,3,4,E
2,4,N,N,D,D,8,8,8,8
3,3,4,5,E,9
:,3
a. (unei datele ntrt0un ir ordonat.
b. Care dintre cele dou forme de prezentare ofer mai multe informaiiQ. ,iscutai.
c. Care este cantitatea de motorin care are ansele cele mai mari de a fi cumpratQ
d. Eist o concentraie spre mi%locul distribuiei a cantitii de motorin cumpratQ
e. Credei c eantionul de 3N este reprezentativ pentru o populaie mai largQ ,iscutai.
N. (lec"nd de la aceeai distribuie Hcreang i frunzeI de la eerciiul 4
a. Construii distribuia de frecvene i distribuia procenta%elor
b. Arasai .istograma procenta%elor
c. Arasai poligonul procenta%elor
D. n anul 3::5, numrul de credincioi ai marilor religii ale lumii era urmtorul/ cretini 32:8
milioane, musulmani 23E4 milioane, .indui EN2 de milioane, buditi 48N milioane, iudaici 2N
milioane.
a. Construii distribuia frecvenelor pentru aceste date.
b. Construii distribuia frecvenelor relative pentru aceste date.
c. Construii un grafic bar.
d. Se poate calcula media, mediana sau modul pentru aceste dateQ 1nterpretai.
8. Cele dou iruri ordonate din tabelul urmtor prezint durata de via, n ore, a dou eantioane
de c"te 5: de becuri de 2::@, eantioane etrase din producia a dou fabrici.
>abrica ' >abrica <
DE5 D98 83: 884 E32 E29 E4D EEE E98 9:4
E42 E4N E5E EN3 EN3 9:8 923 92E 953 954
EN9 ED: EDE E8: E8D 9N3 9N9 9D3 9ED 993
E94 E99 9:N 9:9 922 995 2::5 2::N 2::8 2:2N
933 935 93D 93D 94E 2:2D 2:2E [Link] 2:33 2:45
949 954 95D 9N5 982 2:4E 2:83 2:88 2:88 2:E3
983 988 9E5 2::N 2:25 2:9D 22:: 2224 2224 222D
2:2D 2:52 2:N3 [Link] 2:94 22N4 22N5 2285 22EE 234:
a. Construii distribuia frecvenelor pentru cele dou fabrici, utiliz"nd clase de 2:: de ore lime.
b. Construii alte distribuii ale frecvenelor, utiliz"nd urmtoarea [Link]/
>abrica '/ de la DN: p"n la 8N:, de la 8N: inclusiv la EN:, amd
25
>abrica </ de la 8N: p"n la EN:, de la EN: inclusiv la 9N:, amd
c. [Link] limea intervalelor de la 2:: la N: &DN: B 8::, 8:: B 8N:, etc+. Comentai rezultatele
acestei modificri.
d. Construii distribuia procenta%elor din distribuia frecvenelor de la punctul b.
e. Arasai separat .istogramele procenta%elor.
f. Arasai poligoanele procenta%elor.
g. <ecurile crei fabrici au o speran de via mai lungQ Eplicai.
E. F variabil nominal are patru categorii, cu urmtoarele procenta%e/
Categoria (rocenta%ul
'
<
C
,
23
39
4N
35
a. Construii un grafic bar
b. Construii un grafic tort
2N
,. Statistic descriptiv. Msuri ale tendinei centrale i ale dispersiei
,.1. Msuri ale tendinei centrale. ale dispersiei i formei
Cele mai multe dintre seturile de date arat o tendin clar a datelor de a se grupa n %urul unui punct
central. ,in acest motiv, pentru orice set de date, o anumit valoare tipic poate fi utilizat pentru a descrie
ntregul set. F astfel de valoare descriptiv se numete msur a tendinei centrale. Eist trei astfel de
msuri ale tendinei centrale/ media aritmetic, mediana i modul.
Media aritmetic
6edia aritmetic reprezint cea mai utilizat msur a tendinei centrale. 6edia aritmetic se
calculeaz prin mprirea sumei tuturor valorilor numerice ale unei variabile dintr0un set de date la numrul
de date din acel set.
(entru un eantion care conine n observaii, notate #
2
, #
3,...,
#
n
, media aritmetic a eantionului,
notat X i numit # barat, se calculeaz dup formula/
n n
X X X X
X
n
i
i
n
X

=
=
+ + + +
=
2 4 3 2
...
(entru o populaie care conine N observaii, media aritmetic a populaiei se noteaz cu litera
greceasc T i se calculeaz dup o formul similar/
N N
X X X X
n
i
i
n
X

=
=
+ + + +
=
2 4 3 2
...

Arebuie subliniat faptul c T reprezint un parametru, iar X este doar o informaie statistic.
S lum n considerare urmtorul eemplu/
Aabelul 4.2. 'ctivitatea economic a femeilor n EuropaJ 'nga%area n munc a femeilor ca procent din
anga%area n munc a brbailor
2D
Europa occidental Europa central i de est
Uara 'ctivitatea economic Uara 'ctivitatea economic
'ustria D: <ulgaria EE
<elgia 58 [Link] E5
,anemarca 88 (olonia 88
Elveia D: !om"nia 88
>rana D5 Slovacia E2
1rlanda 52 $ngaria 8:
1talia 55
6area <ritanie D:
;orvegia DE
Flanda 53
(ortugalia N2
Spania 42
Suedia 88
(entru a calcula media aritmetic a anga%rii n munc a femeilor din Europa central i de est, nt"i
se calculeaz suma valorilor &EEVE5V88V88VE2V8: O 588+, care apoi se mparte la numrul de cazuri
&588PDO89,N+. 6edia, ca i ceilali indicatori ai tendinei centrale, permite compararea ntre grupuri. n cazul
eemplului anterior, valoarea mediei aritmetice pentru Europa central i de est &89,N+ poate fi comparat cu
cea pentru Europa occidental &NN,N4+, iar diferena poate fi analizat.
(roprietile mediei/
0 media este o msur potrivit doar pentru datele cantitative
0 media este puternic influenat de observaiile care sunt foarte deprtate de restul datelor, care
sunt numite observaii ecentrice.
Mediana
6ediana este msura care mparte eact n dou un ir ordonat de date.
6ediana O a &nV2+P3 observaie
,ac eist un numr impar de observaii, mediana reprezint valoare numeric ce este poziionat
eact n punctul de &nV2+P3.
,ac eist un numr par de observaii, atunci mediana se situeaz ntre cele dou observaii din
mi%loc i este egal cu media lor.
n cazul datelor din tabelul 4.2, pentru rile din Europa occidental, irul ordonat al datelor este
urmtorul/ 42, 52, 53, 55, 58, N2, /0, D:, D:, D5, DE, 88, 88. ;umrul observaiilor fiind impar, observaia a
80a mparte irul n dou pri egale, deci 6ediana O D:.
n cazul datelor pentru Europa central i de este, irul ordonat al datelor este/ 8:, 88, 11. 21, E5, EE.
(entru c numrul observaiilor este par, 6ediana O &88VE2+P3 O 89
28
(rincipala calitate a medianei n raport cu media const n faptul c nu este afectat de valorile
ecentrice. ,ar, pe de alt parte, pentru seturi de date relativ mici, distribuii diferite pot avea aceeai
median.
Modul
6odul este valoarea care are frecvena cea mai mare ntr0un set de date. Spre deosebire de media
aritmetic, modul nu este afectat de valorile etreme. 6odul este utilizat doar pentru scopuri descriptive,
deoarece el este mult mai variabil de la un eantion la altul dec"t dec"t celelalte msuri ale tendinei centrale.
(entru variabilele continue, aa cum ar fi venitul, deoarece sunt etrem de multe valori posibile pe care
variabila le poate lua, sunt anse foarte mari ca nici o valoare s nu apar de dou ori. n consecin, pentru
variabilele continue nu putem discuta despre mod.
n eemplul datelor din tabelul 4.2, pentru rile din Europa occidental, valoare cu frecvena cea mai
mare este D:, deci 6odul O D:. (entru rile din Europa central i de est, 6odul O88.
3uartilele
Wuartilele reprezint cea mai utilizat msur a locaiei necentrale i sunt utilizate pentru a descrie
proprietile unor seturi mari de date. n vreme ce mediana este valoarea care mparte n dou un set ordonat
de date &N:R dintre observaii sunt mai mari dec"t aceasta iar N:R mai mici+, Xuartilele sunt msuri
descripitve care mpart un i ordonat de date n patru sferturi.
Prima 4uartil. 3
1
, este valoarea pentru care 3NR dintre observaii sunt mai mici, iar 8NR sunt mai
mari/ W
2
O a &nV2+P5 observaie
5 treia 4uartil. 3
,
. este valoarea pentru care 8NR dintre observaii sunt mai mici, iar 3NR sunt mai
mari/ W
2
O a 4&nV2+P5 observaie
(entru calcularea Xuartilelor se folosesc urmatoarele reguli/
2. ,ac numrul rezultat din formul este ntreg, atunci observaia corespunztoare numrului
rezultat reprezint Xuartila.
3. ,ac numrul rezultat din formul este la %umtatea dintre dou numere ntregi, atunci Xuartila
reprezint media dintre valorile observaiilor ntre care se situeaz.
4. ,ac numrul rezultat din din formul nu este nici ntreg i nici la %umtatea distanei dintre dou
numere ntregi, atunci Xuartila reprezint valoarea observaiei cea mai apropiat.
$tiliz"nd datele din tabelul 4.2, pentru rile din Europa occidental, irul ordonat al datelor este
urmtorul/ 42, 52, 6#. 66, 58, N2, D:, D:, D:, /6. /2, 88, 88
n acest caz, W
2
O a &24V2+P5 observaie O a 4,N observaie. $tilizand a doua regul, prima Xuartil va
fi media dintre a 40a i a 50a observaie/ W
2
O &53V55+P3 O 54
2E
W
2
O a 4&24V2+P5 observaie O a 2:,N observaie. $tiliz"nd a doua regul, a treia Xuartil va fi media
dintre a 2:0a i a 220a observaie/ W
4
O &D5VDE+P3 O DD
Msuri ale dispersiei
F a doua proprietate important care descrie un set de date este dispersia sau mprtierea datelor.
,ou seturi de date pot diferi at"t n ceea ce privete tendina central c"t i dispersia, dup cum se poate
observa n figurile 4.2 i 4.3.
>ig. 4.2. ,ou distribuii simetrice care difer doar n privina tendinei centrale
>ig. 4.3. ,ou distribuii simetrice care difer doar prin dispersie
Eist cinci msuri ale dispersiei/ 'mplitudinea, amplitudinea interXuartilic, variana, deviaia
standard i coeficientul de variaie.
5mplitudinea reprezint diferena dintre cea mai mare i cea mai mic observaie dintr0un set de
date/ ' O #
ma
0#
min
$tiliz"nd datele din tabelul 4.2, pentru rile din Europa occidental, ' O 88042 O 5D
'mplitudinea msoar mprtierea total a unui set de date. ,ei amplitudinea este o msur simpl
a variaiei totale a datelor, slbiciunea ei principal este c nu ine cont de modul n care datele sunt
29
mprtiate ntre cea mai mare i cea mai mic valoare. 'stfel, atunci c"nd eist cel puin o valoare
ecentric, folosirea amplitudinii nu este corespunztoare.
5mplitudinea inter4uartilic reprezint diferena dintre a treia Xuartil i prima Xuartil dintr0un set
de date/ '
iX
O W
4
0W
2
'ceast msur ia n considerare mprtierea a N:R dintre date i de aceea nu este influenat de
valorile etreme. $tiliz"nd irul ordonat rezultat din datele din tabelul 4.2, pentru rile din Europa
occidental, '
iX
O DD054 O 34
"ariana i deviaia standard
,ei at"t amplitudinea c"t i amplitudinea interXuartilic msoar mprtierea, nici una dintre aceste
msuri nu ia n considerare modul n care observaiile sunt distribuite sau grupate. Cele dou msuri ale
variaiei care iau n considerare modul de distribuie al observaiilor sunt variana &numit i dispersie+ i
deviaia. 'ceste msuri apreciaz cum fluctueaz valorile n %urul mediei. "ariana unui eantion ar putea fi
astfel considerat ca media ptratelor diferenei dintre fiecare observaie i medie.
'stfel, pentru un eantion care conine n observaii, notate #
2
, #
3,...,
#
n
, variana eantionului este/
[ ] + 2 P& + & ... + & + &
3 3
3
3
2
3
+ + + = n X X X X X X S
n
Sau
2
+ &
2
3
3

=
n
X X
n
i
i
S
Cea mai practic i cea mai utilizat msur a variaiei este deviaia standard. 'ceast msur
reprezint radical din varian/
2
+ &
2
3

=
n
X X
n
i
i
S
Continu"nd eemplul cu datele din tabelul 4.2. pentru rile din Europa occidental, n tabelul 4.3.
sunt prezentai paii necesari calculrii varianei i deviaiei standard. 'stfel, variana este
S
3
O 3542,34P&2402+ O 3:3,D
1ar deviaia standard
34 , 25 D , 3:3 = = S

Aabelul 4.3.
3:
Uara
#
i X
+ & X X
i

3
+ & X X
i

'ustria D: NN,N4 5,58 29,9E
<elgia 58 NN,N4 0E,N4 83,8D
,anemarca 88 NN,N4 32,58 5D:,9D
Elveia D: NN,N4 5,58 29,9E
>rana D5 NN,N4 E,58 82,85
1rlanda 52 NN,N4 025,N4 322,23
1talia 55 NN,N4 022,N4 243,95
6area <ritanie D: NN,N4 5,58 29,9E
;orvegia DE NN,N4 23,58 2NN,N2
Flanda 53 NN,N4 024,N4 2E4,:D
(ortugalia N2 NN,N4 05,N4 3:,N3
Spania 42 NN,N4 035,N4 D:2,83
Suedia 88 NN,N4 32,58 5D:,9D
Aotal :,:: 3542,34
Calcul"nd S
3
i S, diferenele dintre fiecare observaie i valoarea medie au fost ridicate la ptrat. ,e
aceea, niciodat variana i deviaia standard nu pot fi negative. Singura situaie n care S
3
i S sunt zero este
atunci c"nd nu eist nici un fel de variaie n interiorul setului de date.
,atele numerice sunt n mod inerent variabile, nu constante, fiecare
variabil care este studiat lu"nd mai multe valori. Aocmai datorit
acestei variabiliti, pentru a sumariza un set de date este important de
precizat nu doar msurile tendinei centrale, ci i msurile care reflect
modul n care datele sunt dispersate. ,eviaia standard este folositoare
la nelegerea modului n care un set de date este grupat n %urul mediei.
(entru cele mai multe seturi de date, ma%oritatea observaiilor sunt n
intervalul plus B minus o deviaie standard fa de medie.
n cazul eemplului cu anga%area n munc a femeilor din Europa
occidental, media era NN,N4, iar deviaia standard 25,34. ,eci
ma%oritea cazurilor se vor gsi n intervalul NN,N4 B 25,34 O 52,4 i
NN,N4 V 25,34 O D9,8D. Verific"nd acest lucru pe irul ordonat al
datelor, se observ ca 2: din 24 cazuri sunt cuprinse n acest interval.
7oeficientul de variaie
32
7alcularea lui S
#
i S
2. Se calculeaz
diferenele dintre
fiecare observaie i
medie
3. Se ridic la ptrat
fiecare diferen
4. Se adun diferenele
ridicate la ptrat
5. !ezultatul se
mparte la n02
(entru a calcula S se
etrage rdcina
ptrat din S
3
8nele%erea dispersiei
2. cu c"t datele sunt mai mprtiate,
cu at"t mai mare vor fi
amplitudinea, amplitudinea
interXuartilic, variana i deviaia
standard.
3. cu c"t datele sunt mai concentrate i
mai omogene, cu at"t mai mici vor
fi amplitudinea, amplitudinea
interXuartilic, variana i deviaia
standard.
4. dac datele sunt aceleai &adic nu
eist nici un fel de variaie+,
amplitudinea, amplitudinea
interXuartilic, variana i deviaia
standard vor fi nule.
5. pentru un set obinuit de date nici
una dintre msurile variaiei
&amplitudinea, amplitudinea
interXuartilic, variana i deviaia
standard+ nu pot fi vreodat nule.
Spre deosebire de msurile anterioare ale variaiei, coeficientul de variaie este o msur relativ a
acesteia. El este eprimat n procente i nu ntr0o anumit unitate de msur. Coeficientul de variaie se
calculeaz pein mprirea deviaiei standard la media aritmetic i nmulind totul cu 2::.
CV O
R 2::
X
S
Coeficientul de variaie este folositor c"nd se compar dou sau mai multe seturi de date, i n special
c"nd aceste date sunt msurate n uniti de msur diferite.
9orma
F a treia proprietate important a unui set de date o reprezint forma, adic modul n care sunt
distribuite datele. F distribuie poate fi simetric sau asimetric. Cele asimetrice se mai numesc i nclinate.
(entru a descrie forma se poate compara media cu mediana. ,aca aceste dou msuri sunt egale,
atunci distribuia este considerat simetric. ,ac media este mai mare dec"t mediana, distribuia este
conisderat pozitiv sau nclinat spre dreapta. ,ac mediana este mai mare dec"t media, atunci distribuia
este conisderat negativ sau nclinat spre st:n%a.
>ig. 4.4. ,istribuie nclinat spre st"nga
>ig. 4.5. ,istribuie nclinat spre dreapta
33
6edia Y 6ediana
6edia Z 6ediana
>ig. 4.N. ,istribuie simetric
,.#. &!inerea unui rezumat descriptiv al unei populaii
n seciunea anterioar au fost prezentate proprietile tendinei centrale, variaiei i formei pentru un
eantion. S presupunem c datele nu reprezint un eantion, ci o ntreag populaie. n acest caz nu mai
discutm despre date statistice ci despre parametrii ai tendinei centrale, variaiei i formei. Ele se calculeaz
dup formule similare celor pentru eantioane, dar se noteaz diferit.
Media populaiei se calculeaz prin mprirea sumei tuturor valorilor din populaie la mrimea
populaiei, N.
N N
X X X X
n
i
i
n
X

=
=
+ + + +
=
2 4 3 2
...

"ariana populaiei se calculez prin nsumarea ptratului diferenei dintre fiecare valoare i media
aritmetic a valorilor populaiei, urmat de mprirea acestei sume la mrimea populaiei.
N
X
n
i
i
=

=
2
3
3
+ &

Deviaia standard a populaiei este rdcina ptrat din variana popuaiei/


N
X
n
i
i
=

=
2
3
+ &

Arebuie notat faptul c formulele pentru variana populaiei i pentru deviaia standard a populaiei
difer de cele pentru eantion prin faptul c, n cazul populaiei, numitorul este N i nu n-1.
;e%ula empiric
n cele mai multe seturi de date, o mare parte a datelor tinde s se concentreze n %urul medianei. n
seturile de date nclinate spre dreapta, aceast grupare apare la st"nga medianei &valori mai mici dec"t
mediana+, iar n seturile de date nclinate spre st"nga, observaiile se grupeaz la dreapta medianei &valori
mai mari dec"t aceasta+. n seturile de date care sunt simetrice, n care mediana a este egal cu media,
34
6edia O 6ediana
observaiile tind s fie distribuite n mod egal n %urul msurilor tendinei centrale. 'tunci c"nd ntr0un set de
date nu este vizibil o nclinaie puternic, se poate utiliza regula empiric pentru a eamina variabilitatea
datelor i pentru a avea nelegere mai bun a ceea ce msoar deviaia standard.
;e%ula empiric afirm c pentru o distribuie simetric, n form de clopot, aproimativ dou
treimi din toate observaiile &D8R+ sunt concentrate la o distan de [ o deviaie standard fa de medie, iar
aproimativ 9NR dintre observaii sunt concentrate n intervalul de [ dou deviaii standard fa de medie.
'stfel, deviaia standard, ca o msur a variaiei medii n %urul mediei, a%ut la nelegerea modulului
n care sunt distribuite observaiile deasupra i dedesubtul mediei, permi"nd concetrarea asupra valorilor
anormale, ecentrice, atunci c"nd este analizat un set de date numerice.
,.,. 7oeficientul de corelaie
7oeficientul de corelaie. \, msoar puterea unei relaii sau a unei asocieri ntre dou variabile ale
unei populaii. Valorile acestuia pot varia de la B2, pentru o corelaie negativ perfect, la V2, pentru o
corelaie pozitiv perfect. n acest caz, perfect nseamn c tote punctele de pe o diagram care reprezint
cele dou variabile ar putea fi unite de o linie dreapt. 'stfel, coeficientul de corelaie msoar gradul de
asociere liniar ntre dou variabile. Semnul pozitiv al coeficientului de corelaie arat c valorile variabilei
# cresc n acelai timp cu cele ale variabilei ], iar semnul negativ arat c valorile mari ale variabilei # sunt
asociate cu valori mici ale variabilei ]. 'tunci c"nd coeficientul de corelaie este apropiat de zero, se poate
considera c nu eist nici un fel de corelaie ntre cele dou variabile. >igura 4.D. ilustreaz trei tipuri de
asociere ntre variabile.
9i%. ,./. Corelaie perfect negativ &\ O 02+ Corelaie perfect pozitiv &\ O 2+
35
;ici un fel de corelaie
1n cazuri reale, este foarte puin probabil s eiste corelaii perfecte de un anumit fel. n figura 4.8.
sunt prezentate o corelaie pozitiv puternic &\ O :,8N+ i o corelaie negativ puternic &\ O 0:,8N+.

9i%. ,.1
n ambele situaii, relaiile sunt descrise ca tendine i nu ca relaie cauz efect. ,oar corelaia nu
poate s dovedeasc eistena unei relaii de cauzalitate, c o modificarea unei variabile provoac
modificarea celeilalte variabile. F corelaie puternic se poate produce doar datorit nt"mplrii, datorit
nelurii n considerare a ueni a treia variabile sau datorit relaiei cauz B efect. Este necesar o analiz
suplimentar pentru a determina care dintre cele trei situaii a provocat corelaia.
Coeficientul de corelaie pentru un eantion se calculeaz dup urmtoarea formul/

= =
=


=
n
i
i
n
i
i
n
i
i i
Y Y X X
Y Y X X
r
2
3
2
3
2
+ & + &
+ +& &
3N
E$erciii
2. 6anagerul unei firme de curierat trebuie s cumpere un set de camioane. 'tunci c"nd [Link] sunt
puse n camioane pentru livrare, eist dou constr"ngeri ma%ore/ greutatea i volumul fiecrui item. ,ac
ntr0un eantion de 3:: de [Link], greutatea medie este de 3D 7g cu o deviaie standard de 4,9 7g, iar
volumul mediu este de E,E litri, cu o deviaie standard de 3,3 litri, cum poate fi comparat variaia greutii i
a volumuluiQ
3. >ie urmtorul set de date dintr0un eantion de mrimea n O N elemente/ 8, 5, 9, E, 3.
a. Calculai media, mediana i modul.
b. Calculai amplitudinea, amplitudinea interXuartilic, variana, deviaia standard i coeficientul de
variaie.
c. ,escriei forma datelor.
4. >ie urmtorul set de date dintr0un eantion de mrimea n O D elemente/ 8, 5, 9, 8, 4, 23.
a. Calculai media, mediana i modul.
b. Calculai amplitudinea, amplitudinea interXuartilic, variana, deviaia standard i coeficientul de
variaia.
c. ,escriei forma datelor.
5. >ie urmtoarele dou seturi de date, fiecare form"nd un eantion de 8 elemente/
Setul 2/ 2:, 3, 4, 3, 5, 3, N
Setul 3/ 3:, 23, 24, 23, 25, 23, 2N
a. (entru fiecare set de date calculai media, mediana i modul
b. Comparai rezultatele.
c. (entru fiecare set de date calculai amplitudinea, amplitudinea interXuartilic, variana, deviaia
standard i coeficientul de variaie.
d. ,escriei forma fiecrui set de date.
e. Comparai rezultatele de la punctele c i d.
N. $rmtorul set de date reprezint informaii despre o populaie cu N O 2:/ 8, N, 22, E, 4, D, 3, 2, 9, E
a. Calculai media populaiei
b. Calculai deviaia standard a populaiei
D. $rmtorul set de date reprezint informaii despre o populaie cu N O 2:/ 8, N, D, D, D, 5, E, D, 9, 4
a. Calculai media populaiei
b. Calculai deviaia standard a populaiei
8. $rmtoarele date reprezint informaii de la un eantion cu n O 22 elemente/
3D
# 8 N E 4 D 2: 23 5 9 2N 2E
] 32 2N 35 9 2E 4: 4D 23 38 5N N5
a. Calculai coeficientul de corelaie
b. C"t de puternic este relaia dintre # i ]Q Eplicai.
38
6. Pro!a!ilitatea i distri!uia pro!a!ilitii
6.1. 7oncepte fundamentale n pro!a!ilitate
Pro!a!ilitatea reprezint ansa ca un anumit eveniment s se produc. (robabilitatea poate s se
refere la ansa de a nimeri o anumit culoare c"nd se alege o carte dintr0un [Link] de cri de %oc, la ansa ca
un anumit individ s aleag un candidat n dauna altuia, ori la ansa ca un nou produs s aib succes pe pia.
n oricare dintre aceste eemple, probabilitatea reprezint o proporie sau o fracie i ia valori ntre : i 2.
Evenimentul care este imposibil s apar are probabilitatea :, iar cel care apare cu certitudine are
probabilitatea 2.
Pro!a!ilitatea de apariie < =>, unde # O numrul de cazuri n care evenimentul poate s apar,
iar A O numrul total de rezultate.
Elemente de voca!ular
Elementele de baz ale teoriei probabilitii sunt rezultatele procesului sau fenomenului studiat. n
limba%ul statisticii, un e$periment reprezint un proces al crui rezultat este imprecis. Spaiul de
pro!a!ilitate &S+ reprezint toate rezultatele posibile ale unui eperiment. >iecare rezultat posibil este numit
eveniment. ,ac evenimentul poate fi descris n funcie de o singur caracteristic, atunci el este un
eveniment simplu. ,ac un eveniment are dou sau mai multe caracteristici, atunci el se numete
eveniment reunit. 7omplementul unui eveniment ', notat 'C, include toate evenimentele din spaiul S
care nu sunt parte a evenimentului '.
Pro!a!ilitatea &(+ sau pro!a!ilitatea simpl este un numr real din intervalul ^:,2_, corespunztor
unui unui subset de rezultate din spaiul de probabilitate.
Eemplu/ s presupunem c aruncarea unui zar reprezint eperimentul. Spaiul de probabilitate, n
acest caz este S O K2,3,4,5,N,DM.
Evenimentul ' este reprezentat de cazurile n care rezultatul aruncrilor sunt numere impare, ' O
K2,4,NM, iar evenimentul < este reprezentat de cazurile n care rezultatul aruncrilor este mai mic dec"t 4, <
O K2,3M.
(resupun"nd c ansele de apariie a oricrei faete a zaruli sunt aceleai, (&2+ O 2PD, atunci
probabilitatea de apariie a evenimentului ' este (&'+ O 4PD O :,N, iar probabilitatea de apariie a
evenimentului < este (&<+ O 3PD O :,44
,ac probabilitatea simpl se refer la apariia unor evenimente simple, pro!a!ilitatea reunit se
refer la situaii care implic dou sau mai multe evenimente, reprezent"nd intersecia evenimentelor.
Eemplu/ (entru cazul anterior, evenimentul reunit &' i <+ O K2 M, iar (&' i <+ O 2PD O :,2D
3E
;e%uli ale pro!a!ilitii
2. : ` (&'+ ` 2, pentru orice ' n S
(robabilitatea oricrui eveniment ' ntr0un spaiu de probabilitate S este cuprins ntre :i 2.
3. (&spaiu de probabilitate vid+ O :, pentru orice S
(robabilitatea unui eveniment care nu are nici un element este nul.
4. ,ac ' i 'C sunt evenimente complementare n spaiul S, atunci ( &'C+ O 2 B (&'+
Eemplu/ ,ac eperimentul const n aruncarea unui zar, i evenimentul ' O K2,4,NM, atunci
complementarul su este 'C O K3,5,DM.
( &'C+ O 4PD O :,N
2 B (&'+ O 20 4PD O :,N
n cazul aceluiai eperiment, dac < O K2,3M, atunci complementarul su este <C O K4,5,N,DM.
( &<C+ O 2 B (&<+ O 2 B 3PD O :,D8
5. ,ac ' i < sunt evenimente din spaiul S, iar ' este un subset al lui <, atunci (&'+ ` (&<+
Eemplu/ ,ac eperimentul const n aruncarea unui zar, i evenimentul < reprezint elementele mai
mari sau egale cu 4, < O K4,5,N,DM, iar ' reprezint elementele mai mari sau egale cu N, ' O KN,DM, atunci
' este un subset a lui <, iar (&<+ O 5PD O :,D8 i (&'+ O 3PD O :,44, ceea ce verific regula.
F diagram Venn a eemplului anterior este prezentat n figura 5.2.
9i%. 6.1
N. !egula de nsumare/ probabilitatea lui ' sau < este egal cu probabilitatea evenimentului ' plus
probabilitatea evenimentului < minus probabilitatea lui ' i </
( &' sau <+ O (&'+ V (&<+ B (&' i <+
Eemplu/ ,ac eperimentul const n aruncarea unui zar, i evenimentul ' reprezint obinerea lui 4
sau 5, iar evenimentul < reprezint obinerea lui 2, 3 sau 4, atunci (&'+ O 3PD O :,44, iar (&<+ O 4PD O
:,N.
,iagrama Venn a acestui spaiu de probabiliti este prezentat n figura 5.3.
39
S
2,3
<
4,5
'
N,D
9i%. 6.#
' sau < reprezint reunirea celor dou evenimente/ ' $ < O K2,3,4,5M, ( &' $ <+ O 5PD O :,D8
' i < reprezint intersecia celor dou evenimente/ ' a < O K4M, (&' a <+ O 2PD O :,2D
n aceast situaie, aplic"nd regula de nsumare se obine/ ( &' $ <+ O 3PD V 4PD B 2PD O 5PD O :,D8
6.#. Pro!a!ilitate condiional
>iecare dintre situaiile de p"n acum au implicat probabilitatea unui eveniment particular atunci
c"nd acesta este selectat dintr0un c"mp de probabilitate. ,ar cum ar putea fi determinat probabilitatea dac
anumite informaii despre evenimentele petrecute ar fi de%a cunoscuteQ
'tunci c"nd se calculeaz probabilitatea unui anumit eveniment ', dat fiind informaia despre
apariia unui alt eveniment <, aceast probabilitate se numete pro!a!ilitate condiional i se noteaz
(&'b<+.
(robabilitatea lui ' dat fiind < este egal cu probabilitatea evenimentului ' i < mprit la
probabilitatea evenimentului <.
(&'b<+ O (&' i <+P(&<+
(robabilitatea lui < dat fiind ' este egal cu probabilitatea evenimentului ' i < mprit la
probabilitatea evenimentului '.
(&<b'+ O (&' i <+P(&'+
Eemplu/ S presupunem c avem urmtorul tabel care prezint rezultatele unui sonda% efectuat n
[Link] de gospodrii cu privire la cumprarea unui televizor nou.
a!elul 6.1
'u cumprat
1ntenioneaz s cumpere ,a ;u Aotal
,a 3:: N: 3N:
;u 2:: DN: 8N:
Aotal 4:: 8:: [Link]
4:
ntrebarea la care se dorete rspuns este urmtoarea/ care este probabilitatea ca ntr0o gospodrie s
se cumpere un televizor nouQ n acest caz, scopul este de a calcula (&au cumpratbintenioneaz s
cumpere+. 'stfel, spaiul de probabilitate nu mai este ntregul eantion de [Link] de gospodrii, ci doar
gospodriile n care se intenioneaz s se cumpere un televizor, adic 3N:. ,in cele 3N: de astfel de
gospodrii, doar n 3:: s0au cumprat televizoare. 'stfel, probabilitatea ca ntr0o gospodrie s se cumpere
un televizor dat fiind inteniile de cumprare este/
(&au cumpratbintenioneaz s cumpere+ O (&au cumprat i intenioneaz s cumpere+P (&intenioneaz s
cumpere+
(&au cumpratbintenioneaz s cumpere+ O &3::P[Link]+P&3N:P[Link]+ O 3::P3N: O :,E
Independena statistic
n eemplul anterior, probabilitatea ca ntr0o gospodrie s se cumpere un televizor dat fiind
inteniile de cumprare este de 3::P3N: O :,E. (robabilitatea simpl ca ntr0o gospodrie s se cumpere un
televizor este doar de 4::P[Link] O :,4. 'ceste rezultate ofer informaii importante. Cunoaterea prealabil a
inteniei de cumprare a afectat probabilitatea ca ntr0o gospodrie [Link] s se cumpere un televizor.
!ezultatul este condiionat de o informaie prealabil. 'tunci c"nd rezultatul unui eveniment nu afecteaz
probabilitatea apariiei altui eveniment, se spune despre cele dou evenimente c sunt independente din
punct de vedere statistic.
,ou evenimente ' i < sunt statistic independente dac i numai dac (&'b<+ O (&'+.
Eemplu/ S presupunem c avem urmtorul tabel care prezint rezultatele unui sonda% efectuat n
4:: de gospodrii cu privire la cumprarea unui televizor cu ecran normal sau cu ecran plat i dac sunt
mulumii de ceea ce au cumprat.
a!elul 6.#
Satisfcui de [Link]
Aipul de televizor ,a ;u Aotal
Cu ecran normal D5 2D E:
Cu ecran plat 28D 55 33:
Aotal 35: D: 4::
Arebuie s se determine dac a fi satisfcut de [Link] i tipul de televizor [Link] sunt
independente din punct de vedere statistic.
(&satisfaciebecran normal+ O (&satisfacie i ecran normal+P(&ecran normal+ O &D5P4::+P&E:P4::+ O D5PE: O
:.E, care este egal cu
(&satisfacie+ O 35:P4:: O :,E
42
,e aici rezult c relaia privind independena evenimentelor este satisfcut/ cunoaterea unui
eveniment nu afecteaz probabilitatea celuilalt eveniment.
;e%ula de multiplicare
>ormula probabilitii condiionale poate fi tranformat algebric, asfel nc"t probabilitatea reunit
(&' i <+ s fie determinat funcie de probabilitatea condiional.
(&' i <+ O (&'b<+(&<+
,eci re%ula de multiplicare afirm c probabilitatea lui ' i < este egal cu probabilitatea lui ' dat
fiind < nmulit cu probabilitea lui <.
Eemplu/ -tim c E: de familii au cumprat un televizor cu ecran normal. ,in tabelul 5.3 se poate
observa c D5 sunt satisfcui iar 2D nu. S presupunem c sunt alei, n mod aleatoriu, doi clieni dintre cei
E:. Care este probabilitatea ca am"ndoi s fie satisfcui de [Link]
n acest caz se poate utiliza regula de multiplicare. ,ac ' O al doilea cumprtor este satisfcut, iar
< O primul cumprtor este satisfcut, atunci/
(&' i <+ O (&'b<+(&<+
(robabilitatea ca primul cumprtor s fie satisfcut de [Link] este de D5PE:. (robabilitatea ca al
doilea cumprtor s fie satisfcut depinde de rezultatul primei selecii. ,ac primul cumprtor nu este pus
la loc n eantion &eantionare fr nlocuire+, atunci numrul cumprtorilor rmai este de 89. n acest caz,
probabilitatea ca i al doilea cumprtor s fie satisfcut este de D4P89. 'tunci,
(&' i <+ O &D4P89+&D5PE:+ O :,D4E
n cazul n care dup etragerea primului cumprtor, acesta este introdus la loc n eantion
&eantionare cu nlocuire+ probabilitatea celui de0al doilea cumprtor de a fi satisfcut este egal cu cea a
primului. ,e aceea,
(&' i <+ O &D5PE:+&D5PE:+ O :,D5
Eemplul anterior demonstreaz c a doua etragere este independent de prima, deoarece a doua
probabilitate nu este influenat de prima. ,e aceea, nlocuind (&'b<+ cu (&'+, obinem re%ula de
multiplicare pentru evenimente independente/ dac ' i < sunt independente din punct de vedere
statistic, probabilitatea evenimentului ' i < este egal cu produsul dintre probabilitatea lui ' i
probabilitatea lui <.
(&' i <+ O (&'+(&<+
!ezult de aici c sunt dou modaliti de determinare a independenei statistice/
2. Evenimentele ' i < sunt independente dac i numai dac (&'b<+ O (&'+.
3. Evenimentele ' i < sunt independente dac i numai dac (&' i <+ O (&'+(&<+.
43
6.,. Distri!uia de pro!a!ilitate pentru o varia!il aleatoare discret
'a dup cum s0a discutat n capitolul 2, o variabil numeric este aceea pentru care rspunsurile
sunt eprimate prin cifre. Variabilele numerice pot fi discrete sau continue, primele rezult"nd dintr0un
proces de numrare, iar celelate dintr0un proces de msurare.
Distri!uia de pro!a!ilitate pentru o varia!il aleatoare discret este o list [Link] a tuturor
rezultatelor numerice posibile ale acelei variabile, construit astfel nc"t fiecrui rezultat i este asociat
proabilitatea de apariie.
,e eemplu, s considerm numrul de cereri aprobate sptm"nal de ctre rectorul unei universiti,
aa cum sunt prezentate n tabelul 5.4. ,eoarece toate rezultatele posibile sunt incluse n tabel, lista este
[Link], iar suma probabilitilor este 2.
a!elul 6.,.
;umr de cereri aprobate sptm"nal (robabilitatea
: :,2:
2 :,2:
3 :,3:
4 :,4:
5 :,2N
N :,2:
D :,:N
"aloarea ateptat a unei varia!ile discrete ?@A reprezint media ponderat a tuturor rezultatelor
posibile, ponderea fiind probabilitaea rezultatului respectiv. 'ceast medie ponderat se obine prin
nmulirea fiecrui rezultat posibil # cu probabilitatea corespunztoare (&#+, urmat de nsumarea
rezultatelor.

=
= =
N
i
i i
X X X !
2
+ & + &
(entru distribuia de probabilitate a numrului de cereri aprobate sptm"nal, valoarea ateptat este
calculat dup formula anterioar/
T O &:+&:,2+ V &2+&:,2+ V&3+&:,3+ V&4+&:,4+ V&5+&:,2N+ V&N+&:,2+ V&D+&:,:N+ O
O : V :,2 V :,5 V :,9 V :,D V :,N V :,4 O 3,E
Arebuie notat faptul c valoarea ateptat a numrului de cereri aprobate, 3,E, nu are neaprat sens,
pentru c numrul de cereri aprobate trebuie s fie unul ntreg. Valoarea ateptat reprezint o medie.
"ariana unei varia!ile aleatoare discrete ?B
#
A reprezint media ponderat a ptratului diferenelor
dintre fiecare rezultat posibil i medie, ponderea find reprezentat de probabilitatea respectivului rezultat.
44

=
=
N
i
i i
X X ! X
2
3 3
+ & +_ & ^
Deviaia standard a unei varia!ile aleatoare discrete ?BA este obinut prin etragerea radicalului
din varian.

=
=
N
i
i i
X X ! X
2
3
+ & +_ & ^
Variana i deviaia standard pentru cererile aprobate pe sptm"n se calculeaz astfel/
c
3
O &: B 3,E+
3
&:,2+ V &2 B 3,E+
3
&:,2+ V & 3 B 3,E+
3
&:,3+ V &4 B 3,E+
3
&:,4+ V &5 B 3,E+
3
&:,2N+ V
&N B 3,E+
3
&:,2+ V &D B 3,E+
3
&:,:N+ O :,8E5 V :,435 V :,23E V :,:23 V :,39D V :,5E5 V :,N23 O 3,5D
c O 2,N8
6.6. Distri!uia !inomial
'tunci c"nd eist o epresie matematic pentru o variabila aleatorie, poate fi calculat probabilitatea de
apariie a unui anumit rezultat. n astfel de cazuri ntreaga distribuie de probabilitate poate fi calculat i
prezentat. ,e eemplu, funcia de distribuie a probabilitii de selecie a unui numr dintr0un tabel cu
numere aleatoare este uniform. (rincipala caracteristic a unei distribuii uniforme este c orice rezultat al
unei variabile aleatorii are aceeai ans de apariie. 'stfel, probabilitatea etragerii unui numr de o cifr
este aceeai B 2P2: B deoarece sunt posibile 2: rezultate. 'u fost dezvoltate mai multe modele de distribuii a
diverse variabile care apar n tiinele sociale, n tiinele naturale sau n administrarea afacerilor. $nul dintre
cele mai utilizate modele este reprezentat de distribuia binomial.
Proprietile distri!uiei !inomialeC
2. Eantionul const ntr0un anumit numr de observaii, n.
3. >iecare observaie poate fi clasificat doar n dou categorii, care sunt mutual eclusive i colectiv
[Link], care n general sunt numite succes i eec.
4. (robabilitatea ca o observaie s fie clasificat ca succes, p, este constant de la o observaie la alta. Ga
fel, probabilitatea ca o observaie s fie clasificat ca eec, 2 B p, este constant pentru toate observaiile.
5. !ezultatul &succes sau eec+ uneiobservaii este independent de rezultatul oricrei alte observaii.
9ormula distri!uiei !inomiale/
X n X n
X
p p C X

= + 2 & + &
$nde/
0 C
#
n
reprezint combinaii de n luate c"te #/
+d & d
d
X n X
n
C
n
X

=
0 n reprezint mrimea eantionului, iar nd &numit n factorial+ este produsul n&n02+&n03+....2
45
0 p reprezint probabilitatea de succes a fiecrei ncercri
0 20p reprezint probabilitatea de eec a fiecrei ncercri
0 # reprezint numrul de succese din eantion
'tunci,
X n X
p p
X n X
n
X

= + 2 &
+d & d
d
+ &

7aracateristicile unei distri!uii !inomiale
,e fiecare dat c"nd un set de parametrii &n i p+ este specificat, se genereaz o anumit distribuie
binomial.
9orma. F distribuie binomial poate fi simetric sau nclinat. 'tunci c"nd p O :,N, distribuia
binomial va fi simetric, indiferent de valoarea lui n. 'tunci c"nd p e :,N, distribuia va fi nclinat. Cu c"t
p este mai apropiat de :,N i cu c"t este mai mare numrul de observaii n, cu at"t mai puin nclinat va fi
distribuia.
Media unei distribuii binomiale se obine prin nmulirea celor doi parametrii, n i p.
T O E&#+ O np
Deviaia standard a unei distri!uii !inomiale se calculeaz dup formula/
+ 2 &
3
p np = =
Eemplu/
,ac eperimentul const n aruncarea o singur dat a unei monede i suntem interesai de obinerea
stemei, atunci, aplic"nd formula distribuiei binomiale (&#O2+ O :,N
2
&20:,N+
202
2dP^2d&202+d_
O :,N&2+&2+ O :,N
,istribuia binomial poate fi scris sub forma urmtorului tabel
# (&#+ !ezultat
: :,N ban
2 :,N stem
,ac eperimentul const n aruncarea de dou ori a unei monede i suntem interesai de obinerea
unei steme, atunci (&#O2+ O :,N
2
&20:,N+
302
2dP^2d&302+d_ O :,N&:,N+3&2+P2 O :,3N&3+ O :,N
,istribuia binomial poate fi scris sub forma urmtorului tabel
# (&#+ !ezultat
: :,3N ban, ban
2 :,N: ban, stem
3 :,3N stem, stem
,eci sunt N:R anse ca din 3 aruncri ale unei monede s obinem o stem.
Care este probabilitatea ca din 23 aruncri ale unei monede s se obin de N ori stemQ
4N
n aceast situaie sunt 893 de posibiliti de a obine N steme din 23 aruncri &combinaii de 23 luate
c"te N+
'stfel/ n O 23, # O N, p O :,N
(&# O N+ O ^&23f22f2:f9fEf8fDfNf5f4f3f2+P&Nf5f4f3f2+&8fDfNf5f4f3f2+_:,N
N
&2 B :,N+
8
O
O 893f:,:423Nf:,::8E235 O :,2944N
,eci probabilitatea de a obtine N steme din 23 aruncri ale unei monede este de aproimativ 29R.
,ac vom ncerca s construim o distribuie a probabilitii pentru 23 aruncri ale monedei vom obine/
# (&#+ !ezultat
: :,:::35 de 23 ori ban
2 :,::393 o dat stem, de 22 ori ban
3 :,:2D22 de 3 ori stem de, de 2: ori ban
4 ... de 4 ori stem de, de 9 ori ban
5 ... de 5 ori stem de, de E ori ban
N :,2944N de N ori stem de, de 8 ori ban
D :,33NNE de D ori stem de, de D ori ban
8 :,2944N de 8 ori stem de, de N ori ban
E ... de E ori stem de, de 5 ori ban
9 ... de 9 ori stem de, de 4 ori ban
2: :,:2D22 de 2: ori stem de, de 3 ori ban
22 :,::393 de 22 ori stem de, o dat ban
23 :,:::35 de 23 ori stem
Care este probabilitatea de a obine cel puin 2: stemeQ
(&#g2:+ O (&#O2:+ V (&#O22+ V (&#O23+ O :,:2D V :,::39 V :,:::3 O :,:29
'dic sunt 2,9R anse ca din 23 aruncri s obinem cel puin 2: steme.
6edia unui eperiment care const n aruncarea unei monede de 23 ori este/
T O np O :,N&23+ O D
,eviaia standard este/
84 , 2 4 + N , : 2 & N , : 23 + 2 & = = = = p np

Cum se interpreteaz aceste rezultateQ ,ac se repet eperimentul de foarte multe ori, cea mai
probabil medie, adic cel mai probabil rezultat dup 23 aruncri ale monedei este de D ori stem i de D ori
ban. Conform regulii empirice, sunt DER anse ca rezultatul s se afle n intervalul medie [ deviaia
standard, adic D [ 2,84. nseman este o probabilitate de DER ca dup 23 aruncri ale monedei s obinem
N, D sau 8 steme, care sunt valorile cuprinse ntre 5,38 i 8,84.
E$erciii
2. Se d urmtorul tabel/
4D
< <C Aotal
' 2: 3: 4:
'C 3: 5: D:
Aotal 4: D: 9:
Care este probabilitatea/
a. Evenimentului '
b. Evenimentului <
c. Evenimentului 'C
d. Evenimentului ' i <
e. Evenimentului ' i <C
f. Evenimentului 'C i <C
g. Evenimentului ' sau <
.. Evenimentului ' sau <C
i. Evenimentului 'C sau <C
3. n ultimii ani, bncile au fcut eforturi deosebite pentru ca studenii s i [Link] conturi. S
presupunem c am etras un eantion de 3:: de studeni care posed un card de credit obinuit iPsau un card
de credit pentru cltorii/
Card de credit pentru cltorii
Card de credit obinuit ,a ;u Aotal
,a D: D: 23:
;u 2N DN E:
Aotal 8N 23N 3::
a. ,ai un eemplu de eveniment simplu
b. ,ai un eemplu de eveniment reunit
c. Care este complementul evenimentului de a avea un card de credit obinuitQ
d. ,e ce H a avea un card de credit obinuit i un card de credit pentru cltoriiI este eveniment reunitQ
e. Construi i diagrama Venn asociat tabelului.
,ac este selectat la nt"mplare un student, care este probabilitatea ca/
f. studentul s aib un card de creditQ
g. studentul s aib un card de credit pentru cltoriiQ
.. studentul s aib un card de credit i un card de credit pentru cltoriiQ
i. studentul sa nu aib nici card de credit i nici card de credit pentru cltoriiQ
%. studentul s aib un card de credit sau un card de credit pentru cltoriiQ
7. studentul s nu aib un card de credit sau s aib un card de credit pentru cltoriiQ
4. Se da urmatorul tabel/
48
< <C
' 2: 4:
'C 3N 4N
a. Care este probabilitatea lui ' dat fiind <Q
b. Care este probabilitatea lui ' dat fiind <CQ
c. Care este probabilitatea lui 'C dat fiind <CQ
d. ' si < sunt independente din punct de vedere statisticQ
5. ,at fiind tabelul de la problema 3,
a. (resupun"nd c se cunoate faptul ca un student are un card de credit, care este probabilitatea ca el s
aib un card de credit pentru cltoriiQ
b. (resupun"nd c se cunoate faptul ca un student nu are un card de credit pentru cltorii, care este
probabilitatea ca el s aiba un card de creditQ
c. Cele doua evenimente, a avea un card de credit i a avea un card de credit pentru cltorii, sunt
independente din punct de vedere statisticQ Eplicai.
N. S presupunem c avem un [Link] de cri de %oc. n interiorul su sunt patru suite &pic, trefl, cup i
caro+, fiecare av"nd 24 valori &as, 3, 4, ..., regin, pop+. 'cest [Link] de cri de %oc este amestecat, iar
dumneavoastr primii primele dou cri, fr nlocuire.
a. Care este probabilitatea ca ambele cri s fie regineQ
b. Care este probabilitatea ca prima carte s fie un 2: i a doua carte s fie un N sau un DQ
c. ,ac etragerea ar avea loc cu nlocuire, care ar fi rspunsul la punctul aQ
d. n %ocul numit <lac7%ac7, figurile &valet, dam, pop+ au c"te 2: puncte, asul are fie 2 fie 22 puncte,
iar celelalte cri au at"tea puncte c"te indic cifra de pe ele. !ealizezi un blac7%ac7 dac cele dou
cri pe care le ai totalizeaz 32 de puncte. Care este probabilitatea de a realiza un blac7%ac7 n
aceast problemQ
D. Aabelul urmtor prezint distribuia probabilitii accidentelor de circulaie dintr0un ora.
;umr zilnic de accidente (&#+
: :,2:
2 :,3:
3 :,5N
4 :,2N
5 :,:N
N :,:N
a. calculai media sau numrul ateptat de accidente dintr0o zi
b. calculai deviaia standard
4E
8. $n student trebuie s susin un eamen sub form de gril, n care la fiecare ntrebare trebuie s aleag
ntre patru rspunsuri posibile. (resupun"nd c nu are nici cea mai mic idee despre rspunsurile corecte, el
.otrte s [Link] aleator rspunsul de la fiecare ntrebare. Ga acel eamen eist cinci ntrebri.
a. care este probabilitatea ca toate cele cinci rspunsuri s fie corecteQ
b. care este probabilitatea de a obine cel puin patru rspunsuri corecteQ
c. care este probabilitatea ca nici unul dintre rspunsuri s nu fie corectQ
d. care este probabilitatea de a obine cel mult dou rspunsuri corecteQ
e. care este media i deviaia standard a acestui eperimentQ
f. presupun"nd c grila de eaminare conine 2: de ntrebri i trebuie N rspunsuri corecte pentru a
lua eamenul, care va fi probabilitatea de a trece eamenul urm"nd aceeai strategieQ
E. (entru cei care au magazine electronice, pe internet, s aib un vizitator pe site nu este suficient.
V"nztorii trebuie s0i persuadeze clienii online pentru ca acetia s cumpere. Eperii estimeaz c EER
dintre cumprtorii de pe internet abandoneaz tranzacia nainte de terminarea ei. Conisder"nd un eantion
de 3: de cumprtori care viziteaz un magazin electronic, iar probabilitatea ca unul dintre acetia s
abandoneze site0ul nainte de a cumpra ceva este de :,EE, utilizai modelul binomial pentru a rspunde la
urmtoarele ntrebri/
a. Care este valoarea ateptat sau media distribuiei binomialeQ
b. Care este deviaia standard a distribuiei binomialeQ
c. Care este probabilitatea ca toi cumprtorii s plece de site nainte de a finaliza tranzaciaQ
d. Care este posibilitatea ca cel puin 2E cumprtori s plece de pe site nainte de a finaliza
tranzaciaQ
e. Care este probabilitea ca cel puin 2N cumprtori s plece de pe site nainte de a finaliza
tranzaciaQ
f. ,ac site0ul este mbuntit i doar 8:R dintre clieni nu [Link] tranzacia, cum va modifica acest
lucru rspunsurile la ntrebrile a B eQ
49
D. Distri!uia normal i distri!uia eantioanelor
'cest capitol trateaz cea mai important distribuie din statistic, distribuia normal, care implic o
variabil continu. ,istribuia normal, numit uneori i distribuie gaussian, este una dintre multele
distribuii continue rezultate din procesul de msurare a variabilelor. histogramele datelor obinute de la un
eantion sunt de multe ori apropiate de forma unui clopot. n asemenea cazuri se spune c variabila este
aproimativ normal distribuit. (rincipalul motiv care face din aceast curb cea mai important distribuie
din statistic este faptul c cele mai multe metode ale inferenei statistice utilizeaz proprietile distribuiei
normale [Link] i atunci c"nd datele din eantion nu sunt distribuite sub form de clopot.
D.1. Distri!uia normal
'tunci c"nd eist o epresie matematic pentru a reprezenta o variabil continu, se poate calcula
probabilitatea ca anumite valori s apar n anumite intervale. Cu tote acestea, probabilitatea eact a unei
anumite valori dintr0o distribuie continu este zero.
Proprieti ale distri!uiei normaleC
2. 're o form simetric, de clopot.
3. Aoate msurile tendinei centrale &media, mediana i modul+ sunt egale ntre ele.
4. ,istana interXuartilic este cuprins ntre dou treimi de deviaie stanadard sub medie i dou treimi
de deviaie standard dincolo de medie.
5. Este asociat cu o variabil aleatoare care are o amplitudine infinit &0i Y # Y i+.
Epresia matematic a funciei de densitate a probabilitii este notat cu f&+ i este dat de
urmtoarea formul/

3
_ P + +^& 3 P 2 &
3
2
+ &



=
X
e X f
n care/ e O constanta matematic 3,82E3E
j O constanta matematic 4,252N9
T O media populaiei
c O deviaia standard a populaiei
# O orice valoare a variabilei continue, unde 0i Y # Y i
5:
,eoarece e i j sunt constante matematice, probabilitile asociate unei vatiabile aleatoare sunt
dependente doar de doi parametrii ai distribuiei normale/ media populaiei, T, i deviaia standard a
populaiei, c. ,e fiecare dat c"nd eist o anumit combinaie de T i c, va rezulta o distribuie normal
diferit, dup cum se poate observa n figura N.2. Curbele ', < i C au aceai medie, dar au deviaii standard
diferite. Curba , difer de celelelate at"t n privina mediei c"t i n cea a deviaiei standard.
9i%. D.1.
,in pcate, epresia matematic a distribuiei normale este greu de calculat. (entru a evita astfel de
calcule se pot folosi un set tabele care ofer probabilitile necesare. ,eoarece eist un numr infinit de
valori pentru combinaiile dintre T i c, ar fi necesar un numr infinit de astfel de tabele. ns, prin ceea ce se
numete standardizare, este necesar doar un singur tabel. (rin utilizarea formulei de transformare, orice
variabil aleatoare # este transformat ntr0o variabil normal standardizat k.
9ormula de transformare afirm c valoarea lui k este egal cu diferena dintre # i media
populaiei T mprit la deviaia statndard c.
k O &# 0 T+P c
,ei forma original a variabilei # avea media T i deviaia standard c, variabila standardizat k are
ntotdeauna media T O : i deviaia standard c O 2. 'stfel, orice set de date normal distribuite pot fi
convertite ntr0o form standardizat, iar orice probabilitate poate fi determinat dintr0un tabel al distribuiei
normale standardizate, ca cel din anea 2.
(entru a nelege modul de aplicare a formulei de transformare s considerm urmtorul eemplu/ o
firm de comer electronic, care este interesat de un acces c"t mai rapid la propriul site, a constatat c
do)nloadarea paginii sale de acces dureaz n medie 8 secunde, cu o deviaie standard de 3 secunde. ,in
figura N.3. se poate observa c fiecrui # de pe scala iniial i corespunde un k obinut prin formula de
transformare.
52
9i%. D.#.
'stfel, pentru un timp de do)nloadare de 9 secunde, [Link] standardizat este 2 &cu o deviaie
standard deasupra mediei+ deoarece k O &9 B 8+P 3 O 2. 1ar pentru un timp de do)nloadare de o secund &4
deviaii standard sub medie+ k O &2 08+P 3 O 04. 'stfel, deviaia standard a devenit unitatea de msur.
S presupunem acum c se dorete s se afle care este probabilitatea ca timpul de do)nloadare a site0
ului s fie mai mic de 9 secunde. (entru c 9 secunde se afl la o deviaie standard deasupra mediei, este
necesar s aflm valoarea k pentru care timpul de do)nloadare este mai mic de o deviaie standard. Aabelul
din anea 2 prezint probabilitile cumulative sau aria de sub aria de sub curba normal standardizat
calculat pentru un anumit k. (entru a utiliza acest tabel, k trebuie nregistrat cu dou zecimale. 'stfel,
pentru a determina probabilitatea sau aria de sub curb pentru k O V2,::, trebuie cobor"t pe prima coloan
p"n se a%unge la valoarea ntreag a lui k, adic 2. 'poi, la intersecia liniei k O 2, cu coloana :.::, se va
gsi probabilitatea cutat/ :,E524. 'dic sunt E5,24R anse ca do)nloadarea s dureze mai puin de 9
secunde. 'ceasta este suprafaa de sub curba normal de la 0 i la 2c &figura N.3+.
Eemplul 2. ,ac se dorete aflarea probabilitii ca timpul de do)loadare s fie mai mic de o
secund, se procedeaz n mod similar. Arebuie calculat aria de sub curba normal standardizat aflat la
stanga valorii lui k calculat cu a%utorul formulei de transformare &k O 04,::+. >olosind tabelul din anea 2,
53
la intersecia liniei k O 04 cu coloana .:: se va afla (&# Y2+ O :,::24. Cu alte cuvinte, sunt :,24R anse ca
timpul de do)nloadare s fie mai mic de o secund.
Eemplul 3. Care este probabilitatea ca timpul de do)nloadare s fie mai mare de 9 secundeQ (entru
c probabilitatea ca timpul de do)nloadare s fie mai mic de 9 secunde a fost de%a determinat, privind
figura N.3 se opoate observa c valoarea cutat este complementul acesteia, adic suprafaa de sub curba
normal de la # O 9 &k O 2+ p"n la i/ (&# Z 9+ O 2 B E524 O :,2NE8.
Eemplul 4. Care este probabilitatea ca timpul de do)nloadare s fie mai mare de o secund, dar mai
mic de 9 secundeQ n acest caz, probabilitatea cutat va fi egal cu suprafaa de sub curba normal cuprins
ntre # O 2 i # O 9. (entru c (&# Y2+ i (&# Z 9+ au fost de%a calculate, probabilitatea ce trebuie calculat
va fi complementul sumei celor dou probaibliti/
(&2 Y # Y 9+ O 20 ^(&# Y2+ V (&# Z 9+_ O 2 B &:,::24 V :,2NE8+ O :,E5
(entru a gsi o anumit valoare asociat cu o probabilitate cunoscut, se procedeaz n modul urmtor/
2. Se [Link] curba normal i se plaseaz valorile pentru medie pe scalele lui # i k.
3. Se gsete aria cumulativ situat p"n la #.
4. Se .aureaz acea arie.
5. $tiliz"nd tabelul din anea 2 se determin valoarea lui k corespunztoare ariei de sub curba
normal de p"n la #.
N. Se calculeaz # din ecuaia de transformare/
k O &# 0 T+Pc l # O T V k c
Eemplul 5. Care este timpul necesar &n secunde+ pentru ca 2:R dintre pagini s se do)nloadezeQ
(entru c n 2:R din cazuri este de ateptat ca pagina s se do)nloadeze n mai puin de # secunde, aria de
sub curba normal pentru acest k trebuie sa fie mai mic de :,[Link]. $tiliz"nd tabelul din anea 2, se observ
c cea mai apropiat valoare de :,[Link] este :,2::4, care se gsete la intersecia liniei k O 02,3 cu coloana
:,:E. ,eci k O 0 2,3E. n aceast situaie, # O 8 V &02,3E+&3+ O 5,55 secunde. 'stfel, ne putem atepta ca n
2:R din cazuri pagina de internet s se do)nloadeze n mai puin de 5,55 secunde.
Eemplul N. Care sunt valorile minim i maim a lui #, valori situate simetric fa de medie, care
vor include 9NR dintre timpii de do)nloadareQ
(entru c 9NR dintre valori sunt situate ntre #
min
i #
ma
, i #
min
i #
ma
se afl la distane egale de medie,
nseamn 3,NR dintre valori sunt mai mici dec"t #
min
. Cut"nd n tabelul din anea 2 valoarea :,:3N:, o
gsim la intersecia lui liniei k O 02,9 i coloanei :,:D. ,eci k
min
O 02,9D. !ezult c # O 8 V &02,9D+&3+ O
4,:E secunde.
(entru a afla #
ma
, trebuie gsit k pentru care sub curba normal se afl 98,NR dintre cazuri. ,in tabel,
aceast valoare o gsim la intersecia cliniei k O 2,9 i a coloanei :,:D. ,eci k O 2,9D.
54
(rin urmare, # O 8 V &2,9D+&3+ O 2:,93 secunde.
nseamn c n 9NR dintre cazuri, timpul de do)nloadare va fi ntre 4,:E i 2:,93 secunde.
D.#. Distri!uia eantioanelor
$n scop important al analizei statistice este de a face inferene, adic de a utiliza media eantionului
sau proporia eantionului pentru a estima parametrii corespunztori ai ntregii populaii. (rincipala
problem n utilizarea inferenei statistice este s se trag concluzii despre populaie i nu despre eantion.
,e eemplu, un sonda% de opinie despre intenia de vot a cetenilor folosete eantionul doar ca o cale de a
afla cum vor fi distribuite voturile n r"ndul ntregului electorat. Valorile determinate doar pentru eantion nu
au o valoare prea mare n sine.
n mod ipotetic, utilizarea datelelor statistice ale unui eantion pentru estimarea parametrilor
populaiei ar necesita eaminarea tuturor eantioanelor posibile din acea populaie. C"nd o astfel de selecie
de eantioane este fcut, distribuia rezultatelor astfel obinute este numit distri!uia eantioanelor. Spre
deosebire de distribuiile studiate p"n n acest moment, o distribuie a eantioanelor nu se refer observaii
individuale, ci la valori statistice calculate n urma culegerii observaiilor, eantion dup eantion.
7onstrucia unei distri!uii a eantioanelor
C"teodat este posibil de construit o distribuie de aantioane fr a recurge la simulri matematice
complee. (entru a ilustra aceasta, se va construi distribuia eantioanelor de patru persoane dintr0o
populaie n care %umtate favorizeaz candidatul liberal la preedenie, iar cealalt %umtate favorizeaz
candidatul social0democrat. (entru fiecare subiect se va defini variabila # care reprezint preferina pentru
un anumit candidat/
# O 2, dac subiectul prefer candidatul liberal
# O :, dac subiectul prefer candidatul social0democrat
Cele patru rezultate posibile dintr0un eantion vor fi plasate ntr0o parantez, dup modelul urmtor/
&2,:,:,2+. 'ceasta ar nsemna c primul i ultimul respondent prefer candidatul liberal, iar al doilea i al
treilea l prefer pe cel social0democrat. S presupunem c s0au etras 2D eantioane/
&2,2,2,2+ &2,2,2,:+ &2,2,:,2+ &2,:,2,2+
&:,2,2,2+ &2,2,:,:+ &2,:,2,:+ &2,:,:,2+
&:,2,2,:+ &:,2,:,2+ &:,:,2,2+ &2,:,:,:+
&:,2,:,:+ &:,:,2,:+ &:,:,:,2+ &:,:,:,:+
Eantioanele ar fi corecte dac %umtate din populaie l0ar prefera pe fiecare dintre candidai.
'cum se poate construi distribuia de eantioane pentru proporia celor care l prefer pe candidatul
liberal. (entru un eantion de 5, aceast proporie poate fi :, :,3N, :,N, :,8N i 2. (roporia : rezult doar
55
pentru unul dintre cele 2D eantioane, &:,:,:,:+, aa c probabilitatea acestui eantion este de 2P2D O :,:D3N.
(roporia de :,3N apare n patru eantioane, &2,:,:,:+, &:,2,:,:+, &:,:,2,:+ i &:,:,:,2+, aa c probabilitatea
unui astfel de eantion este de 5P2D O :,3N. n mod similar se poate construi probabilitatea fiecrei proporii,
aa cum se poate vedea n tabelul urmtor.
(roporia n eantion (robabilitatea
:,:: :,:D3N
:,3N :,3N::
:,N: :,48N:
:,8N :,3N::
2,:: :,:D3N
,istribuiile de eantioane reflect variabilitatea care apare atunci c"nd se colecteaz date de la
eantioane i se utilizeaz informaiile statistice pentru a estima parametrii. ,ac patru organizaii de sondare
a opiniei publice ar face patru [Link], fiecare cu eantionul ei, ar trebui s obin rezultate diferite, pentru c
eantioanele sunt diferite. n practic, dac se lucreaz profesionist, rezultatele nu ar trebui s fie foarte
diferite. F distribuie a eantioanelor unei informaii statistice bazate pe n observaii reprezint distribuia
frecvenelor relative ale acelei informaii statistice, rezultat n urma etragerii repetate a unor eantioane de
dimensiunea n, de fiecare dat calcul"ndu0se valoarea statistic de interes. Este posibil de construit o astfel
de distribuie n mod empiric, la fel ca n eemplul anterior. n practic, nu este necesar s se etrag
eantioane n mod repetat pentru a genera distribuii de eantioane. >orma distribuiei eantioanelor este
cunoscut din punct de vedere teoretic, astfel nc"t se pot face afirmaii despre valoarea unei informaii
statistice pornind doar de la un singur eantion de o anumit dimensiune.
D. ,. Distri!uia mediei eantioanelor
n capitolul 4 au fost discutate c"teva msuri ale tendinei centrale. Cea mai utilizat dintre acestea
este media aritmetic. 6edia aritmetic este i cea mai bun msur pentru o distribuie care se presupune c
este normal. 'tunci c"nd se colecteaz informaii i se calculeaz media unui eantion, X , nu se tie c"t
de aproape se situeaz aceast valoare de media populaiei, T, pentru c nu se cunoate aceast ultim
valoare. Aotui, folosind distribuia eantioanelor se poate prezice eroarea de estimare. ,e eemplu,
distribuia eantioanelor poate indica faptul c este o probabilitate mare ca X s se situeze la, s zicem, 2:
uniti nainte sau dup T. 6edia eantionului, X , este o variabil care i modific valoarea de la
eantion la eantion. (entru eantioane aleatorii, ea fluctueaz n %urul mediei populaiei, T, c"teodat fiind
mai mare, alteori fiind mai mic. ,e fapt, media distribuiei eantioanelor este egal cu media populaiei, T.
5N
,ac se etrag n mod repetat eantioane, pe termen foarte lung, media mediilor eantioanelor va egala
media populaiei.
Eroarea standard a distri!uiei mediei eantioanelor descrie mprtierea acestor valori de la un
eantion la altul. Valoarea ei rezult din etragerea repetat a unor eantioane, calcularea mediei X pentru
fiecare eantion i apoi prin calcularea deviaiei standard a mediilor. Simbolul utilizat,
X

n loc de c, i
terminologia utilizat, eroare standard n loc de deviaie standard, disting aceast msur statistic de
deviaia standard a unei distribuii obinuite.
Eroarea standard a mediei,
X

, este egal cu deviaia standard a populaiei, c, mprit la rdcina


ptrat a mrimii eantionului, n/
n
X

=
'stfel, mprtierea distribuiei eantioanelor depinde de mrimea eantionului i de mprtierea
eistent n cadrul populaiei. ,e aceea, pe msur ce dimensiunea eantionului crete, eroarea
standard a mediei descrete cu un factor egal cu rdcina ptrat a mrimii eantionului &figura
N.4.+.
>ig. N.4.
eorema limitei centrale, care se bazeaz pe constatrile anterioare, afirm c pe msur ce
mrimea eantionului, n, crete, distribuia mediilor eantioanelor, X , se apropie de distribuia normal.
'ceast teorem are c"teva consecine foarte importante/
0 ,istribuia aproimativ normal a mediei eantioanelor este valabil indiferent de forma
distribuiei populaiei &figura N.5.+
0 ,istribuia eantioanelor ia o form din ce n ce mai apropiat de cea normal pe msur ce n
crete. C"t de mare trebuie s fie eantionul pentru ca distribuia mediilor s se apropie de cea
normal, depinde de gradul de nclinare a distribuiei populaiei. Cu c"t nclinarea este mai mare,
cu at"t este necesar un eantion mai mare. n cele mai multe cazuri, un eantion de 3N B 4: este
suficient pentru o bun aproimaie.
5D
>igura N.5.
0 ,ei un eantion de aproimativ 4: este n general suficient de mare pentru ca distribuia
mediilor s fie apropiat de normal, acest lucru nu nseamn c 4: de cazuri sunt suficiente
pentru o inferen statistic suficient de precis.
&!inerea lui E pentru distri!uia mediilor eantioanelor. Valoare lui k este egal cu diferena
dintre media eantionului X i media populaiei T, mprit la eroarea standard a mediei
X

C
n
X
X
"
X
X

=
Eemplul 2.
S presupunem c suntem managerul unei firme alimentare, iar [Link] de ambalare umple
cutiile de cereale dup o distribuie normal, cu o medie de 4NEg pentru fiecare cutie. ,in eperiena
anterioar se tie c deviaia standard a populaiei n procesul de umplere este de 2Ng. ,ac se etrage un
eantion aleator de 3N de cutii i este calculat greutatea medie, ce rezultat ar fi de ateptatQ C"t credei c va
fi media eantionului/ 4DEg, 3::g, 4DNgQ
Eantionul este ca o reprezentare n miniatur a populaiei, iar dac valorile populaiei sunt normal
distribuite, valorile din eantion ar trebui s fie i ele aproimativ normal distribuite. 'stfel, dac media
populaiei este de 4DEg, media eantionului are anse mari de a fi apropiat de 4DEg.
58
6ai departe, cum s0ar putea determina probabilitatea ca greutatea medie a celor 3N de cutii s fie mai
mic de 4DNgQ ,e la distribuia normal se tie c aria mai mic dec"t orice valoare a lui # poate fi
determinat convertind pe # n valori standardizate k i gsind valoare corespunztoare din tabelul
distribuiei normale/
:: , 2
4
4
3N
2N
4DE 4DN
=

=
n
X
"

'ria corespunztoare lui k O 02 din tabelul aneei 2 este :,2NE8. 'ceasta nseamn c 2N,E8R din
toate eantioanele posibile de 3N de cutii au o medie pe eantion de sub 4DNg. ;u este acelai lucru cu a
spune c acesta ar fi procentul cutiilor cu o greutate mai mic de 4DNg. 'cest procent poate fi calculat astfel/
3: , :
2N
4DE 4DN
=

X
"
'ria corespunztoare lui k O 0:,3: este de :,53:8. ,eci este de ateptat ca 53,:8R dintre cutii s aib
mai puin de 4DNg. Compar"nd rezultatele se poate observa c mai multe cutii dec"t media eantioanelor vor
avea mai puin de 4DNg. 'cest rezultat poate fi eplicat prin faptul c procesul de calcul al mediei dilueaz
importana valorilor individuale. 'stfel, ansa ca media unui eantion de 3N de cutii s fie departe de media
populaiei va fi mai mic dec"t ansa unei anumite cutii.
Eemplul 3.
Cum este afectat eroarea standard a mediei de creterea eantionului de cutii de la 3N la 2:: de
buciQ
,ac n O 3N, atunci/
: , 4
N
2N
3N
2N
= = = =
n
X

,ac n O 2::, atunci/


N , 2
2:
2N
2::
2N
= = = =
n
X

Se poate observa c urmare a creterii mrimii eantionului de la 3N la 2::, eroarea standard a sczut
la %umtate/ de la 4 la 2,N grame. 'ceasta demonstreaz c etrtagerea unor eantioane mai mari va duce la o
variabilitate mai redus a mediilor eantioanelor de la un eantion la altul.
Eemplul 4.
,ac este etras un eantion de 2:: de cutii, care este ansa de a obine o medie a eantionului mai
mic de 4DNgQ
5E
:: , 3
N , 2
4
2::
2N
4DE 4DN
=

=
n
X
"

,in tabelul aneei 2, aria pentru un k mai mic dec"t B3 este :,:33E. 'ceasta nseamn c ne putem
atepta ca 3,3ER dintre eantioanele de 2:: de buci s aib mai puin de 4DNg, comparativ cu 2N,E8R
pentru eantioanele de 3N.
C"teodat este necesar s se afle intervalul n care va cdea o proporie de medii ale eantioanelor.
Similar eemplelor de la seciunea anterioar, distana dintre valoarea inferioar mediei i cea superiaor
mediei va conine aria de sub curba normal care trebuie determinat.
n
X
"
#
#


=
unde k
#
O 0k
n
X
"
S
S


=
unde k
S
$%"
'stfel,
n
" X
#

=
, iar
n
" X
S

+ =
Eemplul 5.
S se determine un interval situat n %urul mediei populaiei care va include 9NR dintre mediile
eantioanelor, pentru un eantion de 3N de cutii.
,ac 9NR este divizat n dou pri egale, situate simetric dedesubtul i deasupra mediei, valoarea lui
k
#
corespunztoare unei arii de :,:3N: este, conform tabelului din anea 2, 02,9D, iar valoare lui k
S
&
corespunztoare unei arii de :,98N este V2,9D. 'tunci, valorile inferioar i superioar ale lui X vor fi/
23 , 4D3 EE , N 4DE
3N
2N
9D , 2 4DE = = =
#
X
EE , 484 EE , N 4DE
3N
2N
9D , 2 4DE = + = + =
S
X
'stfel, 9NR dintre mediile eantioanelor bazate pe eantioane de 3N de cutii vor fi situate ntre
4D3,23 g i 484,EEg.
D.6. Distri!uia proporiei eantioanelor
59
'tunci c"nd se lucreaz cu variabile categorice, situaie n care fiecare individ sau fiecare item din
cadrul populaiei este clasificat ca av"nd sau nu o anumit caracteristic &s fie brbat sau femeie, s prefere
candidatul ' sau candidatul <+ cele dou rezultate posibile sunt 2 sau :, care reprezint prezena sau absena
respectivei caracteristici. ,ac este disponibil un singur eantion de n indivizi, atunci media eantionului
pentru o astfel de variabil va fi obinut prin nsumarea tuturor cifrelor de 2 i : i mprirea rezultatului la
n. ,e eemplu, dac ntr0un eantion de N indivizi, 4 l prefer pe candidatul ' i 3 nu l prefer, atuci suma
scorurilor va fi 4, mprit la N va rezulta :,D. 'ceasta este proporia indivizilor din eantion care l prefer
pe candidatul '. ,e aceea, atunci c"nd se lucreaz cu variabile categorice, media eantionului &rezultat din
scoruri de 2 i :+ reprezint proporia eantionului p
e
. 'stfel, proporia eantionuui este/
n
X
p
e
=
(roporia unui eantion are o proprietate special/ ia valori ntre : i 2. ,ac toi indivizii posed
aceeai proprietate, fiecare av"nd astfel scorul 2, p
e
va fi 2. ,ac %umtate din eantion posed acea
proprietate i %umtate nu o posed, p
e
va fi :,N, iar dac nici un individ nu posed proprietatea, p
e
va fi :.
(rin analogie cu distribuia mediei eantioanelor, eroarea standard a proporiei se poate calcula cu
urmtoarea formul/
n
p p
e
p
+ 2 &
=
'tunci c"nd se erag eantioane dintr0o populaie finit, cu nlocuire, distribuia proporiei
eantioanelor este binomial. Aotui, distribuia normal poate fi utilizat pentru a aproima distribuia
binomial atunci c"nd produsele np i n'1-p( sunt cel puin N. n cele mai multe cazuri n care se fac
inferene despre proporii, mrimea eantionului este suficient de mare pentru ca distribuia s poat fi
aproimat ca fiind normal. 'stfel, n multe cazuri, distribuia normal poate fi utilizat pentru a evalua
distibuia proporiei eantioanelor.
,ac n ecuaia
n
X
X
"
X
X

=
se nlocuiete X cu p
e
, ) cu p i
n

cu
n
p p + 2 &
, atunci
n
p p
p p
"
e
+ 2 &

=
Eemplu
S presupunem c directorul unei bnci a constatat c 5:R dintre cei care i pstreaz economiile la
acea banc posed mai multe conturi. ,ac ar selecta un eantion aleator de 3:: de clieni, care este
probabilitatea ca proporia eantionului de clieni ce au mai multe conturi s fie mai mic de :,4:Q
N:
,eoarece np O 3::&:,5:+ O E: Z N i n'1 p( O 3::&:,D:+ O 23: Z N, distribuia proporiei
eantionului poate fi considerat ca aproimativ normal. n acest caz,
E9 , 3
:45D , :
2: , :
3::
35 , :
2: , :
3::
+ D: , : +& 5: , : &
5: , : 4: , :
+ 2 &
=

=
n
p p
p p
"
e
$tiliz"nd tabelul din anea 2, aria de sub curba normal de p"n la k O 03,E9 este de :,::29. 'stfel,
probabilitatea de a obine o proporie a eantionului mai mic de :,4: este de :,29R, ceea ce nseamn c
evenimentul este foarte puin probabil. 'ceasta nseamn c dac proporia adevrat din cadrul populaiei
este de :,5, atunci este de ateptat ca mai puin de o cincime din eantioanele de mrime 3:: s aib
proporii mai mici dec"t :,4
E$erciii
2. ,at fiind o distribuie normal cu media de N: i deviaia standard de 5, care este probabilitatea ca/
a. # Z 54Q
b. # Y 53Q
c. 53 Y # Y 5EQ
d. # Z N8,NQ
e. # Y 5: sau # Z NNQ
f. NR dintre valori s fie mai mici dec"t #Q
g. D:R dintre valori s se afle ntre dou valori ale lui #, situate simetric fa de medieQ
.. ENR dintre valori s fie mai mari dec"t #Q
3. F firm de transport a determinat c distana parcurs anual de fiecare camion este normal distribuit, cu o
medie de N:::: 7m i o deviaie standard de [Link] 7m.
a. Care este proporia camioanelor care ar putea face ntre [Link] i N:::: 7m ntr0un anQ
b. Care este probabilitatea ca un camion ales aleator s fac ntre [Link] i [Link] 7m pe anQ
c. Care este procentul camioanelor care vor face sub [Link] sau peste [Link] 7m pe anQ
d. Care este procentul camioanelor care vor face ntre [Link] i [Link] 7m pe anQ
e. C"i 7m vor face cel puin E:R dintre camioaneQ
f. Care vor fi rspunsurile la ntrebrile a B e dac deviaia standard ar fi [Link]mQ
4. Se constat c notele finale la un eamen de statistic sunt normal distribuite i cu o medie de 8,4 i o
deviaie standard de :,E.
a. Care este probabilitatea de a obine cel mult 9,2 la acest eamenQ
b. Care este procentul de studeni cu note ntre D,N i E,9Q
c. Care este procentul de studeni cu note cuprinse ntre E,2 i E,9Q
N2
d. ,oar NR dintre studeni obin o not mai mare dec"t ce valoareQ
e. n ce situaie eti mai bine situat fa de colegii ti/ atunci c"nd obii E,2 puncte la acest eamen sau
atunci c"nd obii D,E puncte la un eamen a crui medie este D,3 iar deviaia standard este 4Q
5. Aimpul utilizat pentru consultarea e0mailului este normal distribuit, cu T O E minute i c O 3 minute.
a. dac sunt etrase eantioane aleatorii de 3N de sesiuni, care este proporia mediilor eantioanelor care
sunt cuprinse ntre 8,E i E,3 minuteQ
b. dac sunt etrase eantioane aleatorii de 3N de sesiuni, care este proporia mediilor eantioanelor care
sunt cuprinse ntre 8,N i E minuteQ
c. dac sunt etrase eantioane aleatorii de 2:: de sesiuni, care este proporia mediilor eantioanelor
care sunt cuprinse ntre 8,E i E,3 minuteQ
d. eplicai diferena dintre rezultatele de la punctul a i punctul c
e. ce are anse mai mari de apariie/ o anumit sesiune de consultare a e0mailului care s fie mai lung
de 22 minute, o medie a unui eantion care s fie mai mare de 9 minute dintr0un eantion de 3N de
sesiuni sau o medie a unui eantion care s fie mai mare de E,D minute dintr0un eantion de 2:: de
sesiuni. Eplicai rezultatul.
N. F firm de transport a determinat c, anual, distana parcurs de fiecare camion este normal distribuit, cu
o medie de N:::: 7m i o deviaie standard de [Link] 7m.
a. dac este etras un eantion de 2D camioane, care este probabilitatea ca distana medie parcurs s fie
mai mic de 5N::: 7m pe anQ
b. dac este etras un eantion de 2D camioane, care este probabilitatea ca distana medie parcurs s fie
ntre [Link] i [Link] 7m pe anQ
c. dac este etras un eantion de D5 de camioane, care este valoarea distanei parcurse anual pentru
care eist 9NR anse ca media eantionului s fie mai mic dec"t aceastaQ
d. care sunt rspunsurile la ntrebrile a B c, dac deviaia standard este [Link] 7mQ
D. F instituie de sondare a opiniei publice analizeaz rezultatele unui eit0poll pentru a face predicii n
seara alegerilor. (resupun"nd c este vorba de o competiie electoral ntre doi candidai i c dac
unul dintre acetia a primit NNR din voturi n cadrul eantionului, atunci acel candidat va fi anunat
ca i c"tigtor al alegerilor. ,ac eantionul este de 2:: de persoane
a. care este probabilitatea ca acel candidat s fie anunat ca nvingtor atunci c"nd adevratul procent de
voturi primite este de N:,2RQ
b. care este probabilitatea ca acel candidat s fie anunat ca nvingtor atunci c"nd adevratul procent de
voturi primite este de D:RQ
N3
c. care este probabilitatea ca acel candidat s fie anunat ca nvingtor atunci c"nd adevratul procent de
voturi primite este de 59R &adic, de fapt, a pierdut alegerile+Q
d. dac mrimea eantionului crete la 5::, care vor fi rspunsurile la punctele a B cQ
8. Se efectueaz un eperiment de mar7eting care const n identificarea de ctre respondeni a dou
buturi rcoritoare. Sunt etrase eantioane de ctre 3:: de participani i se presupune c acetia nu
pot distinge ntre cele dou branduri &aceasta nseamn c ansa fiecrei buturi de a fi selectat este
de N:R+.
a. Care proporia eantioanelor pentru care identificarea va fi ntre N:R i D:R corectQ
b. ntre ce limite simetrice ale procentului populaiei se vor afla 9:R dintre eantioaneQ
c. Care este probabilitatea de a obine eantioane cu un procent de identificare corect mai mare
de DNRQ
d. Ce are anse mai mari de apariie/ D:R identificare corect ntr0un eantion de 3:: sau NNR
identificare corect ntr0un eantion de [Link]Q Eplicai.
/. Estimarea intervalului de ncredere
N4
1nferena statistic reprezint procesul de utilizare a rezultatelor obinute n urma etragerii unui
eantion pentru a trage concluzii despre caracteristicile ntregii populaii. n acest capitol vor fi discutate
proceduri care permit estimarea mediei sau a proporiei populaiei.
Eist dou tipuri ma%ore de date estimative/ estimrile punctuale i estimrile interval. & estimare
punctual repezint o singur informaie statistic, care este utilizat pentru a estima adevrata valoare a
parametrului populaiei. ,e eemplu, media eantionului, X , este o estimare punctual a mediei populaiei,
T, iar variana eantionului, S
3
, este o estimare punctual a varianei populaiei, c
3
. F informaie statistic,
aa cum este X , variaz de la eantion la eantion, deoarece depinde de itemii care sunt selectai n cadrul
acestuia. 'ceast variaie trebuie luat n considerare atunci c"nd se dorete oferirea unei estimri a
caracteristicii populaiei. (entru a realiza acest lucru se folosete o estimare a intervalului n care se gsete
adevrata medie a populaiei, utiliz"nd distribuia mediei eantioanelor. 'cest interval va avea o anumit
ncredere sau probabilitate de estimare corect a adevratei valori a parametrului T. F estimare asemntoare
poate fi calculat pentru proporia, p, din cadrul unei populaii. ,e eemplu, se poate construi un interval
pentru care putem fi 9NR siguri c acesta include proporia real a votului pentru un anumit candidat. Aot n
acest capitol se va discuta i modul de determinare a dimensiunii unui eantion.
/.1. Estimarea intervalului de ncredere a mediei atunci c:nd deviaia standard este
cunoscut
n capitolul anterior a fost utilizat teorema limitei centrale iPsau distribuia populaiei pentru a
determina procenta%ul mediilor eantioanelor care vor fi la o anumit distan de media populaiei. n
eemplul folosit, cel cu ambalarea cerealelor n cutii, 9NR dintre mediile eantioanelor erau situate ntre
4D3,23 i 484,EEg. 'ceast afirmaie este una deductiv, dar ceea ce trebuie s calculm acum necesit un
raionament inductiv. 1nducia este necesar deoarece n cazul statisticii infereniale rezultatele unui singur
eantion sunt utilizate pentru a trage concluzii despre populaie i nu invers. n practic, ceea ce nu se
cunoate i trebuie determinat este media populaiei.
S presupunem, n eemplul cu cerealele la cutie, c adevrata medie a populaiei, T, este
necunoscut, dar este cunoscut deviaia standard a populaiei, c, care este egal cu 2N grame. 'stfel, n loc
s plecm de la formula + P & 9D , 2 n pentru a afla limita superioar i inferioar n %urul lui T, se va
utiliza X n loc de T pentru a0l determina pe acesta din urm/ + P & 9D , 2 n X . ,ei n practic este
etras un singur eantion de mrime n, i pentru acesta se calculeaz X , pentru a nelege ce nseamn
estimarea intervalului, se va lua n considerare un set de eantioane, fiecare de mrime n.
N5
,e eemplu, s presupunem c media populaiei, T, este egal cu 4DEg. S presupunem n continuare
c a fost etras un eantion de 3N de cutii, iar media acestuia este de 4D3,4g. 1ntervalul pentru estimarea lui T
este + 3N P 2N & 9D , 2 4 , 4D3 sau 4D3,4 [ N,EE. ,eci estimarea lui T este/
4ND,53 ` T ` 4DE,2E
,eoarece media populaiei &4DE+ este inclus n acest interval, putem afirma c eantionul a condus
la o concluzie corect n privina lui T &figura D.2.+.
9i%ura /.1. Estimarea intervalului de ncredere pentru cinci eantioane diferite de 3N de elemente,
etrase dintr0o populaie pentru care T O 4DE i c O 2N
NN
(entru a continua acest eemplu, s presupunem c pentru un alt eantion de 3N de cutii, media este
4D9,N. 1ntervalul calculat pentru acest eantion va fi + 3N P 2N & 9D , 2 N , 4D9 sau 4D9,N [ N,EE. ,eci
estimarea lui T este/
4D4,D3 ` T ` 48N,4E
,eoarece media populaiei &4DE+ este inclus i n acest interval, putem afirma c eantionul a condus
la o concluzie corect n privina lui T &figura D.2.+.
nainte de a crede orice eantion poate duce la concluzii corecte despre T, s presupunem c s0a etrs
un al treilea eantion de mrimea n O 3N, a crui medie este 4D:g. 1ntervalul calculat pentru acest eantion va
fi + 3N P 2N & 9D , 2 4D: sau 4D: [ N,EE. ,eci estimarea lui T este/
4N5,23 ` T ` 4DN,EE
'ceast estimare nu este corect, deoarece media populaiei nu este inclus n intervalul calculat din
acest eantion. 'stfel, pentru unele eantioane intervalul de estimare al lui T va fi corect, ns pentru alte
eantioane nu va fi corect. 6ai mult dec"t at"t, n practic este etras un singur eantion i deoarece media
populaiei nu este cunoscut, nu se poate ti dac estimarea intervalului este corect. (entru a iei din aceast
dilem este necesar s se determine proporia eantioanelor care conduc la intervale de ncredere corecte
pentru media populaiei, T. (entru a face acest lucru vor fi eaminate alte dou eantioane ipotetice/ unul
pentru care media este 4D3,23g i altul pentru care media este 484,EEg. (entru primul dintre aceste
eantioane intervalul calculat va fi + 3N P 2N & 9D , 2 23 , 4D3 sau 4D3,23 [ N,EE. ,eci estimarea lui T este/
4ND,35 ` T ` 4DE,::
,eoarece media populaiei este limita superioar a acestui interval, estimarea este corect.
(entru cel de0al doilea eantion, intervalul calculat va fi + 3N P 2N & 9D , 2 EE , 484 sau 484,EE [ N,EE.
,eci estimarea lui T este/
4DE,:: ` T ` 489,8D
,eoarece media populaiei este limita inferioar a acestui interval, estimarea este corect.
,in aceste eemple, ilustrate n figura D.2, se poate observa c dac media unui eantion format din
3N de cutii se situeaz oriunde ntre 4D3,23g i 484,EEg, atunci media populaiei este inclus undeva n acest
interval. ,in acelai eemplu discutat n capitolul N a rezultat c 9NR dintre mediile eantioanelor se
situeaz ntre 4D3,23g i 484,EEg. ,e aceea, 9NR dintre toate eantioanele de n O 3N de cutii au medii care
includ media populaiei n intervalul calculat, iar NR dintre toate eantioanele vor conduce la intervale care
nu conin media populaiei.
,eoarece n practic este etras un singur eantion iar media populaiei este necunoscut, nu putem fi
niciodat siguri c intervalul calculat conine media populaiei. Aotui, este o ncredere de 9NR c eantionul
ND
respectiv include media populaiei. n general, un interval de ncredere de FDG este interpretat n felul
urmtor/ dac sunt etrase toate eantioanele posibile de mrime n i sunt calculate mediile lor, atunci 9NR
dintre intervalele calculate vor include media populaiei undeva n %urul mediei eantionului i doar n NR
dintre cazuri nu se va nt"mpla aa ceva.
n unele situaii este necesar un grad mai mare de siguran n estimarea intervalului n care se
situeaz media &de eemplu 99R+. n alte cazuri, un grad de siguran mai mic &9:R+ este suficient. n
general, nivelul de ncredere este simbolizat de &2 B m+ 2::R, unde m este proporia din laturile
distribuiei care este n afara intervalului de ncredere. (roporia aflat pe latura superioar a distribuiei este
mP3, care este egal cu cea aflat pe latura inferioar a acesteia. (entru a obine un interval de &2 B m+ 2::R
ncredere n estimarea mediei atunci c"nd deviaia standard este cunoscut se folosete urmtoarea formul/
n
" X

sau
n
" X
n
" X

+
unde k este valoarea corespunztoare suprafeei de p"n la 2 0 mP3 din distribuia normal standardizat, sau
probabilitatea de mP3 din latura superioar a distribuiei.
(entru a construi un interval de ncredere de 9NR, pentru estimarea mediei, se alege m O :,:N.
Valorile lui k corespunztoare unei suprafee din care se scad cele dou laturi &mP3 O :,:3N+ sunt B2,9D i
V2,9D. 'ceast valoare a lui k obinut n construcia unui interval de ncredere se numete valoare critic a
distribuiei.
Eist valori critice diferite pentru fiecare nivel de ncredere 2 0 m ales. $n nivel de ncredere de 9NR
conduce, aa cum am vazut de%a, la o valoare a lui k egal cu [2,9D &figura D.3.+. ,ac se dorete un nivel de
ncredere de 99R, atunci m O :,:2, iar valoarea lui k este aproimativ 3,NE, pentru c suprafaa din latura
superioar este de :,::N &figura D.4+.
N8
>igura D.3. Curba normal pentru determinarea valorii lui k necesar pentru o ncredere de 9NR
>igura D.4. Curba normal pentru determinarea valorii lui k necesar pentru o ncredere de 99R
Cineva s0ar putea ntreba de ce nu construim un interval de ncredere c"t mai apropiat de 2::RQ
'cest lucru nu este de dorit deoarece, aa cum s0a observat i din cele dou eemple anterioare, orice
cretere a nivelului de ncredere este obinut prin lrgirea intervalului de ncredere. ntr0o astfel de situaie
putem avea mai mult ncredere c media populaiei se afl n interiorul unui spectru mai larg de valori, ns
NE
acest lucru s0ar putea s nu fie foarte folositor din punct de vedere al unei decizii. 'stfel eist un [Link]
ntre mrimea intervalului de ncredere i nivelul de ncredere.
Eemplul 2
$n productor de ."rtie de scris fabric foi de dimensiunea '5, pentru care este de ateptat ca
lungimea s fie de 398mm, iar deviaia standard de 3mm. Ga intervale periodice se etrag eantioane pentru
a determina dac lungimea foilor este egal cu 398mm sau ceva s0a deteriorat n procesul de producie. ,ac
s0ar observa aa ceva, utila%ele ar trebui recalibrate. S presupunem c a fost etras un eantion de 2:: de
foi, iar media lungimii acestora este de 39D,8mm. S se construiasc un interval de ncredere de 9NR pentru
estimarea lungimii medii a foilor.
$tiliz"nd formula
n
" X
n
" X

+
, cu k O 2,9D pentru o ncredere de 9NR,
2::
3
9D , 2 8 , 39D
2::
3
9D , 2 8 , 39D +
:93 , 398 4:E , 39D
'stfel, cu o ncredere de 9NR, se estimeaz c media populaiei este cuprins ntre 39D,4:E i 398,:93.
(entru c 398, valoarea care indic faptul c procesul de producie este corespunztor, este inclus n acest
interval, nu eist nici un motiv s se cread c este ceva n neregul cu procesul de producie.
Eemplul 3
S se construiasc un interval de ncredere de 99R pentru estimarea lungimii medii a foilor.
$tiliz"nd aceeai formul cu k O 3,NE pentru o ncredere de 99R,
2::
3
NE , 3 8 , 39D
2::
3
NE , 3 8 , 39D +
32D , 398 2E5 , 39D
,eoarece 398 este inclus n intervalul calculat, nu eist nici un motiv s se cread c procesul de producie
este dereglat.
/.#. Estimarea intervalului de ncredere a mediei atunci c:nd deviaia standard este
necunoscut
'a cum de obicei media populaiei, T, nu este cunoscut, nici deviaia standard a populaiei, c, nu
este cunoscut. ,e aceea a trebuit s se dezvolte un procedeu de estimare a intervalului de ncredere pentru T
pornind doar de la informaiile statistice ale eantionului, X i S.
N9
Distri!uia Student
Ga nceputul secolului ##, un statistician numit @illiam S. =osset, anga%at al productorului de bere
=uinness, din 1rlanda, era interesat de inferenele ce se pot face despre medie atunci c"nd deviaia standard a
populaiei, c, este necunoscut. (entru c anga%aii de la =uinness nu aveau permisiunea s publice cercetri
sub propriul nume, =osset a adoptat pseudonimul de Student. ,istribuia pe care el dezvoltat0o a a%uns astfel
s se numeasc distribuia Student.
,ac variabila # este normal distribuit, atunci urmtoarea informaie statistic are o distribuie t cu
n02 grade de libertate/
n
S
X
t

=
Se poate observa c epresia lui t este similar celei a lui k din capitolul N, cu ecepia faptului c
deviaia standard a populaiei, c, care nu este cunoscut, este nlocuit cu deviaia standard a eantionului, S.
Proprieti ale distri!uiei t
Ca form, distribuia t este foarte asemntoare distribuiei normale standardizate. 'mbele distribuii
au form de clopot i sunt simetrice. Aotui, distribuia t are suprafee mai mari pe laturi i mai mici pe
centru dec"t cea normal standardizat &figura D.5.+. 'cest lucru se nt"mpl deoarece c este necunoscut iar S
este utilizat pentru a0l estima. (entru c valoarea lui c este incert, valorile lui t care sunt observate vor avea
o variabilitate mai mare dec"t k.
Aotui, pe msur ce numrul gradelor de libertate crete, distribuia t se apropie treptat de ditribuia
normal standardizat, p"n c"nd cele dou distribuii devin identice. 'cest lucru se nt"mpl deoarece S
devine o estimare mai bun pentru c pe msur ce mrimea eantionului crete. (entru un eantion mai mare
sau egal cu 23:, S l estimeaz suficient de precis pe t, astfel nc"t diferena dintre distribuia t i distribuia k
este nesemnificativ. ,in acest motiv, cei mai muli statisticieni utilizeaz k n loc de t atunci c"nd
eantionul este mai mare de 23:.
D:
>ig. D.5. ,istribuia normal standardizat i distribuia t pentru 2E grade de libertate
Valorile critice ale lui t pentru numrul corespunztor de grade de libertate se obin din tabelul cu
distribuia t &'nea 3+. !"ndul de sus al fiecrei coloane indic suprafaa din latura superioar a distribuiei
tJ fiecare linie reprezint valoarea specific a lui t pentru fiecare grad de libertate.
,e eemplu, pentru 2:: de grade de libertate, dac se dorete construirea unui interval de ncredere
de 9NR, nseamn c 3,NR dintre valori &o suprafa de :,:3N+ sunt n fiecare latur a distribuiei. Ga
ncruciarea coloanei de :,:3N i a liniei corespunztoare pentru 2:: de grade de libertate, vom gsi valoarea
critic a lui t/ 2,9E5:. ,eoarece t este o distribuie simetric cu media zero, dac valoarea din latura
superioar este de V2,9E5:, atunci valoarea din latura inferioar va fi de B2,9E5:. F valoare a lui t de 2,9E5:
nseamn c probabilitatea ca t s depeasc V2,9E5: este de :,:3N, adic de 3,NR &figura D.N.+.
>igura D.N. ,istribuia t cu 2:: de grade de libertate
D2
7onceptul de %rade de li!ertate
>ormula varianei, din capitolul 4 era
2
+ &
2
3
3

=
n
X X
n
i
i
S
. 'stfel, pentru a calcula S
3
este necesar
s se cunoasc X . Ca urmare, doar n02 din valorile eantionului pot s varieze. 'cest lucru nseamn c
eist n02 grade de libertate. ,e eemplu, s presupunem c un eantion de N elemente are media de 3:. C"te
valori distincte trebuie cunoscute pentru a le cunoate pe cele rmaseQ >aptul c n O N i 3: = X ne spune
c
2::
2
=

=
n
i
i
X
deoarece
X n X
n
i
i
=

=2
'stfel, atunci c"nd patru dintre valori sunt cunoscute, a cincea nu va fi liber s varieze, pentru c
suma lor trebuie s fie 2::. ,e eemplu, dac patru dintre valori ar fi 2E, 35, 29 i 2D, atunci a cincea
valoare trebuie s fie 34, astfel nc"t suma s fie 2::.
9ormula intervalului de ncredere atunci c:nd B este necunoscut
1ntervalul de ncredere de valoare &20m+2:: se calculeaz cu a%utorul urmtoarei formule/
n
S
t X
n 2

sau
n
S
t X
n
S
t X
n n 2 2
+
(entru a ilustra aplicarea formulei intervalului de ncredere atunci c"nd deviaia standard, c, este
necunoscut, s considerm urmtorul eemplu/ managerul unei firme selecteaz un eantion de 2:: de
facturi din populaia de facturi din ultima lun. 6edia eantionului celor 2:: de facturi este de 22:,38 !F;,
iar deviaia standard este de 3E,9N !F;. >irma cere un nivel de ncredere de 9NR, asfel c valoarea critic a
distribuiei t &'nea 3+ poate fi aproimat la 2,9E5 &n 'nea 3 avem valoarea lui t doar pentru 2:: de
grade de liberate i nu pentru 99+. $tiliz"nd ecuaia anterioar
85 , N 38 , 22:
2::
9N , 3E
+ 9E5 , 2 & 38 , 22:
2
= =

n
S
t X
n
:2 , 22D N4 , 2:5
'stfel, cu o ncredere de 9NR se poate aferma c media facturilor este situat ntre 2:5,N4 i 22D,:2
!F;. $n interval de ncredere de 9NR nseamn c dac ar fi etrase toate eantioanele posibile de 2:: de
D3
facturi &ceea ce n practic nu va realiza niciodat+, 9NR dintre intervalele calculate vor include adevrata
medie. Validitatea estimrii intervalului de ncredere depinde de asumpia de normalitate pentru distribuia
valorilor facturilor. ,eoarece mrimea eantionului este sufiecient de mare &n O 2::+, se poate considera c
presupunerea este corect, iar utilizarea distribuiei t este corect.
/.,. Estimarea intervalului de ncredere a proporiei
n acest subcapitol, conceptul de interval de ncredere va fi etins i la date categorice, pentru a putea
estima proporia populaiei, p, din proporia eantionului p
e
O #Pn. ,in capitolul N am reinut c atunci c"nd
produsele np i n&20p+ au o valoare cel puin egal cu N, atunci distribuia binomial poate fi aproimat cu o
distribuie nomal. 'stfel, un interval de ncredere de &20m+2::R pentru estimarea proporiei populaiei, p,
poate fi calculat cu urmtoarea formul/
n
p p
" p
e e
e
+ 2 &

sau
n
p p
" p p
n
p p
" p
e e
e
e e
e
+ 2 & + 2 &
+

unde, p
e
O proporia din eantion O #Pn O numrul de succese Pmrimea eantionului
p O proporia n populaie
k O valoarea critic rezultat din distribuia normal standardizat
n O mrimea eantionului
Eemplu/ S presupunem c firma din eemplul anterior dorete s determine frecvena de apariie a
erorilor n scrierea facturilor. Se dorete construirea unui interval de ncredere de 9NR pentru a estima
proporia din ntreaga populaie de facturi care conin erori, pentru a le putea remedia. S presupunem c n
eantionul de 2:: de facturi, 2: conin erori. (entru aceste date, p
e
O 2:P2:: O :,2:. (entru un interval de
ncredere de 9NR, k O 2,9D, astfel c
:NEE , : 2: , : + :4 , : +& 9D , 2 & 2: , :
2::
+ 9: , : +& 2: , : &
+ 9D , 2 & 2: , :
+ 2 &
= = =

n
p p
" p
e e
e
2NEE , : :523 , : p
'stfel se poate afirma c ntre 5,23R i 2N,EER dintre facturi conin erori de completare.
/.6. Determinarea dimensiunii eantionului
D4
n eemplele utilizate anterior referitoare la estimarea unui interval de ncredere, eantioanele au fost
alese fr a se ine cont de limea intervalului de ncredere rezultat. n lumea real, determinarea unei
mrimi corespunztoare a eantionului presupune o procedur complicat, care trebuie s in cont de
constr"ngerile legate de bugetul disponibil, de timpul disponibil i de uurina n selectare. n cele dou
eemple anterioare, dac se dorete estimarea mediei facturilor sau a proporiei facturilor ce conin erori, ar
trebui de determinat, n primul r"nd, c"t de precis se doretea fi estimarea. 'stfel este necesar s se
determine eroarea de eantionare admisibil n estimarea fiecrui parametru c"t i ncrederea necesar pentru
o estimare corect a acestora.
Determinarea mrimii eantionului pentru medie
(entru a detremina mrimea eantionului necesar pentru estimarea mediei, trebuie avute n vedere
eroarea de eantionare considerat acceptabil, nivelul de ncredere dorit, precum i deviaia standard.
Se pleac de la formula din capitolul precedent
n
X
"


=
, unde k este variabila normal standardizat
mai departe,

= X
n
"
Valoarea lui k este pozitiv sau negativ, depinz"nd de faptul dac X este mai mare sau mai mic
dec"t T. ,iferena dintre media eantionului, X , imedia populaiei, T, este numit eroare de eantionare
i este notat cu e.
n
" e

=
,e aici rezult mrimea eantionului pentru determinarea mediei, care este egal cu produsul dintre
ptratul lui k i ptratul deviaiei standard, mprit la ptratul erorii de eantionare
3
3 3
e
"
n

=
,eci, pentru a putea determina mrimea eantionului trebuie s cunoatem trei factori/
2. ;ivelul dorit de ncredere, care va determina k, valoarea critic din distribuia normal standardizat
3. Eroarea de eantionare acceptabil, e
4. ,eviaia standard, c
n practic, nu este at"t de uor de determinat aceti trei factori. Cum ar putea fi determinate nivelul
de ncredere i eroarea de eantionareQ n mod obinuit, rspunsul la aceast ntrebare este oferit de
eperien. ,ei un nivel de ncredere de 9NR este cel mai utilizat &n acest caz k O 2,9D+, dac se dorete o
ncredere mai mare, 99R este o valoare mai potrivit, iar dac nu este necesar prea mult precizie, 9:R
D5
poate fi acceptabil. Eroarea de eantionare nu trebuie privit din perspectiva unei valori dorite, pentru c, de
fapt, nu se dorete nici o eroare, ci din perspectiva valorii care poate fi tolerate i care permite tragerea unor
concluzii valide.
n plus, este necesar o estimare a deviaiei standard. ,in nefericire, deviaia standard a populaiei, c,
este rareori cunoscut. n unele situaii, deviaia standard a populaiei poate fi estimat din cercetri
anterioare. n alte situaii se poate face o estimare suficient de corect n funcie de amplitudinea i
distribuia variabilei. ,e eemplu, dac se presupune c eist o distribuie normal, amplitudinea este
aproimativ egal cu Dc &adic [4c n %urul mediei+, astfel c deviaia standard poate fi estimat ca fiind o
esime din amplitudine. ,ac deviaia standard nu poate fi dedus n aceste maniere, atunci trebuie
desfurat un studiu pilot, iar c va fi etras de aici.
(entru a nelege modul de determinare a mrimii eantionului pentru estimarea mediei populaiei, s
relum un eemplu anterior, n care la o firm au fost selectate 2:: de facturi pentru a caluca un interval de
9NR ncredere. Cum a fost determinat aceast mrime a eantionuluiQ
S presupunem c, dup o consultare n cadrul firmei, s0a stabilit c eroarea de eantionare nu trebuie
s fie mai mare de [N !F;, mpreun cu o ncredere de 9NR. ,ate anterioare indic faptul c deviaia
standard a v"nzrilor a fost de 3N !F; pentru o lung perioad de timp. 'stfel, e O N, c O 3N, iar k O 2,9D
&pentru o ncredere de 9NR+, iar n va fi
:5 , 9D
+ N &
+ 3N & + 9D , 2 &
3
3 3
3
3 3
= = =
e
"
n

(utem considera c n O 98. ,eoarece regula general este de a suprasatisface criteriile, prin rotun%ire
la urmtorul numr ntreg, mrimea eantionului a fost aleas la 2::.
Determinarea mrimii eantionului pentru proporie
6etoda de determinare a mrimii eantionului pentru estimarea proporiei este similar cu cea
utilizat pentru estimarea mediei.
Se pleac de la formula
n
p p
p p
"
e
+ 2 &

=
, unde k este variabila normal standardizat.
p p
n
p p
"
e
=
+ 2 &
Eroarea de eantionare, este egal cu diferena dintre p
e
i p, adic diferena dintre proporia
eantionului i parametrul care trebuie estimat. 'stfel, eroarea de eantionare este definit ca
DN
n
p p
" e
+ 2 &
=
,e aici rezult mrimea eantionului pentru determinarea proporiei, care este egal cu produsul
dintre ptratul lui k, p i &20p+, totul mprit la ptratul erorii de eantionare/
3
3
+ 2 &
e
p p "
n

=
(entru a determina mrimea eantionului necesar estimrii proporiei, trebuie cunoscui trei factori/
2. ;ivelul dorit de ncredere, care determin valoarea lui k
3. Eroarea de eantionare acceptabil, e
4. 'devrata proporie eistent n r"ndul populaiei, p
n practic, alegerea acestor factori necesit o oarecare planificare. ,up ce este ales nivelul de
ncredere, se poate determina valoarea corespunztoare a lui k din distribuia normal standardizat. Eroarea
de eantionare, e, indic mrimea erorii care poate fi tolerat n estimarea proporiei populaiei. 'l treilea
factor, adevrata proporie eistent n populaie, p, este eact parametrul care se dorete a fi determinat.
'stfel apare ntrebarea cum ar putea fi stabilit o valoare pentru un factor care este necesar la determinarea
eantionului care, la r"ndul su, duce la stabilirea factorului respectiv. Eist dou alternative pentru acest
lucru. (rima este c, n multe situaii, eist informaii din trecut sau din eperiene anterioare care ne pot
oferi o estimare suficient de corect a lui p. ' doua alternativ, atunci c"nd nu eist informaii anterioare,
const n ncercarea de a nu subestima niciodat mrimea eantionului care este necesar. (rivind ecuaia
pentru determinarea lui n se poate observa produsul p&20p+ care apare la numrtor. Valoarea lui p trebuie
aleas astfel nc"t produsul p&20p+ s fie c"t mai mare posibil.
'tunci c"nd p O :,9, p&20p+ O &:,9+&:,2+ O :,:9
'tunci c"nd p O :,8, p&20p+ O &:,8+&:,4+ O :,32
'tunci c"nd p O :,N, p&20p+ O &:,N+&:,N+ O :,3N
'tunci c"nd p O :,4, p&20p+ O &:,4+&:,8+ O :,32
'tunci c"nd p O :,2, p&20p+ O &:,2+&:,9+ O :,:9
Se poate observa c cea mai mare valoare a produsului p&20p+ se obine pentru p O :,N. ,e aceea,
atunci c"nd nu eist informaii prealabile despre adevrata proporie din populaie, trebuie folosit cel mai
conservator mod de determinare a mrimii eantionului, folosind :,N pentru valoarea lui p. 'ceast variant
produce cel mai mare eantion posibil, dar duce, n acelai timp, i la cel mai mare cost al eantionrii.
,ac ne ntoarcem la eemplul cu managerul firmei care dorea s afle proporia facturilor completate
greit, s presupunem c se dorete o ncredere de 9NR n estimarea proporiei facturilor cu erori, ntr0o
mar% de [:,:8 fa de adevrata proporie a populaiei. !ezultatele din ultimele luni indic faptul c
DD
niciodat proporia facturilor cu erori nu a depit :,2N. 'stfel, e O :,:8, p O :,2N i k O 2,9D &pentru 9NR
ncredere+/
9D , 99
+ :8 , : &
+ EN , : +& 2N , : & + 9D , 2 & + 2 &
3
3
3
3
= =

=
e
p p "
n
,e aceea, n O 2::, pentru c regula general este ca mrimea eantionului s fie rotun%it la numrul
ntreg cel mai apropiat, pentru a suprasatisface criteriile.
E$erciii
2. ntr0un sonda% de opinie, respondenii sunt rugai s i evalueze poziia ideologic pe o scal cu 8
trepte, unde 2 nseamn etrema stang, 5 nseamn centru, iar 8 nseamn etrema dreapt. S
presupunem c un astfel de sonda% a fost realizat pe un eantion de n O 3E89 de persoane, media
rspunsurilor fiind 5,282, iar deviaia standard este 2,49:.
a. Construii un interval de 9NR ncredere pentru media ideologiei politice.
b. 'rtai care este efectul creterii nivelului de ncredere construind un interval de 99R ncredere.
c. 'rtai care este efectul scderii nivelului de ncredere construind un interval de 9:R ncredere.
3. ,ac X O 23N, c O 35 i n O 4D, construii un interval de 99R ncredere pentru estimarea mediei
populaiei.
4. 6anagerul responsabil de controlul calitii la o fabric de becuri trebuie s estimeze media de via a
unui important lot de produse. El tie din procesul de producie c deviaia standard este de 2:: de ore.
Este etras un eantion de D5 de becuri pentru care media speranei de via este de 4N: de ore.
a. Construii un interval de 9NR ncredere pentru a estima adevrata medie a speranei de via a
becurilor din lotul respectiv.
b. Credei c productorul are dreptul s afirme c, n medie, becurile rezist 5:: de oreQ Eplicai.
c. Eplicai de ce o speran de via a unui bec de 43: de ore nu este ceva neobinuit, [Link] dac este n
afara intervalului de ncredere calculat.
d. ,ac deviaia standard ar fi E: de ore, care ar fi rspunsurile la punctele a i bQ
5. ,eterminai valoarea critic a lui t pentru fiecare din situaiile urmtoare/
a. 20m O :,9N, n O 2:
b. 20m O :,99, n O 2:
c. 20m O :,9N, n O 43
d. 20m O :,9N, n O D2
e. 20m O :,9:, n O 2D
D8
N. ,ac N: = X , S O 2N i n O 2D i presupun"nd c populaia este normal distribuit, construii un
interval de ncredere de 99R pentru a estima media populaiei, T.
D. Construii un interval de ncredere de 9NR pentru estimarea mediei populaiei, plec"nd de la
urmtoarele seturi de date i presupun"nd c populaia este normal distribuit/
Setul 2/ 2, 2, 2, 2, E, E, E, E
Setul 3/ 2, 3, 4, 5, N, D, 8, E
Eplicai de ce aceste seturi de date au intervale de ncredere diferite, dei au aceeai medie i aceeai
amplitudine.
8. Construii un interval de 9NR ncredere pentru a estima media populaiei pe baza urmtoarelor numere/ 2,
3, 4, 5, N, D i 3:. [Link] numrul 3: cu 8 i recalculai intervalul de ncredere. $tiliz"nd aceste rezultate,
descriei efectele unei valori etreme asupra intervalului de ncredere.
E. S presupunem c ntr0un sonda% de opinie aplicat unui eantion de 9E8 de subieci a fost pus urmtoarea
ntrebare/ Hn ultimul an ati fost victima unui furt din buzunare, a unei t"[Link] sau a unei spargeriQI. ,in
totalul respondenilor, 28 au rspuns da, iar 98: nu.
a. ,eterminai proporia populaiei care a fost victima unor astfel de infraciuni.
b. Construii un interval de ncredere de 9NR pentru proporia populaiei. Se poate concluziona c mai
puin de NR din populaie a fost victima unei astfel de infraciuniQ
9. 6anagerul unui ziar de mare tira% vrea s determine proporia de ziare care conin erori de tipar &eces de
cerneal, tieri necorspunztoare ale paginilor, pagini lipsa sau pagini reptate+. El .otrte s selecteze un
eantion de 3:: de ziare pentru analiz i dorete s se construiasc un interval de ncredere de 9:R pentru a
estima proporia ziarelor cu erori de tipar din toatalul populaiei de ziare. ,in acest eantion, 4N de ziare
conin erori. 6anagerul dorete s aib 9:R ncredre n estimarea adevratei proporii din populaie.
Construii intervalul de ncredere.
2:. $n dealer de autoturisme dorete s estimeze proporia clienilor care nc dein maina pe care au
cumprat0o de la el n urm cu cinci ani. $n eantion aleator de 3:: de clieni etras din dosarele firmei arat
faptul c E3 dintre acetia nc dein autoturismele [Link] cu cinci ani n urm. Construii un interval
de ncredere de 9NR pentru a estima proporia clienilor care nc dein autoturismul cumprat cu cinci ani n
urm.
22. ,ac o [Link] de inspecie de la (rotecia consumatorului vrea s estimeze media volumului de suc
mbuteliat n sticlele de 3 litri, ntr0o mar% de [:,:2 litri, cu o ncredere de 9NR i presupun"nd c deviaia
standard este de :,:N litri, care este mrimea necesar a eantionuluiQ
DE
23. F organizaie de sondare a opiniei publice dorete s estimeze proporia votului pentru unul dintre cei
doi candidai aflai n finala alegerilor prezideniale. Se dorete o ncredere de 9:R n corectitudinea
prediciei, cu o mar% de [:,:5 fa de adevrata proporie a populaiei.
a. Care este mrimea eantionului necesar pentru acest lucruQ
b. ,ac se dorete o ncredere de 9NR, c"t de mare trebuie s fie eantionulQ
c. ,ac se dorete o ncredere de 9NR, cu o eroare de [:,:4, care ar trebui s fie mrimea eantionuluiQ
1. estarea ipotezelorC teste pentru un sin%ur eantion
n acest capitol ne vom concentra atenia asupra asupra unei alte etape a statisticii infereniale, i
anume testarea ipotezelor pornind de la informaiile oferite de un eantion. Va fi prezentat o metodologie
D9
care, pas cu pas, va permite efectuarea de inferene despre un parametru al populaiei analiz"nd diferenele
dintre rezulatelel observate &informaiile statistice etrase din eantion+ i rezultatele ateptate dac ipoteza
emis ar fi corect.
1.1. Metodolo%ia testrii ipotezelor
Ipoteza nul i ipoteza de lucru
Aestarea ipotezelor ncepe cu acceptrea unei anumite teorii sau asumpii despre un anumit parametru
al populaiei. ,e eemplu, ipoteza iniial n cazul eemplului anterior folosit, cel cu cerealele ambalate n
cutii, a fost c procesul de producie este corespunztor, adic fiecare cutie are o greutate medie de 4DE g i
nu sunt necesare corecii. 1poteza care afirm c parametrul populaiei este egal cu specificaiile firmei se
numete ipoteza nul. & ipotez nul este cea care afirm status *uo0ul sau c nu eist nici o diferen, i
este notat cu h
:
. (entru eemplul n discuie, ipoteza nul poate fi scris n mod formal ca
h
:
/ T O 4DE
,ei informaia disponibil se refer doar la eantion, ipoteza nul este scris n termeni de parmetru
al populaiei. 1nformaia statistic va fi utilizat pentru a face inferene despre ntreaga populaie, n cazul
nostru despre ntregul proces de umplere a cutiilor cu cereale. $na dintre inferenele care poate rezulta din
analiza eantionului este aceea c ipoteza nul este fals. ,ac ipoteza nul este fals, atunci altceva ar trebui
s fie adevrat. (entru a anticipa aceast posibilitate, ori de c"te ori este emis o ipotez nul trebuie emis i
o ipotez alternativ &sau ipotez de lucru+. 'ceasta se noteaz cu h
2
i poate fi scris n mod formal ca
h
2
/ T e 4DE
1poteza alternativ reprezint concluzia rezultat din respingerea ipotezei nule, dac eantionul ofer
suficiente dovezi pentru a decide c ipoteza nul nu are anse s fie adevrat. n eemplul cu cerealele, dac
greutatea medie a cutiilor de cereale este suficient de deprtat de cifra specificat de companie, 4DE g,
atunci ipoteza nul poate fi respins i poate fi acceptat ipoteza alternativ, c greutatea medie a cutiilor de
cereale este diferit de 4DE g. Ca urmare, producia ar trebui s fie oprit i s se ia msurile de corecie
corespunztoare.
6etodologia testrii ipotezelor este proiectat astfel nc"t respingerea ipotezei nule se bazeaz pe
informaiile oferite de eantion c ipoteza de lucru are mult mai multe anse s fie adevrat. Aotui, eecul
de a respinge ipoteza nul nu nseamn neaprat c aceasta este adevrat. (ractic, niciodat nu se poate
dovedi c o ipotez nul este corect, deoarece decizia este luat ntotdeauna pe baza informaiilor oferite de
ctre un eantion i nu pe baza informaiilor oferite de ctre ntreaga populaie. ,e aceea, atunci c"nd ipoteza
nul nu poate fi respins, se poate concluziona doar c eist prea puine dovezi pentru a fi siguri de
respingerea ei.
8:
"aloarea critic a testului statistic
Gogica ce st la baza metodologiei testrii ipotezelor poate fi dezvoltat dac ne g"ndim cum ar putea
fi utilizat informaia oferit de eantion pentru a determina plauzibilitatea ipotezei nule.
n cazul cu firma productoare de cereale, ipoteza nul afirm c greutatea medie a fiecrei cutii de
cereale, pentru ntrega cantitate produs, este de 4DE g. ,e pe banda de producie este etras un eantion de
cutii, fiecare cutie este c"ntrit i se calculeaz media acestora. ,up cum tim, o informaie statistic este o
estimare a parametrului populaiei din care a fost etras eantionul. [Link] dac ipoteza nul este adevrat,
informaia statistic poate s difere de valoarea parametrului datorit variaiei produs de eantionare.
Aotui, ne putem atepta ca informaia statistic etras din eantion s fie apropiat de parametrul populaiei
n cazul n care ipoteza nul este adevrat. ntr0o asemenea situaie nu sunt suficeinte dovezi pentru a
respinge ipoteza nul. ,ac, de eemplu, media eantionului de cutii ar fi 4D8,9 g, bunul sim ne0ar sugera s
concluzionm c media populaiei nu s0a modificat n procesul de producie, deoarece 4D8,9 este foarte
apropiat de 4DE.
(e de alt parte, dac eist o discrepan ma%or ntre valoarea informaiei statistice i parametrul
corespunztor pentru care se face ipoteza, bunul sim ne conduce la concluzia c ipoteza nul nu are cum s
fie adevrat. ,e eemplu, dac media eantionului este 43:, vom fi nclinai s presupunem c media
populaiei nu este 4DE deoarece media eantionului este foarte ndeprtat de valoarea pentru care se face
ipoteza, i anume 4DEg. ntr0o asemenea situaie este foarte puin probabil s se obin o medie a
eantionului de 43: dintr0o populaie a crei medie este 4DE i de aceea este mai logic s se concluzioneze c
c media populaiei nu este 4DE. ntr0o asemenea situaie vom respinge ipoteza nul. n ambele situaii
anterioare, decizia este luat pe baza credinei c eantionul este ntr0adevr reprezentativ pentru populaia
din care a fost etras.
,in nefericire, luarea unei decizii nu este ntotdeauna at"t de uoar i nici nu poate fi lsat pe
seama unei %udeci subiective i arbitrare legat de c"t de aproape sau de departe se afl media eantionului
de aceea a populaiei. 6etodologia testrii ipotezelor asigur definiii clare pentru evaluarea unor astfel de
diferene. 'cest lucru este realizat prin determinarea distribuiei de eantioane pentru informaia statistic de
interes &de eemplu, media eantionului+, urmat apoi de calcularea unui anumit test statistic bazat pe
rezultatele eantionului respectiv. ,eoarece distribuia de eantioane pentru testul statistic are de cele mai
multe ori o form cunoscut, fie distribuia normal standardizat fie distribuia t, aceste distribuii pot fi
utilizate pentru a determina ansele ipotezei nule de a fi adevrate.
;e%iunile de respin%ere i de nerespin%ere
82
,istribuia de eantioane pentru testul statistic este mprit n dou regiuni/ o regiune de respingere
&numit i regiune critic+ i o regiune de nerespingere &fig. 8.2+. !egiunea de respingere reprezint valorile
testului statistic care nu sunt de ateptat s apar dac ipoteza nul este adevrat. 'ceste valori au anse de
apariie mai mari dac ipoteza nul este fals.
9i%. 1.1. ;e%iunile de respin%ere i de nerespin%ere n testarea ipotezelor
,ac testul statistic se situeaz n regiunea de nerespingere, ipoteza nul nu poate fi respins. n
eemplul cu cerealele, dac se consider c nu eist suficiente dovezi pentru a concluziona c media
populaiei este diferit de 4DEg, atunci ipoteza nul nu poate fi respins. ,ac testul statistic se situeaz n
regiunea de respingere, atunci ipoteza nul poate fi respins. n acest caz, firma poate concluziona c media
populaiei nu este 4DEg.
(entru a lua o decizie n privina ipotezei nule, n primul r"nd trebuie determinat valoarea critic a
testului statistic. Valoarea critic este cea care separ regiunea de nerespingere de cea de respingere.
,eterminarea acestei valori critice depinde de mrimea regiunii de respingere, care la r"ndul ei este funcie
de riscurile implicate de utilizarea unui eantion atunci c"nd se dorete estimarea unui parametru al unei
populaii.
;iscuri n luarea unei decizii atunci c:nd se utilizeaz metodolo%ia testrii ipotezelor
83
'tunci c"nd este utilizat o informaie statistic etras de la un eantion pentru a lua o decizie n
privina unui parametru al unei populaii, eist riscul tragerii unei concluzii eronate. ,ou tipuri de erori pot
s apar atunci c"nd sunt testate ipoteze/ tipul 1 de eroare i tipul 11 de eroare.
ipul I de eroare apare atunci c"nd ipoteza nul, h
:
, este respins c"nd de fapt ea este adevrat i
nu ar trebui respins. (robabilitatea de apariie a tipului 1 de eroare este m.
ipul II de eroare apare atunci c"nd ipoteza nul, h
:
, nu este respins, dei ea este fals i ar trebui
respins. (robabilitatea de apariie a tipului 11 de eroare este n.
n cazul eemplului discutat, tipul 1 de eroare apare atunci c"nd, pe baza informaiilor oferite de
eantion se concluzioneaz c greutatea medie a populaiei de cutii nu este 4DEg, c"nd de fapt ea este 4DEg.
(e de alt parte, tipul 11 de eroare apare atunci c"nd, pe baza informaiilor oferite de eantion se
concluzioneaz c greutatea medie a populaiei de cutii este 4DEg, c"nd de fapt ea nu este 4DEg.
Hivelul de semnificaie
(robabilitatea de a comite tipul 1 de eroare se numete nivel de semnificaie al testului statistic. n
mod obinuit, tipul 1 de eroare poate fi controlat prin stabilirea nivelului de risc, m, care poate fi tolerat n
respingerea ipotezei nule, atunci c"nd ea este de fapt adevrat. ;ivelul de semnificaie este ales nainte de
testarea ipotezei i de obicei ia valori de :,:2, :,:N sau :,2.
7oeficientul de ncredere, care este notat 2 B m, i care este complementul probabilitii erorii de tip
1, reprezint probabilitatea ca ipoteza nul, h
:
, s fie acceptat atunci c"nd ea este adevrat. Hivelul de
ncredere pentru testarea unei ipoteze este de &2 B m+2::R. n ipoteza cu cerealele, coeficientul de ncredere
msoar probabilitatea concluziei c greutatea medie a populaiei de cutii este de 4DEg, c"nd ea [Link] este
4DEg.
;iscul I
(robabilitatea de a comite tipul 11 de eroare se noteaz cu n. Spre deosebire de tipul 1 de eroare, care
este controlat prin alegerea lui m, probabilitatea de a face tipul 11 de eroare este dependent de diferena
dintre valoarea care se presupune prin ipotez c eist i valoarea real a parametrului din populaie.
,eoarece diferenele mari sunt mai uor de observat dec"t cele mici, dac diferena dintre informaia
statistic obinut de la eantion i parametrul corespunztor al populaiei este mare, probabilitatea de a face
tipul 11 de eroare este de ateptat s fie mic. ,e eemplu, dac adevrata medie a populaiei &care de fapt nu
este cunoscut+ este de 43:g, sunt anse mici &n+ s se concluzioneze c media nu s0a [Link] fa de 4DEg.
(e de alt parte, dac diferena dintre informaia statistic i valoarea parametrului corespunztor este mic,
probabilitatea de a comite tipul 11 de eroare este mare. 'stfel, dac media populaiei este ntr0adevr 4D8g,
este o mare probabilitate de a concluziona c media cu care sunt umplute cutiile nu s0a modificat fa de
4DEg, i s0ar face tipul 11 de eroare.
84
Puterea testului statistic, 2 B n, este complementul tipului 11 de eroare i reprezint probabilitatea de
respingere a ipotezei nule c"nd aceasta este fals i [Link] trebuie respins. n eemplul nostru, puterea
testului este probabilitatea de a concluziona c greutea medie a cutiilor nu este 4DEg, c"nd ea de fapt nu este
4DEg.
;iscuri n luarea deciziei atunci c:nd se testeaz o ipotez
Aabelul 8.2. ilustreaz rezultatele celor dou decizii posibile &s se accepte h
:
sau s resping h
:
+
care pot s apar atunci c"nd se testeaz ipoteze. n funcie de decizia luat, pot s apar una din cele dou
tipuri de erori sau poate fi luat una din cele dou decizii corecte.
a!elul 1.1.
Situaia real
,ecizia statistic h
:
este adevrat h
:
este fals
;erespingerea lui h
:
,ecizie corect
ncredere O 2 B m
Eroare de tip 11
(&eroare de tip 11+ O n
!espingerea lui h
:
Eroare de tip 1
(&eroare de tip 1+ O m
,ecizie corect
(utere O 2 0 n
F cale de reducere a probabilitii de a face tipul 11 de eroare este de a mri dimensiunea
eantionului. Eantioanele mari permit sesizarea diferenelor mici dintre valoarile reale ale parametrilor i
valorile cuprinse n ipotez. (entru un anumit nivel al lui m, creterea dimensiunii eantionului va duce la
scderea lui n, ceea ce va duce la creterea capacitii testului de a detecta faptul dac ipoteza nul, h
:
, este
fals. Cu toate acestea, ntotdeauna eist o limit dat de resursele disponibile, ceea ce va afecta mrimea
eantionului luat n considerare. ,e aceea, pentru o anumit mrime a eantionului, trebuie luat n
considerare un anumit [Link] ntre cele dou tipuri de erori. ,eoarece riscul de apariie al tipului 1 de
eroare poate fi controlat, acest risc poate fi redus prin selectarea unei valori c"t mai mici pentru m. ,e
eemplu, dac sunt consecine negative importante asociate cu tipul 1 de eroare, se poate alege m O :,:2 n
loc de m O :,:N. Aotui, c"nd m scade, n crete, astfel c o reducere a riscului de a face tipul 1 de eroare va
duce la o cretere a riscului tipului 11 de eroare. ,ac, pe de alt parte, se dorete reducerea lui n, atunci
trebuie aleas o valoare mai mare pentru m. 'stfel, dac este important s se evite tipul 11 de eroare, atunci se
poote selecta m O :,:N sau :,2 n loc de m O :,:2.
n eemplul nostru cu fabrica de cereale, tipul 1 de eroare duce la concluzia c media greutii per
cutie s0a [Link] de la 4DEg, c"nd de fapt ea nu s0a [Link]. Aipul 11 de eroare duce la concluzia c
greutatea medie per cutie nu s0a modificat de la 4DEg, c"nd de fapt ea s0a modificat. 'legerea unor valori
rezonabile pentru m i n depinde de costurile asociate fiecrui tip de eroare. ,ac, de eemplu, este foarte
85
costisitor de modificat procesul [Link] de umplere a cutiilor, atunci probabil c vom dori s fim siguri c
[Link] va fi benefic, deci tipul 1 de eroare va fi cel mai important i va trebui meninut la valori c"t mai
sczute. (e de alt parte, dac se dorete siguran n detectarea [Link] de la media de 4DEg, atunci
riscul apariiei tipului 11 de eroare este mai important i trebuie ales un nivel mai ridicat al lui m.
1.#. estul E pentru medie. atunci c:nd deviaia standard este cunoscut
n eemplul discutat anterior, se dorea determinarea faptului dac procesul [Link] al umplerii
cutiilor cu cereale decurge corect, adic dac greutatea medie a cutiilor este 4DEg, i nu sunt necesare
a%ustri. (entru a evalua acest lucru se etrage un eantion de 3N de cutii, fiecare cutie este c"ntrit, iar
greutatea care este ateptat prin ipotez &parametrul populaiei+ este comparat cu greutatea rezultat din
eantion. n aceast situaie, ipoteza nul este h
:
/ T O 4DE, iar ipoteza de lucru este h
2
/ T e 4DE.
,ac deviaia standard, c, este cunoscut, atunci distribuia mediei este normal &acest lucru este
adevrat dac populaia este normal distribuit sau dac mrimea eantionului este cel puin 4:+, de aici
rezult"nd valoarea testului k
n
X
"


=
n ecuaia anterioar, numrtorul arat c"t de departe se afl media eantionului de media pentru
care se face ipoteza, T. ;umitorul reprezint eroarea standard a mediei, astfel nc"t k reprezint diferena
dintre X i T n uniti de erori standard.
Perspectiva valorii critice n testarea ipotezelor
,ac se utilizeaz un nivel de semnificaie de :,:N, mrimea regiunii de respingere este de :,:N, iar
valorile critice ale distribuiei pot fi determinate. 'ceste valori critice pot fi eprimate ca valori standardizate
ale lui k &adic n uniti de deviaie standard+. ,eoarece regiunea de respingere este divizat n dou pri
&de aceea acest test se numete i test pentru dou laturi+, valoare :,:N este mprit n dou pri egale de
valoare :,:3N fiecare. F regiune de respingere de :,:3N pe fiecare dintre laturile distribuiei normale va
conduce, conform tabelului din 'nea 2, la o valoare critic inferioar de B2,9D i la o valoare critic
superioar de V2,9D. >igura 8.3. ilustreaz aceast situaie/ dac media este de fapt 4DEg, aa cum presupune
ipoteza de nul, h
:
, atunci valorile testului statistic k au o distribuie normal standardizat centrat pe : &ceea
ce corespunde unei valori X de 4DEg+. Valori ale lui k mai mari dec"t V2,9D sau mai mici dec"t B2,9D
indic faptul c X este prea departe de T O 4DE, ceea ce nu este de ateptat dac h
:
ar fi adevrat.
8N
9i%ura 1.#. estarea unei ipoteze despre medie atunci c:nd B este cunoscut. pentru un nivel de
semnificaie de 0.0D
n aceast situaie, regula pentru luarea deciziei este urmtoarea/ se respinge h
:
dac k Z V2,9D sau
kY 02,9D i nu se respinge h
:
n orice alt situaie.
S presupunem c un eantion de 3N de cutii are o greutate medie X O 483,Ng, iar deviaia standard
a populaiei, c, este de 2Ng. 'tunci,
N: , 2
3N
2N
4DE N , 483
+ =

=
n
X
"

,eoarece testul statistic k O V2,N:, este cuprins n intervalul &02,9D, V2,9D+, decizia este de a nu
respinge h
:
. Concluzia este c media greutii cu care sunt umplute cutiile de cereale este de 4DEg. Sau,
lu"nd n considerare posibilitatea tipului 11 de eroare, concluzia poate fi formulat n felul urmtor/ nu eist
dovezi suficiente c media este diferit de 4DEg.
8D
9i%. 1.,.
Perspectiva valoriiJp n testarea ipotezelor
88
Pai n testarea unei ipoteze
2. Se enun ipoteza de nul, h
:
. 1poteza de nul trebuie enunat n termeni statistici utiliz"nd
parametrii populaiei.
3. Se enun ipoteza de lucru, h
2
. 1poteza de lucru trebuie enunat n termeni statistici utiliz"nd
parametrii populaiei.
4. Se alege nivelul de semnificaie, m. ;ivelul de semnificaie este ales n funcie de importana
riscurilor legate de apariia erorilor de tip 1 i de tip 11.
5. Se alege mrimea eantionului, n. 6rimea eantionului este aleas dup luarea n considerare a
riscurilor implicate de apariia erorilor de tip 1 i de tip 11 &trebuie selectate nivelurile pentru m i n+
i dup luarea n considerare a const"ngerilor bugetare.
N. Se determin testul statistic corespunztor. ,ac deviaia standard a populaiei, c, este cunoscut,
testul statistic selectat va fi k.
D. Se stabilesc valorile critice care separ regiunea de nerespingere de regiunile de respingere.
8. Se colecteaz datele i se calculeaz informaia statistic corespunztoare pentru eantion &media
eantionului+.
E. Se determin faptul dac testul statistic se situeaz n regiunea de nerespingere sau n regiunile de
respingere.
9. Se ia decizia statistic. ,ac testul statistic se situeaz n regiunea de nerespingere, atunci ipoteza
de nul, h
:
, nu poate fi respins. ,ac testul statistic se situeaz n regiunile de respingere, ipoteza
de nul este respins.
2:. ,ecizia statistic trebuie eprimat n contetul problemei.
n ultimii ani, odat cu dezvoltarea programelor statistice, perspectiva valorii0p a devenit tot mai
acceptat. Valoarea0p este probabilitatea de a obine un test statistic egal sau dincolo de rezultatul obinut din
eantion n condiiile n care ipoteza nul, h
:
, ar fi adevrat. ValoareaBp este numit i nivelul observat de
semnificaie, care este cea mai mic valoare la care h
:
poate fi respins. ,ecizia pentru respingerea lui h
:
din perspectiva valorii0p este luat astfel/
0 dac valoarea0p este mai mare sau egal cu m, ipoteza nul nu este respins.
0 dac valoarea0p este mai mic dec"t m, ipoteza nul este respins.
(entru a nelege perspectiva valorii0p, s relum eemplul cu cerealele. S0a testat faptul dac media
greutii cutiilor cu cereale este 4DEg. ' fost obinut o valoare de V2,N: pentru k, iar ipoteza nul nu a fost
respins deoarece aceast valoare este mai mic dec"t valoarea critic superioar &V2,9D+ i mult mai mare
dec"t valoarea critic inferioar &02,9D+.
(entru utilizarea valorii0p, pentru un test pe dou laturi, trebuie gsit probabilitatea de a obine un
test statistic k care este egal sau mai ndeprtat dec"t V2,N deviaii standard fa de centrul distribuiei
normal standardizate. Cu alte cuvinte, trebuie calculat probabilitatea de a obine o valoare k mai mare dec"t
V2,N: sau o valoare k mai mic dec"t B2,N:. ,in tabelul distribuiei normal standardizate &'nea 2+,
probabilitatea de a obine o valoare a lui k mai mic dec"t B2,N: este de :,:DDE, iar cea de a obine o
probabilitate mai mic dec"t V2,N: este de :,9443. ,e aceea, probabilitatea de a obine o valoare mai mic
dec"t V2,N: este de 20:,9443 O :,:DDE. 'stfel, valoarea0p pentru un test pe dou laturi este :,:DDE V :,:DDE
O :,244D &>ig. 8.5.+.
9i%. 1.6. -sirea valoriiJp pentru un test pe dou laturi
8E
1nterpretarea rezultatului/ probabilitatea de a obine un rezultat egal sau mai ndeprtat dec"t cel
observat este de :,244D. ,eoarece :,244D este mai mare dec"t m O :,:N, ipoteza de nul nu poate fi respins.
Ke%tura dintre estimarea intervalului de ncredere i testarea ipotezelor
n acest capitol i n cel anterior au fost discutate dou componente ma%ore ale statisticii infereniale/
estimarea intervalului de ncredere i testarea ipotezelor. ,ei ambele teme se bazeaz pe acelai set de
concepte, ele sunt utilizate n scopuri diferite. 1ntervalele de ncredere sunt utilizate pentru a estima
parametrii, iar testarea ipotezelor se face cu scopul de a lua decizii despre anumite valori ale parametrilor
populaiei.
n eemplul cu cerealele, n loc s testm ipoteza de nul c T O 4DEg, putem a%unge la aceeai
concluzie prin estimarea intervalului de ncredere al lui T. ,ac valoarea de 4DEg se situeaz n acest
interval, ipoteza de nul nu poate fi respins, deoarece 4DE nu este o valoare anormal. (e de alt parte, dac
valoarea pentru care se face ipoteza nu se situeaz n intervalul de ncredere, ipoteza de nul este respins,
deoarece 4DE este considerat o valoare ecentric.
$tiliz"nd ecuaia pentru calcularea intervalului de ncredere din capitolul anterior,
n
" X

pentru n O 3N, X O 483,Ng, c O 2Ng i pentru un interval de ncredere de 9NR &care corespunde unui nivel
de semnificaie de :,:N+
EE , N N , 483
3N
2N
9D , 2 N , 483 =
4E , 48E D3 , 4DD
89
Pai n determinarea valoriiJp
2. Se emite ipoteza de nul, h
:
.
3. Se emite ipoteza de lucru, h
2
.
4. Se alege nivelul de semnificaie, m.
5. Se alege mrimea eantionului, n.
N. Se alege testul statistic corespunztor.
D. Se colecteaz datele i se calculeaz valorile corespunztoare testului statistic.
8. Se calculeaz valoarea0p pe baza testului statistic. 'cest lucru implic/
a. Arasarea distribuiei bazate pe ipoteza de nul, h
:
.
b. (lasarea testului statistic pe aa orizontal.
c. haurarea ariei corespunztoare de sub curb, pe baza ipotezei de lucru, h
2
.
E. Se compar valoare0p cu m.
9. Se ia decizia statistic. ,ac valoarea0p este mai mare sau egal cu m, ipoteza de nul nu este
respins. ,ac valoarea0p este mai mic dec"t m, ipoteza de nul este respins.
2:. Se eprim decizia statistic n contetul problemei.
,eoarece intervalul de ncredere include valoarea pentru care s0a fcut ipoteza &4DEg+, ipoteza de nul
nu poate fi respins. Eist prea puine dovezi pentru a concluziona c greutatea medie a cutiilor este diferit
de 4DEg. 'dic am a%uns la aceeai decizie ca i n cazul utilizrii metodologiei testrii ipotezelor.
1.,. este pe o sin%ur latur
("n acum, metodologia de testare a ipotezelor a fost utilizat pentru a eamina dac media
populaiei este egal cu cea specificat n ipoteza de nul. 1poteza de lucru conine dou posibiliti/ meid
apoate fi mai mic sau mai mare dec"t cea specificat. ,in acest motiv, regiunea de respingere este mprit
n dou pri. Aotui, n unele situaii, ipoteza de lucru se concentreaz pe o anumit direcie. 1poteza de
lucru h
2
/ TZ T
:
se aplic atunci c"nd se dorete detectarea faptului dac T este mai mare dec"t o anumit
valoare T
:
, iar ipoteza de lucru h
2
/ TY T
:
se aplic atunci c"nd se dorete detectarea faptului dac T este mai
mic dec"t o anumit valoare T
:
.
1potezele de lucru h
2
/ TZ T
:
i h
2
/ TY T
:
sunt numite ipoteze pe o singur latur sau direcionate. $n
astfel de test este aplicat atunci c"nd cercettorul prezice o deviaie de la h
:
ntr0o anumit direcie. (rin
contrast, testele pe dou laturi, h
2
/ Te T
:,
se aplic atunci c"nd cercettorul dorete s detecteze orice tip de
deviaie a lui T de la T
:
. 'legerea ntre cele dou tipuri de teste se face nainte de analizarea datelor.
E$emplu
S presupunem c o firm de prelucrarea laptelui este interesat dac cei care o aprovizioneaz cu
lapte adaug ap, pentru a crete astfel cantitatea v"ndut. Se tie faptul c eesul de ap reduce temperatura
de ng.e a laptelui. (unctul de ng.e al laptelui natural este normal distribuit, cu o medie de B:,N5NoC.
,eviaia standard a temperaturii de ng.e a laptelui este cunoscut ca fiind de :,::EoC. ,eoarece firma de
prelucrare a laptelui este interesat doar n determinarea faptului dac temperatura de ng.e a laptelui este
mai mic dec"t cea a laptelui natural, ntreaga regiune de respingere este concentrat pe latura inferioar a
distribuiei.
1poteza de nul i ipoteza de lucru sunt urmtoarele/
h
:
/ T g 0:,N5NoC
h
2
/ TY 0:,N5NoC
!egiunea de respingere este situat n ntregime pe latura inferioar a distribuiei, geoarece se dorete
respingerea ipotezei de nul doar c"nd media eantionului este semnificativ mai mic dec"t 0:,N5NoC.
,ac se alege un nivel de seminifcaie, m, de :,:N, valoarea critic a lui k trebuie s fie negativ. 'a
dup cum se vede din >igura 8.N., deoarece ntreaga arie de respingere de :,:N se gsete n partea inferioar
a distribuiei, valoarea critic a lui k este de B2,D5N, adic media dintre B2,D5 i B2,DN. ,ecizia este de a
repinge h
:
dac k Y B2,D5N. 'ltfe, h
:
nu poate fi respins.
E:
9i%. 1.D. estarea unei ipoteze pe o sin%ur latur
n situaia noastr, pentru n O 3N, X O 0:,NN:oC i c O :,::EoC
23N , 4
3N
::E , :
+ N5N , : & NN: , :
=

=

=
n
X
"

,eoarece k O 04,23N Y B2,D5N, h


:
, trebuie respins. Concluzia este c sunt dovezi c temperatura
medie de ng.e este mai mic dec"t 0:,N5NoC. ,rept consecin, firma ar trebui s nceap o investigaie cu
privire la practicile companiei care o aprovizioneaz cu lapte.
(entru a obine valoarea0p, trebuie calculat probabilitatea de a obine o valoare a lui k mai mic
dec"t testul statistic de B4,23N. 'ceast valoare este de :,:::9. ,eoarece valoarea0p este mai mic dec"t
nivelul de seminificaie stabilit &m O :,:N+, ipoteza de nul este respins.
1.6. estul t pentru medie. atunci c:nd deviaia standard este necunoscut
n cele mai multe situaii n care se testeaz ipoteze, deviaia standard a populaiei, c, este
necunoscut. 'stfel, deviaia standard a populaiei este estimat prin calcularea lui S, deviaia standard a
eantionului. ,ac se presupune c populaia este normal distribuit, distribuia mediei eantioanelor
urmeaz &aa cum am artat n capitolul anterior+ distribuia t, cu n02 grade de libertate. Aestul statistic t
pentru determinarea diferenei dintre media eantionului, X , i media populaiei, T, atunci c"nd se cunoate
deviaia standard a eantionului, S, este dat de urmtoarea ecuaie/
E2
n
S
X
t

=
n care testul statistic t urmeaz o distribuie t cu n02 grade de libertate.
S presupunem c o firm umrete cu atenie v"nzrile pe care le face. ,epartamentul de audit al
firmei etrage lunar un eantion de facturi. n ultimii ani, valoarea medie a facturilor a fost de 23: de lei.
$rmtoarele date reprezint sumele dintr0un eantion aleator de 23 facturi/
2:E,9E 2N3,33 222,5N 22:,N9 238,5D 2:8,3D 94,43 92,98 22,ND 8N,82 23E,NE 24N,22
,eoarece departamentul de audit este interesat dac apare vreo [Link] n valoarea medie a
facturilor emise de ctre firm fa de media lunar de 23: de lei din ultimii ani, indiferent de direcia
[Link], se utilizeaz un test pe dou laturi pentru urmtoarea ipotez de nul i ipotez de lucru/
h
:
/ T O 23: lei
h
2
/ T e 23: lei
Perspectiva valorii critice
(entru un eantion de mrime n, testul statistic t are o distribuie t cu n02 grade de libertate. ,eoarece
ipoteza de lucru nu este direcionat, aria de respingere este mprit n dou, :,:3N pe latura inferioar i
:,:3N pe cea superioar &>ig. 8.D.+.,ac se alege un nivel de semnificaie m O :,:N, valoarea critic a
distribuiei t cu 2302 O 22 grade de libertate poate fi obinut din tabelul 'neei 3 i ea este de [3,[Link].
,ecizia este de a respinge h
:
dac t Y 0 t
22
O 03,[Link] sau t Z t
22
O V3,[Link], altfel h
:
nu poate fi
respins.
,in datele eantionului se pot calcula
EN , 223
2
= =

=
n
X
X
n
i
i
E: , 3:
2
+ &
2
3
=

=
n
X X
S
n
i
i
n aceast situaie, valoarea parametrului t este
29 , 2
23
E: , 3:
23: EN , 223
=

=
n
S
X
t

E3
9i%. 1./. estarea unie ipoteze la 0.0D nivel de semnificaie. pentru 11 %rade de li!ertate
,eoarece t O 02,29 se situeaz n regiunea de nerespingere dintre valorile critice t
22
O [3,[Link], ipoteza
nul nu poate fi respins. ;u eist suficiente dovezi pentru a crede c media lunar a facturilor s0a
modificat fa de ceea ce era pe termen lung, adic de 23: leiJ diferena observat este nesemnificativ i se
poate datora unui accident.
Perspectiva valoriiJp
n aceast situaie, valoarea0p poate fi calculat doar cu a%utorul unui program specializat de statistic
i ea este de :,3D pentru un test pe dou laturi. ,eoarece valoarea0p, sau nivelul observat de semnificaie,
este mai mare dec"t nivelul de semnificaie, m, ipoteza de nul, h
:
, nu poate fi respins. ,ac ipoteza nul ar
fi fost adevrat, probabilitatea ca media eantionului s difere de 23: de lei este de :,3D. ,eci
departamentul de audit nu are de fcut nici o recomandare ctre conducerea firmei n privina modificrii
politicii de v"nzri.
1.D. estul E pentru proporie
n unele situaii se dorete testarea unei ipoteze despre o anumit proporie ntr0o populaie, p, i nu
despre o medie a populaiei respective. n aceast situaie se etrage un eantion aleator din cadrul
E4
populaiei, ceea ce ne permite s calculm proporia eantionului,
n
X
e
p =
. Valoarea acestei informaii
statistice este comparat cu cea pentru care se face ipoteza, p, astfel nc"t s se poat lua o decizie n privina
ipotezei.
,ac numrul de succese, #, i numrul de eecuri, n B #, sunt cel puin N, fiecare dintre ele,
distribuia eantioanelor proporiei are o distribuie care se apropie de cea normal standardizat. estul E
pentru proporie este dat de urmtoarea ecuaie/
n
p p
p p
"
e
+ 2 &

=
unde
n
X
p
e
=
, adic proporia succeselor din eantion
iar p O proporia de succese din populaie pentru care se face ipoteza.
,ac se fac nlocuirile, testul k poate fi scris i funcie de numrul de succese/
+ 2 & np np
np X
"

=
S presupunem c se dorete un rspuns la urmtoarea problem de cercetare/ H>irmele mici sunt
deinute n proporie egal de femei i de brbaiQI. Se etrage un eantion de E99 de firme mici, 4D9 dintre
acestea fiind deinute de ctre femei. n termeni de proporie, ipoteza nul i ipoteza de lucru pot fi scrise
astfel/
h
:
/ p O :,N &adic proporia de firme mici deinute de femei este de :,N+
h
2
/ p e :,N &adic proporia de firme mici deinute de femei este diferit de :,N+
Perspectiva valorii critice
,eoarece suntem interesai dac proporia firmelor mici deinute de femei este de :,N &i deci
proporia celor deinute de brbai este de :,N+, va fi utilizat un test pe dou laturi. ,ac se alege un nivel de
semnificaie m O :,:N, regiunile de respingere i de nerespingere apar ca n figura 8.8. ,ecizia va fi de a
respinge h
:
dac k Y 02,9D sau k Z V2,9D, altfel h
:
neput"nd fi respins.
,in datele culese,
52:5D , :
E99
4D9
= = =
n
X
p
e
'tunci, testul k va fi/
48 , N
:2D8 , :
:E9N5 , :
E99
+ N , : 2 & N , :
N , : 52:5D , :
+ 2 &
=

=
n
p p
p p
"
e
E5
9i%. 1.1. estarea unei ipoteze pe dou laturi pentru proporie. la un nivel de semnificaie de 0.0D
,eoarece BN,48 Y 02,9D, ipoteza nul, h
:
, trebuie respins. ,eci sunt dovezi c proporia firmelor
mici deinute de femei nu este :,N.
Perspectiva valoriiJp
(robabilitatea de a obine o valoare a lui k dincolo de BN,48 sau VN,48 este practic : &valoarea
maim din tabelul 'neei 2, pentru un k O 4,9 este de :,::::N+. Cu a%utorul unui program de statistic,
aceast valoare este gsit ca fiind :,:::::::89:D5. ,eoarece aceast valoare este mult mai mic dec"t
nivelul selectat de semnificaie &m O :,:N+, ipoteza nul este respins. Valoarea etrem de mic a valorii0p
arat c practic nu este nici o ans de a obine o proporie a unui eantion de :,52:5D dac adevrata medie
a populiei ar fi :,N.
E$erciii
2. ,ac n testarea unei ipoteze &test pe dou laturi+ se utilizeaz un nivel de semnificaie de :,:N, ce se va
decide dac valoarea calculat a testului k este V3,32Q
3. ,ac n testarea unei ipoteze &test pe dou laturi+ se utilizeaz un nivel de semnificaie de :,:2, ce se va
decide n privina ipotezei de nul dac T O 23,N i se utilizeaz testul kQ
4. Se presupune c n testarea unei ipoteze, valoarea testului statistic k este V3,:. Care este valoarea0pQ
5. $n [Link] realizeaz un eperiment pe un eantion de 59 de copii dintr0o coal. Valoare medie a
coeficientului de inteligen pentru copiii din eantion este de 2:4. Consider"nd c valoarea
EN
coeficeintului de inteligen la nivel naional este de 2::, cu o deviaie standard de 25, este posibil ca
media copiilor din acea coal s fie tot 2::Q
a. Enunai ipoteza de nul i ipoteza de lucru.
b. Calculai k i p.
c. Guai o decizie referitor la h
:
, dac m O :,:N.
d. Construii un interval de ncredere de 9NR pentru T i comparai rezultatul cu cel de la punctul c.
e. Care ar fi concluzia dac m O :,3, m O :,2 sau m O :,:2. ,e ce m O :,3 nu se utilizeaz de obicei n
practic.
N. $n director al unei fabrici de stof trebuie s determine dac un utila% nou [Link] produce un
anumit tip de stof, n conformitate cu specificaiile productorului/ adic stofa s aib o rezisten la
rupere de 8: 7g, cu o deviaie standard de 4,N 7g. Este etras un eantion de 59 de buci de stof, din
care rezult c rezistana la rupere este de D9,2 7g.
a. Enunai ipoteza de nul i ipoteza de lucru.
b. Eist suficiente dovezi c utila%ul nu ndeplinete specificaiile productoruluiQ &utilizai un nivel
de semnificaie de :,:N+
c. Calculai valoarea0p i interpretai rezultatul ei.
d. Care ar fi rspunsul la punctul b dac deviaia standard ar fi 2,8N 7g.
e. Care ar fi rspunsul la punctul b dac media eantionului ar fi de D9 7g iar deviaia standard 4,N 7gQ
D. Se presupune c n testarea unei ipoteze pe o singur latur, unde trebuie respins doar latura superioar,
valoarea testului statistic k este V3,:. Care este valoarea0pQ
8. Se presupune c n testarea unei ipoteze pe o singur latur, unde trebuie respins doar latura inferioar,
valoarea testului statistic k este B2,4E. Care este valoarea0pQ
E. F companie metalurgic fabric bare de oel. ,ac procesul de producie este corespunztor, lungimea
barelor trebuie s fie de cel puin 3,E metri i cu o deviaie standard de :,3m. <arele mai lungi pot fi
folosite sau pot fi scurtate, ns barele mai scurte trebuie s fie retopite. ,e pe banda de fabricaie este
selectat un eantion de 3N de bare. Gungimea medie a barelor din eantion este de 3,84m. Compania
vrea s determine dac [Link] su necesit regla%e.
a. Enunai ipoteza nul i ipoteza de lucru
b. ,ac se dorete testarea ipotezei la un nivel de semnificaie de :,:N, care ar fi decizia luat dac se
utilizeaz perspectiva valorii criticeQ
c. ,ac se dorete testarea ipotezei la un nivel de semnificaie de :,:N, care ar fi decizia luat dac se
utilizeaz perspectiva valorii0pQ
d. 1nterpretai nelesul valorii0p n aceast problem.
ED
e. Comparai concluziile de la punctele b i c.
9. $n director al unei fabrici de stof trebuie s determine dac un utila% nou [Link] produce un
anumit tip de stof, n conformitate cu specificaiile productorului/ adic stofa s aib o rezisten la
rupere de 8: 7g, cu o deviaie standard de 4,N 7g. ,irectorul este ngri%orat de faptul c dac rezistena
la rupere este de fapt mai mic dec"t 8: de 7g, firma va trebui s fac fa multor reclamaii. Este
etras un eantion de 59 de buci de stof, din care rezult c rezistana la rupere este de D9,2 7g.
a. Enunai ipoteza de nul i ipoteza de lucru.
b. Eist suficiente dovezi c rezistena medie la rupere este mai mic dec"t 8: de 7gQ
&utilizai un nivel de semnificaie de :,:N+
c. Calculai valoarea0p i interpretai rezultatul ei.
d. Comparai rezultatele de la punctul b i c.
2:. ,ac dintr0un eantion de n O 2D elemente, etras dintr0o populaie normal distribuit, media
eantionului este X O ND, iar deviaia standard a eantionului este S O 23, care este valoarea testului t,
dac se testeaz o ipotez nul h
:
, care afirm c T O N:Q
22. (rorectorul responsabil cu admiterea al unei universiti dorete s i sftuiasc pe prinii viitorilor
studeni n legtur cu costul crilor i altor materiale didactice de pe parcursul unui semestru. Este
etras un eantion de 2:: de studeni, care [Link] pe cri, n medie 42N,5 lei, cu o deviaie standard
de 54,3: lei.
a. $tiliz"nd un nivel de semnificaie de :,2, sunt suficiente dovezi pentru a afirma media populaiei
este de peste 4:: de leiQ
b. Care ar fi rspunsul la punctul a dac deviaia standard ar fi de 8N lei, iar nivelul de semnificaie de
:,:NQ
c. Care ar fi rspunsul la punctul a dac media eantionului ar fi de 4:N,22 lei, iar deviaia standard de
54,3: leiQ
23. $n productor de baterii etrage un eantion de 24 baterii de pe banda de producie i le utilizez p"n
c"nd acestea se consum total. Aimpul de via, n ore, al bateriilor din eantion este urmtorul/
453 53D 428 N5N 3D5 5N2 2:59 D42 N23 3DD 593 ND3 39E
a. Ga un nivel de semnificaie de :,:N, eist dovezi durata medie de via a bateriilor este mai mare
de 5:: de oreQ
b. Ce sfat i0ai da productorului dac acesta ar vrea s afirme n reclam c Hbateriile rezist mai
mult de 5:: de oreIQ
c. ,ac prima cifr din ir ar fi 2453 n loc de 453, care ar fi rspunsurile la punctele anterioareQ
Comentai diferena de rezultat.
E8
24. Eist dovezi pentru a afirma c %umtate dintre anga%aii din !om"nia au acces la internet
la locul de muncQ F [Link] efectuat pe un eantion de [Link] de anga%ai indic faptul c 55: dintre
acetia au acces la internet.
a. ,ac este ales un nivel de semnificaie de :,:N, sunt dovezi pentru a afirma ca mai puin de
%umtate dintre anga%ai au acces la internet la locul de muncQ
b. Calculai valoarea0p i interpretai0o.
25. ,irectorul de personal al unei companii de asigurri este interesat de a reduce rata
HmortalitiiI agenilor n primul lor an de la anga%are. ,atele din anii precedeni indic faptul c 3NR
dintre noii anga%ai renun la locul de munc n primul an. $n nou program de pregtire este lansat
pentru pregtirea unui eantion de 2N: de noi anga%ai. Ga sf"ritul primului an de slu%b, 39 dintre cei
2N: care au urmat cursul prsiser compania.
a. Ga un nivel de semnificaie de :,:2, sunt dovezi pentru a afirma c proporia celor care
abandoneaz firma este mai mic de 3NRQ
b. Calculai valoarea0p i interpretai0o.
c. Care ar fi rspunsul la punctul a dac numrul celor care au prsit compania ar fi de 33Q
d. Calculai valoarea0p, pentru punctul c, i interpretai0o.
EE
5ne$a 1
'ria de sub curba normal de la 0i la k
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
------------------------------------------------------------------------------
-3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
-3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
-2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
-1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641

E9

'ria de sub curba normal de la 0i la k

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
------------------------------------------------------------------------------
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
9:
Anexa 2 Valorile critice ale lui t
aria din latura
%r. de sup.
li!ertate
:,3N :,2: :,:N :,:3N :,:2 :,::N
1 2.::: 4.:888 D.424E 23.8:D3 42.E3:8 D4.DND5
# :.E2DN [Link] 3.93:: 5.4:38 D.9D5D 9.935E
, :.8D59 2.D488 3.4N45 4.2E35 5.N5:8 N.E5:9
6 :.85:8 2.N443 3.242E 3.88D5 4.85D9 5.D:52
D :.83D8 2.58N9 3.:2N: 3.N8:D 4.4D59 5.:433
/ :.828D 2.549E 2.9543 3.55D9 4.2538 4.8:85
1 :.8222 2.5259 2.E95D 3.4D5D 3.99E: 4.599N
2 :.8:D5 2.49DE 2.EN9N 3.[Link] 3.E9DN 4.4NN5
F :.8:38 2.4E4: 2.E442 3.3D33 3.E325 4.359E
10 :.D99E 2.4833 2.E23N 3.33E2 3.8D4E 4.2D94
11 :.D985 2.4D45 2.89N9 3.[Link] 3.82E2 4.2:NE
1# :.D9NN 2.4ND3 2.8E34 3.28EE 3.DE2: 4.:N5N
1, :.D94E 2.4N:3 2.88:9 3.2D:5 [Link] 4.:234
16 :.D935 2.45N: 2.8D24 3.255E 3.D35N 3.98DE
1D :.D923 2.45:D 2.8N42 3.242N 3.D:3N 3.95D8
1/ :.D9:2 2.44DE 2.85N9 3.2299 3.NE4N 3.93:E
11 :.DE93 2.4445 2.849D 3.2:9E 3.NDD9 3.E9E3
12 :.DEE5 2.44:5 2.8452 3.2::9 3.NN35 3.E8E5
1F :.DE8D 2.4388 2.8392 3.:94: 3.N49N [Link]
#0 :.DE8: 2.43N4 2.8358 3.:ED: 3.N3E: 3.E5N4
#1 :.DED5 2.4343 2.83:8 3.:89D 3.N288 3.E425
## :.DENE 2.4323 2.8282 3.:849 3.N:E4 3.E2EE
#, :.DEN4 2.429N 2.8249 3.:DE8 3.5999 3.E:84
#6 :.DE5E 2.428E 2.82:9 3.:D49 3.5933 3.89D9
#D :.DE55 2.42D4 2.8:E2 3.:N9N 3.5EN2 3.8E85
#/ :.DE5: 2.42N: 2.8:ND 3.:NNN 3.58ED 3.88E8
#1 :.DE48 2.4248 2.8:44 3.:N2E 3.5838 3.88:8
#2 :.DE45 2.423N 2.8:22 3.:5E5 3.5D82 3.8D44
#F :.DE4: 2.4225 2.D992 3.:5N3 3.5D3: 3.8ND5
,0 :.DE3E 2.42:5 2.D984 3.:534 3.5N84 3.8N::
,D :,DE2D 2,4:D3 2,DE9D 3,:4:2 3,5488 3,834E
60 :.DE:8 2.4:42 2.DE49 3.:322 3.5344 3.8:5N
6D :,DE:: 2,4::D 2,D895 3,:252 3,5232 3,DE9D
D0 :.D895 2.39E8 2.D8N9 3.::ED 3.5:44 3.D88E
/0 :.D8ED 2.39NE 2.D8:D 3.:::4 3.49:2 [Link]
10 :,D8E: 2,394E 2,DDD9 2,9955 3,4E:E 3,D589
20 :.D88D 2.3933 2.DD52 2.99:2 3.4849 3.D4E8
F0 :,D883 2,392: 2,DD3: 2,9ED8 3,4DEN 3,D42D
100 :.D88: 2.39:2 [Link] 2.9E5: 3.4D53 3.D3N9
1#0 :.D8DN 2.3EED 2.DN88 2.9899 3.4N8E 3.D285
92
:.D85N 2.3E2D 2.D559 2.9D:: 3.43D4 3.N8NE
93

S-ar putea să vă placă și