Sunteți pe pagina 1din 9

LUCRAREA 4 Utilizarea funcțiilor de repartiție.

Tema: Având funcțiile de repartiție continue:


- să se calculeze utilizând software-ul de specialitate Excel, parametrii funcțiilor de repartiție
continue pentru fiecare aplicație data;
- să se verifice rezultatele obținute in urma calculelor matematice a valorilor parametrilor funcțiilor
de repartiție continue utilizând tabelele de specialitate, Anexele A-D.

Aplicația1. Repartiția normală


1.1. Pentru repartiția normală cu un risc unilateral dreapta se da valoarea lui zα=1,58. Se cere să
se determine riscul.
1- Utilizând funcțiile oferite de software-ul Excel, calculul riscului α presupune:
=NORMSDIST(1.58), obținând valoarea nivelului de semnificație 1-α: 0.94295, valoare ce va
ocupa in continuare adresa E2 in cadrul raportului Excel;
Deoarece ne interesează riscul α, (şi nu valoarea nivelului de semnificație), este necesară
efectuarea calculului: α=1-(1-α), adică =1-E2, obținând valoarea: 0.05705, riscul α= 5,71%
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv utilizând
tabelul repartiției normale, Anexa A,
- nivelul de semnificație găsit este: 1-α = 0,9429 = 94,29%;

- riscul: α = 0,0571 = 5,71%;


Se observă astfel că valorile tabelare sunt aceleași cu valorile calculate, deci calculația este
corectă.

1.2. Pentru repartiția normală cu un risc unilateral dreapta se da valoarea nivelului de semnificație
1-α=95%. Se cere determinarea limitei zα.
1- Utilizând funcțiile oferite de software-ul Excel, vom avea: =NORMSINV(0.95), obținând valoarea
limitei: 1.6449, valoare ce va ocupa in continuare adresa E3 in cadrul raportului Excel;
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv
utilizând tabelul repartiției normale, Anexa A. Valorile cele mai apropiate de nivelul de semnificație
sunt: 1-α=0,9495=94,95%, valoare căreia îi corespunde limita: zα=1,64 și 1-α =0,9505=95,05%,
valoare căreia îi corespunde limita: zα=1,65.
Deoarece valoarea 95% se afla in mijlocul intervalului [0,9495 – 0,9505), rezultă că limita zα este: z
α=1,645, valoare ce se regăsește in calculele matematice efectuate anterior.

1.3. Pentru repartiția normală cu un risc bilateral simetric de 5%, se cere determinarea intervalului
de semnificație.
1- Utilizând funcțiile oferite de software-ul Excel, şi ținând cont de faptul ca riscul este de aceasta
data bilateral simetric (α=5%; α/2=2.5%), vom avea: =NORMSINV(0.975), obținând valoarea
limitei: zα/2=1.96; deoarece funcția de repartiție normală este simetrică, valoarea limitei de stânga
va fii: -zα/2= -1.96.
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv utilizând
tabelul repartiției normale, Anexa A, astfel:

1
- nivelul de semnificație pentru care trebuie determinată limita din dreapta zα/2 este: 1-α
=95%,+2.5%=97.5%
Valorile tabelare cele mai apropiate de nivelul de semnificație sunt: 1-α=0,9744=97,44% având

limita: zα/2=1,96 și: 1-α=0,9756=97,56% având limita: zα/2=1,97


Deoarece valoarea 97.5% se afla in mijlocul intervalului [0,9744 – 0,9756), rezultă că valoarea
limitei zα/2 este: zα/2=1,96(5). Simetrica funcției ne conduce la determinarea limitei de stânga: -zα/2=-
1,96(5), valorile obținute regăsindu-se în calculele matematice anterioare.

Aplicatia2. Repartiția X 2 (chi)


2.1. Pentru repartiția X 2 cu un risc unilateral dreapta se da valoarea lui X 2 =13,362, și numărul
gradelor de libertate ν=8. Se cere determinarea riscului.
1- Utilizând funcțiile oferite de software-ul Excel, vom avea: =CHIDIST(13.362;8), obținând
valoarea riscului: α=0.1000.
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv utilizând
tabelul repartiției X 2 , Anexa B. Valoarea riscului pentru valorile X 2 =13,362, și ν=8 este: α
=0.10=10%, valoare pe care am obținut-o și cu ajutorul calculelor matematice anterioare.

2.2. Pentru repartiția X 2 cu un risc unilateral dreapta, se da valoarea nivelului de semnificație 1-α
=95% și numărul gradelor de libertate ν=10. Se cere determinarea limitei X 2

1- Utilizând funcțiile oferite de software-ul Excel, şi având valoarea nivelului de semnificație 1-α
=95% , respectiv valoarea riscului α=5%, vom avea: =CHIINV(0.05;10), obținând valoarea limitei:
X 2 =18.3070.
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv utilizând
tabelul repartiției X 2 , Anexa B. Pentru valoarea riscului α=5% şi ν=10, din tabelul repartiției
valoarea limitei X 2 este: X 2 =18.3070. Valoare obținută şi prin calculele matematice.

2.3. Pentru repartiția X 2 cu un risc bilateral simetric de 5%, se cere determinarea intervalului
de semnificație pentru ν=15 grade de libertate.

1- Având de aceasta data un risc bilateral simetric α=5% (1-α= 95%), respectiv valoarea riscului

α/2=2.5%,=0.025. Pentru a obține valoarea limitei din dreapta a intervalului de semnificație, se


2
aplica formula: =CHIINV(0.025,15), obținând valoarea limitei (din dreapta): X  /2 =27.4884. Pentru
a determina valoarea limitei din stânga, deoarece valoarea nivelului de semnificație este: 1-α=
100%-2.5%=97.5%, de aceasta data funcția aplicată este: =CHIINV(0.975;15), obținând valoarea
limitei (din stânga): X 12 /2 =6.2621
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv utilizând
tabelul repartiției X 2 , Anexa B. Pentru valoarea riscului bilateral simetric α=5% , din tabelul
repartiției valorile limitei sunt:

2
Pentru α/2=2.5%,=0.025 şi ν=15, limita la dreapta este: X 2 /2 =27.488;

Pentru 1-α/2=100%-2.5%,=97.5%=0.975 şi ν=15, limita la stânga este: X 12 /2 =6.262;


Valori obținute şi în cazul calculelor matematice, anterioare.

Aplicația 3. Repartiția Student

3.1. Pentru repartiția Student cu un risc unilateral dreapta se da valoarea lui tα=1,812, și ν=10
grade de libertate. Se cere să se determine riscul.
1- Utilizând funcțiile oferite de software-ul Excel, şi având valoarea limitei tα=1,812, respectiv
valoarea numărului gradelor de libertate: ν=10, pentru a determina valoarea riscului, vom avea:

=TDIST(1.812;8;1), obținând valoarea riscului α=0.0538. Parametrii funcției sunt: valoarea limitei tα

=1,812, valoarea numărului gradelor de libertate ν=10 şi o valoare ce descrie tipul funcției de
repartiție şi anume:
1- în cazul repartiției Student cu risc unilateral, respectiv valoarea
2- în cazul repartiției Student cu risc bilateral.
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv utilizând
tabelul repartiției Student, Anexa C. Pentru valoarea limitei tα=1,812 respectiv valoarea numărului
gradelor de libertate: ν=10, din tabelul repartiției valoarea riscului α este: α=0.05= 5%, valoare care
se regăsește in rezultatele anterioare.
Observație: în acest caz tabelul se citește de jos in sus.

3.2. Pentru repartiția Student cu un risc unilateral dreapta de α=10% si ν=15 grade de libertate, se
cere determinarea limitei tα.
1- Utilizând funcțiile oferite de software-ul Excel, şi având valoarea riscului α=10%, respectiv ν=10,
pentru a determina valoarea limitei se aplica formula: =TINV(0.2;15), obținând valoarea limitei: tα
=1.3406 (cu observația: in cazul repartiției cu risc unilateral, pentru determinarea limitei intervalului
de semnificație, valoarea riscului luată în calcul se dublează, deoarece funcția implementată este
pentru calculul limitelor repartiției bilaterale).
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv utilizând
tabelul repartiției Student, Anexa C. Pentru valoarea riscului α=10%, respectiv ν=15, din tabelul
repartiției valoarea limitei tα care se găsește, este: tα=1.341, valoare ce se regăsește mai sus.
3.3. Pentru repartiția Student cu un risc bilateral simetric de 10% si ν=20 grade de libertate,
se cere determinarea limitelor intervalului de semnificație.
1- Utilizând funcțiile oferite de software-ul Excel, având de aceasta data un risc bilateral
simetric α=10%, (α/2=5%), respectiv valoarea numărului gradelor de libertate: ν=20,
pentru a determina valorile limitei intervalului de semnificație, se aplica formula:
=TINV(0.05;20), obținând valoarea limitei (din dreapta): tα/2=2.0860. Riscul fiind bilateral simetric,
valoarea limitei din stânga va fii: -tα/2= -2.0860
2- Verificarea valorilor obținute se va realiza utilizând tabelele de specialitate, respectiv utilizând
tabelul repartiției Student, Anexa C. Pentru valoarea riscului bilateral simetric, α=10%, respectiv ν
=20, din tabelul repartiției valoarea limitei (din dreapta) tα/2 care se găsește, este: tα/2=2.086

3
Funcția de repartiție Student este simetrică, ceea ce ne conduce la determinarea limitei din stânga:
-tα/2= -2.086, valori care se regăsesc in rezultatele calculelor matematice anterioare.
Observație: in acest caz tabelul se citește de sus in jos.

Tema 1:. Pentru a caracteriza precizia unei mașini care produce hârtie de ziar în ceea ce privește
gramajul, interesează mai ales dacă dispersia 2 este tipică pentru mașina respectivă, deci dacă
în condiții normale ea este aceeași. De aceea trebuie să se studieze dispersia gramajului pentru
mai multe suluri de hârtie produse în schimburi și zile diferite.
S-au considerat 12 astfel de selecții. Din suluri produse în schimburi și zile diferite s-a luat
câte o bandă de hârtie având o lungime de 40 metri. Din metru în metru, de la mijlocul bandei, s-au
luat probe pentru determinarea gramajului. Rezultatele s-au trecut în fișa alăturată.

Să se elimine eventualele dispersii de selecție care diferă semnificativ de celelalte și să se


estimeze dispersia generală a gramajului  .
2

Rezolvare: 1.1 Se inserează în foaia Excel tabelul de mai sus. Se întocmește tabelul de mai jos:

Sel.
1 2 3 4 5 6 7 8 9 10 11 12

xi
s i2
fi

4
n

x ij
j 1
Se calculează mediile de selecție, date de relația: x i  . Se va utiliza funcția Excel AVERAGE.
n
În prima căsuță se scrie =AVERAGE(B7:B46), în următoarele se aplică aceeași funcție pentru
coloanele C până la M, ce cuprind datele corespunzătoare selecțiilor 2 – 12.

Sel.
1 2 3 4 5 6 7 8 9 10 11 12

xi 48,825 50,263 49,338 49,388 50,000 49,075 46,613 49,938 51,075 49,513 51,388 50,663

s i2
fi

x 
n
2
ij
 xi
j 1
Se calculează dispersiile celor 12 selecții, date de relația: si2  cu funcția Excel
n1
VAR.S. În prima căsuță se scrie =VAR.S(B7:B46), în următoarele se aplică aceeași funcție pentru
coloanele C până la M, ce cuprind datele corespunzătoare selecțiilor 2 – 12.

Sel.
1 2 3 4 5 6 7 8 9 10 11 12

xi 48,825 50,263 49,338 49,388 50,000 49,075 46,613 49,938 51,075 49,513 51,388 50,663

s i2 1,481 0,897 1,069 0,275 2,962 1,866 0,904 0,823 0,622 1,078 0,442 0,595

fi
Numărul gradelor de libertate pentru fiecare selecție, fi = n -1 este 39.

Sel.
1 2 3 4 5 6 7 8 9 10 11 12

xi 48,825 50,263 49,338 49,388 50,000 49,075 46,613 49,938 51,075 49,513 51,388 50,663

s i2 1,481 0,897 1,069 0,275 2,962 1,866 0,904 0,823 0,622 1,078 0,442 0,595

fi 39 39 39 39 39 39 39 39 39 39 39 39

1.2 Din tabel observăm că cea mai mare dispersie este cea corespunzătoare selecției 5, adică
s5  2,962 . Se calculează statistica de testare c5:
2

2
s5 2,962
c5  k
  0,22758 .
s i
2 13,015
i 1

Pentru 0 ,05 , f = 39 ≈36 și k = 12, din tabelul 4 se găsește c 0 ,05  0,14 .

Deoarece c0,05 = 0,22758 calculat este mai mare decât c 0 ,05  0,14 , dispersia s52  2,962 se exclude.

1.3 Următoarea valoare a dispersiei corespunde selecției 6, s6  1,866 . După eliminarea dispersiei
2

anterioare, se calculează statistica de testare c6,

5
2
s6 1, 866 k

c6  k
  0 ,1856 . În relația anterioară, s i
2
nu mai cuprinde valoarea dispersiei
s i
2 10,053 i 1

i 1
k

eliminate, deci s i
2
 13,015  2,962  10,053 .
i 1

Pentru 0 ,05 , f = 39 ≈36 și k = 11, din tabelul 4 se găsește c 0 ,05 0,15 . Deoarece c0,05 = 0,1856

calculat este mai mare decât c 0 ,05  0,15 , dispersia s6 2  1,866 se exclude.

1.4 Din tabel observăm că cea mai mare dintre dispersiile rămase este cea corespunzătoare
selecției 1, adică s1 2  1,481 .

După eliminarea dispersiei s 6 2 rezultă:  si2  10,053  1,866  8,187 . Se calculează statistica de
i 1

2
s1 1,481
testare c1, c1  k
  0,18089
s i
2 8,187
i 1

Pentru 0 ,05 , f = 39 ≈36 și k = 10, din tabelul 4 se găsește c 0 ,05 0,16 . Deoarece c0,05 = 0,18089

calculat este mai mare decât c 0 ,05  0,16 , dispersia s1 2  1,481 se exclude.

1.5 Din tabel observăm că cea mai mare dintre dispersiile rămase este cea corespunzătoare
selecției 3, adică s32  1,069 . În urma eliminării valorii anterioare s1 2  1,481 , se calculează
k

s i
2
 8,187  1,481  6,706
i 1

2
s1 1,069
c3    0,1594
s2  ...  sk
2 2
6,706

Pentru 0 ,05 , f = 39 ≈36 și k = 9, din tabelul 4 se găsește c 0 ,05 0,18 .

Deoarece c3  0,1594 calculat este mai mic decât c 0 ,05 0,18 , dispersia s 3
2
= 1,069 nu diferă
semnificativ de celelalte dispersii. În concluzie, putem spune că cele 9 dispersii rămase sunt
omogene și ca atare sunt estimații ale uneia și aceleași dispersii generale  2 , care va fi estimată
ca media ponderată a acestora:
k

f  s i i
2

39 9
6,707
s2  i 1
k

9  39
s i
2
  0,745222
f i
i 1 9
i 1

  s  0,745222
2 2

6
Tabelul 4

Tema 2: În tabelul următor sunt date rezultatele obținute de un eșantion de 9 studenți la un test
aplicat pe parcurs, respectiv nota finală la examen.

Nr. de puncte obținute la test Nota la examen


(variabila X) (variabila Y)
230 8
310 10
250 9
310 10
150 7
180 7
80 6
350 10
230 8

1. Să se determine media, mediana, modulul, dispersia de selecție și abaterea medie


pătratică de selecție ale variabilei test, respectiv notă finală;
2. Să se afle dacă rezultatele obținute de cei 9 studenți la testul aplicat pe parcurs au
influențat notele lor finale la examen.
Rezolvare: Introduceți într-o nouă foaie Excel tabelul de date de mai sus. Pentru calculul mediei
folosiți funcția AVERAGE, al medianei funcția MEDIAN, al modulului funcția MODE.SNGL, al
dispersiei de selecție funcția VAR.S și al abaterii medie pătratice de selecție cu funcția STDEV.S.
7
Se determină covarianța cu funcția =COVAR(A2:A10;B2:B10)

Se determină coeficientului de corelație cu funcția CORREL sau PEARSON, din aplicația Excel:
=CORREL(A2:A10;B2:B10), sau =PEARSON(A2:A10;B2:B10).

Dacă valoarea coeficientului de variație este pozitivă, creșterea uneia dintre variabile determină
creșterea celeilalte. Dacă valoarea obținută este negativă, atunci pe măsură ce valorile unui șir
cresc, cele ale celuilalt șir scad. Corelația este cu atât mai puternică cu cât r este mai aproape de
valoarea1.
 pentru | r | < 0,3 corelația este foarte slabă;
 pentru | r | = 0,3÷0,5 corelația este slabă;
 pentru | r | = 0,5÷0,7 corelația este moderată;
 pentru | r | = 0,7÷0,9 corelația este puternică;
 pentru | r | = 0,9÷1 corelația este foarte puternică.
Concluzie: deoarece coeficientul de corelație r  0,974 se poate aprecia că între variabila X = Nr.
puncte obținute la test și variabila Y = Nota la examen există o foarte bună corelație, ceea ce
înseamnă că punctele obținute la testul aplicat pe parcurs au influențat notele finale la examen.

Tema 3. Trebuie să se verifice dacă media m a diametrelor unui lot de piese obținute în aceleași
condiții de producție este m0 = 2,00 mm, știind din cercetări anterioare că abaterea medie pătratică
este σ = 0,03 mm și că distribuția pieselor după diametrul cercetat este una normală. Se vor folosi
datele unei selecții compusă din n = 9 piese.

Rezolvare: Diametrul mediu x al celor 9 produse trebuie să se găsească în intervalul determinat


de următoarea relație:

   
P  m  z /2  x  m  z /2   2    z /2 
 n n

Alegând pentru probabilitatea P valoarea 0,9973, rezultă că   z/2   0,9973 / 2  0, 49865 ; în tabelul
1, ANEXA A, se găsește că pentru valoarea de mai sus, z/2  3 . Limitele intervalului de încredere
corespunzător probabilității P = 0,9973 vor fi:

0,03 0,03
23  1,97mm; 23  2,03mm .
9 9

Tema 4: Pentru a verifica dacă gramajul mediu al unui reper (caracteristică ce urmează legea
normală) produsă la un moment dat este m0=50 g, cu abaterea medie pătratică σ=0,67 g, cât
prevede specificația produsului, se extrage o selecție compusă din n=4 probe. Pentru a putea
afirma pe baza selecției că gramajul mediu este m=m0=50 g, se aplică criteriul de semnificație Z.
Se alege pentru nivelul de semnificație (riscul) valoarea α=0,02.

Rezolvare:

Se calculează limitele intervalului de încredere corespunzător nivelului de semnificație α =0,02:

  
  1  P  m0  z  /2  x  m0  z  /2   1  2    z  /2 
 n n ,

z /2 se determină din relația:

8
1  0,02
0,02  1  2    z /2     z /2    0,49
2 .

Din tabelul 1, ANEXA A, pentru   z/2   0,49 rezultă z/2  2,33 .

 0,67
Limitele intervalului de încredere: m0  z/2  50  2,33  49,22 g / m
2

n 4

 0,67
m0  z /2  50  2,33  50,78 g / m
2

n 4

În cazul în care ipoteza că m=m0=50 g este adevărată, din 100 cazuri (selecții compuse din n=4
probe), în 98 de cazuri media de selecție x se va găsi între 49,22 și 50,78 g și numai în două
cazuri în afara acestor două limite, adică vor fi 2 cazuri din 100 de neacceptare a ipotezei când ea
este justă și spunem că se comite o eroare de speța I (riscul producătorului).

Să presupunem acum că mașina care produce reperul lucrează cu o abatere sistematică   0,5g .

În acest caz media este: m =m1=50+0,5=50,5 g.

m1  m0  0,5 0,5 1
Abaterea sistematică normată este: 1       1,5
  0,67 0,67 0,67
n n 4 2

Se calculează funcția de putere a criteriului:

 m  50,5   1     z  /2  1     z  /2  1   1     2,33  1,5     2,33  1,5  


 1     0,83     3,83   1   0,296731  0,499936   0,203205

Funcția puterii are valoarea  m  50,5   0,203 .

Aceasta înseamnă că dacă luăm un număr de 100 de selecții de mărime n=4, ipoteza falsă
m=m0=50 g se va respinge în 20,3% din cazuri și se va accepta în mod greșit în 79,6% din cazuri;
în aceste cazuri spunem că se comite o eroare de speța II (β = 79,6%).

S-ar putea să vă placă și