Sunteți pe pagina 1din 13

Să se prelucreze statistic un volum de n=25 valori care reprezinta finetea unui fir Nm=34 din

50% bumbac + 50% Poliester, cu valorile intre limitele (32,2-35,5) valori cu o zecimala,
cunoscând g tab = 4 și numărul de clase k=5.

Pasul 1. Se aleg aleatoriu 25 valori cuprinse in intervalul inchis 32,2-35,5

Valoarea a n-a Valoarea


1. 32.5
2. 32.5
3. 35.0
4. 34.0
5. 33.5
6. 34.0
7. 34.5
8. 33.0
9. 34.0
10. 33.3
11. 35.0
12. 35.0
13. 32.5
14. 34.5
15. 32.5
16. 33.5
17. 34.5
18. 34.0
19. 35.0
20. 32.5
21. 33.0
22. 35.0
23. 34.5
24. 34.0
25. 35.0

Pasul 2. Se ordoneaza valorile observate sau obtinute cu ajutorul unui aparat, in ordine
crescatoare
Valoarea a n-a Valoarea
1. 32,5
2. 32,5
3. 32,5
4. 32,5
5. 32,5
6. 33.0
7. 33.0
8. 33.0
9. 33.5
10. 33.5
11. 34.0
12. 34.0
13. 34.0
14. 34.0
15. 34.0
16. 34.5
17. 34.5
18. 34.5
19. 34.5
20. 35.0
21. 35.0
22. 35.0
23. 35.0
24. 35.0
25. 35.0

Pasul 3. Deci valorile extreme sunt Xmin=32,2si Xmax=35,5. Ne punem intrebarea daca
aceste valori sunt sau nu aberante.

Se aplica testul Grubbs.

Trebuie sa calculam statisticile gmin, pentru valoarea Xmin, respectiv gmax, pentru valoarea
extrema Xmax.

;
Unde:
- media aritmetica
Xmin – valoarea minima
Xmax – valoarea maxima
s - abaterea medie patratica

Decizii :

1. Daca , valoarea Xmin nu este aberanta. In caz contrar este


aberanta si se elimina din sirul de valori.
2. Daca , valoarea Xmax nu este aberanta. In caz contrar este
aberanta si se elimina din sirul de valori.

Pasul 4. Pentru a calcula statisticile gmin si gmax avem nevoie sa calculam media aritmetica
si abaterea medie patratica.

Pasul 5. Media aritmetica se calculeaza cu relatia :

unde X1=Xmin si X25=Xmax

Pasul 6. Abaterea medie patratica se calculeaza cu relatia :

, unde
D2 reprezinta dispersia care se calculeaza cu relatia :

Pasul 7. Calculam dispersia

Pasul 8. Revenim in formulele initiale si calculam statisticile


Cum rezulta ca valoarea Xmin nu este aberanta, deci este valida, deci se retine
pentru calcule. Inn caz contrar, daca ar fi fost aberanta, se elimina din sirul de valori si ne
puneam intrebarea daca nu si urmatoarea valoare , care a devenit acum Xmin nu o fi aberanta.
Se reluau toate calculele dupa eliminarea valorilor X1 si X2, deci, 32.5 si 32.5. In acest caz ar
fi ramas un esantion de 23 valori

Cum rezulta ca valoarea Xmax nu este aberanta, deci este valida, deci se retine
pentru calcule. Inn caz contrar, daca ar fi fost aberanta, se elimina din sirul de valori si ne
puneam intrebarea daca nu si urmatoarea valoare , care a devenit acum Xmax nu o fi aberanta.
Se reluau toate calculele dupa eliminarea valorilor X24 si X25, deci, 35. si 35. . In acest caz ar
fi ramas un esantion de 21 valori.

Impartirea pe clase :

Amplitudinea claselor se determina cu relatia

Unde k – numarul de clase

Deci

Clasele se formeaza astfel :

Clasa 1: [Xmin; Xmin+a)

Clasa 2 : [Xmin+a; Xmin+2a)

Clasa 3 : [Xmin+2a; Xmin+3a)

.....................................

Clasa k : [Xmin+(k-1)a; Xmax]

In cazul esantionului nostru:

Clasa 1: [32.3; 32.92)

Clasa 2 : [32.92; 33.54)

Clasa 3 : [33.54; 34.16)

Clasa 4 : [34.16; 34.78)

Clasa 5 : [34.78 ; 35.4]


In continuare analizam in ce clasa se incadreaza fiecare din cele n valori ale esantionului
analizat, determinand de fapt frecventa absoluta a fiecarei clase:
Clasa 1: [32.3; 32.92)
Clasa 2 : [32.92; 33.54)
Clasa 3 : [33.54; 34.16)
Clasa 4 : [34.16; 34.78)
Clasa 5 : [34.78 ; 35.4]

Valoarea a n-a Valoarea Clasa


1. 32,5 1
2. 32,5 1
3. 32,5 1
4. 32,5 1
5. 32,5 1
6. 33.0 2
7. 33.0 2
8. 33.0 2
9. 33.5 2
10. 33.5 2
11. 34.0 3
12. 34.0 3
13. 34.0 3
14. 34.0 3
15. 34.0 3
16. 34.5 4
17. 34.5 4
18. 34.5 4
19. 34.5 4
20. 35.0 5
21. 35.0 5
22. 35.0 5
23. 35.0 5
24. 35.0 5
25. 35.0 5

Deci in clasa 1 sunt 5 valori, deci frecventa valorilor in clasa 1 va fi f1=5


Deci in clasa 2 sunt 5 valori, deci frecventa valorilor in clasa 2 va fi f2=5
Deci in clasa 3 sunt 5 valori, deci frecventa valorilor in clasa 3 va fi f3=5
Deci in clasa 4 sunt 4 valori, deci frecventa valorilor in clasa 4 va fi f4=4
Deci in clasa 5 sunt 6 valori, deci frecventa valorilor in clasa 5 va fi f5=6

Prin insumarea frecventelor din toate clasele, 5+5+5++4+6=25, am facut o verificare daca am
repartizat toate cele 25 valori in cele k clase.

In continuare calculam frecventele relative, adimensionale, adica nu au unitate de masura:


Pentru a face verificare calculelor efectuate, se aduna frecventele, iar rezultatul trebuie sa fie
egal cu 1. In cazul nostru este corect.

In continuare calculam frecventele relative, procentuale, adica se exprima in procente:

Pentru a face verificare calculelor efectuate, se aduna frecventele, iar rezultatul trebuie sa fie
egal cu 100. In cazul nostru este corect.

Pentru a evidentia configuratia datelor de sondaj, repartitiile acestora pot fi reprezentate si cu


ajutorul unor grafice dintre care mentionam

HISTOGRAMA,
POLIGONUL FRECVENTELOR RELATIVE
POLIGONUL FRECVENTELOR CUMULATE

In cazul histogramei, intr-un sistem rectangular de axe, sunt trecute, la scari potrivite, valorile
frecventelor, pe axa ordonatelor, si valorile limitelor claselor, pe axa absciselor. Diagrama
obtinuta este sub forma unor coloane ale caror inaltimi vor reprezenta frecventele claselor.
in clasa 1 sunt 5 valori, deci frecventa absoluta in clasa 1 este f1=5
in clasa 2 sunt 5 valori, deci frecventa absoluta in clasa 2 este f2=5

in clasa 3 sunt 5valori, deci frecventa absoluta in clasa 3 este f3=5


in clasa 4 sunt 4 valori, deci frecventa absoluta in clasa 4 este f4=4
in clasa 5 sunt 6 valori, deci frecventa absoluta in clasa 5 este f5=6

Vizualizare in Power Point, construirea histogramei.

Spre deosebire de histograma, la poligonul frecventelor in locul limitelor intervalelor,


claselor, se iau centrele acestora diagrama fiind sub forma unui poligon obtinut prin unirea
extremitatilor segmentelor ridicate din centrele claselor de pe axa absciselor si a caror inaltimi
corespund frecventelor claselor.

Avand trasata histograma, poligonul frecventelor se poate obtine prin unirea mijloacelor
laturilor superioare ale dreptunghiurilor
Vizualizare in Power Point, construirea poligonului frecventelor.

Poligonul frecventelor cumulate se obtine prin cumularea frecventelor relative, pas cu pas.

Vizualizarea construirii in Power Point .

Valorile tipice de sondaj

1. Media aritmetica de sondaj, notata cu .


Media aritmetica. Este un indicator simplu şi în acelaşi timp foarte sintetic, fiind un
foarte bun indiciu al valorii în jurul căreia se grupează datele. Media este indicatorul
care arată tendinţa centrală a seriei de valori, şi de obicei arată unde tind datele să se
aglomereze. De cele mai multe ori, valorile din serie sunt situate în majoritate în
apropierea mediei, iar o mai mică parte din ele sunt situate mult în stânga sau în
dreapta mediei.
Media aritmetică are dezavantajul că este sensibilă la valori extreme fie foarte mici, fie
foarte mari. Adăugarea unei singure valori (sau a câtorva) mult mai mari sau mult mai
mici decât celelalte, modifică sensibil media aritmetică.

Daca X1, X2, ...., Xn sunt valorile individuale obtinute in urma examinarii unui
fenomen sau caracteristica a unui produs sau semifabricat, iar n este volumul
esantionului de date, media aritmetica de sondaj este definita cu relatia

Împrăştiere. Valorile dintr-o serie de valori pot fi mai aglomerate în jurul mediei sau
mai dispersate, adică la distanţe mari de medie. Un mod de a măsura aceste abateri de la
medie este să se facă diferenţa între toate aceste valori şi media lor. Unele abateri vor fi
pozitive, altele negative. Ele nu pot fi adunate, deoarece, prin adunare dau suma 0.

Dispersia. Un mod de a ocoli faptul că suma abaterilor absolute este 0, este ridicarea la pătrat
a acestora înainte de a fi adunate, pentru a face să dispară semnele negative la unele şi
pozitive la altele. Suma obţinută, ar trebui împărţită la numărul de abateri pentru a se obţine o
medie.

Valoarea care se obţine astfel se numeşte dispersie şi este un indicator al gradului de


împrăştiere al seriei. Dispersia arata imprastierea, raspandirea sau concentrarea unei multimi
de valori in jurul unei valori medii.

După cum se observă, numărătorul fracţiei din definiţia dispersiei este cu atât mai mare cu cât
abaterile individuale de la medie sunt mai mari şi deci este natural să considerăm că o valoare
mare a dispersiei arată o împrăştiere mare a valorilor din serie.

De fapt, este bine de reţinut că:

•La medii aproximativ egale, este mai împrăştiată seria cu dispersia mai mare.

•La dispersii aproximativ egale, este mai împrăştiată seria cu media mai mică.

Dispersia are dezavantajul că se exprimă cu unităţile de măsură ale valorilor din serie, ridicate
la pătrat, şi are în general valori foarte mari comparativ cu abaterea medie.
De aceea se mai foloseşte un alt indicator, numit abatere standard sau abaterea medie
patratica, care este radicalul dispersiei.

Acest indicator se exprimă cu aceeaşi unitate de măsură ca şi valorile din seria considerată şi
este un indicator foarte fidel al împrăştierii seriei. Abaterea standard, nu are dezavantajele
dispersiei, adică unitatea de măsură este aceeaşi cu a valorilor din serie, şi, are o valoare
comparabilă cu abaterile individuale de la medie.

Este bine de reţinut că:

•La medii aproximativ egale, este mai împrăştiată seria cu deviaţia standard mai mare.

•La deviaţii standard aproximativ egale, este mai împrăştiată seria cu media mai mică.

2. Dispersia de sondaj, se calculeaza cu relatia prezentata mai sus

3. Abaterea medie patratica de sondaj, conform definitiei stabilite mai sus este
radacina patrata a dispersiei de sondaj.

4.

Ce se întămplă însă dacă mediile şi deviaţiile sunt foarte diferite? Atunci o bună
apreciere se obţine dacă se foloseşte raportul deviaţiei standard faţă de medie, exprimat în
procente, acest raport fiind un alt indicator al împrăştierii valorilor dintr-o serie.

Acest indicator se numeşte coeficient de variaţie.

4. Coeficientul de variatia de sondaj, este definit de relatia

iar daca se va exprima procentual


Aprecierea cu ajutorul coeficientului de variaţie se face mai ales atunci când două serii de
valori au medii mult diferite şi deviaţiile standard pot să nu ne dea o indicaţie suficient de
utilă.

5. Coeficienti pentru aprecierea graficului repartitiei de sondaj:

Indicatori de asimetrie.

Atunci când valorile unei serii sunt distribuite nesimetric în jurul mediei, acest fapt este
imposibil de surprins cu ajutorul indicatorilor de dispersie. De aceea, s-au introdus indicatori
care să pună în evidenţă şi acest aspect al seriilor de valori: excentricitatea, sau asimetria. Va
trebui să ţinem cont atât de numărul de valori care sunt în stânga şi în dreapta mediei, cât şi
depărtarea lor faţă de medie.

Mediana. Este un indicator al tendinţei centrale, şi anume este valoarea de mijloc, într-o serie
de valori

6. Mediana de sondaj, notata cu Me. Prin definitie, mediana de sondaj reprezinta


valoarea fata de care frecventa valorilor mai mici decat ea este egala cu frecventa
valorilor mai mari decat ea.
Avand valorile ordonate, vom avea :

, daca n este impar, deci daca avem un numar impar de valori

, daca n este par, adica daca avem un numar par de valori

In cazul valorilor analizate de noi,

Valoarea a n-a Valoarea


1 32,5
2 32,5
3 32,5
4 32,5
5 32,5
6 33.0
7 33.0
8 33.0
9 33.5
10 33.5
11 34.0
12 34.0
13 34.0
14 34.0
15 34.0
16 34.5
17 34.5
18 34.5
19 34.5
20 35.0
21 35.0
22 35.0
23 35.0
24 35.0
25 35.0

Avand un numar impar de valori, deci n=25, se foloseste relatia


,

deci mediana de sondaj este valoarea a 13-a. Daca am fi avut inca o valoare, deci total 26
valori, mediana de sondaj ar fi fost media aritmetica a valorilor a 13-a si a 14-a, deci

(34+34)/2=34 conform relatiei scrisa mai sus .

Valoarea mod de sondaj, notata cu Mo, este data de valoarea corespunzatoare frecventei
maxime. Pentru repartitii de sondaj ce pot fi aproximate cu o repartitie normala, valoarea mod
se calculeaza cu relatia:

Coeficientul de asimetrie, se calculeaza cu relatia

Unde este dispersia, , iar este momentul centrat de sondaj de ordinul 3, care se
calculeaza asemanator cu dispersia, care este de fapt un moment centrat de ordinul 2.
Deci
Pentru calculul coeficientului de asimetrie ridicam la patrat momentul centrat de ordinul 3 si
apoi impartim la dispersia ridicata la puterea a 3-a.

Coeficientul de boltire, se calculeaza cu relatia:

Unde este dispersia, , iar este momentul centrat de sondaj de ordinul 4, care se
calculeaza asemanator cu dispersia, care este de fapt un moment centrat de ordinul 2.
Deci

Excesul, se calculeaza cu relatia:

E
Unde este coeficientul de boltire prezentat mai sus

S-ar putea să vă placă și