Documente Academic
Documente Profesional
Documente Cultură
intregi situate in intervalul inchis 20-30, cunoscand statistica gtab=3. Apoi sa se imparta
valorile pe clase si sa se determine frecventele absolute si relative cunoscand numarul de clase
k=5
Pasul 2. Se ordoneaza valorile observate sau obtinute cu ajutorul unui aparat, in ordine
crescatoare
Pasul 3. Deci valorile extreme sunt Xmin=20 si Xmax=30. Ne punem intrebarea daca aceste
valori sunt sau nu aberante.
Trebuie sa calculam statisticile gmin, pentru valoarea Xmin, respectiv gmax, pentru valoarea
extrema Xmax.
;
Unde:
- media aritmetica
Xmin – valoarea minima
Xmax – valoarea maxima
s - abaterea medie patratica
Decizii :
Pasul 4. Pentru a calcula statisticile gmin si gmax avem nevoie sa calculam media aritmetica
si abaterea medie patratica.
, unde
D reprezinta dispersia care se calculeaza cu relatia :
2
Cum rezulta ca valoarea Xmin nu este aberanta, deci este valida, deci se retine
pentru calcule. Inn caz contrar, daca ar fi fost aberanta, se elimina din sirul de valori si ne
puneam intrebarea daca nu si urmatoarea valoare , care a devenit acum Xmin nu o fi aberanta.
Se reluau toate calculele dupa eliminarea valorilor X1 si X2, deci, 20 si 20. In acest caz ar fi
ramas un esantion de 23 valori
Cum rezulta ca valoarea Xmax nu este aberanta, deci este valida, deci se retine
pentru calcule. Inn caz contrar, daca ar fi fost aberanta, se elimina din sirul de valori si ne
puneam intrebarea daca nu si urmatoarea valoare , care a devenit acum Xmax nu o fi aberanta.
Se reluau toate calculele dupa eliminarea valorilor X24 si X25, deci, 30 si 30. In acest caz ar
fi ramas un esantion de 21 valori.
Impartirea pe clase :
Deci
Clasele se formeaza astfel :
.....................................
.....................................
In continuare analizam in ce clasa se incadreaza fiecare din cele n valori ale esantionului
analizat, determinand de fapt frecventa absoluta a fiecarei clase:
Clasa 1: [20; 22)
Clasa 2 : [22; 24)
Clasa 3 : [24; 26)
.....................................
Clasa k : [28; 30]
Prin insumarea frecventelor din toate clasele, 2+4+8+6+5=25, am facut o verificare daca am
repartizat toate cele 25 valori in cele k clase.
Pentru a face verificare calculelor efectuate, se aduna frecventele, iar rezultatul trebuie sa fie
egal cu 1. In cazul nostru este corect.
A doua clasa va fi
A treia clasa va fi
Deci, o valoare egala cu limita superioara a unei clase va apartine clasei imediat urmatoare
deoarece intervalul este deschis la dreapta.
Deci, numarul datelor care apartin unei clase poarta denumirea de frecventa absoluta a clasei,
iar raportul dintre frecventa absoluta si numarul total de valori poarta denumirea de
frecventa relativa.
Reamintim faptul ca verificarea se face prin insumare, in primul caz suma trebuie sa fie 1, iar
in al doilea caz, 100.
HISTOGRAMA,
POLIGONUL FRECVENTELOR RELATIVE
POLIGONUL FRECVENTELOR CUMULATE
In cazul histogramei, intr-un sistem rectangular de axe, sunt trecute, la scari potrivite, valorile
frecventelor, pe axa ordonatelor, si valorile limitelor claselor, pe axa absciselor. Diagrama
obtinuta este sub forma unor coloane ale caror inaltimi vor reprezenta frecventele claselor.
Avand trasata histograma, poligonul frecventelor se poate obtine prin unirea mijloacelor
laturilor superioare ale dreptunghiurilor
Poligonul frecventelor cumulate se obtine prin cumularea frecventelor relative, pas cu pas.
Daca X1, X2, ...., Xn sunt valorile individuale obtinute in urma examinarii unui
fenomen sau caracteristica a unui produs sau semifabricat, iar n este volumul
esantionului de date, media aritmetica de sondaj este definita cu relatia
Împrăştiere. Valorile dintr-o serie de valori pot fi mai aglomerate în jurul mediei sau
mai dispersate, adică la distanţe mari de medie. Un mod de a măsura aceste abateri de la
medie este să se facă diferenţa între toate aceste valori şi media lor. Unele abateri vor fi
pozitive, altele negative. Ele nu pot fi adunate, deoarece, prin adunare dau suma 0.
Dispersia. Un mod de a ocoli faptul că suma abaterilor absolute este 0, este ridicarea la pătrat
a acestora înainte de a fi adunate, pentru a face să dispară semnele negative la unele şi
pozitive la altele. Suma obţinută, ar trebui împărţită la numărul de abateri pentru a se obţine o
medie.
După cum se observă, numărătorul fracţiei din definiţia dispersiei este cu atât mai mare cu cât
abaterile individuale de la medie sunt mai mari şi deci este natural să considerăm că o valoare
mare a dispersiei arată o împrăştiere mare a valorilor din serie.
•La medii aproximativ egale, este mai împrăştiată seria cu dispersia mai mare.
•La dispersii aproximativ egale, este mai împrăştiată seria cu media mai mică.
Dispersia are dezavantajul că se exprimă cu unităţile de măsură ale valorilor din serie, ridicate
la pătrat, şi are în general valori foarte mari comparativ cu abaterea medie.
De aceea se mai foloseşte un alt indicator, numit abatere standard sau abaterea medie
patratica, care este radicalul dispersiei.
Acest indicator se exprimă cu aceeaşi unitate de măsură ca şi valorile din seria considerată şi
este un indicator foarte fidel al împrăştierii seriei. Abaterea standard, nu are dezavantajele
dispersiei, adică unitatea de măsură este aceeaşi cu a valorilor din serie, şi, are o valoare
comparabilă cu abaterile individuale de la medie.
•La medii aproximativ egale, este mai împrăştiată seria cu deviaţia standard mai mare.
•La deviaţii standard aproximativ egale, este mai împrăştiată seria cu media mai mică.
3. Abaterea medie patratica de sondaj, conform definitiei stabilite mai sus este
radacina patrata a dispersiei de sondaj.
Ce se întămplă însă dacă mediile şi deviaţiile sunt foarte diferite? Atunci o bună
apreciere se obţine dacă se foloseşte raportul deviaţiei standard faţă de medie, exprimat în
procente, acest raport fiind un alt indicator al împrăştierii valorilor dintr-o serie.
Atunci când valorile unei serii sunt distribuite nesimetric în jurul mediei, acest fapt este
imposibil de surprins cu ajutorul indicatorilor de dispersie. De aceea, s-au introdus indicatori
care să pună în evidenţă şi acest aspect al seriilor de valori: excentricitatea, sau asimetria. Va
trebui să ţinem cont atât de numărul de valori care sunt în stânga şi în dreapta mediei, cât şi
depărtarea lor faţă de medie.
Mediana. Este un indicator al tendinţei centrale, şi anume este valoarea de mijloc, într-o serie
de valori
deci total 26 valori, mediana de sondaj ar fi fost media aritmetica a valorilor a 13-a si a 14-a,
Valoarea mod de sondaj, notata cu Mo, este data de valoarea corespunzatoare frecventei
maxime. Pentru repartitii de sondaj ce pot fi aproximate cu o repartitie normala, valoarea mod
se calculeaza cu relatia:
Unde este dispersia, , iar este momentul centrat de sondaj de ordinul 3, care se
calculeaza asemanator cu dispersia, care este de fapt un moment centrat de ordinul 2.
Deci
Unde este dispersia, , iar este momentul centrat de sondaj de ordinul 4, care se
calculeaza asemanator cu dispersia, care este de fapt un moment centrat de ordinul 2.
Deci
Excesul, se calculeaza cu relatia: