Documente Academic
Documente Profesional
Documente Cultură
numeric univariat
Erori aleatoare, care sunt mici, se produc n ambele sensuri i se compenseaz reciproc Erori sistematice, grosolane, care se produc sistematic n acelai sens i produc o deplasare sistematic a valorii cutate (Dragomirescu L., op. cit.).
Valori aberante
Prin urmare, aceste valori trebuie eliminate dac dorim s folosim aceti indicatori (i dorim, datorit proprietilor matematice, de exemplu aditivitatea). Pentru a le elimina, este necesar identificarea lor.
Distribuia normal
Se mai numete curba erorilor de msurare ntmpltoare, curba erorilor de msurare aleatoare sau curba lui Gauss. Forma de clopot ilustreaz urmtoarele aspecte:
Marea majoritate a msurtorilor au valori apropiate de centrul distribuiei (care este, cel mai probabil, valoarea corect sau real) Numrul msurtorilor care se abat de la centru scade odat cu creterea abaterii de la centru Numrul msurtorilor cu o anumit abatere pozitiv este relativ egal cu numrul msurtorilor cu aceeai abatere, dar de semn negativ (Dragomirescu L., op. cit.).
Este o distribuie unimodal i simetric, cu dou cozi care tind asimptotic ctre infinit. Este caracterizat de doi parametri: media m abaterea standard s Are dou puncte de inflexiune situate simetric fa de verticala x = m la distana s, respectiv x + s i x s. M = Me = Mo = m. m poate fi orice numr real, iar s orice numr real pozitiv, deci exist o infinitate de distribuii normale. Distribuia normal de medie m i abatere standard s se noteaz: N(m, s).
Dac m = 0 i s = 1, avem de-a face cu distribuia normal N(0, 1), care se numete distribuia normal standard. Se obine o distribuie normal standard dac pentru distribuia normal N(m, s) se aplic simultan transformrile:
Transformarea z = (x m) / s se numete standardizare, iar rezultatul scor z (Dragomirescu L., op. cit.).
Pentru serii de volum mare (N > 30) se utilizeaz regula 3 sigma de eliminare a valorilor aberante. Regula se bazeaz pe:
inegalitatea lui Cebev: orice distribuie se ntinde ntre media sa plus / minus 6 abateri standard, faptul c aria cuprins ntre media unei distribuii normale plus / minus 3 abateri standard reprezint cca. 99,7% din aria total. Valorile situate n afara acestor limite sunt improbabile sau aberante, i neglijabile.
Aplicarea regulii presupune existena unei distribuii normale a datelor / fenomenului. Dac acest lucru nu este cunoscut, se aplic regula 6 sigma (Dragomirescu L., op. cit.).
Aplicaie
Revenim la cel de-al treilea exemplu prezentat pentru distribuiile de frecvene. Se cere determinarea valorilor aberante.
Xj
7 16,1 16,5 16,7 16,8 16,9 16,9 17 17 17 17 17 17,1 17,1 17,1 17,2 17,3 17,5 17,8 18
Rezolvare
Deoarece avem de-a face cu un proces de msurare, tim c datele se distribuie normal i folosim regula 3 sigma. M = 16,55, S = 2,23. Orice valoare mai mic dect 16,55 3 2,23 = 9,86 sau mai mare dect 16,55 + 3 2,23 = 23,24 este o valoare aberant. Deoarece 7 < 9,86, este valoare aberant. Volumul seriei este N = 20 < 30, deci aplicarea regulii este improprie.
Am observat c aplicarea regulii 3 sigma n locul regulii 6 sigma se bazeaz pe faptul c avem de-a face cu o distribuie normal. Se pune problema: cum putem aprecia dac distribuia datelor pe care le avem este normal?
Exemplu
Valoare Frecven Frecven seria 1 seria 2
Reprezentm datele sub forma unei histograme Suprapunem peste histogram distribuia normal cu aceeai medie i cu aceeai abatere standard cu distribuia datelor Apreciem pe baza graficului concordana distribuiilor.
1
2 3 4 5
1
10 3 3 1
1
3 10 3 1
Seria 1
10 8 6 4 2 0 10 8 6 4 2 0
Seria 2
c
2 j 1
o j t j
t
j
unde oj sunt frecvenele observate, corespunztoare distribuiei analizate, iar tj sunt frecvenele teoretice, corespunztoare distribuiei normale.
Pentru a calcula frecvenele teoretice, avem nevoie de tabele ale distribuiei normale standard, dup care, prin anumite calcule, vom determina valorile teoretice pentru o distribuie normal cu media i abaterea standard egale cu cele ale distribuiei analizate. n acest curs nu vom studia aceste aspecte.
ntrebri
Atept ntrebri.