Sunteți pe pagina 1din 3

Există o mare de detaliu şi ezoterism în mai multe secţiuni de acest raport care nu este esenţial material pentru majoritatea

cititorilor. Punctele 4, 5 şi 6, unde sunt derivate algoritmi de calcul, pot fi de exemplu deosebit de împovărătoare. Desigur
aceste calcule, în general, au nevoie de un computer pentru orice caz practic, şi este puţin probabil vreodată ar fi făcut
manual de către un om. Prin urmare, este în întregime rezonabile că mulţi cititori ar alege să săriţi peste o parte din acest
text. Mai degrabă decât distruge organizarea raportului de surghiunire acest material o serie nestructurate de anexe, am
indicat la cititor în cazul în care el sau ea poate sari peste textul fără teama de a pierde ceva interesant sau pierde firul de
argumentul. Aceste indicii sunt evidenţiate cu gri de umbrire (cum ar fi această teză este). Cititorii care nu sunt deosebit de
interesate în unele cât special sau cum unele calcule vor fi efectuate în interiorul software-ul poate sari peste acest
material şi relua lectură la un loc menţionat în indiciu. 15 2 unde face interval de date provin de la? Incertitudinea
măsurărilor care în mod corespunzător este caracterizata prin intervale se numeşte incertitudine, şi apare în mod natural
într-o varietate de împrejurări (Ferson et al. 2004b; Osegueda et al. 2002). Această secțiune recenzii opt surse din care
informaţiile este cel mai bine reprezentat de intervale, inclusiv rapoartele de plus sau minus, cifre semnificative, măsurări
intermitente, non-detectează, cenzura, datele binning, lipsesc datele şi ignoranţa brut. La sfârşitul de secţiune, vom discuta
despre cum intervale epistemologic diferă de alte tipuri de date. Rapoarte de incertitudine de plus sau minus. Ingineri şi
oameni de ştiinţă fizice sunt învăţaţi să raporteze plus sau minus incertitudinile legate de calibrare a dispozitivelor de
măsurare. Aceste rapoarte reprezintă adesea epistemic incertitudine în formă de intervale. De exemplu, un instrument de
măsurare ar putea fi caracterizat de către producătorul său ca avand o fiabilitate specificat, astfel că o măsură luată în
condițiile prevăzute este bine sa în termen de o marjă. O observaţie folosind un astfel de instrument ar avea o formă ca
12.64  0,03, care ar fi asociat de rotunjire la intervalul [12.61, 12.67]. În unele cazuri, numărul după simbolul  reprezinta
o deviere standard sau o eroare standard, dar în alte cazuri, aceasta pur şi simplu denotă o halfrange. În astfel de cazuri, nu
există justificare statistice sau epistemologice, pentru ipoteza în care valoarea corectă este orice mai aproape de mijloc din
aceasta gama decât este să fie endpoint (deşi s-ar putea argumenta că aceste limite nu sunt absolute în sensul că
adevărata măsurarea are zero şanse situată în afara ei). Pentru instrumente cu înregistrările digitale, Geneza acestor
măsurări şi naturii lor ca intervalul poate fi aparentă. În cazul unor instrumente analogice, pe de altă parte, actul măsurării
(mensuration) necesită poziţia de un ecartament de raportare sau ac de-a lungul o scară pe care sunt indicate valorile de
punct de reper. Mai mulţi observatori raport valoare asociate cu cel mai apropiat punct de reper ca măsurătoare. După ce
s-a raportat această valoare, este asociat cu intervalul transzonale cel mai apropiat punct de reper şi extinderea (de obicei)
la jumătatea a două repere adiacente. Unii utilizatori de aparate de măsurare analogice sunt predate pentru a interpola la
partea cea mai apropiată zecime între două repere. La limita de interpolare operatorului, orice ar fi, există un fel de
incertitudine, care pot fi reprezentate în mod rezonabil și în mod corespunzător printr-un interval. Dacă citiţi la cea mai
apropiată valoare de reper sau interpolate mai fin, observator este responsabil pentru recunoaşterea şi raportarea la
numărul de plus sau minus asociate cu măsurarea. Reţineţi că originea intervalul în aceste cazuri este asociata cu raportare
de măsurare. Chiar dacă mensuration ar putea în principiu au fost mai precise, după ce s-a raportat această valoare, acesta
are incertitudinea exprimată de observator. Cifre semnificative. Prin convenție, numărul cifrelor folosite pentru a exprima
o cantitate scalar este utilizat pentru a transmite o indicație dur de incertitudine asociat cu expresia. De exemplu, valoarea
unadorned 12.64 este asociat de rotunjire la intervalul [12.635, 12.645], fără vreo sugestie despre unde valoarea reală este
în acest interval. Deoarece multe masuratori empirice care sunt raportate lipsa o declaraţie expresă despre fiabilitatea lor,
Convenţia de interpretare cifre semnificative pentru a defini implicit un interval de plus sau minus 16 este esenţială pentru
a accesa aceste date şi le folosesc în mod corespunzător pentru nevoile. Deşi convențiile bazate pe cifre semnificative
sparga când incertitudinea este foarte mare (Denker 2003), interpretarea ei ca definirea intervale ne permite de a face uz
de o cantitate enormă de date istorice şi moştenirea (şi, probabil, unele colectat recent date) care au fost colectate înainte
de atenție curent incertitudinea măsurării a devenit larg răspândite. Intervalul de Convenţia de cifre semnificative este, din
nou, asociate cu raportare de măsurare ca un număr de scalare finit multe cifre intermitente de măsurare. Planurile de
monitorizare unele apel pentru măsurările periodice sau intermitentă. Un exemplu comun este inspectarea periodică a
componentelor. Dacă o componentă se observă să fie în bună stare de funcționare la un control, dar nu la următoarea
inspecție, când au intarziat componenta? Se pare rezonabil în întregime pentru a concluziona că nu există o fereastră de
timp între ultimele două inspecții în care componenta nu a reuşit şi că reprezentarea matematice naturale ori eşecul este
un interval. Aceste concluzii bazate pe observaţii temporală apar în mai multe domenii şi cazuri. De exemplu, analiza
medico-legală a criminalităţii secvenţiere este adesea bazat pe sinteza de mărturiile mai multor martori care produce un
interval fereastră de oportunitate. Non-detectează. În quantifications chimice şi evaluări de puritatea materialului, sunt
uneori "non-detectează" în care procedura de laborator pot doar să spun că este concentrația de substanță sub o anumită
sumă cunoscut ca limita de detectare. Incertitudinea în acest caz este în formă de un interval între zero și limita de
detecție, şi nu poate fi nici un motiv empirice să cred că concentrația reală este mult mai probabil să fie în orice parte a
intervalului. Pentru situaţiile în care nu poate fi neglijată astfel incertitudinea într-o analiză, s-ar părea să fie esenţial să
existe o modalitate de a trata aceste incertitudini interval în calcule. Cenzura. Non-detectează descrise mai sus uneori sunt
spus să fie cenzurate de stânga datelor. Pot fi cenzurate de drept date. Un exemplu comun este eşecul de date, care
include unele componente care niciodată nu a reuşit în timpul studiului. Pentru astfel de componente, observate vieti ar
trebui să fi caracterizat printr-un interval de durata studiului la infinit. Aceasta este comun pentru analisti pentru a construi
un model care încearcă să proiecteze atunci când astfel de componente ar au eşuat, dar credem că este clar că acest lucru
merge dincolo de informaţiile empirice la îndemână. În cazul în care concluzia unei analize depinde de extrapolări, ar fi
important să verifice ceea ce informaţiile empirice brut este spunându-ne. Date binning şi rotunjire. Un alt fel de interval
măsurarea apare binned date, care sunt uneori numite cenzurate de interval de date. Binned date apar atunci când valorile
posibile sunt grupate împreună pentru a realiza economii Design empirice, pentru a satisface limitele pe stocarea datelor,
şi ca urmare a unor date incomplete transcrierea. Chestionar date, de exemplu, sunt foarte frecvent binned într-un număr
mic de categorii (de exemplu, la întrebări ca "este de vârsta ta (a) mai mică de 20, (b) între 20 şi 50, sau (c) peste
50?"). Aceste date sunt foarte frecvente în recensământ informatii de tot felul. Date binning este adesea rezultatul unor
restricţii privind colectarea datelor referitoare la confidenţialitate sau probleme de securitate. Binning din motive de
confidentialitate este foarte frecvente în informatii epidemiologice medicale. 17 de exemplu, registre de cancer poate
permite accesul la informaţii geografice despre pacienţi numai la nivel de recensământ tractului. Informaţii lacune şi
mascarea intenţionată a datelor sunt tot mai frecvente în această perioadă a sporit securitatea. Binned date sunt, de
obicei, ordinal în forma (deşi acestea nu trebuie să fie din moment ce în principiu ar putea suprapune intervalele), dar care
stau la baza de date nu sunt ordine în natură dar valori mai degrabă continuă, care pur şi simplu au fost grupate pe
categorii. Date de rotunjire este un caz special de date binning în care valorile numerice sunt grupate în jurul unei valori
nominale, care este un număr întreg sau o valoare cu un număr mic, special de zecimale. Date de rotunjire este frecvent
practicată în transcrierea manuală de date şi este de asemenea comună în seturi de date extrem de mari, cum ar fi imagini
sau continuu în timp mediu monitorizare datelor de satelit în cazul în care limitări pe calculator depozitare sau informaţii
rate de transmisie limita măsurări individuale la câteva biţi sau octeţi. Rotunjire în mod tradiţional a fost modelat cu
uniforme distributii statistice. Datele care lipsesc. Uneori date duc lipsă. În cazul în care lipsesc date la întâmplare, atunci ar
putea fi rezonabil să ignore pierderea şi ajusta dimensiunea eşantionului în jos pentru a reflecta numărul de valori de date
disponibile. Dar, în general, nu ar fi rezonabil să se prefacă datele nu au fost planificate sau colectate în cazul în care
acestea lipsesc non-aleator din anumite motive sistematică. De exemplu, în cazul în care datele sunt mai susceptibile de a fi
dispărute în cazul în care acestea reprezintă mărimi mari, nu reuşesc să ţină seama de aceste valori lipsă ar tind să părtinire
setul de date. De asemenea, în mai multe seturi de date, numai dacă lipseşte o dimensiune din multe, nu este rezonabil să
abandoneze toate măsurătorile care sunt disponibile doar pentru că o singură valoare lipsă din setul. Unei strategii practice
în aceste cazuri este de a utiliza intervale să stea pentru datele care lipsesc. În cazul în care un datum a fost planificat, dar
nu ar putea fi colectate sau a fost colectate dar ulterior pierdut pentru un motiv oarecare, apoi un interval vacuous
[, ], sau poate [0, ] în cazul în care valoarea este cu siguranţă pozitiv, ar trebui să reprezinte valoarea
lipsă. Simbol  ar putea reprezenta matematice infinity, sau doar cea mai mare magnitudine posibil o valoare s-ar putea
lua. Chiar mai multe intervale vacuous într-un set de date distruge neapărat utilitatea sa. Mai degrabă, ei permit limitele
epistemic încorporate în datele ce urmează a fi exprimat în mod explicit, şi permite o analiză ordonată a informaţiilor
disponibile. Brut ignoranţă. Uneori o cantitate poate nu au fost studiate la toate, şi doar real informaţii despre asta vine de
la constrângerile teoretice. De exemplu, concentraţii, solubilitate, şi probabilităţi şi multe alte tipuri de variabile au limitele
fizice. Aceste limite fizice pot fi utilizate pentru a circumscrie posibil gamelor de cantități chiar atunci când nu există
informaţii empirice despre ele este disponibil. De obicei, aceste intervale de timp sunt destul de mare, şi sunt considerate
adesea vacuous declaraţii pentru că ei reprezintă nici o informaţie empirice. Cu toate acestea, calcule matematice, pe baza
lor nu poate fi întotdeauna gol. Incertitudinea induce în calcule depinde de incertitudinile de alte mărimi şi modul în care
toate cantităţile sunt combinate împreună într-o expresie matematică. Lăţimea de incertitudine capturat de lăţimile de
aceste intervale ar putea fi atât de mici încât să fie neglijabile. Atunci când este cazul, nu este nevoie să te deranjez cu
oricare dintre metodele elaborate în acest raport. Într-adevăr, aproape toate analizele statistice efectuate în trecut au
presupune acest lucru să fie cazul. Dar latimi de intervale nevoie nu 18 întotdeauna fie mici. În fiecare dintre situaţiile
descrise mai sus în cazul în care apărea intervalul de date, incertitudinea s-ar putea fi substanţiale în raport cu
magnitudinea de măsurare, sau în orice caz semnificativ de calcul în care măsurările vor fi folosite. Atunci când aceste
incertitudini sunt suficient de mari pentru a contează, este prudent să se ia în considerare explicit dintre ele în cadrul
analizei. În acest raport, un interval ce caracterizează o măsurare individuală incertitudine reprezintă o afirmaţie despre
valoarea măsurată este justificată de măsurare special. Intervalul specifică unde empirist (sau poate că instrumentul) este
de a spune este valoarea. În acelaşi timp se spune în cazul în care valoarea nu este. Această afirmaţie va fi înţeles să aibă
două componente matematice: concentrația de No: intervalul lipseşte orice concentrare de probabilitate sau
probabilitatea în intervalul, astfel încât valoarea efectivă nu este mult mai probabil să fie la un singur loc sau în
cadrul interval. Dar nu este neapărat o distribuire uniformă de probabilitate pe intervalul. În schimb, valoarea reală a
latitudine completă a fi oriunde în interiorul intervalului cu probabilitatea unul. De fapt, ar putea fi mai multe valori în
intervalul, ca ar fi cazul în cazul în care cantitatea nu este fixă, dar diferite. Intervalul reprezintă faptul că nu ştim funcția de
distribuție care trebuie utilizat pentru a caracteriza probabilitatea ca cantitatea este de fapt o valoare sau alta în
intervalul. Plin de încredere: măsurarea reprezintă o afirmaţie cu deplină încredere că valoarea este în intervalul specificat,
şi nu în afara ei. Afirmaţia nu este o declaraţie de încredere statistice. Intervalul este nu numai o gamă în care avem, de
exemplu, 95 % încredere valoarea se află, nici nu sunt intervalele astfel încât medie, de exemplu, 95 % dintre ele va
încadraţi valorile adevărat respective. Asta este, nu este un interval de încredere sau interval de credibilitate. Mai degrabă,
intervalul reprezinta-vă limitele cantitative, la gradul de plin de încredere, care este deţinută de măsurare în sine sau de
aparatul de măsură. Ambele ipoteze de nici o concentrare şi plin de încredere sunt relaxat la punctul 8.3. Motivele vom
începe cu aceste ipoteze va fi evidentă atunci când comparăm abordare dezvoltat în acest raport de la abordarea standard
pentru evaluarea, exprimându- şi săditor incertitudinea măsurării. Folosind concentrația de no intervale dotează noastre
abordare cu anumite caracteristici de dorit nu partajat prin metode comparabile care utilizează uniforma sau normala (sau
orice altă formă) probabilitate (a se vedea punctul 8.1). Utilizarea intervalelor de încredere complet foarte mult simplifică
anumite calcule, dar, desigur, adevarata valoare a unei mărimi nu fapt se regăsesc în intervalul dat doar pentru că unele
măsurători afirmă o face. Instrumentul poate fi incorect calibrat. Şi, chiar şi pentru dispozitive bine calibrat, probabil că nu
este posibil a legat toate potenţiale erori de măsurare. De exemplu, erori de transcriere şi alte greşeli pot apărea chiar şi în
măsurători atent executate. Prin urmare, de limitele intervalului nu poate fi în întregime corecte chiar dacă ele sunt
reprezentate ca matematic anumite. Cu toate acestea, aceste intervale de timp sunt cu siguranţă nu mai necinstit decât
folosind un scalar de măsurare, care implicit reprezintă sine ca fiind 100 % precizie (Hajagos 2005, pagina 96). Punctul de
ansamblu de a folosi un interval model incertitudinea măsurării este de a începe să recunoască intrinsecă imprecizie în
măsurare.

S-ar putea să vă placă și