Documente Academic
Documente Profesional
Documente Cultură
2018
Selectia
Proiectelor
Obiective
Explicarea diferitelor statistici utilizate pentru
a exprima localizarea și dispersia datelor
Scală rationala: Datele care pot fi puse intr-o scală, clasificate și cu care pot fi
efectuate toate operațiile aritmetice, inclusiv divizare. (Diviziunea prin zero, este, desigur,
exclusă). O valoare de zero indică o absență completă a caracteristicii de interes.
Exemple: înălțime, greutate, tensiune arterială
Scală de tip interval : Datele pot fi aranjate într-o anumită ordine și diferențele de
valori au semnificație. Datele pot fi ordonate într-o scală si diferențele pot fi interpretate si
pot fi comparate; nu exista zero, adevărat. Rapoartele nu pot fi comparate.
7
Exemplu: temperatura in grade Celsius.
Slide 7 © 2018 Business Future Solutions
Variabile de tip categorie (calitative)
Scală nominală: – data e de tip grupa, categorie, tip. Nu pot fi aranjate într-
o ordine si nici nu pot fi efectuate operații aritmetice.
Exemple: starea civilă, ramura de activitate.
8
Slide 8 © 2018 Business Future Solutions
Să vedem – Tipuri de date
Eșantion
Eșantion Eșantion
Statisticile Eșantionului :
Parametri Populatiei:
– Descrierea aritmetica a esantionului
– Descrierea aritmetica a populatiei
– X-bar , s, p, s2, n
– µ, , P, 2, N
Slide 10
10 © 2018 Business Future Solutions
Definiții
Range
Varianța
Deviația standard
Esantion Populatie
Date 200 0 5.0006 0.000654 5.0007 0.00925 4.9764 4.9943 5.0008 5.0072 Data 5.0241
Data 200 0 5.0006 0.000654 5.0007 0.00925 4.9764 4.9943 5.0008 5.0072 Data 5.0241
Slide 17 © 2018 Business Future Solutions
Parametrii localizării
Media trunchiată este:
Compromisul dintre Medie și Mediană.
Media trunchiată este calculată prin eliminarea unui procentaj specific
din observațiile cu valorile cele mai mari și cele mai mici din setul de
date și apoi calcularea mediei observațiilor rămase
Utilă cu datele care au valori potențiale
extreme.
Data 200 0 5.0006 0.000654 5.0007 0.00925 4.9764 4.9943 5.0008 5.0072 Data 5.0241
Data 200 0 5.0006 0.000654 5.0007 0.00925 4.9764 4.9943 5.0008 5.0072 Data 5.0241
Varianța este:
Abaterea pătratică medie față de medie a fiecărui punct de date
individual.
Esantion Populatie
Esantion Populatie
Data 200 0 5.0006 0.000654 5.0007 0.00925 4.9764 4.9943 5.0008 5.0072 Data 5.0241
Deviații standard
Regula Empirică…
Are un μ = 0, și σ = 1
Datele din orice Distribuție Normală pot fi determinate să se potrivească
Normalei standard prin convertirea scorurilor brute la scoruri standard.
Scorurile Z măsoară distanța dintre Medie și valoarea unei anume date, în
Deviații Standard.
30
Există un număr mare de instrumente statistice care includ în calculele lor proprietăți
ale Distribuției Normale.
Prin urmare, înțelegerea a cât de „Normale” sunt datele va avea impact asupra
modului în care abordăm datele.
Valoarea P 0,975
Testul Anderson-Darling este un bun test indicator
pentru normalitate: dacă valoare P este mai mare de
0,05, datele Dvs. sunt suficient de Normale pentru
majoritatea scopurilor.
Valoare P = 0.975
Histogram of Histogram
40
30
Frequency
20
10
0
98 99 100 101 102 103
Histogram
Dotplot of Granular
44 46 48 50 52 54 56
Granular
Percentila75
Mijloc Percentila 50 (Mediana)
50% din date Media
Percentila 25
Outlier
*
Limita superioară:
Q3+1,5(Q3-Q1) sau maxima
Upper Whisker
Q3: Percentila 75
BOX
Mediana
Q2: Mediana, Percentila 50
Q1: Percentila 25
Lower Whisker
Limita inferioară:
Q1-1,5(Q3-Q1) sau minima
Slide 43 © 2018 Business Future Solutions
Graficul de dispersie (Scatter Plot)
Graficul de dispersie (Diagrama de dispersie) reprezintă grafic perechi de
date numerice, cu câte o variabilă pe fiecare axă, pentru a căuta o relație
între acestea.
602
601
600
Time 1
599
598
597
1 10 20 30 40 50 60 70 80 90 100
Index
602
601
600
Time 1
599
598
597
1 10 20 30 40 50 60 70 80 90 100
Index
DATE
Statistici de bază
Statistici descriptive
Distribuția Normală
Evaluarea Normalității
Tehnici de reprezentare grafică