Documente Academic
Documente Profesional
Documente Cultură
Shawish Yazan
Grupa 2
CONTINUT:
HISTOGRAMA
ASIMETRIA
DISPERSIE
CORELAŢIA
STATISTICA DESCRIPTIVA
Histograma
Total
80
70
60 Figure 1-Histogram
50
40
Am deschis archive.ics.uci.edu si
30 Total
am descarcat un fisier de date
20
numit (Indian Liver Patient
10
Disease), am ales primul column
0
(column A) care reprezinta varstele 4-8
9-13
14-18
74-78
19-23
24-28
29-33
34-38
39-43
44-48
49-53
54-58
59-63
64-68
69-73
84-88
89-93
de pacientii si i-am copiat intru o
noua pagina, am ales column A si
am facut PivotTable, apoi am
grupat varstele si am calculat Row Labels Count of
valoare prin adaugare date grupate 65
in Values. 4-8 6
9-13 8
14-18 22
19-23 24
Apoi am ales tabelul facut si din 24-28 38
Insert am adaugat un diagram care 29-33 60
reprezinta numere de pacientii cu 34-38 61
varsta lor, am generat graficul din 39-43 53
Figura 1. 44-48 70
49-53 57
54-58 51
59-63 50
64-68 39
69-73 21
74-78 19
84-88 2
89-93 1
Grand Total 582
Table 1 (PivotTable cu Varsta si numeral de
pacientii)
Asimetria
𝑛 𝑋𝑖 − 𝑋 2
𝑆𝑘𝑒𝑤 = ∑( )
(𝑛 − 1)(𝑛 − 2) 𝑠
La asimetria am descarcat un set de data cu titlu de (Arrhythmia), am ales column care reprezinta varstelor de
pacientii intr-o pagina noua in column A care reprezinta 𝑋𝑖.
Apoi in column G am gasit (𝑋𝑖 − 𝑋)² prin functia =F1^2 si am plicat functia asta la toate numere.
In column H am gasit suma ∑(𝑋𝑖 − 𝑋)² prin functia =SUM(G:G)
̅̅̅2
∑(𝑥−𝑥)
Apoi in column I am gasit prin functia =H1/B1
𝑛
̅̅̅2
∑(𝑥−𝑥)
In column J am gasit √ care reprezinta s in equatia prin functia =SQRT(I1)
𝑛
𝑋𝑖−𝑋
Apoi in column N am gasit prin functia =F1/$J$1 si dupa am cubat rezultatele in column O ca sa gasesc
𝑠
suma care este reprezintata in column P prin functia =SUM(O:O)
𝑛
In column Q am gasit (𝑛−1)(𝑛−2) prin functia =B1/C1 si am gasit asimetria (SKEW) in column R prin =Q1*P1 care
𝑛 𝑋𝑖−𝑋 2
este (𝑛−1)(𝑛−2) ∑( )
𝑠
Ce
Column reprezinta
A Varstelor = 𝑋𝑖
B numerul de pacientii 𝑛
C (𝑛 − 1)(𝑛 − 2)
D Medie varstelor = 𝑋
F 𝑋𝑖 − 𝑋
G (𝑋𝑖 − 𝑋)²
H Sum=(𝑋𝑖 − 𝑋)² // ∑(𝑋𝑖 − 𝑋)²
I ∑(𝑥 − ̅̅̅
𝑥)2
𝑛
J ̅̅̅2
∑(𝑥−𝑥)
√
𝑛
=s
N 𝑋𝑖 − 𝑋
𝑠
O 𝑋𝑖 − 𝑋
( )³
𝑠
P ̅̅̅2
∑(𝑥−𝑥)
∑√ 𝑛
Q 𝑛
(𝑛 − 1)(𝑛 − 2)
R 𝑛
∑(
𝑋𝑖−𝑋 2
) = 𝑆𝑘𝑒𝑤
(𝑛−1)(𝑛−2) 𝑠
Si se poate sa gasim Asimetria prin DATA. Selectam Data Analysis
.
Alegem “Descriptive Statistics”
1- Am copiat baza de date si am ales varstelor de pacientii intr-o noua foaia de calcul in Column A.
In B1 am scris “=STDEV” si am ales column A, apoi am facut clic pe ENTER ca sa apare valoare de deviaţia standard.
Apoi in column G am gasit (𝑋𝑖 − 𝑋)² prin functia =F1^2 si am plicat functia asta la toate numere.
In column H am gasit suma ∑(𝑋𝑖 − 𝑋)² prin functia =SUM(G:G)
̅̅̅2
∑(𝑥−𝑥)
Apoi in column I am gasit prin functia =H1/B1
𝑛
̅̅̅2
∑(𝑥−𝑥)
In column J am gasit √ care reprezinta deviatia standard prin functia =SQRT(I1)
𝑛
Corelaţia
Este un termen general folosit pentru a defini interdependenţa sau legătura dintre variabilele observate în populaţii
statistice.
∑(𝑋−𝑋̅)(𝑌−𝑌̅)
𝑟=
𝑛𝑠𝑥 𝑠𝑦
A= X B= Y
C= X̅ D= X-X̅
E= Y̅ F= Y-Y̅
G= (X-X̅)*(Y-Y̅) H= ∑(X-X̅)*(Y-Y̅)
I= (X-X̅) ² J= ∑(X-X̅)²
K=n L= √n
M= (Y-Y̅) ² N=∑(Y-Y̅) ²
O= ∑(Y-Y̅) ²/n P=√∑(y-Y)^2/n
Q= r
Statistica Descriptiva
Am lucrat pe un set de date Vertebral Column cu data despre Kidney Chronic Disease. Am ales primul column,
Column A cu scopul de a afla un minim, maxim, mediana, etc
Apoi am copiat datele intru o noua foaia de calcul. Am deschis menul Data si am selectat functia Data Analysis pentru a
realiza tabelul si alegem Descriptive Statistics.
La input selectam coloana A, si la output selectam unde vrem sa iese tabelul, alegem OK sau facem clic pe ENTER
ca sa iese tabelul unde am pus Output-ul.