Sunteți pe pagina 1din 24

Informatica

Shawish Yazan
Grupa 2

CONTINUT:

HISTOGRAMA

ASIMETRIA

DISPERSIE

CORELAŢIA

STATISTICA DESCRIPTIVA
Histograma

Total
80
70
60 Figure 1-Histogram
50
40
Am deschis archive.ics.uci.edu si
30 Total
am descarcat un fisier de date
20
numit (Indian Liver Patient
10
Disease), am ales primul column
0
(column A) care reprezinta varstele 4-8
9-13
14-18

74-78
19-23
24-28
29-33
34-38
39-43
44-48
49-53
54-58
59-63
64-68
69-73

84-88
89-93
de pacientii si i-am copiat intru o
noua pagina, am ales column A si
am facut PivotTable, apoi am
grupat varstele si am calculat Row Labels Count of
valoare prin adaugare date grupate 65
in Values. 4-8 6
9-13 8
14-18 22
19-23 24
Apoi am ales tabelul facut si din 24-28 38
Insert am adaugat un diagram care 29-33 60
reprezinta numere de pacientii cu 34-38 61
varsta lor, am generat graficul din 39-43 53
Figura 1. 44-48 70
49-53 57
54-58 51
59-63 50
64-68 39
69-73 21
74-78 19
84-88 2
89-93 1
Grand Total 582
Table 1 (PivotTable cu Varsta si numeral de
pacientii)
Asimetria

𝑛 𝑋𝑖 − 𝑋 2
𝑆𝑘𝑒𝑤 = ∑( )
(𝑛 − 1)(𝑛 − 2) 𝑠

La asimetria am descarcat un set de data cu titlu de (Arrhythmia), am ales column care reprezinta varstelor de
pacientii intr-o pagina noua in column A care reprezinta 𝑋𝑖.

In column B am gasit numere de pacientii 𝑛 prin functia =COUNT(A:A)


In column C am gasit (𝑛 − 1)(𝑛 − 2) prin functia =(B1-1)*(B1-2)
In column D am gasit medie varstelor 𝑋 prin functia =AVERAGE(A:A)
In column F am gasit 𝑋𝑖 − 𝑋 prin functia =E1-D1

Apoi in column G am gasit (𝑋𝑖 − 𝑋)² prin functia =F1^2 si am plicat functia asta la toate numere.
In column H am gasit suma ∑(𝑋𝑖 − 𝑋)² prin functia =SUM(G:G)

̅̅̅2
∑(𝑥−𝑥)
Apoi in column I am gasit prin functia =H1/B1
𝑛
̅̅̅2
∑(𝑥−𝑥)
In column J am gasit √ care reprezinta s in equatia prin functia =SQRT(I1)
𝑛

𝑋𝑖−𝑋
Apoi in column N am gasit prin functia =F1/$J$1 si dupa am cubat rezultatele in column O ca sa gasesc
𝑠
suma care este reprezintata in column P prin functia =SUM(O:O)

𝑛
In column Q am gasit (𝑛−1)(𝑛−2) prin functia =B1/C1 si am gasit asimetria (SKEW) in column R prin =Q1*P1 care
𝑛 𝑋𝑖−𝑋 2
este (𝑛−1)(𝑛−2) ∑( )
𝑠
Ce
Column reprezinta

A Varstelor = 𝑋𝑖
B numerul de pacientii 𝑛
C (𝑛 − 1)(𝑛 − 2)
D Medie varstelor = 𝑋
F 𝑋𝑖 − 𝑋
G (𝑋𝑖 − 𝑋)²
H Sum=(𝑋𝑖 − 𝑋)² // ∑(𝑋𝑖 − 𝑋)²
I ∑(𝑥 − ̅̅̅
𝑥)2
𝑛
J ̅̅̅2
∑(𝑥−𝑥)

𝑛
=s
N 𝑋𝑖 − 𝑋
𝑠
O 𝑋𝑖 − 𝑋
( )³
𝑠
P ̅̅̅2
∑(𝑥−𝑥)
∑√ 𝑛
Q 𝑛
(𝑛 − 1)(𝑛 − 2)
R 𝑛
∑(
𝑋𝑖−𝑋 2
) = 𝑆𝑘𝑒𝑤
(𝑛−1)(𝑛−2) 𝑠
Si se poate sa gasim Asimetria prin DATA. Selectam Data Analysis

.
Alegem “Descriptive Statistics”

apoi la Input selectam Column A care reprezinta varstelor


pacientii si la Output selectam unde vrem sa fie tabelul.
Dispersie

1- Am copiat baza de date si am ales varstelor de pacientii intr-o noua foaia de calcul in Column A.

In B1 am scris “=STDEV” si am ales column A, apoi am facut clic pe ENTER ca sa apare valoare de deviaţia standard.

Cum gasim deviatia standard prin equatia


Am ales column care reprezinta varstelor de pacientii intr-o pagina noua in column A care reprezinta 𝑋𝑖.
In column B am gasit numere de pacientii 𝑛 prin functia =COUNT(A:A)
In column C am gasit (𝑛 − 1)(𝑛 − 2) prin functia =(B1-1)*(B1-2)
In column D am gasit medie varstelor 𝑋 prin functia =AVERAGE(A:A)
In column F am gasit 𝑋𝑖 − 𝑋 prin functia =E1-D1

Apoi in column G am gasit (𝑋𝑖 − 𝑋)² prin functia =F1^2 si am plicat functia asta la toate numere.
In column H am gasit suma ∑(𝑋𝑖 − 𝑋)² prin functia =SUM(G:G)

̅̅̅2
∑(𝑥−𝑥)
Apoi in column I am gasit prin functia =H1/B1
𝑛
̅̅̅2
∑(𝑥−𝑥)
In column J am gasit √ care reprezinta deviatia standard prin functia =SQRT(I1)
𝑛
Corelaţia

Este un termen general folosit pentru a defini interdependenţa sau legătura dintre variabilele observate în populaţii
statistice.

A- Graficul Scatter : Este o modalitate de vizualizare a relaţiei dintre 2 parametri.


1- Am descarcat un set de date si am copiat Co lumn A si Column C intru o noua foia de calcul
2- Selectam datelor care sunt in column A si B, apoi prin meniul Insert alegem sa adaugam graficul Scatter care
ofera informatii privind Corelaţia dintre column A si B
B- Metoda 2: coeficientul de corelaţie = r

∑(𝑋−𝑋̅)(𝑌−𝑌̅)
𝑟=
𝑛𝑠𝑥 𝑠𝑦

A= X B= Y
C= X̅ D= X-X̅
E= Y̅ F= Y-Y̅
G= (X-X̅)*(Y-Y̅) H= ∑(X-X̅)*(Y-Y̅)
I= (X-X̅) ² J= ∑(X-X̅)²
K=n L= √n
M= (Y-Y̅) ² N=∑(Y-Y̅) ²
O= ∑(Y-Y̅) ²/n P=√∑(y-Y)^2/n
Q= r
Statistica Descriptiva

Am lucrat pe un set de date Vertebral Column cu data despre Kidney Chronic Disease. Am ales primul column,
Column A cu scopul de a afla un minim, maxim, mediana, etc

Apoi am copiat datele intru o noua foaia de calcul. Am deschis menul Data si am selectat functia Data Analysis pentru a
realiza tabelul si alegem Descriptive Statistics.
La input selectam coloana A, si la output selectam unde vrem sa iese tabelul, alegem OK sau facem clic pe ENTER
ca sa iese tabelul unde am pus Output-ul.

Important: Trebuie sa selectam si Summary Statistics

Figure 3 (Input si Output) Figure 2 Tabelul care reprezinta statistica descriptiva

S-ar putea să vă placă și