Sunteți pe pagina 1din 23

Informatica

Shawish Yazan
Grupa 2

CONTINUT:

Histograma
Histograma

Total
80

Am deschis archive.ics.uci.edu si 70
60
am descarcat un fisier de date Figure 1-Histogram
50
numit (Indian Liver Patient
40 Total
Disease), am ales primul column
30
(column A) care reprezinta varstele
20
de pacientii si i-am copiat intru o 10
noua pagina, am ales column A si 0
am facut PivotTable, apoi am 8 3 8 3 8 3 8 3 8 3 8 3 8 3 8 8 3
4- 9-1 4-1 9-2 4-2 9-3 4-3 9-4 4-4 9-5 4-5 9-6 4-6 9-7 4-7 4-8 9-9
grupat varstele si am calculat 1 1 2 2 3 3 4 4 5 5 6 6 7 8 8

valoare prin adaugare date grupate


in Values.
Row Labels Count of
65
Apoi am ales tabelul facut si din 4-8 6
9-13 8
Insert am adaugat un diagram care
14-18 22
reprezinta numere de pacientii cu 19-23 24
varsta lor, am generat graficul din 24-28 38
Figura 1. 29-33 60
34-38 61
39-43 53
44-48 70
49-53 57
54-58 51
59-63 50
64-68 39
69-73 21
74-78 19
84-88 2
89-93 1
Grand Total 582
Table 1 (PivotTable cu Varsta si numeral de
pacientii)
Asimetria

n Xi−X
Skew=
( n−1 )( n−2 )
∑ ( s ¿) 2 ¿

La asimetria am descarcat un set de data cu titlu de (Arrhythmia), am ales column care reprezinta varstelor de
pacientii intr-o pagina noua in column A care reprezinta Xi .

In column B am gasit numere de pacientii n prin functia =COUNT(A:A)


In column C am gasit ( n−1 )( n−2 ) prin functia =(B1-1)*(B1-2)
In column D am gasit medie varstelor X prin functia =AVERAGE(A:A)
In column F am gasit Xi− X prin functia =E1-D1

Apoi in column G am gasit ( Xi− X) ² prin functia =F1^2 si am plicat functia asta la toate numere.
In column H am gasit suma ∑( Xi− X) ² prin functia =SUM(G:G)

Apoi in column I am gasit ∑ ¿¿ ¿ ¿ prin functia =H1/B1


In column J am gasit √ ∑ ¿ ¿ ¿ ¿ ¿ care reprezinta s in equatia prin functia =SQRT(I1)

Xi−X
Apoi in column N am gasit prin functia =F1/$J$1 si dupa am cubat rezultatele in column O ca sa gasesc
s
suma care este reprezintata in column P prin functia =SUM(O:O)

n
In column Q am gasit prin functia =B1/C1 si am gasit asimetria (SKEW) in column R prin =Q1*P1
( n−1 ) ( n−2 )
n Xi− X 2
care este
( n−1 ) ( n−2 )
∑ (
s
¿) ¿
Ce
Column reprezinta

A Varstelor = Xi
B numerul de pacientii n
( n−1 )( n−2 )
C
D Medie varstelor = X
Xi− X
F
( Xi− X) ²
G
H Sum=( Xi− X) ² // ∑( Xi− X) ²
I ∑ ¿¿ ¿ ¿

J √∑ ¿ ¿ ¿ ¿ ¿ =s
Xi−X
N s

Xi−X
O (
s

P ∑√∑ ¿ ¿ ¿ ¿ ¿
n
Q ( n−1 ) ( n−2 )

n Xi− X 2
R ( n−1 ) ( n−2 )
∑ (
s
¿) ¿ = Skew
Si se poate sa gasim Asimetria prin DATA. Selectam Data Analysis

Alegem “Descriptive Statistics”

apoi la Input selectam Column A care reprezinta varstelor


pacientii si la Output selectam unde vrem sa fie tabelul.
Dispersie

1- Am copiat baza de date si am ales varstelor de pacientii intr-o noua foaia de calcul in Column A.

In B1 am scris “=STDEV” si am ales column A, apoi am facut clic pe ENTER ca sa apare valoare de deviaţia standard.

Cum gasim deviatia standard prin equatia


Am ales column care reprezinta varstelor de pacientii intr-o pagina noua in column A care reprezinta Xi.
In column B am gasit numere de pacientii n prin functia =COUNT(A:A)
In column C am gasit ( n−1 )( n−2 ) prin functia =(B1-1)*(B1-2)
In column D am gasit medie varstelor X prin functia =AVERAGE(A:A)
In column F am gasit Xi− X prin functia =E1-D1

Apoi in column G am gasit ( Xi− X) ² prin functia =F1^2 si am plicat functia asta la toate numere.
In column H am gasit suma ∑( Xi− X) ² prin functia =SUM(G:G)

Apoi in column I am gasit ∑ ¿¿ ¿ ¿ prin functia =H1/B1


In column J am gasit √ ∑ ¿ ¿ ¿ ¿ ¿ care reprezinta deviatia standard prin functia =SQRT(I1)
Corelaţia

Este un termen general folosit pentru a defini interdependenţa sau legătura dintre variabilele observate în populaţii
statistice.

A- Graficul Scatter : Este o modalitate de vizualizare a relaţiei dintre 2 parametri.


1- Am descarcat un set de date si am copiat Co lumn A si Column C intru o noua foia de calcul
2- Selectam datelor care sunt in column A si B, apoi prin meniul Insert alegem sa adaugam graficul Scatter care
ofera informatii privind Corelaţia dintre column A si B
B- Metoda 2: coeficientul de corelaţie = r

r=
∑ (X − X́ ¿)(Y −Ý ) ¿
n sx sy

A= X B= Y
C= X̅ D= X-X̅
E= Y̅ F= Y-Y̅
G= (X-X̅)*(Y-Y̅) H= ∑(X-X̅)*(Y-Y̅)
I= (X-X̅) ² J= ∑(X-X̅)²
K=n L= √n
M= (Y-Y̅) ² N=∑(Y-Y̅) ²
O= ∑(Y-Y̅) ²/n P=√∑(y-Y)^2/n
Q= r
Statistica Descriptiva

Am lucrat pe un set de date Vertebral Column cu data despre Kidney Chronic Disease. Am ales primul column,
Column A cu scopul de a afla un minim, maxim, mediana, etc

Apoi am copiat datele intru o noua foaia de calcul. Am deschis menul Data si am selectat functia Data Analysis pentru a
realiza tabelul si alegem Descriptive Statistics.
La input selectam coloana A, si la output selectam unde vrem sa iese tabelul, alegem OK sau facem clic pe ENTER
ca sa iese tabelul unde am pus Output-ul.

Important: Trebuie sa selectam si Summary Statistics

Figure 2 (Input si Output) Figure 3 Tabelul care reprezinta statistica descriptiva

S-ar putea să vă placă și