Sunteți pe pagina 1din 9

Elemente de statistică

Instrumente Excel
Pentru a executa operații statistice folosim secțiunea Data → Data Analysis (Tools →
Data Analysis în Excel 2003).

Această secțiune poate să nu apară în mod implicit pe barele de butoane. Pentru a o


introduce, procedăm în felul următor:
Accesăm meniul File și alegem secținea Options.

Alegem din stânga secțiunea Add-Ins, apoi din lista din dreapta alegem Analysis
ToolPak și apăsăm butonul Go.

1
Bifăm Analysis ToolPak.

Elemente de statistică descriptivă


Considerăm următoarele date care reprezintă evoluția principalelor valute în perioada
1.04 - 11.05 2020.
Valoare Valoare Valoare Valoare
Data EUR (lei) USD (lei) CHF (lei) GBP (lei)
11 Mai 2020 4.8295 4.461 4.5901 5.5163
8 Mai 2020 4.8278 4.4545 4.5859 5.5143
7 Mai 2020 4.8242 4.4695 4.5825 5.5241
6 Mai 2020 4.8258 4.4708 4.5857 5.5335
5 Mai 2020 4.829 4.4515 4.5892 5.5397
4 Mai 2020 4.8387 4.424 4.588 5.5023
30 Apr. 2020 4.8421 4.4541 4.5838 5.5644
29 Apr. 2020 4.8425 4.459 4.5833 5.5378
28 Apr. 2020 4.8436 4.452 4.5744 5.5638
27 Apr. 2020 4.836 4.46 4.5828 5.5421
24 Apr. 2020 4.8412 4.4984 4.6047 5.5423
23 Apr. 2020 4.8414 4.4926 4.6058 5.5441
22 Apr. 2020 4.8382 4.4536 4.5971 5.5039
21 Apr. 2020 4.8345 4.4605 4.5979 5.51
16 Apr. 2020 4.836 4.4524 4.5981 5.5532
15 Apr. 2020 4.8345 4.4215 4.5883 5.5327
14 Apr. 2020 4.8327 4.415 4.5831 5.5399
13 Apr. 2020 4.8297 4.4155 4.5708 5.5222
10 Apr. 2020 4.8277 4.4115 4.5706 5.5048
9 Apr. 2020 4.8278 4.4355 4.5746 5.5115
8 Apr. 2020 4.8338 4.4477 4.5796 5.4833
7 Apr. 2020 4.8314 4.4445 4.5663 5.4595
6 Apr. 2020 4.828 4.4671 4.5696 5.4926
3 Apr. 2020 4.8286 4.4674 4.5775 5.4858
2 Apr. 2020 4.8288 4.4163 4.5682 5.4966
1 Apr. 2020 4.8246 4.4133 4.5646 5.4549

2
Din secțiunea Data alegem Data Analysis și bifăm Descriptive Statistics.

În fereastra următoare Input Range se introduc celulele pentru care se realizează analiza
statistică – aici am ales valorile din coloana Valoare EUR (lei). Trebuie bifat dacă datele sunt
organizate pe linii sau pe coloane. În acest exemplu am ales ca rezultatul să fie afișat începând cu
celula G2 și am bifat Summary statistics (statistică sumativă).

Rezultatele sunt afișate în figura următoare:

3
1. Mean reprezintă media aritmetică. Se poate calcula și cu funcția AVERAGE.
2. Standared Error este eroarea standard. Aceasta oferă o informație referitoare la
precizia mediei exemplului ca estimare a mediei populaţiei. Cu cât eroarea
standard este mai mică, cu atât este mai probabil ca orice medie a unui exemplu să
fie apropiată de media populaţiei. Se poate determina și cu formula
= STDEV(domeniu)/SQRT(COUNT(domeniu)).
3. Median reprezintă mediana (valoarea din mijloc). Se poate determina și folosind
funcția MEDIAN.
4. Mode este modul (valoarea care apare de cele mai multe ori). Poate fi determinată
și folosind funcția MODE).
5. Standard deviation este deviația standard care indică gradul de împrăștiere față
de medie. Se poate determina și cu STDEV.
6. Sample variance este media pătratelor diferențelor dintre valorile date și valoarea
medie.
7. Kurtosis reprezintă coeficientul de boltire. Se poate afla și cu funcția KURT. O
valoare mai mare decât 0 arată distributie mai înaltă decât cea normală, iar o
valoare mai mică decât 0 indică o distribuție mai joasă.

8. Skewness este coeficientul de asimetrie (se poate determina și folosind SKEW).


Dacă valoarea sa este mai mare decât 0 atunci avem distribuție spre dreapta, iar
dacă valoarea sa este mai mică decât 0 avem distributie cu coada spre stânga.

9. Range este diferența dintre valoarea maximă și valoarea minimă.


10. Minimum este valoarea minimă ce poate fi determinată și cu funcția MIN.
11. Maximum este valoarea maximă ce poate fi determinată și cu funcția MAX.
12. Sum reprezintă suma valorilor. Se poate determina și folosind SUM.
13. Count reprezintă numărul valorilor. Se poate determina și folosind COUNT.
14. Confidence Level (95%) Un interval de încredere de 95% înseamnă că dacă
repetăm un test de mai multe ori, în 95% din cazuri media va fi între limita

4
superioară şi limita inferioară a intervalului de încredere. Intervalul de încredere
de 95% este determinat din tabel astfel:
[Mean - Confidence Level (95%), Mean + Confidence Level (95%)].

Histograme
O histogramă este un tip de grafic cu aplicații în statistică. Histogramele oferă o
reprezentare vizuală a datelor numerice indicând numărul de date care se află într - un interval de
valori. Aceste intervale de valori se numesc clase sau pubele. Frecvența datelor care se
încadrează în fiecare clasă este desenată sub forma unei bare. Cu cât bara este înaltă, cu atât este
mai mare frecvența valorilor datelor din acea clasă.
Pentru a crea o histogramă în Excel care să reprezinte o serie de date, trebuie să stabilim
o serie de intervale cuprinse între valoarea minimă și valoarea maximă. Apoi, din secțiunea Data
Analysis alegem Histogram.

5
În figura de mai sus, în secțiunea Input Range am introdus celulele care memorează
Output Range și am stabilit că rezultatele se vor afișa începând cu celula G10 și am bifat Chart
Ouput pentru a afișa reprezentarea grafică. Rezultatul este prezentat în imaginea următoare:

6
Coeficientul de corelație Pearson
Corelația și regresia pun în evidență relațiile ce există între două serii de observații
simultane. Coeficientul de corelaţie r al lui Pearson (coeficient de corelaţie liniară) este folosit
cel mai des pentru a măsura gradul de legătură dintre variabile. Coeficientul de corelaţie r are
valori cuprinse între -1 şi 1. Cu cât coeficientul de corelație este mai apropiat de 1, cu atât datele
sunt mai corelate în sens direct. Cu cât coeficientul de corelație este mai apropiat de -1, cu atât
datele sunt mai corelate în sens invers (datele sunt invers proporționale). Dacă valoarea lui r este
apropiată de 0 (< 0.25), atunci spunem că datele nu sunt corelate.
În Excel coeficientul de corelație se determină cu funcția CORREL specificând cele
două serii de date pe care dorim să le corelăm, sau din Data Analysis alegând Correlation.

7
Rezultatele sunt prezentate în imaginea următoare:

8
Dacă două serii de date sunt corelate, la reprezentarea sub formă de grafic cu puncte, ele
tind să se alinieze sub forma unei drepte.

Între USD și CHF avem o corelație medie (r = 0.59877).

S-ar putea să vă placă și