0% au considerat acest document util (0 voturi)
92 vizualizări9 pagini

Elemente de Statistica in Excel

Documentul oferă instrucțiuni pentru utilizarea instrumentelor statistice din Excel, inclusiv activarea Analysis ToolPak și realizarea analizei statistice descriptive. Se discută despre diferite statistici descriptive, cum ar fi media, eroarea standard, mediana, deviația standard și coeficientul de corelație Pearson. De asemenea, se explică cum se pot crea histograme și se analizează relațiile dintre variabile prin corelație.
Drepturi de autor
© © All Rights Reserved
Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.
Formate disponibile
Descărcați ca PDF, TXT sau citiți online pe Scribd
0% au considerat acest document util (0 voturi)
92 vizualizări9 pagini

Elemente de Statistica in Excel

Documentul oferă instrucțiuni pentru utilizarea instrumentelor statistice din Excel, inclusiv activarea Analysis ToolPak și realizarea analizei statistice descriptive. Se discută despre diferite statistici descriptive, cum ar fi media, eroarea standard, mediana, deviația standard și coeficientul de corelație Pearson. De asemenea, se explică cum se pot crea histograme și se analizează relațiile dintre variabile prin corelație.
Drepturi de autor
© © All Rights Reserved
Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.
Formate disponibile
Descărcați ca PDF, TXT sau citiți online pe Scribd

Elemente de statistică

Instrumente Excel
Pentru a executa operații statistice folosim secțiunea Data → Data Analysis (Tools →
Data Analysis în Excel 2003).

Această secțiune poate să nu apară în mod implicit pe barele de butoane. Pentru a o


introduce, procedăm în felul următor:
Accesăm meniul File și alegem secținea Options.

Alegem din stânga secțiunea Add-Ins, apoi din lista din dreapta alegem Analysis ToolPak
și apăsăm butonul Go.

1
Bifăm Analysis ToolPak.

Elemente de statistică descriptivă


Considerăm următoarele date care reprezintă evoluția principalelor valute în perioada 1.04
- 11.05 2020.
Valoare Valoare Valoare Valoare
Data EUR (lei) USD (lei) CHF (lei) GBP (lei)
11 Mai 2020 4.8295 4.461 4.5901 5.5163
8 Mai 2020 4.8278 4.4545 4.5859 5.5143
7 Mai 2020 4.8242 4.4695 4.5825 5.5241
6 Mai 2020 4.8258 4.4708 4.5857 5.5335
5 Mai 2020 4.829 4.4515 4.5892 5.5397
4 Mai 2020 4.8387 4.424 4.588 5.5023
30 Apr. 2020 4.8421 4.4541 4.5838 5.5644
29 Apr. 2020 4.8425 4.459 4.5833 5.5378
28 Apr. 2020 4.8436 4.452 4.5744 5.5638
27 Apr. 2020 4.836 4.46 4.5828 5.5421
24 Apr. 2020 4.8412 4.4984 4.6047 5.5423
23 Apr. 2020 4.8414 4.4926 4.6058 5.5441
22 Apr. 2020 4.8382 4.4536 4.5971 5.5039
21 Apr. 2020 4.8345 4.4605 4.5979 5.51
16 Apr. 2020 4.836 4.4524 4.5981 5.5532
15 Apr. 2020 4.8345 4.4215 4.5883 5.5327
14 Apr. 2020 4.8327 4.415 4.5831 5.5399
13 Apr. 2020 4.8297 4.4155 4.5708 5.5222
10 Apr. 2020 4.8277 4.4115 4.5706 5.5048
9 Apr. 2020 4.8278 4.4355 4.5746 5.5115
8 Apr. 2020 4.8338 4.4477 4.5796 5.4833
7 Apr. 2020 4.8314 4.4445 4.5663 5.4595
6 Apr. 2020 4.828 4.4671 4.5696 5.4926
3 Apr. 2020 4.8286 4.4674 4.5775 5.4858
2 Apr. 2020 4.8288 4.4163 4.5682 5.4966
1 Apr. 2020 4.8246 4.4133 4.5646 5.4549

2
Din secțiunea Data alegem Data Analysis și bifăm Descriptive Statistics.

În fereastra următoare Input Range se introduc celulele pentru care se realizează analiza
statistică – aici am ales valorile din coloana Valoare EUR (lei). Trebuie bifat dacă datele sunt
organizate pe linii sau pe coloane. În acest exemplu am ales ca rezultatul să fie afișat începând cu
celula G2 și am bifat Summary statistics (statistică sumativă).

Rezultatele sunt afișate în figura următoare:

3
1. Mean reprezintă media aritmetică. Se poate calcula și cu funcția AVERAGE.
2. Standared Error este eroarea standard. Aceasta oferă o informație referitoare la
precizia mediei exemplului ca estimare a mediei populaţiei. Cu cât eroarea standard
este mai mică, cu atât este mai probabil ca orice medie a unui exemplu să fie
apropiată de media populaţiei. Se poate determina și cu formula
= STDEV(domeniu)/SQRT(COUNT(domeniu)).
3. Median reprezintă mediana (valoarea din mijloc). Se poate determina și folosind
funcția MEDIAN.
4. Mode este modul (valoarea care apare de cele mai multe ori). Poate fi determinată
și folosind funcția MODE).
5. Standard deviation este deviația standard care indică gradul de împrăștiere față de
medie. Se poate determina și cu STDEV.
6. Sample variance este media pătratelor diferențelor dintre valorile date și valoarea
medie.
7. Kurtosis reprezintă coeficientul de boltire. Se poate afla și cu funcția KURT. O
valoare mai mare decât 0 arată distributie mai înaltă decât cea normală, iar o valoare
mai mică decât 0 indică o distribuție mai joasă.

8. Skewness este coeficientul de asimetrie (se poate determina și folosind SKEW).


Dacă valoarea sa este mai mare decât 0 atunci avem distribuție spre dreapta, iar
dacă valoarea sa este mai mică decât 0 avem distributie cu coada spre stânga.

9. Range este diferența dintre valoarea maximă și valoarea minimă.


10. Minimum este valoarea minimă ce poate fi determinată și cu funcția MIN.
11. Maximum este valoarea maximă ce poate fi determinată și cu funcția MAX.
12. Sum reprezintă suma valorilor. Se poate determina și folosind SUM.
13. Count reprezintă numărul valorilor. Se poate determina și folosind COUNT.
14. Confidence Level (95%) Un interval de încredere de 95% înseamnă că dacă
repetăm un test de mai multe ori, în 95% din cazuri media va fi între limita

4
superioară şi limita inferioară a intervalului de încredere. Intervalul de încredere de
95% este determinat din tabel astfel:
[Mean - Confidence Level (95%), Mean + Confidence Level (95%)].

Histograme
O histogramă este un tip de grafic cu aplicații în statistică. Histogramele oferă o
reprezentare vizuală a datelor numerice indicând numărul de date care se află într - un interval de
valori. Aceste intervale de valori se numesc clase sau pubele. Frecvența datelor care se încadrează
în fiecare clasă este desenată sub forma unei bare. Cu cât bara este înaltă, cu atât este mai mare
frecvența valorilor datelor din acea clasă.
Pentru a crea o histogramă în Excel care să reprezinte o serie de date, trebuie să stabilim o
serie de intervale cuprinse între valoarea minimă și valoarea maximă. Apoi, din secțiunea Data
Analysis alegem Histogram.

5
În figura de mai sus, în secțiunea Input Range am introdus celulele care memorează
Output Range și am stabilit că rezultatele se vor afișa începând cu celula G10 și am bifat Chart
Ouput pentru a afișa reprezentarea grafică. Rezultatul este prezentat în imaginea următoare:

6
Coeficientul de corelație Pearson
Corelația și regresia pun în evidență relațiile ce există între două serii de observații
simultane. Coeficientul de corelaţie r al lui Pearson (coeficient de corelaţie liniară) este folosit cel
mai des pentru a măsura gradul de legătură dintre variabile. Coeficientul de corelaţie r are valori
cuprinse între -1 şi 1. Cu cât coeficientul de corelație este mai apropiat de 1, cu atât datele sunt
mai corelate în sens direct. Cu cât coeficientul de corelație este mai apropiat de -1, cu atât datele
sunt mai corelate în sens invers (datele sunt invers proporționale). Dacă valoarea lui r este apropiată
de 0 (< 0.25), atunci spunem că datele nu sunt corelate.
În Excel coeficientul de corelație se determină cu funcția CORREL specificând cele două
serii de date pe care dorim să le corelăm, sau din Data Analysis alegând Correlation.

7
Rezultatele sunt prezentate în imaginea următoare:

8
Dacă două serii de date sunt corelate, la reprezentarea sub formă de grafic cu puncte, ele
tind să se alinieze sub forma unei drepte.

Între USD și CHF avem o corelație medie (r = 0.59877).

S-ar putea să vă placă și