Sunteți pe pagina 1din 9

PREZENTAREA DATELOR

TABELE, SERII STATISTICE, REPREZENTARI GRAFICE


• Datele statistice sunt marimi concrete obtinute din experimente, masurare, numarare sau din
calcule.

• O activitate planificata in urma careia se obtine un set de date se numeste experiment sau sondaj

• Datele : Valori ale variabilelor = valori de observatie

• A. Date calitative nominale B. Date cantitative discrete

Date calitative ordinale Date cantitative continue

Exemple: Domeniul in care s-au angajat absolventii unei facultati

Culorile bomboanelor M&M’s

Calificative scolare

Admis/Respins pentru o cerere

Genul angajatilor

Productia de cereale la un numar de ferme intr-un an;

Nivelul productiei inregistrat in zece ani consecutivi.

• Datele sunt inregistrate la inceput in tabele brute numite si tabele initiale in ordinea obtinerii.

Apoi sunt sistematizate in tabele de frecvente absolute si de frecvente relative numite si


distributii de frecvente

Notatii: Variabila statistica in general se notează cu majusculele de la sfârşitul alfabetului, X, Y, Z .

Dacă se notează cu X o variabilă statistică oarecare, atunci cu x1, x2, ...,xn se vor nota stările (valorile)
variabilei respective.

 x1 x2 ,..., xk 
Forma generala a unei serii statistice este: X :  , unde x1, x2, ...,xk sunt
 f1 f2 ,..., f k 
valori distincte inregistrate pentru caracterictica X, iar f1, f2, … ,fk sunt frecventele de aparitie ale celor k
valori. (de cate ori se repeta fiecare valoare).

Observatii: - seria trebuie sa ofere informatii cu privire la succesiunea,


marimea valorilor inregistrate si a frecventelor corespunzatoare;

- intre cele doua siruri de date exista o corespondenta univoca

Frecventa absoluta a valorii xi se noteaza fi = cat de des apare valoarea xi , i=1,...,k

Suma frecventelor absolute este egala cu marimea colectivitatii statistice.


k
𝒇𝟏 + 𝒇𝟐 +….+𝒇𝒌 =n sau cu scriera folosind simbolul “sigma” pentru suma: 
i 1
fi  n

Frecventa relativa (pondere sau proportie) este un indicator derivat notat fi* , i  1,..., k , unde k=nr.
de valori distincte ale variabilei sau nr. de interval in care grupam datele.
1
Page
fi
fi * 
fi
sau f i* 
k
n
 fi
i 1

1) f i* [0,1]
k
2) 
i 1
f i*  1
Observatii:
3) Frecventa relativa poate fi exprimata si procentual
fi
f i*%   100
n
Exemplu: DATE CALITATVE NOMINALE

Distibutia muzeelor dupa tipul lor


Sistematizarea datelor privind muzeele, în anul 2007, în România, în funcţie de tipul acestora:
Numărul muzeelor (la sfârşitul anului) Ponderea muzeelor
Tipul muzeului
( i)
*%
( fi ) f
Ştiinţele naturii 44 6,6
Istoria tehnicii şi ştiinţei 21 3,1
Istorie 117 17,5
Etnografie 115 17,2
Istoria culturii 152 22,8
Artă 149 22,3
Mixte 70 10,5
Total 668 100
Sursa: Anuarul Statistic al României, 2008.

Observatii: Distribuțiile de frecvență relativă sunt indicate pentru a compara două seturi de date.

Deoarece frecvențele relative se situează întotdeauna între 0 și 1, ele ofera un standard pentru
comparare.

Diagrama prin coloane (în cazul frecvenţelor absolute)

160
Nr. muzee (frecvente absolute)

140
120
100
80
60
40
20
0
Ştiinţele Istoria Istorie Etnografie Istoria Artă Mixte
naturii tehnicii şi culturii
ştiinţei
tipul de muzeu
2

Distribuţia muzeelor după tipul lor


Page
Exemplu: DATE CALITATIVE ORDINALE

Intre valorile variabilei ordinale exista o relatie de ordine “<“ sau “≤”

de care tinem seama in sistematizarea datelor.

Distributia pensinilor dupa numarul de margarte

Frecvente absolute:

 0 1 2 3 4 5
X : 
 676 1108 1090 280 91 5 
N=3250 unitati turistice

f3 = 1090 –arată numărul unităţilor de cazare turistice având categoria de „2 stele”;

Frecventa cumulata

Definitii:

- numarul valorilor de observatie mai mici sau egale cu xi se numeste frecventa cumulata crescator;

- nr. datelor mai mari sau egale cu o valoare xi se numeste frecventa cumulata descrescator

- frecventele cumulate impartite la volumul selectiei n se numesc frecvente relative cumulate

Tabel cu distributia frecventelor pensiunilor dupa nr. De margarete

Tipul unitatii Frecventa Frecventa Frecventa Frecventa


absoluta cumulata relativa(%) relativa
cumulata(%)

0 676 676 20,80 20,80

1 1108 1784 34,09 54,89


2 1090 2874 33,54 88,43

3 280 3154 8,62 97,05


4 91 3245 2,80 99,85

5 5 3250 0,15 100


Total 3250 Total 100
3
Page
Exemplu: DATE CANTITATIVE (NUMERICE)

In functie de numarul de valori distincte gruparea datelor se face pe

VARIANTE (valori singulare) daca sunt putine valori distincte


INTERVALE DE VARIATIE daca sunt multe valori distincte

Nivelul profitului anual (unitati monetare) pentru 50 de firme de dulciuri este:

62 90 91 93 95
82 99 102 105 110
89 123 133 145 164
97 65 72 76 79
114 84 86 87 89
63 91 92 94 96
119 101 104 107 113
64 132 134 146 174
84 69 74 77 98
83 85 86 88 102

• X min=62 um, x max= 174 um, Xmax-Xmin= 112

• Xmax-Xmin=amplitudine-=plaja de variatie

• Numarul recomandat de interval este intre 5 si 15

• Formula aproximativa k  n

• Formula k=1+3,22 lg n pentru n mare

• h=lungimea intervalului

K=7, h=16

FC FC
interval BINS FA=fi FR=fi/n FR(%)=(fi/n)*100 crescator descresc FRC
[62,78] 78 f1 =9 9/50=0.18 18 f1 =9 50 0.18
(78,94] 94 f2 =18 18/50=0.36 36 f1+f2=27 41 0.54
(94,110] 110 12 12/50=0.24 24 f1+f2+f3=39 23 0.78
(110,126] 126 4 4/50=0.08 8 43 11 0.86
(126,142] 142 3 3/50=0.06 6 46 7 0.92
(142,158] 158 2 2/50=0.04 4 48 4 0.96
(158,174] 174 f7 =2 2/50=0.04 4 n=50 2 1
4
Page
REPREZENTAREA GRAFICA A DISTRIBUTIILOR DE FRECVENTE

HISTOGRAMA

• Ne ajuta sa vizualizam datele grupate in intervale;

• Este reuniunea dreptunghiurilor cu baza pe axa Ox si avand inaltimea egala cu frecventa absoluta
a datelor din fiecare interval.

• Baza dreptunghiurilor este egala cu lungimea h a intervalelor de grupare

• Inaltimea dreptunghiurilor este frecventa absoluta fi ,sau frecventa relativa

OGIVA

Ogiva este reprezentarea grafica poligonala a frecventelor cumulate

20 18
Histogram 120.00%
100.00%
15 12
Frequency

80.00%
9
10 60.00%
4 40.00% Frequency
5 3 2 2
0 20.00%
0 0.00% Cumulative %

Bin

60
50
40
30 frecventa cumulata
crescator
20
frecventa cumulata
10 descrescator
0
5
Page
POLIGONUL FRECVENTELOR ABSOLUTE SAU RELATIVE

20
18 18
16
14
12 12
10
9 Series1
8
6
4 4
3
2 2 2
0
[62,78] (78,94] (94,110] (110,126](126,142](142,158](158,174]

DIAGRAMA DE STRUCTURA: REPREZENTAREA GRAFICA A FRECVENTELOR RELATIVE

Structura firmelor dupa profit


4%
4%

6% 18%

8%

24%
36%

[62,78] (78,94] (94,110] (110,126] (126,142] (142,158] (158,174]

Dreptunghiul de structura
100% 4%
4%
6%
80% 8%

24%
60%

40%
36%

20%
18%
0%
6
Page
Dot Plot este reprezentarea grafica a datelor folosid puncte pe o axa orizontala.

Un studiu " Cat dureaza micul dejun?" a generat urmatoarele date:

Minute: 0 1 2 3 4 5 6 7 8 9 10 11 12
Oameni: 6 2 3 5 2 5 0 0 2 3 7 4 1

Aceasta inseamna ca 6 pesoane aloca 0 minute pentru micul dejun ,2 persoane raspund ca este
suficient 1 minut , etc.

Acesta este dot plot pentru distributia de frecvente a timpului petrecut la micul dejun.:

6. Diagrama “radacina-frunza” (Stem and Leaf Diagram)

7
Page
FORMA DISTRIBUTIILOR DE FRECVENTA PENTRU UN SIR DE DATE

8
Page
DISTRIBUTIA DE FRECVENTE BIDIMENSIONALA:
Exemplu (date nenumerice)

Despre distribuţia turiştilor în funcţie de naţionalitate, în două hoteluri de categoriile 3 şi 4 stele se


cunosc datele:

Categorie confort
Naţionalitate TOTAL
3 stele 4 stele
Română 802 118 920
Străină 245 497 742
Total 1047 615 1662

Distributia turistilor in functie de


nationalitate si locatia aleasa
1000
802
800
600 497
400 245
200 118

0
Română Străină

Categorie confort 3 stele Categorie confort 4 stele

Exemplu (date numerice): tabel de date initiale si corelograma

9
Page

S-ar putea să vă placă și