Sunteți pe pagina 1din 5

Seminar 2 (Tema 2)

Sistematizarea

SISTEMATIZAREA DATELOR (clasificare și grupare)


 Sistematizarea presupune gruparea datelor în clase de valori sau intervale.

 În cazul variabilelor calitative si cantitative discrete cu un nr. mic de valori distincte, se menționează toate valorile
distincte (cuvinte sau numere) și apoi se numără câte unități din populație se află în fiecare clasă => SERIE DE
DISTRIBUTIE DE FRECVENTE PE VARIANTE (grafice: DIAGRAMA PRIN COLOANE – variabile calitative si
POLIGONUL FRECVENTELOR pentru variabile cantitative)
 În cazul variabilelor cantitative continue, dar și a celor discrete cu un nr. mare de valori distincte, se precizează limitele
intervalelor după care se dorește gruparea și apoi se numără câte unități din populație se află în fiecare Interval =>
SERIE DE DISTRIBUTIE DE FRECVENTE PE INTERVALE DE VARIANTIE (grafice: HISTOGRAMA)

În Excel, funcțiile care se utilizează la sistematizarea datelor sunt:


 COUNTIF, pentru grupare pe variante
 FREQUENCY, pentru grupare pe intervale de variație.
Sintaxa acestor funcții este următoarea:
Sintaxa funcției :
COUNTIF (range, criteria)=(n1, n2, …, nr)
-parametrii de intrare:
range-un vector care cuprinde valorile xi pe care dorim să le grupăm;
criteria-un vector care cuprinde valorile unice după care dorim să facem gruparea;
-parametrii de ieșire :
ni -frecvența de apariție a valorii xi din criteria, în șirul range.
Obs. Funcția trebuie introdusă ca o formulă matrice. După returnarea unei singure valori, se selectează încă
atâtea căsuțe de câte avem nevoie, se tastează F2, apoi CTRL+SHIFT+ENTER. Dimensiunea vectorului de ieșire este
egală cu dimensiunea lui criteria.
Sintaxa funcției :
FREQUENCY (data array, bins array)= (n1, n2, …, nr)
-parametrii de intrare:
data array- un vector care cuprinde valorile pe care dorim să le grupăm pe intervale ;
bins arrray- un vector care cuprinde capetele intervalelor de grupare;
-parametrii de ieșire :
ni - numărul de valori din data array care sunt cuprinse în intervalul  bi , bi 1  , acestea fiind elemente din bins array.
Parametrul de ieșire va fi un vector de dimensiune egală cu dimensiunea lui bins array +1.

A. APLICATII REZOLVATE

1. O agenție imobiliară situată în centrul orașului București intenționează să deschidă un nou birou într-o zonă periferică.
Pentru a cunoaște distribuția geografică a apartamentelor vândute prin intermediul agenției, managerul solicită analiza
repartiției geografice a celor 30 de apartamente vândute în ultima lună. Astfel fiecare apartament este încadrat în una din
zonele: nord-vest (NV), nord-est (NE), sud-vest (SV) și sud-est (SE). Rezultatul analizei se prezintă astfel:
Clientul 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Zona NV SE SE NV SV NV NE SV NV SE NV SE SV NV SV
Clientul 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Zona NE NE NV NV SV NE NV SV SE SV NV NV SE NE SV
Sistematizați datele disponibile și prezentați grafic informațiile sistematizate.

Se efectuează clasificarea datelor:


Variabila după care se efectuează clasificarea: zona de amplasare a apartamentului. Această variabilă are patru variante, deci se
poate realiza o grupare chiar pe aceste variante.

Utilizăm funcția COUNTIF (range, criteria)=(n1, n2, …, nr)

Grupe de apartamente zona de amplasare Număr apartamente (ni)


NE 5
NV 11
SE 6
SV 8
Total 30

1
Distribuția apartamentelor după zona de amplasare

2. Nivelul profitului anual (mii Eur) pentru 50 de firme producătoare de mobilă este:
9 11 6 11 6 8 9 12 6 8 9 10 13 6 8 9 10 13 7
62 82 89 83 99 86
7 4 3 9 4 4 0 3 5 4 1 1 2 9 5 1 2 3 2
10 13 7 9 10 14 7 8 9 10 14 7 8 9 11 16 7 8 9 11 17 9 10
92 86
4 4 4 3 5 5 6 7 4 7 6 7 8 5 0 4 9 9 6 3 4 8 2
a) Să se sistematizeze datele pe intervale egale de variație.
b) Să se reprezinte grafic distribuția firmelor după nivelul profitului anual.
c) Să se reprezinte grafic structura firmelor în funcție de nivelul profitului anual.
Nota: Utilizați funcții EXCEL pentru rezolvarea problemei

Rezolvare:
Se notează cu X – caracteristica de grupare (profitul anual). Se parcurg următorii pași:
 se calculează amplitudinea variației caracteristicii (Ax): Ax = xmax - xmin = 174-62=112 mii Eur
• se stabilește numărul de grupe (r): r=1+3,322* lg(n) =1+3,322lg 50 =6,647 (formula lui Sturges);
A 112
• se stabilește mărimea intervalului de grupare (h): h x   16 mii Eur;
r 7
• se stabilesc limitele intervalelor de variație și se efectuează gruparea.
Limitele intervalelor sunt: 62, 78, 94, 110, 126, 142, 158, 174

Utilizăm funcția FREQUENCY (data array, bins array)= (n1, n2, …, nr)

Rezolvare folosind pachetul Data Analysis din EXCEL:


1. În celula A1 tastați textul „Profit“ și începând de la celula A2 introduceți datele.
2. În celula B1 tastați textul „Bin“. În celula B2 introduceți limita superioară a primului interval: 78 (62+16=78), în
B3 a celui de-al doilea interval: 94 (78+16=94) etc.
3. Apăsați Tools/Data Analysis și Histogram.
4. Introduceți Input Range (A1:A51) și Bin Range (B1:B8). Selectați Labels.
5. Selectați Chart Output, New Workbook și apăsați OK.
6. Se va obține o histogramă cu spații între coloane. Pentru a obține o histogramă cu coloanele lipite se procedează
astfel : Se poziționează cursorul pe coloanele histogramei. Se apasă de două ori pe butonul din stânga al mouse-
ului. Se va deschide o fereastră Format Data Series. În această fereastră se merge pe Options și la Gap width se
trece 0. Se apasă OK.

Se obțin rezultatele:
Distribuția firmelor după profit
Bin Frequency
78 9
94 18
110 12
126 4
142 3
158 2
174 2

2
B. APLICATII PROPUSE
1. Nivelul de instruire pentru cei 50 de angajați ai unei societăți comerciale este (se fac notațiile: P = absolvenți
de învățământ primar; G = absolvenți de învățământ gimnazial; L = absolvenți de învățământ liceal;
S = absolvenți de învățământ superior):
G S S L L G S L S L P S L L S L S G S L S S L G G
S L S L L L S L S L P L L L G L L L G L L L L L L
a) să se sistematizeze datele;
b) să se reprezinte grafic informațiile sistematizate;
c) să se calculeze ponderea salariaților pentru fiecare nivel de instruire și să se reprezinte grafic
rezultatele;
Notă: Utilizați si funcții EXCEL pentru rezolvarea problemei

2. În vederea analizei oportunității deschiderii unui magazin ce vinde aparatură electrocasnică, un analist
financiar este interesat în cunoaș terea nivelului vânzărilor zilnice ale magazinelor de profil. Pentru 50
de astfel de magazine alese întâmplător, înregistrează valoarea facturilor emise zilnic. Datele
rezultate sunt următoarele:
1 1 1 1 1
8. 9. 9. 9. 6. 7. 8. 7. 6. 9. 8. 9. 6. 7. 8. 8. 7. 7. 6.
10.5 0. 0. 0. 1. 1.
4 0 2 7 6 1 0 9 8 5 1 9 9 5 2 0 7 4 5
5 6 1 5 1
1 1 1
8. 6. 7. 8. 9. 7. 8. 8. 9. 6. 6. 7. 7. 5. 7. 5. 5. 5. 6. 7. 6.
9.5 1. 0. 1.
2 9 2 2 6 2 8 5 4 9 5 5 1 2 7 9 2 6 0 8 5
3 5 7

a) să se sistematizeze datele, grupându-se pe intervale egale de variație;


b) să se reprezinte grafic distribuția magazinelor după valoarea facturilor emise zilnic.
c) să se reprezinte grafic structura magazinelor în funcție de valoarea facturilor emise în fiecare zi.
Notă: Utilizați si funcții EXCEL pentru rezolvarea problemei

3. Frecvența absolută cumulată crescător a unei grupe reprezintă:


a) ponderea unităților care se încadrează în grupa respectivă;
b) ponderea unităților care au valoarea caracteristică mai mică sau eventual egală cu limita superioară a
grupei;
c) numărul unităților care au valoarea caracteristicii mai mică sau egală cu limita inferioară a grupei;
d) numărul unităților care au valoarea caracteristicii mai mică sau egală cu limita superioară a grupei;
e) numărul unităților care au valoarea caracteristicii mai mare sau egală cu limita inferioară a grupei.

4. Se cunosc datele următoare:


Număr de piese Muncitori
realizate zilnic (bucăți) (%)
15 15
20 30
22 55
25 25
27 25

Tabelul prezintă:
a) o distribuție heterogradă de frecvențe absolute;
b) o distribuție homogradă de frecvențe absolute;
c) o distribuție heterogradă de frecvențe relative, pe variante;
d) o distribuție homogradă de frecvențe relative;
e) nici una dintre variantele de mai sus.

5. Frecvența relativă cumulată crescător a ultimei grupe este egală cu:


a) numărul unităților statistice din grupa respectivă;
b) ponderea unităților statistice din grupa respectivă în total colectivitate;
c) 100%;

3
d) numărul total de unități statistice din colectivitate;
e) 1.00.

6. Subiectul unui tabel statistic reprezintă:


a) rețeaua de linii ce alcătuiesc rubricile tabelului;
b) colectivitatea la care se referă datele;
c) sistemul de indicatori cuprinși în tabel;
d) datele numerice sau denumirile textuale care se completează în rubricile tabelului;
e) nici una dintre variantele de mai sus.

7. Presupunem că o firmă ce produce trei produse similare, dorește să compare, prin intermediul reprezentărilor
grafice, ponderea vânzărilor pe produse în totalul vânzărilor, în doi ani consecutivi. Reprezentarea grafică va
fi:
a) histograma frecvențelor relative;
b) diagrama de structură
c) cronograma
d) corelograma
e) diagrama prin suprafețe

8. Pentru distribuția a 200 de muncitori, după timpul lucrat în medie pe zi, se dă următoarea reprezentare
grafică:

Distribuția reprezintă:
a) o distribuție heterogradă de frecvențe absolute;
b) o distribuție heterogradă de frecvențe absolute cumulate crescător;
c) o distribuție homogradă de frecvențe absolute cumulate descrescător;
d) o distribuție heterogradă de frecvențe relative cumulate descrescător;
e) o distribuție homogradă de frecvențe relative cumulate.

9. Se dă următoarea reprezentare grafică, privind distribuția a 50 de firme dintr-un județ în funcție de numărul
salariaților:

a) ce tip de distribuție frecvențe s-a reprezentat grafic?


b) construiți, pe baza graficului, distribuția de frecvențe absolute.

4
c) calculați frecvențele relative și reprezentați-le grafic.
d) determinați frecvențele relative cumulate crescător și descrescător și interpretați valorile
corespunzătoare grupelor de firme care au între 40 – 50 salariați.
10. Se cunoaște durata sejurului într-o stațiune montană (zile) pentru 30 de turiști:
12 4 16 13 5 8
9 9 11 3 12 6
10 8 11 7 10 20
15 12 9 16 18 12
6 11 10 7 6 14
a) Să se grupeze datele pe 6 intervale egale și să se reprezinte grafic rezultatele sistematizării;
b) Pentru distribuția obținută la punctul anterior, să se calculeze frecvențele relative;
c) Să se reprezinte grafic structura colectivității de turiști după durata sejurului.

11. Pentru 200 de agenţi economici se cunosc datele:


Grupe de agenţi economici după Sub 10 10-20 20-30 30-40 40-50 50-60
numărul salariaţilor (pers.)
Ponderea agenţilor economici (%) 7 8 12 62 6 5
a) Să se reprezinte grafic structura agenţilor economici în funcţie de numărul salariaţilor ;
b) Să se reprezinte grafic distribuţia de frecvenţe absolute ;
c) Să se calculeze frecvenţele absolute cumulate şi să se reprezinte grafic.

12. Înălțimea și greutatea a 45 de studenți ai unei facultăți, selectați aleator, sunt următoarele:
Student 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Înălțime (cm) 178 181 174 173 200 185 170 169 166 170 165 180 161 167 180
Greutate (Kg) 58 74 64 66 75 70 50 58 54 51 58 57 48 53 70

Student 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Înălțime (cm) 192 164 162 180 180 164 180 165 160 164 165 166 190 178 157
Greutate (Kg) 76 52 49 80 70 48 68 53 44 54 54 57 75 75 40

Student 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
Înălțime (cm) 165 160 160 154 162 181 166 189 168 173 165 168 179 176 165
Greutate (Kg) 55 50 49 44 47 68 55 75 53 63 51 51 68 63 50

a) Să se sistematizeze datele, în funcție de fiecare variabilă în parte folosind funcții Excel. Să se


analizeze grafic tendința de normalitate a distribuției obținute pentru fiecare variabilă.
b) Pentru fiecare distribuție de frecvențe obținută să se calculeze frecvențele absolute cumulate și să se
reprezinte grafic.

S-ar putea să vă placă și