Sunteți pe pagina 1din 7

Seminar 3_4

Sistematizarea

SISTEMATIZAREA DATELOR (clasificare și grupare)


• Sistematizarea presupune gruparea datelor în clase de valori sau intervale.

• În cazul variabilelor calitative si cantitative discrete cu un nr. mic de valori distincte, se menționează toate
valorile distincte (cuvinte sau numere) și apoi se numără câte unități din populație se află în fiecare clasă =>
SERIE DE DISTRIBUTIE DE FRECVENTE PE VARIANTE (grafice: DIAGRAMA PRIN COLOANE –
variabile calitative si POLIGONUL FRECVENTELOR pentru variabile cantitative)
• În cazul variabilelor cantitative continue, dar și a celor discrete cu un nr. mare de valori distincte, se
precizează limitele intervalelor după care se dorește gruparea și apoi se numără câte unități din populație se
află în fiecare Interval => SERIE DE DISTRIBUTIE DE FRECVENTE PE INTERVALE DE VARIANTIE
(grafice: HISTOGRAMA)
În Excel, funcțiile care se utilizează la sistematizarea datelor sunt:

• COUNTIF, pentru grupare pe variante


• FREQUENCY, pentru grupare pe intervale de variație.

Sintaxa acestor funcții este următoarea:


Sintaxa funcției :
COUNTIF (range, criteria)=(n1, n2, …, nr)
-parametrii de intrare:
range-un vector care cuprinde valorile xi pe care dorim să le grupăm;
criteria-un vector care cuprinde valorile unice după care dorim să facem gruparea;
-parametrii de ieșire :
ni -frecvența de apariție a valorii xi din criteria, în șirul range.

Obs. Funcția trebuie introdusă ca o formulă matrice. După returnarea unei singure valori, se selectează
încă atâtea căsuțe de câte avem nevoie, se tastează F2, apoi CTRL+SHIFT+ENTER. Dimensiunea vectorului de
ieșire este egală cu dimensiunea lui criteria.

Sintaxa funcției :
FREQUENCY (data array, bins array)= (n1, n2, …, nr)
-parametrii de intrare:
data array- un vector care cuprinde valorile pe care dorim să le grupăm pe intervale ;
bins arrray- un vector care cuprinde capetele intervalelor de grupare;
-parametrii de ieșire :
ni - numărul de valori din data array care sunt cuprinse în intervalul (bi , bi +1 ) , acestea fiind elemente din bins
array.
Parametrul de ieșire va fi un vector de dimensiune egală cu dimensiunea lui bins array +1.

1
A. APLICATII REZOLVATE

1. O agenție imobiliară situată în centrul orașului București intenționează să deschidă un nou birou într-o zonă
periferică. Pentru a cunoaște distribuția geografică a apartamentelor vândute prin intermediul agenției,
managerul solicită analiza repartiției geografice a celor 30 de apartamente vândute în ultima lună. Astfel fiecare
apartament este încadrat în una din zonele: nord-vest (NV), nord-est (NE), sud-vest (SV) și sud-est (SE).
Rezultatul analizei se prezintă astfel:

Clientul 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Zona NV SE SE NV SV NV NE SV NV SE NV SE SV NV SV
Clientul 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Zona NE NE NV NV SV NE NV SV SE SV NV NV SE NE SV
Sistematizați datele disponibile și prezentați grafic informațiile sistematizate.

Se efectuează clasificarea datelor:


Variabila după care se efectuează clasificarea: zona de amplasare a apartamentului. Această variabilă are patru
variante, deci se poate realiza o grupare chiar pe aceste variante.

Utilizăm funcția COUNTIF (range, criteria)=(n1, n2, …, nr)

Grupe de apartamente zona de amplasare Număr apartamente (ni)


NE 5
NV 11
SE 6
SV 8
Total 30

15
n. apartamente

10

0
NE NV SE SV
Zona de amplasare

Figura 1 - Distribuția apartamentelor după zona de amplasare

2. Despre cei 500 de angajați ai unui agent economic cu activitate în domeniul construcțiilor se cunosc următoarele
date:
Intervale de variație a vechimii în activitate (ani) Sub 10 10-15 15-20 20-25 25-30 peste 30
Ponderea angajaților (%) 5 12 30 75 90 100
a) Să se precizeze tipul frecvențelor redate în tabel;
b) Să se determine frecvențele absolute și să se reprezintă grafic;
c) Să se calculeze centrele de interval;
d) Să se calculeze frecvențele absolute cumulate crescător și descrescător și să se reprezintă grafic;
e) Care este ponderea salariaților care au o vechime de peste 25 de ani? Câți salariați îndeplinesc această
condiție?

Rezolvare
a) În tabel sunt redate frecvențele relative (exprimate procentual) cumulate crescător.
b) Fie n = numărul total de angajați; n = 500.
𝑛 𝑛𝑖 𝑛𝑖∗ %⋅𝑛
𝑛𝑖∗ % = ∑ 𝑛𝑖 ⋅ 100 = 𝑛
⋅ 100 ⇒ 𝑛𝑖 = 100
(coloana 3)
𝑖

2
Tabelul 1
Intervale de variație a Ponderea Frecvențe Frecvențe Frecvențe absolute
Centre de
vechimii în producție (ani) angajaților relative absolute cumulate
interval (xi)
(%) (ni*%) (ni) Crescător Descrescător
0 1 2 3 4 5 6
5 - 10 5 5 25 7,5 25 500
10 - 15 12 7 35 12,5 60 475
15 - 20 30 18 90 17,5 150 440
20 - 25 75 45 225 22,5 375 350
25 - 30 90 15 75 27,5 450 125
30 - 35 100 10 50 32,5 500 50
Total - 100 500 - - -
Reprezentarea grafică se face prin histogramă și poligonul frecvențelor:

Figura 2 Distribuția angajaților după vechimea în producție

c) xiinf + xisup (coloana 4)


xi =
2
d) Frecvențele absolute cumulate crescător și descrescător sunt calculate în coloanele 5, respectiv 6, iar
reprezentarea lor grafică se face cu ajutorul curbelor frecvențelor cumulate (figura 3).

Figura 3 Graficul frecvențelor cumulate

e) Ponderea salariaților care au peste 25 ani vechime este de 15 + 10 = 25%, respectiv această condiție este
îndeplinită de 125 de salariați.
3
2. Nivelul profitului anual (mii Euro) pentru 50 de firme producătoare de mobilă este:

62 82 89 97 114 63 83 119 64 84 90 99 123 65 84 91 101 132 69 85 91 102 133 72 86


92 104 134 74 86 93 105 145 76 87 94 107 146 77 88 95 110 164 79 89 96 113 174 98 102
a) Să se sistematizeze datele pe intervale egale de variație.
b) Să se reprezinte grafic distribuția firmelor după nivelul profitului anual.
c) Să se reprezinte grafic structura firmelor în funcție de nivelul profitului anual.
Nota: Utilizați funcții EXCEL pentru rezolvarea problemei

Rezolvare:
Se notează cu X – caracteristica de grupare (profitul anual). Se parcurg următorii pași:
• se calculează amplitudinea variației caracteristicii (Ax): Ax = xmax - xmin = 174-62=112 mii Euro
• se stabilește numărul de grupe (r): r=1+3,322* lg(n) =1+3,322lg 50 =6,647 (formula lui Sturges);
• se stabilește mărimea intervalului de grupare (h): h = Ax = 112 = 16 mii Euro;
r 7
• se stabilesc limitele intervalelor de variație și se efectuează gruparea.
Limitele intervalelor sunt: 62, 78, 94, 110, 126, 142, 158, 174

Utilizăm funcția FREQUENCY (data array, bins array)= (n1, n2, …, nr)

Rezolvare folosind pachetul Data Analysis din EXCEL:


1. În celula A1 tastați textul „Profit“ și începând de la celula A2 introduceți datele.
2. În celula B1 tastați textul „Bin“. În celula B2 introduceți limita superioară a primului interval: 78
(62+16=78), în B3 a celui de-al doilea interval: 94 (78+16=94) etc.
3. Apăsați Tools/Data Analysis și Histogram.
4. Introduceți Input Range (A1:A51) și Bin Range (B1:B8). Selectați Labels.
5. Selectați Chart Output, New Workbook și apăsați OK.
6. Se va obține o histogramă cu spații între coloane. Pentru a obține o histogramă cu coloanele lipite se
procedează astfel : Se poziționează cursorul pe coloanele histogramei. Se apasă de două ori pe butonul din
stânga al mouse-ului. Se va deschide o fereastră Format Data Series. În această fereastră se merge pe
Options și la Gap width se trece 0. Se apasă OK.

Se obțin rezultatele:
Distribuția firmelor după profit
Bin Frequency Histogram
78 9
20
94 18 18
110 12 16
126 4 14
142 3 12
Frequency

10
158 2 8
174 2 6
4
2
0
78 94 110 126 142 158 174 More
Bin

4
B. APLICATII PROPUSE
1. Nivelul de instruire pentru cei 50 de angajați ai unei societăți comerciale este (se fac notațiile: P = absolvenți
de învățământ primar; G = absolvenți de învățământ gimnazial; L = absolvenți de învățământ liceal;
S = absolvenți de învățământ superior):
G S S L L G S L S L P S L L S L S G S L S S L G G
S L S L L L S L S L P L L L G L L L G L L L L L L
a) să se sistematizeze datele;
b) să se reprezinte grafic informațiile sistematizate;
c) să se calculeze ponderea salariaților pentru fiecare nivel de instruire și să se reprezinte grafic rezultatele;
Notă: Utilizați si funcții EXCEL pentru rezolvarea problemei

2. În vederea analizei oportunității deschiderii unui magazin ce vinde aparatură electrocasnică, un analist
financiar este interesat în cunoașterea nivelului vânzărilor zilnice ale magazinelor de profil. Pentru 50 de astfel
de magazine alese întâmplător, înregistrează valoarea facturilor emise zilnic. Datele rezultate sunt următoarele:
10.5 8.4 10.5 9.0 9.2 9.7 6.6 10.6 10.1 7.1 8.0 7.9 6.8 9.5 8.1 11.5 9.9 6.9 7.5 11.1 8.2 8.0 7.7 7.4 6.5

9.5 8.2 6.9 7.2 8.2 9.6 7.2 8.8 11.3 8.5 9.4 10.5 6.9 6.5 7.5 7.1 5.2 7.7 5.9 5.2 5.6 11.7 6.0 7.8 6.5

a) să se sistematizeze datele, grupându-se pe intervale egale de variație;


b) să se reprezinte grafic distribuția magazinelor după valoarea facturilor emise zilnic.
c) să se reprezinte grafic structura magazinelor în funcție de valoarea facturilor emise în fiecare zi.
Notă: Utilizați si funcții EXCEL pentru rezolvarea problemei

3. Frecvența absolută cumulată crescător a unei grupe reprezintă:


a) ponderea unităților care se încadrează în grupa respectivă;
b) ponderea unităților care au valoarea caracteristică mai mică sau eventual egală cu limita superioară a
grupei;
c) numărul unităților care au valoarea caracteristicii mai mică sau egală cu limita inferioară a grupei;
d) numărul unităților care au valoarea caracteristicii mai mică sau egală cu limita superioară a grupei;
e) numărul unităților care au valoarea caracteristicii mai mare sau egală cu limita inferioară a grupei.

4. Se cunosc datele următoare:


Număr de piese Muncitori
realizate zilnic (bucăți) (%)
15 15
20 30
22 55
25 25
27 25

Tabelul prezintă:
a) o distribuție heterogradă de frecvențe absolute;
b) o distribuție homogradă de frecvențe absolute;
c) o distribuție heterogradă de frecvențe relative, pe variante;
d) o distribuție homogradă de frecvențe relative;
e) nici una dintre variantele de mai sus.

5. Frecvența relativă cumulată crescător a ultimei grupe este egală cu:


a) numărul unităților statistice din grupa respectivă;
b) ponderea unităților statistice din grupa respectivă în total colectivitate;
c) 100%;
d) numărul total de unități statistice din colectivitate;
e) 1.00.

5
6. Subiectul unui tabel statistic reprezintă:
a) rețeaua de linii ce alcătuiesc rubricile tabelului;
b) colectivitatea la care se referă datele;
c) sistemul de indicatori cuprinși în tabel;
d) datele numerice sau denumirile textuale care se completează în rubricile tabelului;
e) nici una dintre variantele de mai sus.

7. Presupunem că o firmă ce produce trei produse similare, dorește să compare, prin intermediul reprezentărilor
grafice, ponderea vânzărilor pe produse în totalul vânzărilor, în doi ani consecutivi. Reprezentarea grafică va
fi:
a) histograma frecvențelor relative;
b) diagrama de structură
c) cronograma
d) corelograma
e) diagrama prin suprafețe

8. Pentru distribuția a 200 de muncitori, după timpul lucrat în medie pe zi, se dă următoarea reprezentare grafică:

Distribuția reprezintă:
a) o distribuție heterogradă de frecvențe absolute;
b) o distribuție heterogradă de frecvențe absolute cumulate crescător;
c) o distribuție homogradă de frecvențe absolute cumulate descrescător;
d) o distribuție heterogradă de frecvențe relative cumulate descrescător;
e) o distribuție homogradă de frecvențe relative cumulate.

9. Se dă următoarea reprezentare grafică, privind distribuția a 50 de firme dintr-un județ în funcție de numărul
salariaților:

a) ce tip de distribuție frecvențe s-a reprezentat grafic?


b) construiți, pe baza graficului, distribuția de frecvențe absolute.
c) calculați frecvențele relative și reprezentați-le grafic.
d) determinați frecvențele relative cumulate crescător și descrescător și interpretați valorile
corespunzătoare grupelor de firme care au între 40 – 50 salariați.
6
10. Se cunoaște durata sejurului într-o stațiune montană (zile) pentru 30 de turiști:
12 4 16 13 5 8
9 9 11 3 12 6
10 8 11 7 10 20
15 12 9 16 18 12
6 11 10 7 6 14
a) Să se grupeze datele pe 6 intervale egale și să se reprezinte grafic rezultatele sistematizării;
b) Pentru distribuția obținută la punctul anterior, să se calculeze frecvențele relative;
c) Să se reprezinte grafic structura colectivității de turiști după durata sejurului.

11. Pentru 200 de agenți economici se cunosc datele:


Grupe de agenți economici după Sub 10 10-20 20-30 30-40 40-50 50-60
numărul salariaților (pers.)
Ponderea agenților economici (%) 7 8 12 62 6 5
a) Să se reprezinte grafic structura agenților economici în funcție de numărul salariaților ;
b) Să se reprezinte grafic distribuția de frecvențe absolute ;
c) Să se calculeze frecvențele absolute cumulate și să se reprezinte grafic.

12. Înălțimea și greutatea a 45 de studenți ai unei facultăți, selectați aleator, sunt următoarele:
Student 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Înălțime (cm) 178 181 174 173 200 185 170 169 166 170 165 180 161 167 180
Greutate (Kg) 58 74 64 66 75 70 50 58 54 51 58 57 48 53 70

Student 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Înălțime (cm) 192 164 162 180 180 164 180 165 160 164 165 166 190 178 157
Greutate (Kg) 76 52 49 80 70 48 68 53 44 54 54 57 75 75 40

Student 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
Înălțime (cm) 165 160 160 154 162 181 166 189 168 173 165 168 179 176 165
Greutate (Kg) 55 50 49 44 47 68 55 75 53 63 51 51 68 63 50

a) Să se sistematizeze datele, în funcție de fiecare variabilă în parte folosind funcții Excel. Să se analizeze
grafic tendința de normalitate a distribuției obținute pentru fiecare variabilă.
b) Pentru fiecare distribuție de frecvențe obținută să se calculeze frecvențele absolute cumulate și să se
reprezinte grafic.

S-ar putea să vă placă și