Sunteți pe pagina 1din 3

1.

PROCEDEE DE SELECŢIE ALEATOARE


Pachetele de software statistic specializat (de exemplu SPSS), precum şi funcţiile statistice, respectiv modulul de analiză a
datelor din EXCEL (Data Analysis) permit obţinerea de eşantioane, prin selecţie repetată sau nerepetată.
Sintaxa comenzii este:
 în Excel Tools/Data
Data Analysis
Sampling

2. SISTEMATIZAREA DATELOR
 Sistematizarea presupune gruparea datelor în clase de valori sau intervale.
 În cazul datelor calitative si cantitative discrete (cu un nr. mic de valori distincte), se menţionează toate valorile
distincte (cuvinte sau numere) şi apoi se numără câte unităţi din populaţie se află în fiecare clasă.
 În mod analog se procedează şi în cazul datelor cantitative continue, numai că în loc de valori se precizează
limitele intervalelor după care se doreşte gruparea.

În Excel, funcţiile care se utilizează la sistematizarea datelor sunt:


 COUNTIF, pentru grupare pe variante
 FREQUENCY, pentru grupare pe intervale de variatie.
Sintaxa acestor funcţii este următoarea:
Sintaxa funcţiei :
COUNTIF (range, criteria)=(n1, n2, …, nr)
-parametrii de intrare:
range-un vector care cuprinde valorile xi pe care dorim să le grupăm;
criteria-un vector care cuprinde valorile unice după care dorim să facem gruparea;
-parametrii de ieşire :
ni -frecvenţa de apariţie a valorii xi din criteria, în şirul range.
Obs. Funcţia trebuie introdusă ca o formulă matrice. După returnarea unei singure valori, se selectează încă atâtea
căsute de câte avem nevoie, se tastează F2, apoi CTRL+SHIFT+ENTER. Dimensiunea vectorului de ieşire este egală cu
dimensiunea lui criteria.
Sintaxa funcţiei :
FREQUENCY (data array, bins array)= (n1, n2, …, nr)
-parametrii de intrare:
data array- un vector care cuprinde valorile pe care dorim să le grupăm pe intervale ;
bins arrray- un vector care cuprinde capetele intervalelor de grupare;
-parametrii de ieşire :
ni - numărul de valori din data array care sunt cuprinse în intervalul  bi , bi 1  , acestea fiind elemente din bins array.
Parametrul de ieşire va fi un vector de dimensiune egală cu dimensiunea lui bins array +1.

1. O agenţie imobiliară situată în centrul oraşului Bucureşti intenţionează să deschidă un nou birou într-o zonă periferică. Pentru
a cunoaşte distribuţia geografică a apartamentelor vândute prin intermediul agenţiei, managerul solicită analiza repartiţiei
geografice a celor 30 de apartamente vândute în ultima lună. Astfel fiecare apartament este încadrat în una din zonele: nord-
vest (NV), nord-est (NE), sud-vest (SV) şi sud-est (SE). Rezultatul analizei se prezintă astfel:
Clientul 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Zona NV SE SE NV SV NV NE SV NV SE NV SE SV NV SV
Clientul 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Zona NE NE NV NV SV NE NV SV SE SV NV NV SE NE SV
Sistematizaţi datele disponibile şi prezentaţi grafic informaţiile sistematizate.

Se efectuează clasificarea datelor:


Variabila după care se efectuează clasificarea: zona de amplasare a apartamentului. Această variabilă are patru variante, deci se poate
realiza o grupare chiar pe aceste variante.

Utilizăm functia COUNTIF (range, criteria)=(n1, n2, …, nr)

Grupe de apartamente zona de amplasare Număr apartamente (ni)


NE 5
NV 11
SE 6
SV 8
Total 30
Distribuţia apartamentelor după zona de amplasare

2. Nivelul profitului anual (mii Eur) pentru 50 de firme producătoare de mobilă este:
9 11 6 11 6 8 9 12 6 8 9 10 13 6 8 9 10 13 7
62 82 89 83 99 86
7 4 3 9 4 4 0 3 5 4 1 1 2 9 5 1 2 3 2
10 13 7 9 10 14 7 8 9 10 14 7 8 9 11 16 7 8 9 11 17 9 10
92 86
4 4 4 3 5 5 6 7 4 7 6 7 8 5 0 4 9 9 6 3 4 8 2
a) Să se sistematizeze datele pe intervale egale de variaţie.
b) Să se reprezinte grafic distribuţia firmelor după nivelul profitului anual.
c) Să se reprezinte grafic structura firmelor în funcţie de nivelul profitului anual.
Nota: Utilizaţi funcţii EXCEL pentru rezolvarea problemei

Rezolvare:
Se notează cu X – caracteristica de grupare (profitul anual). Se parcurg următorii paşi:
 se calculează amplitudinea variaţiei caracteristicii (Ax): Ax = xmax - xmin = 174-62=112 mii Eur
• se stabileşte numărul de grupe (r): r=1+3,322* lg(n) =1+3,322lg 50 =6,647 (formula lui Sturges);
A 112
• se stabileşte mărimea intervalului de grupare (h): h x   16 mii Eur;
r 7
• se stabilesc limitele intervalelor de variaţie şi se efectuează gruparea.
Limiteleintervalelor sunt: 62, 78, 94, 110, 126, 142, 158, 174

Utilizăm functia FREQUENCY (data array, bins array)= (n1, n2, …, nr)

Rezolvare folosind pachetul Data Analysis din EXCEL:


1. În celula A1 tastaţi textul „Profit“ şi începând de la celula A2 introduceţi datele.
2. În celula B1 tastaţi textul „Bin“. În celula B2 introduceţi limita superioară a primului interval: 78 (62+16=78), în B3 a
celui de-al doilea interval: 94 (78+16=94) etc.
3. Apăsaţi Tools/Data Analysis şi Histogram.
4. Introduceţi Input Range (A1:A51) şi Bin Range (B1:B8). Selectaţi Labels.
5. Selectaţi Chart Output, New Workbook şi apăsaţi OK.
6. Se va obţine o histogramă cu spaţii între coloane. Pentru a obţine o histogramă cu coloanele lipite se procedează astfel :
Se poziţionează cursorul pe coloanele histogramei. Se apasă de două ori pe butonul din stânga al mouse-ului. Se va
deschide o fereastră Format Data Series. În această fereastră se merge pe Options şi la Gap width se trece 0. Se apasă
OK.

Se obţin rezultatele:

Bin Frequency
78 9
94 18
110 12
126 4
142 3
158 2
174 2

Distribuţia firmelor după profit


Aplicatii propuse
1. Nivelul de instruire pentru cei 50 de angajaţi ai unei societăţi comerciale este (se fac notaţiile: P =
absolvenţi de învăţământ primar; G = absolvenţi de învăţământ gimnazial; L = absolvenţi de învăţământ
liceal; S = absolvenţi de învăţământ superior):
G S S L L G S L S L P S L L S L S G S L S S L G G
S L S L L L S L S L P L L L G L L L G L L L L L L
a) Să se sistematizeze datele;
b) Să se reprezinte grafic informaţiile sistematizate;
c) Să se calculeze ponderea salariaţilor pentru fiecare nivel de instruire şi să se reprezinte grafic rezultatele;
Nota: Utilizaţi funcţii EXCEL pentru rezolvarea problemei

2. În vederea analizei oportunităţii deschiderii unui magazin ce vinde aparatură electrocasnică, un analist
financiar este interesat în cunoaşterea nivelului vânzărilor zilnice ale magazinelor de profil. Pentru 50 de astfel de
magazine alese întâmplător, înregistrează valoarea facturilor emise zilnic. Datele rezultate sunt următoarele:
8, 10, 9, 9, 9, 6, 10, 10, 7, 8, 6, 9, 8, 11, 9, 6, 7, 11, 8, 7, 7, 6,
10,5 7,9 8,0
4 5 0 2 7 6 6 1 1 0 8 5 1 5 9 9 5 1 2 7 4 5
8, 7, 8, 9, 7, 11, 8, 9, 10, 6, 6, 7, 5, 7, 5, 5, 11, 6, 7, 6,
9,5 6,9 8,8 7,1 5,2
2 2 2 6 2 3 5 4 5 9 5 5 2 7 9 6 7 0 8 5
a) Să se sistematizeze datele, grupându-se pe intervale egale de variaţie;
b) Să se reprezinte grafic distribuţia magazinelor după valoarea facturilor emise zilnic.
c) Să se reprezinte grafic structura magazinelor în funcţie de valoarea facturilor emise în fiecare zi.
Nota: Utilizaţi funcţii EXCEL pentru rezolvarea problemei

S-ar putea să vă placă și