Sunteți pe pagina 1din 57

PROIECT PACHETE SOFTWARE

ANALIZA UNEI AGENȚII IMOBILIARE

Coordonator: ANCA IOANA ANDREESCU

Cuprins
1. PREZENTAREA PROBLEMEI......................................................................................................3
2. EXCEL................................................................................................................................................3
2.1. Funcții logice...................................................................................................................................3
2.2. Funcții definite de utilizator...........................................................................................................4
2.3. Macrocomenzi.................................................................................................................................6
2.4. Pivot Table......................................................................................................................................7
2.5. Goalseek..........................................................................................................................................9
2.6. Scenarii............................................................................................................................................9
2.7. Subtotaluri....................................................................................................................................11
2.8. Grafice...........................................................................................................................................12
3. PYTHON..........................................................................................................................................13
3.1. Importul unei fișier csv sau json în pachetul pandas.................................................................13
3.2. Accesarea datelor cu loc și iloc.....................................................................................................13
3.3. Tratarea valorilor lipsă................................................................................................................15
3.4. Reprezentarea grafică a datelor cu pachetul matplotlib............................................................15
3.5. Ștergerea de coloane și înregistrări.............................................................................................18
3.6. Utilizarea listelor și a dicționarelor, incluzând metode specifice acestora................................20
3.7 Utilizarea pachetului statmodels (regresie multiplă)..................................................................20
3.8 Analiza rezultatelor.......................................................................................................................21
4. PROGRAMARE SAS.....................................................................................................................22
4.1 Crearea unui set de date SAS din fișiere externe..................................................................22
4.2 Crearea și folosirea de formate definite de utilizator............................................................23
4.3 Crearea seturilor de date permanente...................................................................................24
4.4 Procesarea iterativă și conditională a datelor........................................................................26
4.5 Crearea de subseturi de date...................................................................................................27
4.6 Functii SAS...............................................................................................................................30
4.7 Utilizarea de proceduri pentru raportare..............................................................................31
4.8 Folosirea de proceduri statistice.............................................................................................31
4.9 Generarea de grafice...............................................................................................................33
5. SAS ENTERPRISE GUIDE...........................................................................................................35
5.1. Importul unui fisier non-SAS......................................................................................................35
5.2. Interogări.....................................................................................................................................37
5.3. Joncțiuni........................................................................................................................................39
5.4. Folosirea parametrilor.................................................................................................................42
5.5. Utilizarea formatelor definite de utilizator.................................................................................44
5.6. Generarea de rapoarte.................................................................................................................46
5.7. Stiluri create de utilizator............................................................................................................47
5.8. Prelucrări statistice.......................................................................................................................48
5.9. Crearea unui document compus..................................................................................................54
5.10. Grafice.........................................................................................................................................55

1. PREZENTAREA PROBLEMEI

Piaţa imobiliară semnifică cumulul tranzacţiilor care susțin drepturi de proprietate sau de
uzufruct asupra terenurilor şi amplasamentelor. Această piață poate fi de mai multe tipuri,
împărțită pe segmente: comercială, spații birouri, industrială, rezidențială, terenuri etc. Fiecare
dintre aceste tipuri de piețe vine cu propriile caracteristici și contribuie la evoluția de ansamblu a
pieței imobiliare. Caracteristicile proprii fiecărui segment face din aceste piețe unele de sine
stătătoare.

Pană în anul 2003 piața imobiliară din România a avut o creștere relativ lentă de maximum
5% pe an. Datorită lipsei de spațiu locativ și apariției creditelor ipotecare / imobiliare, începând
cu anul 2003 s-a înregistrat o explozie a prețurilor, înregistrându-se creșteri de peste 50% anual.
Diferența majoră dintre cererea și oferta de pe piață imobiliară, precum și deschiderea tot
mai mare a băncilor către creditare au făcut că România să fie o destinație preferată pentru
investitori. În momentul de față, piață imobiliară din România a atins limite superioare prin
activitatea desfășurată de un număr mare de agenți economici. Pentru a înțelege mai bine
fenomenul am analizat situația vânzărilor unei agenții imobiliare din București(sectoarele în care
au fost vândute cele mai multe apartamente, prețul aparatmentelor în funcție de numărul de
camere și de suprafață).

Datele prezentate în Excel reprezintă datele înregistrate de această agenție. Pentru a analiza
compania au fost alese 3530 de înregistrări. Fiecare înregistrare conține date legate de numărul
de camere, suprafață, etaj, numărul total de etaje, sectorul în care se află , scorul și prețul fiecărui
imobil. Tot în acest Excel găsim date și despre agenții imobiliari care au intermediat aceste
tranzacții.
2. EXCEL
2.1. Funcții logice
a) definirea problemei
Să se mărească cu 10% prețurile imobilelor care au numărul de camere egal cu 4 și
prețul mai mic decât 100.000€.
b) metode de calcul, algoritmi, formule de calcul utilizate
Se folosește funcția IF după cum urmează:
IF( AND(A2=4,G2<100000),G2*1.1,G2)
c) prezentarea rezultatelor

Figură 1 Rezultat Creștere Preț

d) interpretarea rezultatelor
Așa cum se observă în Figura 1, în urma folosirii funcției IF, prețurile aparatmentelor
cu numărul de camere egal cu 4 și prețul mai mic de 100.000€, au crescut cu 10%.

2.2. Funcții definite de utilizator


a) definirea problemei
Să se realizeze o funcție care sa acorde un discount clienților în funcție de sectorul în
care se află plasat imobilul.
b) metode de calcul, algoritmi, formule de calcul utilizate

Figură 2 Funcția DiscountClient

c) prezentarea rezultatelor

Figură 3 Rezultat DiscountClient

d) interpretarea rezultatelor
Așa cum se observă în Figura 2 a fost creată o funcție, denumită DiscountClient.
Prin aplicarea acestei funcții asupra setului de date, a fost creată o nouă coloană(Discount
Imobil) ce reprezintă discountul aplicat fiecarei locuințe în funcție de sector.
2.3. Macrocomenzi
a) definirea problemei
Realizați operația anterioară folosind o macrocomandă.
b) metode de calcul, algoritmi, formule de calcul utilizate
Primul pas pentru a construi o macrocomandă îl reprezintă înregistrarea acesteia așa
cum se observă în figura de mai jos.

Figură 4 Înregistrare Macrocomanda

Al doilea pas constă în a denumi aceasta macrocomandă.

Figură 5 Denumire Macrocomandă

Figură 6 Apelare Macrocomandă


c) prezentarea rezultatelor

Figură 7 Rezultat macrocomandă

d) interpretarea rezultatelor
Pentru automatizarea acestei acțiuni repetitive, am folosit macrocomanda
MacroDiscount, aceasta putând fi folosită ori de câte ori este necesar. Așa cum se poate
observa în Figura 7, rezultatele sunt identice cu cele din Figura 3.

2.4. Pivot Table


Un raport PivotTable este un instrument puternic pentru a calcula, a rezuma și a analiza
datele, care ne permite să vedem comparații, modele și tendințe în date.

a) definirea problemei
Realizați un raport privind valoarea vânzărilor realizată de fiecare agent imobiliar
pe fiecare sector.

b) metode de calcul, algoritmi, formule de calcul utilizate


Se va folosi un Pivot Table ce folosește datele din foaia de calcul dataset.
Pașii urmați pentru creearea acestui Pivot Table sunt: Insert > Pivot Table >
Selectăm datele pe care dorim să le analizăm > Alegem locul unde va fi plasat
raportul.
Figură 8 Inserare Pivot Table

Figură 10 Selectare date Pivot Table Figură 9 Adăugare câmuri Pivot Table

c) prezentarea rezultatelor

Figură 11 Rezultat Pivot Table

d) interpretarea rezultatelor
Pivot Table - ul ne permite să rezumăm și analizăm rezultatele obținute de agenție.
În Figura 11 se poate observa valoarea totală a apartamentelor vândute de fiecare
agent.

2.5. Goalseek
a) definirea problemei
Pentru locuința cu pretul 93.126 se cere să se determine cât ar trebui să fie TVA-ul
pentru a avea un preț de vânzare egal cu 100.000.
b) metode de calcul, algoritmi, formule de calcul utilizate

Figură 12 Selectarea parametrilor pentru


Figură 13 Goalseek Goalseek

c) prezentarea rezultatelor

Figură 14 Rezultate Goalseek

d) interpreatrea rezultatelor
Goalseek e o opțiune în Excel care face exact ceea ce avem noi nevoie în momentul de
față, calculează ce valoare e nevoie sa pun într-o celulă pentru ca valoarea în altă celulă să aibă o
anumită valoare. În cazul nostru ne spune că TVA – ul ar trebui să fie 13% pentru ca valoarea
locuinței să ajungă la 100.000.

2.6. Scenarii
Un scenariu este un set de valori pe care Excel le salvează și se pot substitui automat în
foaia de lucru. Putem să creăm și să salvam diferite grupuri de valori ca scenarii, apoi să
comutăm între aceste scenarii pentru a vizualiza diferitele rezultate.

a) definirea problemei
Se presupune că TVA-ul scade de la 5% la 3%. Cum se modifică prețul de vânzare al
imobilelor?
b) metode de calcul, algoritmi, formule de calcul utilizate

Figură 15 Denumire Scenariu

Figură 16 Valoare Scenariu

c) prezentarea rezultatelor

Figură 17 Date înaintea aplicării scenariului


Figură 18 Date dupa aplicarea scenariului

d) interpretarea rezultatelor
Așa cum se observă in Figurile 17 si 18, după aplicarea scenariului în care TVA – ul
scade de la 5% la 3%, prețul unei locuințe care înainte era de ~ 95.700 va deveni acum ~
93.900.

2.7. Subtotaluri
a) definirea problemei
Calculați valoarea totală a veniturilor obținute de fiecare agent imobiliar.
b) metode de calcul, algoritmi, formule de calcul utilizate
Subtotalurile se calculează cu o funcție de rezumare cum ar fi SUM sau AVERAGE ,
utilizând funcția Subtotal.

c) Figură 19 Subtotal

Figură 20 Selectare parametrii


Subtotal

prezentarea rezultatelor

Figură 21 Rezultate Subtotal

d) interpretarea rezultatelor
Rezultatul aplicării acestei funcții îl reprezintă un tabel care reflectă valoarea totală a
apartamentelor vândute de fiecare agent imobiliar.

2.8. Grafice
a) definirea problemei
Să se reprezinte printr-un grafic Pie, numărul de locuințe
vândute pe fiecare sector.
b ) metode de calcul, algoritmi, formule de calcul utilizate
Pentru realizarea graficului Pie, am calculat, folosind functia
COUNTIF, numărul de locuințe vândute pe fiecare sector.
Următorul pas a fost generarea graficului: Insert > Pie, rezultatul fiind următorul:
c) prezentarea rezultatelor
Așa cum se observă și din grafic,
procentul cel mai mare de locuințe
vândute s-a înregistrat în sectorul 1
(29%), urmat de sectorul 3(20%) și
sectorul 2(17%). Cele mai puține
apartamente vândute s-au înregistrat
în sectorul 5(5%).

Figură 22 Pie Chart

3. PYTHON
3.1. Importul unei fișier csv sau json în pachetul pandas
a) definirea problemei
Să se citească datale din fișierul dataset.csv.
b) metode de calcul, algoritmi, formule de calcul utilizate
Pentru citirea datelor s-a folosit funcția read_csv, din pachetul pandas.

Figură 23 Citire date din dataset


c) prezentarea rezultatelor

Figură 24 Rezultate citire

d) interpretarea rezultatelor
Folosind funcția head din pachetul pandas au fost afișate primele 5 înregistrări din
DataFrame.

3.2. Accesarea datelor cu loc și iloc


a) definirea problemei
Să se acceseze primele 5 rânduri din DataFrame și să se preia casele cu 3 camere de
la etajul 4.
b) metode de calcul, algoritmi, formule de calcul utilizate

Figură 25 Iloc

Figură 26 Loc
c) prezentarea rezultatelor

3.3. Tratarea valorilor lipsă


a) definirea problemei
Să se trateze datele nulle.
b) metode de calcul, algoritmi, formule de calcul utilizate

Figură 29 Valori nulle

Figură 27 Rezultat Iloc

Figură 28 Rezultat Loc


c) prezentarea rezultatelor

3.4. Reprezentarea grafică a datelor cu pachetul matplotlib


a) definirea problemei
Să se reprezinte grafic numărul de camere, suprafața totală în funcție de preț și
procentul apartamentelor pe sector.

Figură 30 Rezultat valori nulle

b) metode de calcul, algoritmi, formule de calcul utilizate


c) prezentarea rezultatelor

Figură 31 Frecventa numarului de camere

Așa cum se observă și din Figura 31, majoritatea locuințelor au 2 sau 3 camere în
minoritate fiind cele cu 5, 6 sau 7 camere.
Figură 32 Suprafata in functie de pret

Figură 33 Frecventa caselor in functie de sector


3.5. Ștergerea de coloane și înregistrări
a) definirea problemei
Să se șteargă coloanele Scor și Total Etaje și să se trateze outlierii.
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor

Figură 34 Rezultat Stergere


Figură 35 Rezultat setrgere etaje negative

Figură 36 Rezultat verificare outlieri


3.6. Utilizarea listelor și a dicționarelor, incluzând metode specifice
acestora
a) definirea problemei
Să se împartă setul de date în train și test.
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor

3.7 Utilizarea pachetului statmodels (regresie multiplă)


a) definirea problemei
Crearea unui model de regresie pentru a previziona prețul unui apartament.
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor
3.8 Analiza rezultatelor
a) definirea problemei
Să se afișeze coeficienții regresiei, să se calculeze eroarea pe setul de test și să se
previzioneze valoarea unui apartament cu 2 camere, suprafața de 45 de mp la etajul 5 în
sectorul 3.
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor
4. PROGRAMARE SAS
4.1 Crearea unui set de date SAS din fișiere externe
a) definirea problemei
Să se citească datele din fișierul dataset.csv
b) metode de calcul, algoritmi, formule de calcul utilizate
Pentru a putea importa fișierul dataset.csv am folosit procedura PROC IMPORT,
care a importat datete din fișierul extern în dataset – ul date_apartamente.

c) prezentarea rezultatelor

Figură 37 Rezultat import

d) interpretarea rezultatelor
Folosind procedura PROC PRINT am afișat rezultatul importului. În urma
importului în biblioteca WORK a aparut un nou fișier DATE_APARTAMENT.
4.2 Crearea și folosirea de formate definite de utilizator
1. Problema 1
a) definirea problemei
Pentru datele de mai sus să se creeze un format definit de utilizator pentru variabila
sector astfel: 1 => Sector 1, 2 => Sector 2 etc.
b) metode de calcul, algoritmi, formule de calcul utilizate
Pentru definirea unui format creat de utilizator am folosit procedura PROC
FORMAT, procedură ce permite definirea mai multor formate de afișare.

c) prezentarea rezultatelor

Figură 38 Formatare Sector


d) interpretarea rezultatelor
Prin aplicarea procedurii de formatare se observă că pe coloana sector cifrele 1, 2,3
etc. au fost înlocuite cu formatul definit de noi, și anume Sector1, Sector2, etc.

2. Problema 2
a) definirea problemei
Folosind formatul definit mai sus să se determine câte apartamente au fost vândute în
fiecare sector
b) metode de calcul, algoritmi, formule de calcul utilizate
Pentru calcularea numărului de apartamente vândute în fiecare sector am folosit o
altă procedură numită PROC FREQ.

c) prezentarea rezultatelor

Figură 39 Numarul de case vandute pe fiecare sector

d) interpretarea rezultatelor
Procedura FREQ a calculat frecvențele de apariție ale valorilor formatate.
Din figura 39 se observă că cele mai multe apartamente vândute au fost în sectorul 1,
urmat de sectorul 3 și sectorul 2.

4.3 Crearea seturilor de date permanente


Folosirea declarației data determină crearea unui set de date temporar ce va fi șters
odată ce sesiunea curentă este închisă. Pentru a economisi timp și resurse de calcul este
recomandată folosirea seturilor de date permanente.
Problema 1
a) definirea problemei
Folosind datele de la 4.1 să se creeze un fișier permanent de date SAS.
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor
In urma rulării scriptului anterior, a fost creat pe server fișierul persistent
date.sas7bdat, dar și biblioteca temporară perman.

Figură 40 Date permanente

Problema 2
a) definirea problemei
Să se realizeze un script ce afișează un raport complet al setului de date.
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor
Figură 41 Raport

d) interpretarea rezultatelor
Rezultatul rulării acestui script este un raport ce conține numărul de variabile și de
observații, numele, tipul și dimensiunile variabilelor și alte informații referitoare la setul
de date din fișier. Raportul este prezentat în figura 41.

4.4 Procesarea iterativă și conditională a datelor


a) definirea problemei
Folosind datele din setul de date creat la punctul anterior, să se creeze o nouă
variabilă care să reprezinte tipul de imobil (garsoniera, apartament, penthouse)
b) metode de calcul, algoritmi, formule de calcul utilizate
Deoarece dorim să verificăm mai multe condiții, vom folosi varianta
IF...ELSE...IF. Prin această variantă ne asigurăm că are loc o evaluare eficientă a
programului, fară omiterea vreunei condiții.

c) prezentarea rezultatelor
Figură 42 Rezultat procesare iterativa

d) interpretarea rezultatelor
Rezultatul rulării scriptului de mai sus este un raport ce conține, pe lângă datele
introduse, și tipul locuinței așa cum se observă în Figura 42.

4.5 Crearea de subseturi de date


1. Problema 1
a) definirea problemei
Folosind datele din setul pemanent de date, perman.date, afișați toate observațiile
care au sectorul 1 sau sectorul 2 sau sectorul 3, prețul mai mare de 100000 și agentul
imobiliar Popescu.
b) metode de calcul, algoritmi, formule de calcul utilizate
c) prezentarea rezultatelor

Figură 43 Subseturi

d) interpretarea rezultatelor
În urma rulării scriptului de mai sus, a fost creat un subset ce conține toate
informațiile legate de apartamente, doar pentru acele apartamente care sunt în sectorul 1,
2 sau 3, și ale căror tranzacții au fost intermediate de agentul imobiliar Popescu.
Rezultatul rulării acestui program este prezentat în figura 43.
2. Problema 2
a) definirea problemei
Să se afișeze numărul de locuințe din fiecare tip, pentru setul de date creat la
punctul anterior
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor

Figură 44 Frecventa de aparitie a fiecarui tip de locuinta


d) interpretarea rezultatelor
Rularea scriptului anterior a dus la afișarea rezultatelor din figura 44. Astfel că cele
mai multe locuințe vândute au fost de tip apartament, urmate de penthouse.
3. Problema 3
a) definirea problemei
Rezolvați cerința de la 4.4 folosind SELECT
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor

Figură 45 Select

d) interpretarea rezultatelor
Folosirea instrucțiunii SELECT este o alternativă la utilizarea unei serii de
instrucțiuni IF ELSE. Așa cum se observă și în figura 45, rezultatul este același cu cel
din figura 42 , unde am folosit o serie de instrucțiuni IF ELSE.
4.6 Funcții SAS
1. Problema 1
a) definirea problemei
Să se adauge un adaos comercial pentru fiecare apartament în funcție de suprafață
astfel: dacă suprafața < 50, adaos = 0.01; dacă suprafața este între 50 și 100, adaos =
0.03 și dacă suprafața > 50, adaos = 0.05
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor

Figură 46 Functii SAS


d) interpretarea rezultatelor
Funcţia SUM() returnează suma argumentelor sale şi ignoră valorile lipsă, fiind
preferabilă din acest motiv operatorului de adunare care, atunci când primeşte un
argument NULL, returnează valoarea NULL. Rezultatul rulării programului de mai sus
presupune adunarea la prețul actual a unui adaos comercial. Acest rezultat poate fi
observat în figura 46.

4.7 Utilizarea de proceduri pentru raportare


a) definirea problemei
Să se afișeze valoarea totală a apartamentelor vândute de fiecare agent imobiliar
b) metode de calcul, algoritmi, formule de calcul utilizate

c) prezentarea rezultatelor

Figură 47 Raport SAS

4.8 Folosirea de proceduri statistice


Pentru generarea de statistici descriptive se utilizează procedura UNIVARIATE,
care include identificarea valorilor extreme și evaluarea normalității datelor.
a) definirea problemei
Folosind setul de date ințial, să se folosească procedura UNIVARIATE, pentru a
determina media prețurilor aparatamentelor, dar și pretul maxim si prețul minim.
b) metode de calcul, algoritmi, formule de calcul utilizate
Procedura UNIVARIATE face parte din BASE SAS și este folosită în principal
pentru examinarea distribuției datelor pentru o singură variabilă, incluzând o evaluare a
normalității datelor și identificarea valorilor extreme.

c) prezentarea rezultatelor
Figură 48 Statistici

Figură 49 Distributia pretului


d) interpretarea rezultatelor
Variabila analizată în scriptul anterior este prețul. Conform datelor furnizate de
procedura UNIVARIATE, cel mai mic preț pentru o locuință este de
19.500(înregistrarea 3259 din setul de date), în timp ce cel mai mare preț ajunge la
495.000(înregistrarea 3267).
Așa cum se observă și în figura 48, în medie prețul unei locuințe este de ~ 97.900.
Mediana reprezintă acea valoare a unei serii ordonate crescător sau descrescător
care împarte seria în două părți egale. În cazul nostru valoarea acestei variabile este
78600.
Modul reprezintă valoarea cea mai des întâlnită în cadrul unei serii statistice.
Valoarea acestei variabile este 56000, ceea ce înseamnă ca majoritatea locuințelor
vândute au avut acest preț. Acest lucru poate fi observat și în cadrul graficului din figura
48.
Abaterea standard este o masură a cât de mult sunt dispersate valorile față de
valoarea medie. În cazul nostru abaterea standard are o valoare egală cu 62.844.

4.9 Generarea de grafice


a) definirea problemei
Folosind datele din setul de date SAS perman.date , să se creeze un grafic cu bare
verticale care să arate prețul mediu pe fiecare sector.

b) metode de calcul, algoritmi, formule de calcul utilizate


c) prezentarea rezultatelor

Figură 50 Pretul mediu al unui apartament pe fiecare sector

d) interpretarea rezultatelor
Procedura GCHART permite crearea unor grafice în care înălțimea unei bare
reprezintă anumiți indicatori statistici precum media sau suma, pentru fiecare variabilă de
clasificare.
În cazul nostru indicatorul statistic folosit a fost media, iar variabiala de clasificare
a fost sectorul. Așa cum se poate observa și în figura 50, sectorul cu cel mai mare preț mediu al
apartamentelor este sectorul 1, iar sectoarele cu cele mai mici prețuri medii sunt sectoarele 4 și 6.
5. SAS ENTERPRISE GUIDE
5.1. Importul unui fisier non-SAS
Pentru a rezolva cerințele din cadrul acestui proiect ce se axează pe utilizarea pachetului
software numit SAS Enterprise Guide, s-a folosit fișierul Excel pe baza căruia s-a demonstrat
utilitatea mediului SAS și a limbajului Python, precum și multitudinea de instrumente utile ce se
pot utiliza direct prin intermediul pachetului Excel. Acest fișier conține informații referitoare la
activitatea unei agentii de imobiliare din București.

a) definirea problemei
Să se importe datele din fișierul dataset.csv.
b) metode de calcul, algoritmi, formule de calcul utilizate
Pentru a importa o foaie de calcul se urmează următorii pași:
1. File > Import data > Se selectează fișierul corespunzator
2. Următorul pas conține o serie de 4 instrucțiuni și anume:
 Specify Data – unde trebuiesc specificate datele de intrare
 Select Data Source – sunt specificate datele ce se vor selecta din
fișier( figura 51 )

Figură 51 Import SAS EG


 Define Field Attributes – unde sunt precizate tipurile de date
 Advanced Options – unde se specifică alte modificări ale setului de
date

Figură 52 Advanced Options

c) prezentarea rezultatelor

Figură 53 Rezultate Import


Figură 54 Rezultat Import

5.2. Interogări
a) definirea problemei
Să se creeze o interogare aplicată setului de date dataset numită DetaliiVanzari. În
interogare se vor regasi toate locuințele vândute de agenții imobiliari Ionescu și Popescu.
Atributele ce se vor afișa sunt următoarele : NrCamere, Suprafață, Preț, AgentImobiliar.
b) metode de calcul, algoritmi, formule de calcul utilizate
În setul de date Articole se apasă pe butonul . Acesta deschide
fereastra necesară efectuării unei interogări. În dreptul Select Data vom
adăuga coloanele menționate mai sus, la fel ca în figura de mai jos

Figură 55 Interogare
Pasul următor consă în aplicarea unui filtru(Filter Data), la fel ca în imginile de mai jos.

Figură 56 Pasul 1 - filtrare

Figură 57 Pasul 2 - filtrare

c) prezentarea rezultatelor
d) interpretarea rezultatelor
Așa cum se observă în figura 58,
în urma pașilor parcurși anterior, am
obținut o tabelă ce conține doar
câmpurile Nr.Camere, Suprafața, Preț,
Agent Imobiliar, doar pentru agenții
Ionescu și Popescu.

5.3. Joncțiuni
a) definirea problemei
Să se creeze o joncțiune între seturile de
date DetaliiVânzări și DetaliiAngajați pentru
a determina numărul de locuințe vândute de
fiecare angajat.
b) metode de calcul, algoritmi,
formule de calcul utilizate
Deschidem setul de
date Detalii Angajați și apăsăm
butonul pentru a pregăti Figură 58 Rezultate interogare datele
pentru joncțiunea cerută. Pentru a adăuga încă o tabelă apăsăm butonul și adăugăm setul de date
DetaliiVânzări, ca în figura următoare.

Figură 59 Adaugare tabela


Următorul pas constă âî stabilirea tipului de joncțiune și alegerea manuală a cheii de
legatură dintre tabele.

Figură 60 Jonctiune
Figură 61 Run
Prin apăsarea Run, se obține următorul rezultat:

În Process Flow putem observa interogarea creată.


c) prezentarea rezultatelor

d) interpretarea rezultatelor
Rezultatul obținut este o tabelă ce conține numele fiecărui agent imobiliar și numărul
total de locuințe vândute de acesta.
5.4. Folosirea parametrilor
a) definirea problemei
Să se creeze o interogare asemănătoare celei denumită DetaliiVânzări, în care numele
agentului de vânzări să se introducă de la tastatură. Să se ilustreze interogarea folosind cuvintele
“Atasie” și “Popescu”. Se va folosi setul de date datasetModificat
b) metode de calcul, algoritmi, formule de calcul utilizate
Se urmează pașii de la punctul 5.2, selectându-se suprafața, numărul de camere, prețul
și agentul imobiliar.

Figură 62 Folosire parametrii - pasul 1

Pentru ca denumirea grupei să se introducă de la tastatură, este nevoie de un parametru


asociat coloanei AgentImobiliar. Acest parametru se creează apăsând butonul și
urmând pașii din figurile de mai jos.

Figură 63 Folosire parametrii - pasul 2


După apăsarea butonului Run va apărea următoarea pagina:

c) prezentarea rezultatelor
d) interpretarea rezultatelor
În funcție de numele specificat, va apărea o tabela ce conține tranzacțiile în care
respectivul agent imobiliar a fost implicat.

5.5. Utilizarea formatelor definite de utilizator


a) definirea problemei
Să se modifice coloana sector astfel: 1 => Sector 1, 2 => Sector 2 etc.
b) metode de calcul, algoritmi, formule de calcul utilizate
În continuare creăm formatul definit de utilizator. Se intră în Data  Create format.
Se introduce numele noului format la Options și se specifică tipul acestuia (caracter sau
numeric), apoi se intră la Define Formats și se introduc valorile pentru denumire în
funcție de sector:

Figură 65 Format definit de utilizator


c) prezentarea rezultatelor

Figură 66 Rezultat format definit de utilizator

d) interpretarea rezultatelor
Așa cum se observă și în figura 66, în urma aplicării formatului definit de utilizator
cifrele din coloana sector au fost înlocuite cu noul format.
5.6. Generarea de rapoarte
a) definirea problemei
Să se creeze un raport care să afișeze detaliile despre locuințe, dar și valoarea totală a
vânzărilor pe fiecare sector. Se va folosi setul de date datasetModificat.
b) metode de calcul, algoritmi, formule de calcul utilizate
Pentru a genera un raport deschidem setul de date datasetModificat și se intră în
Describe  List Data. Variabilele dorite se introduc ca în imginea de mai jos:

Figură 67 Generare Raport

c) prezentarea rezultatelor

––– În figura alaturată se poate


observa raportul generat, ce conține
variabilele selectate, și anume
suprafața, preț, număr camere, dar
și valoarea totală a apartamentelor
vândute în sectorul 2.
5.7. Stiluri create de utilizator
a) definirea problemei
Să se creeze un stil plecând de la stilul Festival și apoi să se aplice asupra raportului
Detalii articole de mai sus.

b) metode de calcul, algoritmi, formule de calcul utilizate


Se intră în Tools  Style Manager. Pentru a nu modifica un stil existent, selectăm stilul
și îl copiem (apăsând butonul Create a copy) într-o variabilă nouă denumită UserDefined.
Apoi apăsăm Edit și schimbăm diferite atribute, după cum se observă in figurile de mai jos:

Figură 68 Style Manager - inainte

Figură 69 Style Manager - dupa


c) prezentarea rezultatelor

5.8. Prelucrări statistice


Problema 1
a) definirea problemei
Să se afișeze statisticile descriptive pentru informațiile din setul de date DetaliiVanzari
în care să se analizeze prețurile locuințelor din fiecare sector.

b) metode de calcul, algoritmi, formule de calcul utilizate


Se apasă Describe  Summary Statistics și se adaugă următoarele informații:
c) prezentarea rezultatelor

Figură 70 Rezultate statistici descriptive

d) interpretarea rezultatelor
Așa cum se observă și în figura 70, în urma rulării, este creat un raport în care sunt
prezentate media, prețul minim și maxim, abaterea standard și numărul de observații.
Problema 2
a) definirea problemei
Să se verifice daca între preț și numărul de camere există o legătură liniara.
b) metode de calcul, algoritmi, formule de calcul utilizate
Se folosește interogarea de mai sus și se apasă Analyze  Regression  Linear
Regression și se introduc următoarele informații:

Figură 71 Regresie Liniara

c) prezentarea rezultatelor

Figură 72 Rezultat regresie liniara


Figură 73 Rezultat grafic regresie liniara

d) interpretarea rezultatelor
Conform datelor prezentate în tabelul 72, R2 = 40, 42%, ceea ce înseamnă că modelul
nu este valid statistic, adică nu există o legatură puternică între numărul de camere și
prețul acestora
De asemenea, graficul din figura 73 demonstrează că modelul ales nu este unul valid,
prin urmare demonstrează lipsa legăturii liniare dintre variabilele studiate.
Problema 3
a) definirea problemei
Să se determine influența suprafeței apartamentelor asupra prețului acestora.
b) metode de calcul, algoritmi, formule de calcul utilizate
Se va crea o tabelă nouă folosind o interogare:

Figură 74 Corelograma
c) prezentarea rezultatelor

Figură 75 Corelograma Rezultat


Figură 76 Rezultat Grafic Corelograma

d) interpretarea rezultatelor
Din analiza corelației dintre suprfață și preț observăm că se obține un coeficient de
corelație de 0.8075, mai mare decât 0.7, ceea ce înseamnă că între cele două există o legătură
puternică. Semnul plus indică faptul că legătura este pozitivă (ambele variabile se modifică în
același sens – când una crește și cealaltă crește).
5.9. Crearea unui document compus
a) definirea problemei
Să se creeze un raport compus în care să se afișeze un titlu, raportul statistic de la
problema 1 și graficul Pie.
b) metode de calcul, algoritmi, formule de calcul utilizate
Raportul compus s-a obținut prin apăsarea File  New  Report și adăugarea celor 2
rapoarte menționate:

c) prezentarea rezultatelor
5.10. Grafice
a) definirea problemei
Să se realizeze un grafic de tip Pie Chart în care să se prezinte frecvența locuințelor
vândute în funcție de sector.

b) metode de calcul, algoritmi, formule de calcul utilizate


Se apasă Graph  Pie Chart și se selectează datele.
c) prezentarea rezultatelor

Figură 77 Pie Chart


d) interpretarea rezultatelor
Așa cum se observă și din grafic, procentul cel mai mare de locuințe vândute s – a
înregistrat în sectorul 1 (29%), urmat de sectorul 3(20%) și sectorul 2(17%). Cele mai puține
apartamente vândute s-au înregistrat în sectorul 5(5%).

S-ar putea să vă placă și