Sunteți pe pagina 1din 46

Universitatea Titu Maiorescu

Facultatea de Finanțe-Bănci, Contabilitate și Administrarea Afacerilor


– Anul II –

Bazele statisticii
Cu exemple în SAS ® și Excel

Capitolul 1 – Partea I

Lect. univ. dr. Dan GHERGUT

Părți din Copyright © 2016 SAS Institute Inc., Cary, NC, USA. All rights
reserved. Reprodus cu permisiunea SAS Institute Inc., Cary, NC, USA.
SAS Institute Inc. nu garantează în nici un fel aceste materiale și este
exonerat de orice răspundere.

1
Cum se desfășoară cursul
• Să clarificăm:
• Orarul
• Cum se desfășoară orele de curs și seminar
• Cum va fi făcută evaluarea pe parcurs și finală
• Cum comunicăm
• Care sunt obligațiile mele și ale voastre

2
Orarul și evaluarea cunoștințelor
• Săptămânal: 1 oră curs; 1 oră seminar (M204,
M208) – cele 2 ore vor fi mixate
• Software: SAS® și MS Excel
• Evaluare:
• Examen scris – 50%
• 2 lucrări de verificare în decursul semestrului – 40%
• 1 proiect statistic în SAS® - condiție de susținere a
examenului
• Participare la seminarii, prezență activă (10%)
• Cerințe minime pentru nota 5:
• Examen scris: 5 (cinci)
• Lucrări de verificare: 5 (cinci)

3
Modul de comunicare
• Ideal: să ne vedem (să ne cunoaștem) la
orele de curs și seminar
• În realitate: Comunicăm și pe grupuri
Google:
• UTMCIGZI_1920@googlegroups.com
• UTMFBZI_1920@googlegroups.com
• UTMAAZI_1920@googlegroups.com
• Pe grup găsiți documentele de curs și
seminar și acolo putem să și dialogăm

4
Proiectul statistic în SAS®
• Proiectul individual este condiție de intrare în
examen
• Proiectul este individual, însă pentru realizarea lui
puteți colabora
• Pentru realizarea proiectului trebuie să vă creați un
cont pe SAS OnDemand for Academics
• Veți primi pe grupul Google instrucțiunile de lucru
• Proiectul este destinat să îl realizați la fiecare din
laboratoarele săptămânale. Nu presupune lucru
suplimentar!
• Proiectul trebuie realizat și prezentat până la finele
semestrului; nu poate fi prezentat la examen
• Cei care se prezintă direct la restanță nu sunt scutiți
de realizarea proiectului

5
Care sunt obligațiile mele și ale voastre
Eu Voi

• Să vă explic cât mai clar • Să citiți: notele de curs,


obiectivele cursului exemplele, cărți la bibliotecă
• Să vă învăț noțiuni de bază • Să exersați
ale statisticii (înaintea • Să lucrați disciplinat și
econometriei) și să le consecvent
operaționalizați în SAS
• Să învățați CUM să învățați
• Să vă ascult

SĂ NE RESPECTĂM RECIPROC !

6
Pentru o motivație în plus

Înțelegeți la ce vă
folosește ”statistica”

Învățați prin
exercițiu

Lucrați împreună

7
Surse pentru studiu individual
• Cărți la biblioteca UTM
• Wagner Pavel – Bazele statisticii – Editura Universității ”Titu
Maiorescu”, București, 2005
• Wagner Pavel, Ghergut Dan-Ion, Bazele statisticii – Introducere în
analiza descriptiva, Editura Renaissance, Bucureşti, 2012
• Cărți pe care le puteți descărca gratuit (Bookboon.com)
• Darius Singpurwalla, A Handbook of Statistics – An Overview of
Statistical Methods, 1st Edition, 2013, Bookboon.com
• Marcelo Fernandes, Statistics for Business and Economics, Marcelor
Fernandes & Ventus Publishing ApS, 2009, BookBoon.com
• Surse pe WWW
• Amuzant: Discovering Statistics
(https://www.discoveringstatistics.com)
• Serios și vast: StatPages (http://statpages.info/index.html)

8
Structura cursului
• Introducere: Ce este statistica?
• De ce e nevoie de statistică?
• Noțiuni de bază utilizate în studiul fenomenelor de masă
• Terminologie SAS de bază
• Notații fundamentale
• Probabilitatea în viață și în statistică
• DE CE și CUM construim un studiu statistic
• Statistica descriptivă
• Gruparea, clasificarea și vizualizarea datelor statistice
• Indicatori statistici descriptivi: frecvența, media, mediana,
dispersia (varianța), coeficientul de variație, de asimetrie etc.
• Inferența statistică: testarea ipotezelor
• Legături între fenomene: corelația
• Explicarea fenomenelor: modele ANOVA cu unul și doi
factori; modelul de regresie lineară simplă
9
1. Noțiuni introductive

1.1. Ce este statistica?

1.2. Noțiuni de bază în statistică

1.3. Terminologie echivalentă în SAS ®

1.4. Notații fundamentale

10
1. Noțiuni introductive

1.1. Ce este statistica?

1.2. Noțiuni de bază în statistică

1.3. Terminologie echivalentă în SAS ®

1.4. Notații fundamentale

11
Obiective
• Să trecem în revistă cele mai uzuale accepțiuni
și definiții ale statisticii
• Să înțelegem de ce e nevoie de statistică
• Să vedem cine produce statistici
• Să aflăm cum vedeți voi statistica
• Să vedem care sunt principalele căi de obținere
a datelor statistice
• Să aflăm ce înseamnă statistică descriptivă și
inferențială
• Să trecem în revistă etapele unei cercetări
statistice
12
Accepțiuni, definiții
• Statistica este utilizată în diverse discipline,
științifice și non-științifice, pentru luarea de
decizii și formularea de concluzii bazate pe date
(factuale).
• Există mai multe accepțiuni
• Colectare de cifre, care sunt prelucrate într-o
manieră simplă (totaluri, medii, proporții) și
prezentate, de asemenea, într-o formă ușor de
înțeles și de interpretat
• Viziune îngustă, încă prezentă în mentalitatea socială
• Știința datelor (DATA SCIENCE): colectarea,
clasificarea, sumarizarea, organizarea, interpretarea
și analiza informației numerice.

13
Definiții
• “Ştiinţa colectării şi analizării datelor în scopul
formulării de concluzii şi luării deciziilor”
• Tamhane, Ajit C., and Dorothy D. Dunlop. Statistics
and Data Analysis from Elementary to Intermediate.
Prentice Hall, 2000, pp. 1.
• “Știința care studiază în expresie numerică
fenomenele și procesele din natură, tehnică și
societate”
• Pavel Wagner Bazele statisticii, Ed. Universitatii Titu
Maiorescu, Bucuresti, 2005, pp. 1
• “Statistica este știința învățării din date și de
măsurare, de control și de comunicare a
incertitudinii”
• The American Statistical Association (ASA)

14
Statistics is a meta-discipline in
that it thinks about how to think
about turning data into real-
world insights
Christopher J. Wild, Jessica M. Utts,
Nicholas J. Horton
International Handbook of Research
in Statistics Education
Springer International Hanbooks of
Education, 2018

Statistica este o meta-disciplină


pentru că gândește despre cum să
gândești despre transformarea
datelor în perspective asupra
lumii reale.

15
De ce e nevoie de statistică pentru voi?
• Depinde de ceea ce doriți să deveniți
• Un cercetător profesionist (un producător de
studii statistice)
• Să interpretați rezultate statistice pentru alții
(un utilizator profesional de statistici)
• Sau pur și simplu aveți nevoie să înțelegeți cum
să utilizați datele și cum să interpretați
informația statistică în viața de zi cu zi
• Pentru ca cineva (voi sau alții) să ia decizii
informate, bazate pe dovezi (nu pe
impresii, nu pe păreri)
16
De ce e nevoie de statistică?
• În afaceri, un antreprenor (manager) trebuie să
știe care produse se vând cel mai bine, care
reprezentant de vânzări este mai productiv,
care sunt clienții cei mai profitabili
• În mediul financiar, o bancă trebuie să știe care
este riscul ca un client să nu își poată plăti
ratele și dobânzile la credit
• În industria farmaceutică, o companie trebuie
să știe daca un medicament are efectele
pozitive scontate asupra pacienților care au o
anumită afecțiune medicală
17
Cum rezolvăm problema? (1)
• În afaceri, antreprenorul (managerul)
apelează la un analist de date (statistician)
care analizează cantitățile de produse
vândute, costurile, profitul, vânzările
reprezentanților de vânzări, cantitățile
cumpărate de clienți, comportamentul lor
înainte și după campanii de marketing

18
Cum rezolvăm problema? (2)
• În mediul financiar, banca apelează la
analiști de risc (statisticieni) care construiesc
modele de risc pentru a evalua șansele
(probabilitatea) ca un client potențial să nu
își poată plăti ratele și dobânzile la credit, în
funcție de caracteristicile sale

19
Cum rezolvăm problema? (3)
• În industria farmaceutică, compania
apelează la un consultant care, pe baza unui
eșantion de pacienți de test și unul de
control, testează dacă medicamentul are sau
nu efectele pozitive scontate. Pe baza
rezultatelor testului (experimentului)
recomandă dacă medicamentul are un efect
semnificativ poate să fie sau nu scos pe
piață.

20
Exemple de întrebări care îndeamnă la studii
statistice
• Care e cel mai bun regim de • Cum putem lua o decizie în
slăbire? cunoștință de cauză?
• Are studiul individual • Pe ce anume să ne bazăm:
influență asupra rezultatelor • Părerile altora?
studenților? • Rezultatele vizibile?
• Cum le evaluăm faptic?
• Navigarea pe internet crește
sentimentul de singurătate
și depresia?
• Creșterea salariului mediu
influențează prețurile?

21
Cine se ocupă de “statistici”?
• Instituții publice
• Oficii naționale de statistică (www.insse.ro)
• Băncile centrale
• EUROSTAT
• OECD
• Companii private
• Bursa Română de Mărfuri
• COFACE
• Companii bancare, de asigurări, de
telecomunicații

22
Ocupații și domenii în care se utilizează
”statistica”
• Analiști de date
• Customer Intelligence Specialist
• Data Analyst
• Risk Officer
• Business Intelligence Specialist
• Companii
• Telefonie mobilă
• Asigurări
• Bănci
• Firme de investiții
• Farmaceutică
• Servicii de sănătate

23
Metode de obținere a datelor statistice
• Prin observare directă (așa-numitele ”studii”
sau cercetări)
• Experimente
• Studii observaționale
• Prin observări indirecte: datele există deja
colectate într-un sistem și sunt disponibile
pentru prelucrare și analiză (date din
sistemele proprii ale firmelor; surse publice;
surse private)

24
Metodele specifice de analiză
• Există două principale corpusuri de metode
de analiză:
• Analiza descriptivă
• Analiza inferențială

25
Analiza descriptivă
• Sunt utilizate metode numerice și grafice
pentru a vizualiza tipare de ‘comportament’,
prin prezentarea datelor agregate într-o
maniera potrivită pentru înțelegerea
fenomenului observat și luarea unei decizii.
• Agregarea sub forma de valori ‘de mijloc’,
extreme, măsuri de variație
• Prezentare sub formă de tabele și grafice

26
Analiza inferențială
• De cele mai multe ori, un analist de date are
la dispoziție observațiile dintr-un eșantion
• Eșantionul oferă numai o parte din datele ce
caracterizează o întreagă populație
• Putem să ne încredem în statisticile calculate (ce
precizie și corectitudine au)?
• Metodele inferențiale permit calcularea de
statistici pe baza cărora putem trage
concluzii de generalizare la nivelul întregii
populații de referință
27
Etapele cercetării statistice
• De ce este necesar să definim un set de
etape ale unei cercetări statistice?
• Respectarea unei metode riguroase de
proiectare și punere în practică a unui studiu
statistic asigură obținerea unor rezultate de
calitate, credibile și replicabile

28
Generic Statistical Business Process Model
(GSBPM)
• 8 procese de bază
• Cu sub-procese și activități specifice
• Se desfășoară sub 2 procese de nivel înalt:
• Managementul metadatelor
• Managementul calității
• Vom reveni asupra subiectului în capitolul 2

29
GSBPM

30
1. Noțiuni introductive

1.1. Ce este statistica?

1.2. Noțiuni de bază în statistică

1.3. Terminologie echivalentă în SAS ®

1.4. Notații fundamentale

31
Obiective
• Să trecem în revistă principalele noțiuni de
statistică
• Să înțelegem de ce e nevoie să le cunoaștem
și să stăpânim terminologia

32
Noțiuni de bază în statistică
• Populație (colectivitate statistică)
• Eșantion
• Unitatea statistică/unitatea de observare
• Variabila (caracteristica) statistică
• Observație

• Parametru
• Estimator
• Frecvență
• Indicator statistic

33
Populație (colectivitate statistică)
• Setul omogen al entităților de aceeași
natură supuse observării statistice
• Are caracter obiectiv, concret și finit (sau
infinit)
• Bine definită în timp și spațiu
• Exemple:
• Totalitatea studenților (din universitate,
facultate, specializare, an, grupa etc.)
• Totalitatea persoanelor din populația unei țări,
regiuni, localitate etc.
• Totalitatea firmelor active la sfârșitul unui an…

34
Eșantion
• O parte a populației statistice de referință
• Selectat conform unor metode bine
fundamentate teoretic (teoria sondajelor)
• Aleator nu înseamnă întâmplător
• Estimațiile pe baza eșantionului
caracterizează întreaga populație statistică
• Exemple:
• O selecție de studenți, persoane, întreprinderi

35
Unitatea statistică/unitatea de observare

• Entitatea componentă a colectivității


statistice
• Definită și identificabilă în mod neunivoc
• Unitatea de observare poate diferi de unitatea
statistică (care poate fi identificată și contactată)
• Exemple
• Gospodăria (Unitate statistică)
• Persoana (Unitate de observare)
• Firma (Unitate statistică)
• Activitatea economica (Unitate de observare)

36
Variabila statistică
• Caracteristică, proprietate, atribut al unității
de observare supuse investigării și măsurării
• Variabilele sunt clasificate în funcție de
diferite criterii
• Sunt strâns legate de tipul datelor colectate
și al scalelor de măsurare
• Exemple: vârsta, salariul, cifra de afaceri,
valoarea vânzărilor, nota de apreciere
(acord-dezacord) a unor afirmații

37
Categorii de variabile statistice
• Principala categorizare: după modul de
exprimare:
• Cantitative (numerice);
• Calitative (nenumerice, de tip ”text”)
• După conținut:
• De timp; de spațiu; atributive (timp & spațiu)
• După natura variației:
• Numerice: discrete, continue
• După modul de manifestare:
• Alternative; dihotomice (binare)
• După modul de obținere a datelor:
• Primare; derivate

38
Scale de măsurare
Variabilele cantitative Variabilele calitative
(numerice): (nenumerice) :
• Discrete: numărul copiilor; • Nominale:
numărul de salariați • genul, mediul de rezidență,
• Continue: greutate, stare civilă, profesie
înălțime, venituri (salariu, • Ordinale:
cifra de afaceri) • ierarhia hotelurilor, nivelul de
• Interval: unitatea de interval educație, atitudini, note
are aceeași reprezentare
• Indexul competitivității, • Scala Likert: total de acord; de
dezvoltarea umana acord; neutru; dezacord; total
• Raport – are în plus originea dezacord (scala psihometrică)
“0”.
• Scala temperaturilor Kelvin
• viteza, preț, venit

39
Observația statistică
• Este formată din valorile colectate pentru
toate variabilele supuse observării pentru o
unitate statistică
• Observațiile (valorile variabilelor colectate
pentru fiecare unitate statistică) sunt
stocate în fișiere electronice sub formă
tabelară (rectangulară)
• n observații x j variabile

40
Parametru:
• Parametrul este valoarea numerică care
descrie o anumită caracteristică (variabilă) a
populației statistice (ex.: populația care se
află sub pragul sărăciei; cifra de afaceri a
întreprinderilor dintr-un anumit sector
economic)
• Exprimat ca valoare totală, medie, proporție
pe baza datelor colectate din întreaga
populație

41
Estimator:
• O funcție numerică a unei variabile din
eșantion pentru a estima un parametru al
populației
• Este exprimat ca valoare totală, medie sau
proporție pe baza datelor din eșantion
• Exemple: valoarea totală, medie, abaterea
medie pătratică), proporția unei categorii de
populație în total
• Valorile parametrilor (din populația totală)
nu le vom putea cunoaște aproape niciodată
– din acest motiv apelăm la ESTIMAȚIE
42
Frecvența statistică
• Frecvențe absolute: numărul de apariții ale
unei modalități ale unei variabile
• Variabila: venit
• Modalități: sub 1500 lei/luna, între 1500 și 2000 , între
2000 și 5000, peste 5000 etc.
• Frecvențe: Câte persoane au un venit sub 1500 de
lei/luna, între 1500 și 2000 etc;
• Frecvențe relative: proporția aparițiilor unei
anumite modalități în numărul total de
apariții ale tuturor modalităților
• X% dintre persoane au un venit de sub 1500 lei/luna

43
Indicator statistic
• Expresia numerică a unei măsurători
statistice asupra unui fenomen
• Nu orice “statistică” este indicator:
Indicatorul trebuie conceptualizat și definit
în timp și spațiu; are nevoie de un punct de
referință pentru a putea fi interpretat și
pentru a servii comparațiilor și deciziilor
• Are o parte numerică și una conceptuală
• Poate fi asociat cu indicatorii de
performanță (în legătură cu ținte și obiective
fixate)
44
Indicator statistic
• Exemple de non-indicatori
• Valori fără indicarea unei unități de măsură sau
fără o asociere cu înțeles concret
• Prețurile au crescut cu 2% (care prețuri? Față de ce
perioadă sau moment în timp?)
• Exemple de indicatori (contextualizați)
• În luna ianuarie a acestui an, indicele prețurilor de
consum a crescut cu 2% față de aceeași lună a anului
anterior

45
• Întrebări?
• La seminar:
• Crearea conturilor individuale pe platforma SAS
OnDemand for Academics

46

S-ar putea să vă placă și