Sunteți pe pagina 1din 61

METODE CALITATIVE SI

CANTITATIVE IN
FUNDAMENTAREA DECIZIILOR

al.isaic-maniu
 www.amaniu.ase.ro
Etapele unei investigatii

1. Observarea fenomenului studiat


2. Prelucrarea i modelarea datelor culese
3. Analiza i interpretarea datelor culese
4. Diseminarea /Stocarea-arhivarea
Introducere
Metodele descriptive utilizeaza:
tehnici grafice
masuri numerice descriptive.
Metodele prezentate se aplica in:
Intreaga populatie
- Esantion
Metode infereniale (extinderea rezultatelor
obinute prin cercetri pariale, verificarea
ipotezelor statistice, elemente de prognoz)

3
Noiunile de baz (1)
Unitatea reprezint elementul de baz supus
analizei de investigatie. Exist uniti simple
(de ex.: persoane, obiecte etc.) i uniti
complexe (de ex.: gospodria,firma-compania
etc).
Populaia este compus dintr-o mulime finit
de uniti.
Variabila (caracteristica) este o aplicaie
definit pe populaia studiat i cu valori ntr-
o anumit mulime.
Noiunile de baz (2)

Parametrul este o ilustrare (de obicei


cantitativ) a strii variabile statistice
Estimatorul este o funcie statistic utilizat
pentru aproximarea unui parametru
necunoscut la nivelul unei populaii statistice
Eantionul o mulime de dimensiuni reduse a
unitilor cercetate dintr-o populaie
Tipuri de variabile
n funcie de natura mulimii n care ia valori funcia
definit pe populaia studiat exist:
Variabile numerice (cantitative) i nenumerice
(calitative)
Variabile discrete (mulimea este una
numrabil) sau continue
Variabile binare/ alternative (mulime cu
dou elemente) i variabile cu mulimi
asociate compuse din mai mult de dou
elemente
Date cantitative Date calitative
Persoana Maritata/nemaritata
nemaritata
Varsta - venit 1 da
55 75000 2 nu
42 68000 3 nu
.
Din date calitative,
.
. . . .
putem calcula :
.
Cresterea in. greutate - proportia datelor apartinand fiecarei categorii
+10 -determinarea indicatorilor structurali
+5
. Debutanti Specilisti Asociat Colab. Total
.
15 25 5 15 60
25% 41.67% 8.33% 25% 7
Cunoasterea tipului datelor este necesara
pentru a selecta tehnica adecvata a fi
utilizata.
Uneori, mai ales pentru a utiliza tehnici nonparametrice,
este de asemenea important sa stim daca datele pot fi
clasificate.
Tipul de analiza permis pentru fiecare tip de data
Date cantitative calcule aritmetice
Date calitative numararea frecventei (aparitiilor )
observatiilor din fiecare categorie
Date clasificate calcule bazate pe un proces de
ordonare
8
Cunoasterea tipului datelor este necesara
pentru a selecta tehnica adecvata a fi
utilizata.
Uneori, mai ales pentru a utiliza tehnici nonparametrice,
este de asemenea important sa stim daca datele pot fi
clasificate.
Tipul de analiza permis pentru fiecare tip de data
Date cantitative calcule aritmetice
Date calitative numararea frecventei (aparitiilor )
observatiilor din fiecare categorie
Date clasificate calcule bazate pe un proces de
ordonare
9
De ce prelucrare primar?
din considerente practice (prezentare sintetic,
publicare, diseminare etc.)
pentru a studia pe baza graficelor ulterioare
forma funciilor de repartiie
pentru a cura datele de valorile aberante sau
de non-rspunsuri
 Eliminarea valorilor aberante testul Grubbs-Smirnov
Date transversale si date tip serie cronologica
Datele transversale sunt colectate la un anumit
moment de timp ,sau interval de timp
Sondaj de marketing (observarea preferintelor dupa gen,
varsta)
Punctajul la test la un curs
Salariile de start ale absolventilor unui program MBA
Datele ce formeaza seriile de timp sunt colectate de-
a lungul a mai multe puncte succesive in timp
Pretul saptamanal de inchidere al aurului,sau cotatiei la
bursa
Cantitatea de titei importat lunar

11
Colectarea datelor Pregatirea unei distributii de frecvente

Facturi Bin Frecventa


Cate clase 15
folosim? 71
Desenarea
42,19 Histogramei
80 38,45 30 37
# interval de
45 observatii
13 # interval de clase
60 29,23 < 50 60 5-7
Frecventa

9
40
89,35 50 - 200 7-9
75 10
118,04 200 - 500 9-10
20 90 18
110,46 500 - 1,000
105 28
10-11
0
0,00 120 14
15
30
45
60
75
90
105
120
More
72,88 Alte 0
83,05 Facturi
. Marimea clasei = [Interval] / [# de clase]
.
[119.63 - 0] / [8] = 14.95 15
(Sunt 200 de puncte) Cea mai Cea mai mica
mare observatie
observatie

12
Frecventa relativa
Este deseori de preferat sa se afiseze frecventa
relativa (proportia) de observatii apartinand
fiecarei clase, decat frecventa absoluta.
Frecventa clasei
Frecventa relativa a clasei = Numarul total de
observatii

Frecventele relative ar trebui utilizate atunci cand:


sunt studiate frecventele relative ale populatiei
se compara 2 sau mai multe histograme
numarul de observatii studiate in esantioane sunt
diferite
13
Elemente necesare unui tabel/grafic statistic
1.Titlu scurt i concis (cu precizarea localizrii n timp i spaiu)
2.Uniti de msur;
3. Sursa de date
Grupri combinate
Tabele de contingen (bidimensionale)
Metode de observare-colectarea
datelor
n funcie de periodicitate avem: observri curente i
periodice
n funcie de volumul unitilor statistice observate
avem: cercetri exhaustive (de tip recensmnt) i
cercetri selective (sondaje sau anchete statistice)
n funcie de modalitatea de declanare a
evenimentului avem: observri clasice i provocate
(proiectarea experimentelor)
n funcie de modul de administrare: observri
directe i observri indirecte (din surse publicate
anterior: anuare, buletine, rapoarte etc.)
Surse de date
Consistena i acurateea datelor
influeneaz corectitudinea rezultatelor unei
analize statistice.
Consistena i acurateea datelor depind de
metoda de colectare.
Trei dintre cele mai uzitate surse de date
statistice sunt:
Date publicate
Rezultate ale anchetelor i sondajelor
Studii experimentale
Date publicate
Aceasta reprezint deseori o surs de date preferat
datorit costurilor sczute i accesibilitii.
De exemplu:
Datele
Datele publicate
publicate se gsesc ca materiale tiprite, pe diskete,
de INS,
CD-ROM, sau pe Internet.
BNR.,MFP

Datele publicate de organizaiile care le colecteaz se


De exemplu:
numesc DATE PRIMARE
Diverse rapoarte, studii, cercetri, realizate pe
baza datelor din surse primare ofer rezultate
sintetice.

Datele publicate de o alt organizaie dect cea care


le-a colectat se numesc DATE SECUNDARE.
 Studii de observare i experimentale
 Cnd nu sunt disponibile date publicate, este necesar
organizarea unui studiu pentru obinerea datelor.

Studiul de observare este cel n cadrul cruia


mrimile reprezentnd o variabil de determinare
sunt observate i nregistrate fr a se controla nici
un factor care ar putea influena valorile acestora.
Studiul experimental este cel n cadrul cruia
mrimile reprezentnd o variabil de determinare
sunt observate i nregistrate n acelai timp
controlndu-se factorii care ar putea influena
valorile acestora.
 Anchete
Un chestionar bun trebuie s fie bine formulat:
Anchetele solicit informaii despre populaie.
s fie sintetic, ct se poate de concis.
Anchete pot fi realizate
ntrebrile prin intermediul
s fie scurte, simple i formulate clar.
Interviului direct s nceap cu ntrebri demografice pentru a ajuta
respondentul s se simt confortabil.
Interviului telefonic
s fie utilizate ntrebri dihotomice i cu rspunsuri
Chestionar auto-completat
multiple.
ntrebrile deschise s fie utilizate cu atenie.
s fie evitate ntrebrile prea sugestive.
este util pre-testarea chestionarului.
este bine s fie gndit modul de utilizare a datelor
colectate atunci cnd este pregtit chestionarul.
Histograme in forma de clopot
Multe tehnici statistice necesita ca populatia sa fie
distribuita in forma de clopot.
Desenare histogramei ajuta la verificarea formei
populatiei in discutie

23
Numarul de clase modale

O clasa modala O clasa modala


O histograma bimodala 24
Diagrama de structura

Diagrame prin bare

Grafice tip linie

Prezentarile grafice aratate aici sunt utilizate in


principal pentru date calitative.
Aceste instrumente grafice sunt adecvate cand
datele primare pot fi clasificate intr-o maniera
semnificativa.
25
Graficul tip placintaeste un cerc, subdivizat intr-un numar
de felii
ce reprezinta diverse categorii.
Marimea fiecarei felii este proportionala cu procentajul
corespunzator categoriei pe care o reprezinta.
Alte (28.9 /100)(3600) = 1040
11.1% Contabilitate
28.9%
Management
General
14.2%

Finante Marketing
20.6% 25.3%

26
Diagrama prin bare
Graficele de bare furnizeaza o alternativa la graficele
tip placinta.
Frecventa (sau frecventa relativa) a fiecarei categorii
este reprezentata de o bara verticala.
Exemplul 3 - continuat (reprezentare Excel)

Histograma

80
70 73
60 64
52
Frecventa

50
40 Frecventa
30
36
28
20
10
0
1 2 3 4 5 More
Domeniul

27
Tipuri de reprezentri grafice a datelor
prelucrate primar- CARTOGRAMA

Figura Z. Zonele de provenien a candidailor la concursul de admitere al ASE


2005 sub 1%
BOTOSANI

1-3%
MARAMURES

SATU MAR E
BISTRITA- SUCEAVA
3-5%
NASAUD

IASI
5-10%
SALAJ

BIHOR
NEAMT
10% si peste
CLUJ
VASLUI
HARGHITA
MURES
BACAU
ARAD

ALBA

COVASNA GALATI

SIBIU
BRASOV VRANCEA
HUNED OARA

TIMIS

BRAILA
TULC EA
BUZAU
CARAS- VALCEA ARGES PRAHOVA
GORJ
SEV ERIN
DAMBOVITA

MEHED INTI IALOMI TA


BUCURESTI
Sursa de date: Prelucrri ale
GIURGIU
CALARASI
CONSTANTA informaiilor bazei de date a
DOLJ
OLT
TELEORMAN
admiterii ASE i a informaiilor
L
referitoare la examenele de
Bacalaureat
Graficele de linii
Afiseaza frecventa unei categorii deasupra punctului
de pe axa orizontala ce reprezinta acea categorie.
Se utilizeaza cand categoriile sunt puncte in timp.

Numarul total de produse noi introduse in


fabricatie intre 1995,,2010
20,000

15,000

10,000
Sunt utile cand se doreste evidentierea trendului.
5,000

0
95 96 97 98 99 10
29
Diagramele prin puncte
Deseori suntem interesati de relatiile dintre doua
variabile cantitative.
Exemplul.4
Chelt. Reclama Vanzari
Un intreprinzator doreste sa evalueze1 efectele 30
reclamei asupra nivelului de vanzari. 3 40
5
Au fost colectate perechi de date. Fiecare 40
pereche
4 50
consta in cheltuiala lunara cu reclama 2
si nivelul 35
de
vanzari inregistrat. 5 50
3 35
2 25
30
O diagrama prin puncte poate descrie relatia
dintre cheltuiala cu reclama si nivelul de vanzari.

Diagrama prin puncte Excel


Vanzari
Chelt. Reclama Vanzari
1 30 60
50
3 40
40
5 40
Sales
30
4 50 20
2 35 10 Cheltuiala cu reclama
0
5 50
0 2 4 6
3 35
Advertising Expenditure
2 25

31
Modele tipice
Legatura pozitiva liniara Nici o legatura Relatie liniara negativa

Relatie negativa neliniara Relatie (concava) neliniara


Aceasta este o relatie posibila,
dar cea de-a doua nu pare sa
estimeze datele mai bine?

32
INDICATORI OBTINUTI DIN
PRELUCRAREA DATELOR
Indicatori ai tendinei centrale
Mediile
Media aritmetic
caz particular (media variabilei de tip binar)
Media ptratic
Media geometric
Media armonic
Media cronologic (se va discuta despre ea la
capitolul Serii cronologice)
Indicatorii medii de poziie
Mediana
Valoarea modal
Media aritmetic
Se poate calcula doar pentru variabile
cantitative
Se mai numete momentul de ordin 1
pentru un ir simplu de valori

x=
x i

n
Pentru o serie de frecvene sau de date grupate pe
intervale de grupare

x=
xi ni
ni
Valoarea modala ( moda,modul ) (1)

(Mo sau X mo)

Definiie: Valoarea modal este valoarea cu


frecven maxim de apariie
Avantaje:
Poate fi calculat pentru variabile calitative
(exprimate prin cuvinte) (de ex.: culoarea ochilor,
culoarea prului, starea civil etc.)
ansele ca rezultatul s fie o valoare existent n
realitate sunt mult mai mari dect la medii

38
 Mediana ( 1)

Mediana unui set de valori masurate este


valoarea care cade in mijloc cand valorile
masurate sunt aranjate in ordinea marimii.
Exemplu
Sapte salarii ale unor angajati Presupunem ca salariul unui angajat,
au fost inregistrate (in mii u.m.) : de 31,000 a fost adaugat grupului
28, 60, 26, 32, 30, 26, 29. inregistrat anterior
Gasiti mediana salariului. Gasiti mediana salariului.
Maiimpar
Numar intai, sortati salariile.
de observatii Numar par de observatii
zaSunt
salariile.
doua valori in mijloc!
Apoi, localizati valoarea Apoi, localizeaza valorile
26,26,28,29,30,32,60
din mijloc. 26,26,28,29,
26,26,28,29,
26,26,28,29,29.5
26,26,28,29,30,32,60,31
, 30,32,60,31
30,32,60,31
30,32,60,31
din mijloc.
2
Mediana (Me;Xme) (2)
Avantaj: Spre deosebire de medii, Me nu este
influenat de apariia valorilor extreme
Mod de calcul:
1. Se ordoneaz cresctor seria de date
2. Se calculeaz poziia (locul) Medianei

1
[
locMe = ( ni ) + 1
2
]

40
Relatia intre Medie, Mediana
` si Mod

Daca o distributie este simetrica, media,


mediana si modul coincid

 Daca distributia este asimetrica si alungita


la stranga sau la dreapta, cele trei marimi
difera.
O distributie cu asimetrie pozitiva O distributie cu asimetrie negativa
(alungita la dreapta) (alungita la stanga)

Mod Medie Medie Mod


41
Mediana Mediana
INDICATORII VARIABILITATII
 Indicatori simpli ai variabilitatii :
Amplitudinea
Abaterea valorilor de la medie
Abaterile maxime (+ /- )
 Exprimare :
-absolut
-relativ ( %)
Exemplu
 Amplitudinea
Amplitudinea unui set de masuratori este
diferenta intre cea mai mare si cea mai mica
valoare masurata.

Cel mai Dar


mare avantaj
cum al acesteia
se imprastie valorileeste usurinta
masurate?
cu care se calculeaza.
? ? ?
Amplitudinea nu raspunde la aceasta intrebare
Amplitudinea
Dezavantajul sau major este faptul ca nu
furnizeaza informatii
Minim asupra dispersiei
Maxim valorilor
dintre minim si maxim.

43
Indicatorii sintetici ai variaiei (1)
Abaterea medie liniar

Definiie: Media aritmetic a abaterilor individuale fa de medie (di) luate n


valoare absolut
Pentru o serie de frecvene sau pentru o
Pentru un ir simplu de valori: serie de date grupate pe intervale de


grupare:
x x x x n
d=
i
d=
i i
n n i

Abaterea medie liniar are ca unitate de msur, unitatea de msur a


variabilei analizate.
Indicatorii sintetici ai variaiei (2)
Dispersia sau momentul centrat de ordin 2

Definiie: Media aritmetic a ptratelor abaterilor individuale fa de medie


(di)

Pentru o serie de frecvene sau pentru o


Pentru un ir simplu de valori: serie de date grupate pe intervale de
grupare:
(
ix x )2
(x x ) 2
ni
=2
2
=
i
n n i

Din considerente de interpretare vom lsa dispersia fr unitate de msur.

Formula alternativ de calcul a dispersiei: 2 = x p2 x 2


Indicatorii sintetici ai variaiei (3)
Abaterea standard sau abaterea medie ptratic

Definiie: Rdcina ptrat a dispersiei

= 2

Proprietate: De obicei, ntre abaterea medie ptratic i abaterea medie liniar


exist urmtoarea relaie:
4
d
5
Abaterea medie ptratic are ca unitate de msur, unitatea de msur a
variabilei analizate.
Sondajul
Eantion (Sample)
Una sau mai multe uniti de eantionare prelevate
dintr-o populaie ( N ) i destinate s furnizeze
informaii despre aceast populaie.
Un eantion poate servi ca baz pentru o decizie
asupra populaiei (sau procesului de producie).
Este unanim acceptat faptul c, cu ct un eantion
este mai mare, cu att va reflecta mai fidel
proprietile ntregii populaii.
Simbol : n
 Aleatorizarea extractiilor
Ex.:
Un inspector de fiscal este responsabil pentru
gestionarea a 1.000 de dosare ( firme ,PFA etc ).
Inspectorul va selecta aleator 40 de taxe pentru a le
examina ( lunar )
Va selecta valorile folosind generatorul de numere
aleatoare din Excel.
Soluie
Generm 50 de valori ntre 1 i 1000 (avem nevoie doar
de 40 de numere, dar un supliment ar putea fi util dac
sunt generate duplicate)

08.05.2012 48
X(1000) Rotunjiri

0.3820002 382.00018 383 383


0.1006806 100.68056 101 101
0.5964843 596.48427 597 597
0.8991058 899.10581 900 900
50 numere 0.8846095 884.60952 885 885
0.9584643 958.46431 959 959 50 de numere
uniform distribuite 0.0144963 14.496292 15 15
ntre 0 i 1 aleatoare ntregi
0.4074221 407.4221 408 408 ntre 1 i 1000
0.8632466 863.24656 864 864
0.1385846 138.58455 uniform distribuite
139 139
0.2450331 245.03311 246 246
. . . .
. . . .

50 numere aleatoare
ntre 0 i 1000, Inspectorul va selecta 50
fiecare avnd o probabilitate dosare cu numerele 383, 101, ...
08.05.2012
de 1/1000 de a fi selectat 49
Distribuia veniturilor n populaie

media veniturilor n populaie

Media eantionului se poziioneaz aici doar


Eroare de eantionare
pentru c anumite observaii selectate aleator
au fost incluse n eantion.

x media veniturilor n eantion

08.05.2012 50
Erori de obinere a datelor

Populaie

Eroare de eantionare
Dac aceast observaie
+ este greit nregistrat aici
Eroare de obinere a
Eantion datelor

Media eantionului este afectat


08.05.2012 51
Distributia Normala

52
Respectiv functia de frecventa

f (x ) =
1
exp
( x )
2


2 2
2

sau funcia de densitate a repartitiei variabilei


aleatoare X
X mrimea fizic msurat i care reprezentat grafic are
binecunoscuta form de clopot (aa-numitul clopot al lui
Gauss)
Se tie c o funcie de densitate trebuie s ndeplineasc
urmtoarele cerine:
 (i) f (x ) 0, x D i
 (ii)
D
f (x )dx = 1 unde D este domeniul de definiie al variabilei X, n
cazul nostru dreapta real, R.
INDICII
Indicii individuali
S presupunem c avem fenomenul complex z format din
combinarea prin multiplicare a dou fenomene: unul calitativ x
i unul cantitativ f
z = x f
Indicii individuali vor fi:
z1
iz = rz = iz 1[00] z = z1 z0
z0

ix =
x1
rx = ix 1[00] x = x1 x0
x0
if =
f1 rf = i f 1[00] f = f1 f 0
f0
z1 x1 f1 x1 f1
Evident c: iz = = = = ix i f
z0 x0 f0 x0 f0
Sisteme de ponderare (1)

Introduc pentru un fenomen neagregabil un factor ponderator


transformnd astfel rezultatul ntr-un element agregabil

Sistemul de ponderare Laspeyres pstreaz ponderile n perioada de baz

I x =
x f
1 0
I f =
x f
0 1
Este folosit cu preponderen pentru factorul
cantitativ f
x f
0 0 x f
0 0

Sistemul de ponderare Paasche pstreaz ponderile n perioada curent

x1 f1 I f =
x f 1 1
Este folosit cu preponderen pentru factorul
I x =
x 0 1 f x f 1 0
calitativ x
SERII CRONOLOGICE
Terminologie i clasificri
Seria cronologic (SC) reprezint o serie de date (de obicei
consecutive) ce reflect evoluia n timp a unui fenomen
sau indicator
Tipuri de serii cronologice:
a) n raport cu forma de exprimare timpului
- SC de momente sau de stoc (neagregabile)

- SC de flux sau de interval (agregabile)



t
Indicatorii absolui

 d) Modificrile absolute cu baz fix


Se calculeaz prin diferen ntre valoarea corespunztoare perioadei t i valoarea
corespunztoare unei perioade imobile, considerat baz de comparaie. De obicei baza
de comparaie este primul termen al seriei.

t /1 = yt y1 t = 2, n

 e) Modificrile absolute cu baz mobil sau n lan


Se calculeaz prin diferen ntre valoarea corespunztoare perioadei t i valoarea
corespunztoare perioadei precedente t-1.

t / t 1 = yt yt 1 t = 2, n

Proprieti
k /1 k 1/1 = k / k 1
k


t =2
t / t 1 = k /1
Componentele seriei cronologice

Trendul sau tendina ( )yt 70


65
60
55

 Componenta ciclic (C) 50


45
40
35

 Componenta sezonier (S) 30


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

 Factorii aleatori (ntmpltori) ()

Model aditiv Model multiplicativ

yt = y t + C + S + yt = y t C S
REGRESIA SI CORELATIA
I. REGRESIA
Clasificri
a) dup numrul caracteristicilor independente:
- legturi simple
- legturi multiple
b) dup direcia legturilor, acestea pot fi:
- legturi directe
- legturi inverse
c) dup expresia analitic a legturilor:
- legturi liniare
- legturi neliniare
d) dup tipul legturii
- legturi funcionale
- legturi stohastice
e) dup modul de manifestare n timp:
- legturi concomitente
- legturi cu decalaj
MODELUL UNIFACTORIAL LINIAR
Modelul probabilist la nivelul colectivitii generale:
y i = + xi + i
unde
(xi,yi) reprezint valorile numerice ale variabilelor cauz i efect
nregistrate la nivelul unitii statistice i;
, = parametri constani
= punctul de intersecie al dreptei de regresie cu axa Oy;
= panta dreptei, se mai numete i coeficient de
regresie i arat cu cte uniti de msur se modific Y
dac X se modific cu o unitate
i = componenta rezidual (eroare aleatoare) pentru
unitatea statistic i.
II . Metoda corelaiei

A. Corelaia parametric (variabile msurate


pe scala de raport)

B. Corelaia neparametric (variabile msurate


pe scala nominal, ordinal sau de interval)

S-ar putea să vă placă și