Sunteți pe pagina 1din 49

1

ANALIZA CANTITATIVA IN
MARKETNG



NOTE DE CURS
-SUMAR-


Conf.univ.dr. Elena Bugudui
2
Ce reprezinta analiza datelor?

Analiza datelor reprezint un proces complex i sistematic de aplicare a tehnicilor
statistico-matematice, n scopul extragetrii din colecia de date constituit a
informaiilor necesare procesului decizional.

Perspectivele deschise de analiza datelor din economie pot fi redate in linii mari astfel:
- prezint o cale de a prentmpina surprizele economiei de pia printr-o evaluare
aprioric a comportamentului agenilor economici;
- permite anticiparea efectului unor decizii in vederea alegerii celei mai bune
politici economice (cu efecte benefice maxime i efecte negative minime);
- faciliteaz dezvoltarea teoriei economice ntru-ct este greu de acceptat c se
poate face teorie economic realist fr a apela la o analiz cantitativ a
fenomenelor.
n desfurarea activitilor economice, exist o serie de particulariti care fac ca
domeniul economiei s fie mai bine cunoscut prin utilizarea metodelor statistice i
matematice. Aceste metode au rol bine definit n analiza datelor economice. O prezentare
a diferitelor tipuri de metode i modele de analiz i previziune se va face pe parcursul
acestei lucrri.
Este necesar s subliniem faptul c datorit numrului mare de cazuri diverse,
dintre care unele greu de prevzut, realizrile, faptele, evenimentele din economie nu
sunt, n majoritatea cazurilor, nici certe (evenimente sigure), nici irealizabile (evenimente
imposibile), ci ntr-o msur mai mic sau mai mare ele sunt ntmpltoare. De exemplu,
nu putem afirma cu certitudine c n trimestrul urmtor cursul leului va scdea n raport
cu euro sau c o grev ntr-un sector al economiei naionale se va produce. Avnd ns n
vedere ce s-a petrecut n trimestrele anterioare, cnd anumite taxe au crescut, sau atunci
cnd revendicrile grevitilor nu au fost discutate cu reprezentanii guvernului, afirmm
c evenimentele de felul celor exemplificate sunt probabile.
Numrul mare de cazuri n care se produc diverse procese economice prezint, de
asemenea, un aspect particular important. De exemplu, consumul casnic are loc n
milioane de familii, preul grului s-a modificat de-a lungul a sute de ani, factorii care au
determinat calitatea produciei acioneaz n mii de ntreprinderi. Analiza proceselor
economice pe ansamblul sutelor sau milioanelor de cazuri este dificil, aproape
imposibil n numeroase cazuri, fiind un proces costisitor i de lung durat. Ca urmare,
se apeleaz la eantionare, care include un numr relativ restrns de uniti. De aici
rezult c teoria sondajului statistic ca i teoria estimaiei i gsesc utilizri eficiente n
studiile economice.
Fenomenele care au loc n economie urmeaz legi mai mult sau mai puin
evidente, legi care prezint un mare interes. De exemplu, n ceea ce privete nivelul
cererii, nivelul venitului, mrimea productivitii muncii, numrul de cazuri crete pe
msur ce ne apropiem de medie i scade pe msur ce ne apropiem de cazurile extreme.
Ca urmare, intereseaz prezentarea n medie, dar mai ales aa numita lege normal de
desfurare a evenimentelor sau alte legi care deriv din aceasta.
Fenomenele economice sunt dependente de evoluia altor fenomene (fie
economice, fie de alt natur), cea ce prezint un argument privind interesul pentru
aplicarea funciilor n analiz i previziunea evoluiei indicatorilor economici.
3
Analiza economic are la baz zeci sau chiar sute de ecuaii, n mare majoritate de
regresie, prin care se caut reproducerea elementelor eseniale din mecanismele de
funcionare ale economiei, ncepnd cu economia casnic, trecnd prin economia de
firm, economia naional (aflat n centrul ateniei) i sfrind cu mondoeconomia.
n cadrul analizei economice o noiune cel mai de folosit este cea de variabil.
Ea reprezint o nsuire care poate prezenta diferite nivele exprimat, de regul, numeric.
Astfel, ne referim frecvent la variabile economice precum producia, vnzrile, profitul,
dobnda, stocurile, etc. Dintre acestea, unele prezint o variaie discret, iar altele se
caracterizeaz printr-o evoluie continu (cantitatea de benzin n timpul funcionrii
pompelor de distribuie), unele variabile prezint nivele certe cel puin pentru o perioad
(preul unui produs subvenionat de stat), altele prezint o variaie aleatoare (cotaiile la
burs), unele sunt numerice, nivelul lor putnd fi msurat (capitalul, profitul, dobnda),
altele sunt de natur calitativ n sensul ca nivelul lor este exprimat prin categorii,
atribute, clase (calificarea profesional, calitatea bunurilor,).
Privind intr-un mod foarte general, procesul de analiza a datelor poate fi prezentat
ca o succesiune de operatii sintetizate sub forma urmatoarelor activitati:
- formularea ipotezelor cu privire la comportamentul fenomenului ce reprezintaa
obiectul studiului;
- organizarea experimentelor necesare masurarii caracteristicilor fenomenului
studiat;
- culegerea datelor privind comportamentul fenomenului;
- analiza si interpretarea datelor disponibile;
formularea concluziilor, efectuarea predictiilor si luarea deciziilor
4
A conduce bine o firma, inseamna a fi stapan pe viitorul ei, iar a fi stapan pe viitor,
inseamna a sti sa lucrezi cu informatia
John Neisbitt

TEMA 1.

1. 1. ROLUL INFORMATIILOR DE MARKETING
In sistemele moderne de management, ca principala sursa a cresterii eficientei
activitatii organizatiilor, o reprezinta, modul de utilizare a informatiei de marketing
(comerciale).
Managementul eficient al activitatii de marketing in organizatii presupune
disponibilitatea si utilizarea informatiilor despre: cerere, clienti, concurenti, intermediari
si alti factori, care actioneaza la nivelul pietei, precum si despre propria organizatie.
Conducerea activitatilor si rezolvarea problemelor de marketing sunt de neconceput fara
un flux bogat si continuu de date, purtatoare de informatii, necesare deciziilor de
marketing.
Informatia de marketing inseamna cunostinte, experienta, date si idei asupra unor
oportunitati de afaceri.

1.2.CLASIFICAREA INFORMATIILOR DE MARKETING

Aspecte conceptuale privind informatiile de marketing
Informatia este o comunicare despre un anumit aspect al realitatii obiective.
Informatia primeste intotdeauna atributul domeniului pe care il reflecta. Ca urmare,
informatia de marketing reflecta realitatile din mediul de marketing.
Data este forma de reprezentare accesibila a informatiei prelucrate (transformata din
informatie primara in informatie finala) si consta in suportul formal al informatiei,
concretizat in cifre, litere, simboluri, coduri si alte insemne (Orzan, 2001, p. 11).
Exista o corespondenta determinata intre informatie si data, astfel ca, frecvent, in
practica, termenul informatie este utilizat pentru a desemna date, iar expresia
5
prelucrarea informatiilor include si expresia prelucrarea datelor. In consecinta, se poate
considera ca datele prelucrate, in masura in care afecteaza in sens pozitiv
comportamentul receptorilor, au calitatea de informatii.
Se poate realiza o clasificare a informatiilor de marketing, delimitate dupa
urmatoarele criterii:
1. Dupa natura si continutul lor, informatiile de marketing pot fi:
cantitative;
calitative.
Informatiile cantitative de marketing se refera la observarea comportarii generale
a cumparatorilor pe piata, ca de exemplu:
- notorietatea produselor si a marcilor, in viziunea cumparatorilor;
- cantitatile cumparate;
- locurile de cumparare;
- modurile de informare asupra produselor.
Sunt informatii care se obtin ca raspuns la intrebarile: cat?, cum?, unde? si
pot fi considerate ca fiind relativ obiective si controlabile.
Informatiile calitative de marketing se refera la comportamentul cumparatorului
potential sau efectiv si sunt obtinute de regula cu intrebarea de ce?; aceste informatii au
un puternic caracter subiectiv; exemple de astfel de informatii sunt:
- motivatiile;
- perceptiile;
- atitudinile si opiniile (expresiile verbale ale atitudinilor);
- preferintele.
2. Dupa originea lor, informatiile de marketing pot fi:
interne;
externe.
6
Informatiile interne de marketing au ca origine insasi organizatia; aceste
informatii exista deja inaintea etapei de culegere a datelor, sunt de natura cantitativa si
reflecta activitatea globala a organizatiei si evolutia acesteia; exemple de astfel de
informatii sunt:
- informatiile comerciale despre vanzarile de produse, pe tipuri si sortimente;
- informatii despre clienti privind preferintele si obiceiurile de cumparare;
- informatii despre canalele de distributie si zonele geografice corespunzatoare;
- informatiile contabile despre preturi si rentabilitate;
- informatiile administrative obtinute prin prelucrarea fisierelor cu clientii.
Informatiile externe de marketing au ca origine mediul extern al organizatiei;
rolul lor este, in primul rand, de a caracteriza mediul economic in care se desfasoara
activitatea, vizand in principal: cumparatorii, concurenta, produsele de substitutie,
activitatea economica etc.
3. Dupa importanta si modul de obtinere, informatiile de marketing pot fi:
secundare si primare.
Informatiile secundare au ca principala caracteristica faptul ca se bazeaza pe date
existente dinaintea cercetarii lansate; acestea au fost deja supuse anterior unei prelucrari,
in vederea utilizarii lor in alte scopuri; dupa provenienta lor, informatiile secundare pot fi:
- informatii bazate pe date din interiorul organizatiei;
- informatii bazate pe date din exteriorul organizatiei, ca de exemplu: date provenite din
rapoarte statistice, de la organizatii profesionale, paneluri, banci de date etc.
Informatiile secundare prezinta si avantajul de a fi rapid obtinute, relativ
necostisitoare, insa de multe ori, datorita modalitatilor de elaborare si prezentare, nu
corespund obiectivelor propuse; de asemenea, organizatia nu are, de cele mai multe ori,
mijloacele necesare pentru a le controla calitatea si corectitudinea.
Informatiile primare se obtin printro cercetare comandata, care are ca scop
atingerea unor obiective propuse: in acest caz, trebuie luata decizia privind metodologia
de culegere a datelor si modalitatile de prelucrare si de prezentare, in functie de
obiectivele propuse; aceste informatii sunt culese din surse originale, in forma bruta, asa
cum sunt intalnite in documentele in care sunt inregistrate sau in forma in care acestea
sunt prezentate de purtatorii de informatii. Astfel de informatii se obtin, de exemplu, prin:
- observarea comportamentului cumparatorilor;
7
- experimentarea sau observarea comportamentului cumparatorilor in urma modificarii
unor parametri ai contextului comercial;
- anchete prin intervievare, dupa proceduri mai mult sau mai putin formalizate, a
persoanelor care par a fi dispuse sa coopereze.
4. Dupa tipul relatiilor cercetate, informatiile de marketing pot fi:
Informatii care servesc pentru cercetarea relatiilor cauzale intre variabilele de
marketing cercetate;
Informatii care servesc pentru cercetarea relatiilor de asociere dintre variabilele de
marketing cercetate.
5. Dupa modul de culegere, informatiile de marketing pot fi:
informatii obtinute in sectiune transversala(de tip profil), care sunt culese intrun
anumit moment;
informatii obtinute in sectiune longitudinala(serii de timp), cand informatiile
referitoare la aceleasi variabile sunt culese in mod repetat, in diferite momente, de la
aceleasi organizatii investigate ori de la organizatii diferite.
- informatii de tip panel (mixte).
6. Dupa forma lor initiala, informatiile de marketing pot fi:
informatii scrise,
informatii orale.
Ambele forme pot fi rezultatul preluarii din suporturile in care sunt inregistrate, al
comunicarii cu purtatorul de date si informatii sau rezultatul observarii acestuia, fara ca
purtatorului de date si informatii sa i se solicite o participare activa.
7. Dupa frecventa lor, informatiile de marketing generate pot fi:
informatii permanente, care sunt culese si prelucrate (generate) sistematic on line, in
timp real sau la perioade foarte mici;
informatii periodice, care sunt generate la intervale de timp repetitive sau sezoniere,
cu ocazia unor cercetari periodice;
informatii ocazionale, care sunt generate cu ocazia unor evenimente nerepetitive sau
fara a avea un caracter organizat.
8
1.3. OBTINEREA INFORMATIILOR DE MARKETING.
Informatiile de marketing pot fi obtinute cu ajutorul urmatoarelor grupe de metode:
investigarea surselor secundare de date; cercetarea directa; simularea de marketing;
experimentul de marketing.
Obtinerea informatiilor prin investigarea surselor secundare
Etapa de documentare debuteaza, de multe ori, cu obtinerea de informatii din surse
secundare de date. Aceste surse ofera un volum insemnat de informatii, necesar realizarii
obiectivelor unei cercetari si permit evidentierea unor importante legitati, directii si
proportii ale evolutiei fenomenelor si proceselor de marketing.
Clasificarea surselor secundare de informatii
Principalul criteriu de clasificare il reprezinta continutul si gradul lor de
concretete, criteriu dupa care sursele secundare de date, utilizate pot fi grupate in
1. Surse de date statistice, ofera informatii privind piata globala, pietele zonale,
regionale si nationale, provenind din surse oficiale, semioficiale sau din banci de date
private.
Dupa originea lor, sursele de date statistice se pot grupa in:
Statisticile interne ale organizatiei, referitoare la:
- vanzari, detaliate pe produse, piete, intervale de timp, agenti comerciali etc.;
- cheltuielile pentru promovare, detaliat pe produse, piete, regiuni etc.;
- evolutia costurilor si preturilor propriilor produse si servicii;
- situatia retelei de distributie, a stocurilor, a reclamatiilor primite etc.
Problema datelor statistice este de a le aduce intro forma convenabila pentru decizia
de marketing, deoarece in majoritatea cazurilor au fost colectate pentru alte
departamente: financiarcontabil, desfacere, productie etc. Printre deficientele acestor date
se inscriu, in multe cazuri, incomparabilitatea, gradul ridicat de agregare a lor, forma
rigida de raportare.
9
Personalul de specialitate, purtator al unor informatii deosebit de variate,
referitoare la o multitudine de aspecte ale activitatii organizatiei.
Statistici externe organizatiei, constand din:
- purtatorii de informatii, emisi direct de catre componentele mediului extern, in
cadrul sistemului lor de comunicatie (publicitate si alte forme de promovare, oferte
de vanzari, bilanturi publicate;
- publicatiile editate de catre institutii specializate in culegerea si prelucrarea datelor si
informatiilor de marketing, precum:
- statistici nationale si internationale;
- buletine de informare realizate de institute guvernamentale sau de cercetari, de
organisme bancare si financiare, de institutii specializate in statistici etc.
Abilitatea cercetatorului consta in a identifica acele surse, care contin cele mai
recente informatii, sunt cele mai apropiate de sursa primara in lantul de prelucrare a
datelor si informatiilor si, totodata, sunt credibile.
Frecvent, astfel de surse nu se refera deloc sau contin doar in mica masura
informatii cu privire la fenomenul studiat. In schimb, pot oferi informatii cu privire la
fenomene conexe celui cercetat, motiv pentru care nu trebuie eliminate din randul
surselor investigate. Un alt dezavantaj al statisticilor externe il reprezinta faptul ca si
concurenta are acces la informatiile oferite de acestea.
2. Studii empirice, precum: analize globale sau la nivel de grupe de
produse/servicii ale pietei unei tari sau regiuni, analize ale concurentilor dintr-o industrie,
analize ale comportamentului cumparatorilor, analize ale mediilor de comunicare in masa
etc.
Particularitatile cercetarii surselor secundare de informatii
Natura surselor secundare de informatii confera investigatiei acestor surse caracterul
unei cercetari de birou, cu particularitatile, avantajele si dezavantajele sale. Ca atare,
cercetarea surselor secundare de informatii se caracterizeaza printro insemnata reducere a
timpului, efortului si fondurilor necesare cercetarii de marketing.
Avantaje:
Sursele secundare de informatii ofera posibilitatea obtinerii a numeroase informatii,
fie de natura primara, fie secundara, asigurand un grad mai ridicat de accesibilitate.
Culegerea informatiilor oferite de aceste surse nu ridica probleme metodologice
deosebite, insa trebuie avute in vedere urmatoarele aspecte:
10
Cercetatorii sa fie preocupati ca informatiile culese sa fie veridice, obiective si
valide; ca atare, sursele la care se recurge trebuie sa fie credibile;
In situatiile in care sursele nu ofera informatii directe privind elementul cercetat, sa
se recurga la date si informatii indirecte, aferente unor elemente aflate in contact sau
in anumite relatii de interdependenta cu elementul cercetat;
Cercetarea surselor secundare de informatii are si unele dezavantaje, precum:
- nu intotdeauna datele sunt la zi;
- gradul redus de reprezentativitate si de detaliere a datelor si informatiilor;
- acoperirea redusa de catre indicatorii statistici a proceselor si fenomenelor care
prezinta interes in cadrul cercetarii de marketing in derulare.
Provenienta surselor secundare de informatii
Sursele secundare de informatii pot proveni din:
Dosarele proprii ale cercetatorilor, care pot cuprinde:
informatii obtinute in cadrul unor cercetari de marketing anterioare;
informatii extrase din presa si publicatii de specialitate.
Evidentele organizatiei, constand, in general, din:
evidenta vanzarilor;
lista clientilor, cumparatorilor si datele si informatiile de la acestia;
rapoarte si corespondente ale diversilor intermediari;
evidente financiarcontabile.
Sursele institutionale, guvernamentale sau private, care au ca scop, principal sau
secundar, furnizarea de informatii. Aceste informatii, facand parte din categoria
informatiilor din surse statistice externe, pot fi prezentate pe suport de hartie sau in
format digital; acestea din urma pot fi furnizate pe suporturi magnetice sau optice si cu
o amplasare deosebita, in prezent, prin Internet.
Analizand ofertele de informatii secundare externe, se pot identifica urmatoarele
surse nationale:
A. Publicatii ale Guvernului Romaniei, www.domino.kappa.ro/guvern
11
Baza de date legislative, comunicate, Regia Autonoma Monitorul Oficial;
Publicatii ale ministerelor: Ministerul de Finante (www.mfinante.ro), Ministerul
Muncii si Protectiei Sociale (www.mmps_pm.ro). Ministerul Educatiei si Cercetarii
(www.edu.ro), Ministerul Turismului (www.turism.ro) etc.
In subordinea Ministerului Afacerilor Externe se afla si Centrul Roman de Comert
Exterior, care prin directia sa de informare, Trade Point Bucuresti
(http://tpb.traderom.ro), ofera:
- o gama larga de date si informatii comerciale: preturi de referinta, fise de tara, statistici
de comert exterior, analize economice;
- baze de date: organizatii romanesti, oportunitati de afaceri, legislatie comerciala;
- consultanta si servicii online.
B. Publicatii statistice si servicii ale Institutului National de Statistica si Studii
Economice INSSE, (fosta Comisie Nationala de Statistica CNS) www.cns.ro
Publicatii anuale: Anuarul statistic al Romaniei, Anuarul de comert exterior al
Romaniei, Starea sociala si economia Romaniei, Evolutia sectorului privat in
economia romaneasca, Aspecte privind calitatea vietii populatiei, Analize
demografice, Ancheta asupra fortei de munca in gospodarii (Amigo), Demografia
intreprinderilor mici si mijlocii, Romania in cifre, Turismul Romaniei.
Publicatii periodice: Buletin statistic lunar, Buletin statistic de preturi (lunar),
Buletin statistic de industrie (lunar), Buletin statistic de comert exterior (lunar),
Veniturile, cheltuielile si consumul populatiei (trimestrial), Studii de conjunctura
economica (trimestrial), Revista Romana de Statistica (lunar).
Serii de pulblicatii operative privind populatia, resursele umane si salariile,
investitiile si constructiile, agriculturasilvicultura, activitatea de turism.
Servicii, la cerere si contra cost: date centralizate la nivel national, regional, judetean
sau pe localitati, in functie de solicitari si de existenta in bazele de date ale INSSE a
informatilor solicitate.
C. Publicatii ale Institutului National de Cercetari Economice si ale unitatilor
componente.
D. Publicatii ale Camerei de Comert si Industrie a Romaniei, www.ccir.ro
Panorama economica, Sinteza statistica lunara, Buletin statistic, Mesagerul
Economic, Romania Insight, Eurobuletin si diverse alte baze de date.
12
E. Publicatii ale Camerelor de Comert, Industrie si Agricultura judetene si ale
Camerelor de Comert bilaterale Romania alte tari.
F. Publicatii ale Bancii Nationale a Romaniei, www.bnro.ro
Buletine lunare, buletine trimestriale, buletine de conjunctura, balanta de plati,
rapoarte anuale, date si informatii financiare zilnice.
G. Buletine informative ale Oficiului de Stat pentru Inventii si Marci (OSIM).
H. Societatile comerciale cu profil de cercetareproiectare si consultanta, prin
rapoartele, studiile si buletinele lor informative.
I. Consiliul National al Intreprinderilor Private Mici si Mijlocii din Romania
(CNIPMMR), precum si Asociatii ale producatorilor si consumatorilor din diferite
industrii, prin publicatiile si rapoartele asupra studiilor proprii.
J. Asociatia Romana de Marketing (AROMAR), prin revista Marketing Management.
K. Presa cotidiana si periodica de specialitate
revistele: Tribuna Economica, Capital, Succes, Media&Adversiting, Banii nostri,
Magazinul Progresiv;
ziarele: Adevarul economic, Bursa, Economistul, Ziarul Financiar etc.
L. Rapoarte oferite de institute specializate in furnizarea de date si informatii de afaceri:
Rompress, Mediafax, Reuters, AM Press etc.
Practica cercetarii si evaluarea surselor secundare de date si informatii
Cercetarea eficienta a surselor secundare de date si informatii presupune sa se
cunoasca unde si cu ce sa inceapa cercetarea, cum sa se dirijeze investigatia, iar
cercetatorii sasi organizeze astfel activitatea, incat sa utilizeze timpul la maximum.
Totodata, trebuie sa se aplice urmatoarele doua reguli de baza:
- sa se inceapa cu identificarea materialului documentar si a surselor disponibile;
- sa se lucreze dupa principiul: de la general la specific; de regula, o sursa duce la altele
si fiecare informatie poate indica domenii de investigat.
Evaluarea surselor secundare de date se face de catre cercetatori, in functie de
nevoile lor. Este important ca pentru fiecare tema sa se caute doua sau mai multe surse,
pentru a se evita greselile de interpretare si pentru a compara datele si informatiile.
13
Cand se dispune de mai multe surse pentru aceeasi tema, trebuie sa se faca o
ierarhizare a acestora, in baza urmatoarelor criterii:
Cuprinderea, exprimand masura in care trateaza tema, mai precis si mai acoperitor;
Nivelul tehnicitatii sursei; aprecierea se va face avand in vedere scopul cercetarii si
modul cum se vor folosi datele si informatiile;
Accentul, exprimand masura in care se concentreaza datele si informatiile sursei
asupra celor mai relevante obiective ale temei;
Acoperirea perioadei investigate, de catre datele si informatiile sursei;
Accesibilitatea, exprimand masura in care datele si informatiile sursei pot fi utilizate
rapid, in mod convenabil si ieftin;
Acuratetea, reflectata prin apropierea sursei secundare de sursa primara de date si
informatii, cunoasterea realizatorului si a motivelor realizarii sursei.
Obtinerea informatiilor prin cercetarea directa
Informatiile obtinute prin cercetarea directa au un grad relativ de prelucrare, au
valente de autenticitate mai pronuntate, inlesnesc cunoasterea unor aspecte noi, indeosebi
de natura calitativa ale elementelor investigate si implicit, contribuie la fundamentarea
mai realista a deciziilor de marketing.
Cresterea rolului planificarii strategice in marketing a generat cresterea interesului
organizatiilor pentru informatiile primare.
Astfel, in cadrul preocuparilor pentru segmentarea si analiza tipologica a pietelor
externe, se constata, atat in literatura de specialitate, cat si in activitatea practica de
marketing, renuntarea treptata la variabilele macroeconomice (precum: marimi
demografice, nivel al veniturilor, marime a cumparatorilor etc.) obtinute din surse
secundare (prin cercetare de birou), in favoarea utilizarii unor variabile, ca de exemplu:
stiluri de viata, reprezentari, aspiratii etc., ce pot fi obtinute, in diferite tari ale lumii,
numai din surse primare (prin cercetare directa de teren) (Pop Al. N., 2001, p. 96).
Varietatea metodelor concrete de cercetare directa impune delimitarea acestora,
delimitare ce poate fi realizata dupa urmatoarele criterii :
1. In functie de rigurozitatea stiintifica, indiferent de conditiile si modalitatea
preluarii informatiilor, se delimiteaza net:
metode empirice de cercetare directa, fiind metodele ce asigura obtinerea de
informatii, indeosebi prin intermediul personalului operativ, care se ocupa cu
14
activitatea de distributie; datele si informatiile obtinute pe aceasta cale prezinta, insa,
de regula, un interes redus, nefiind reprezentative si implicit, nefiind generalizabile;
metode stiintifice de cercetare directa, fiind metode ce au la baza teorii verificate de
practica si o rigurozitate metodologica bine definita; aceste metode permit obtinerea
de date si informatii reprezentative, care pot fi verificate si generalizate.
Avand in vedere importanta lor, vom extinde clasificarea asupra metodelor
stiintifice de cercetare directa.
2. In functie de gradul de cuprindere a unitatilor colectivitatii cercetate, aceste
metode stiintifice de cercetare directa se delimiteaza in:
metode de cercetare in masa (completa sau totala),
- metode de cercetare selectiva, in cadrul carora datele si informatiile sunt culese de la o
subcolectivitate reprezentativa (denumita esantion) pentru fenomenul cercetat si
ulterior sunt generalizate asupra intregii colectivitati supuse investigatiei.
Figura 1.1. ilustreaza si metodele utilizate pentru obtinerea informatiilor din surse
primare, prin cercetarea directa selectiva, in functie de neparticiparea sau participarea
purtatorilor de
informatii.
Figura 1.1.: Schema metodelor cercetarii directe de marketing
15
TEMA 2.
ELEMENTE DE STATISTICA DESCRIPTIVA
2.1. CONCEPTE FUNDAMENTALE UTILIZATE
In studiul fenomenelor de masa statistica foloseste un numar mare de notiuni
si concepte fundamentale:
Colectivitate ( populatia) desemneaza totalitatea elementelor de aceeasi natura care sunt
supuse studiului statistic .Ex. Ansamblul de persoane(populatia Romaniei la
recensamatul din 2002); obiecte (parcul de masini din unitatile de turism din Romania la
o anumita data ); evenimente(casatoriile in cursul unei perioade);idei sau opinii (opiniile
exprimate de consumatori asupra calitatii produselor alimentare), etc
.Unitatile (indivizi,componenti) reprezinta elementele constitutive specific care formeaza
aceeasi colectivitate. Unitatile sunt simple si complexe.Ex. Unitati simple: persoane
fizice, student, produse, etc.; unitati complexe: familii, grupe, unitati economice, etc.

o Esantion(E). Este o submultime a populatiei studiate. Esantioanele sunt purtatoare
de informatii, necesare in activitatea unui manager. Numarul elementelor(unitatilor
statistice) continute in submultimea aleasa, ce va constitui esantionul,este numit
volumul esantionului.
Scopul esantionarii este urmatorul: folosind o submultime (relativ mica) a
populatiei, sa se culeaga suficienta informative pentru a face inferente (extrapolari)
privind caracteristicile urmarite.
Partea din populatia aleasa pentru a fi studiata trebuie sa reproduca cat mai
fidelposibil caracteristicile studiate, iar pentru elaborarea de concluzii asupra
populatiei, bazate pe informatii asupra esantionului, este necesar ca acestea sa fie cat
mai reprezentative.
16
Metodele statistice de esantionare, de evaluare a volumului esantionului, permit sa
se evalueze eroarea asociata fiecarui tip de esantionare.

o Parametrul este o denumire generica ce se asociaza unei caracteristici a
populatiei .
Exemple de parametric ce apar in mod frecvent sunt: modul, media, dispersia,
procentul.

o Statistica, este asociata esantionului, fiind utilizata pentru a estima valorile unui
parametru.Vom reveni la asupra acesteia pe parcursul cartii, dar vom da exemplu:

Tabel 1.3. Parametri si statistici

Populatie Esantion
Caracteristici Parametrii

Statistici
Simboluri folosite:







=media(populatiei)

abaterea standard

N= volumul

=procentul
m =media esantionului

s = abaterea standard

n =volumul

p=procentul in esantion

o Caracteristica(variabila) desemneaza trasatura, insusirea, proprietatea comuna
tuturor unitatilor dintr-o colectivitate.
Ex. Varsta, greutatea,sexul,ocupatia, cifra de afaceri, etc.
Nivelul de dezvoltare al unei caracteristici, valoarea observata a unei caracteristici,
poarta numele de varianta sau modalitate.

2.2. CLASIFICAREA CARACTERISTICILOR


I.Clasificarea caracteristicilor in raport cu forma de prezentare. In raport cu
acest criteriu de clasificare, caracteristicile statistice se impart in urmatoarele doua
clase:
i) caracteristici cantitative sunt cele pentru care valorile sunt exprimate numeric.
ii) caracteristici calitative(categoriale )- sunt constituite din acele insusiri, atribute,
trasaturi ale indivizilor ce formeaza populatia care nu se exprima numeric.
Exista o sub clasificare alor in trei categorii:
- Variabile nominale, au de obicei mai mult de doua nivel .
De exmplu,
Nivelul educatiei este o variabila nominala avand modalitatile:
Fara liceu codificata prin 1,
Doar cu liceu-codificata prin 2
= o
17
Facultate neterminata- codificata prin 3,
Licentiat- codificata prin 4,
Postuniversitare - codificata prin 5.

- Variabilele binare au doua valori (nivele).
Ex. Variabila Probleme anterioare de ramburasare are doua nivele (modalitati)
Nu. Codificat 0 si Da , codificat prin 1.
- Variabilele ordinale, sunt variabilele a caror nivele de cele mai multe ori
mai mult de doua, pot fi comparate intre ele. In general, in situatiile intalnite
in cercetarea de matketing, la eceste variabile respondentul unui chestionar
alege un raspuns din cateva posibile, ordonate calitativ;el isi exprima astfel,in
mod preferential, opinia sa despre un anumit atribut.
Ex. Variabila ordinala la raspunsul la intrebarea:
In alegerea unei anumite marci de aparat, in ce masura va influenteaza reclama?

Foarte mult mult potrivit putin deloc
1 2 3 4 5

se observa ca acestor raspunsuri, de natura calitativa, li se asociaza cate un cod
numeric.

Exemplu de insusuiri precum varsta, vechimea etc. constituie caracteristici
cantitative numai in masura in care valorile acestora sunt exprimate
numeric.Vechimea in munca este o caracteristica cantitativa daca definim modalitatile
prin numarul de ani de munca(1,2..) sau grupele de ani de munca(sub 5ani, 5-10, 10-
15, 15-2, peste 20).
Caracteristici precum starea civila, situatia religioasa, sexul, profesia constituie
exemple de caracteristici calitative. Daca pentru caracteristica vechime in munca se
defines urmatoarele trei modalitati: M =vechime mica(sub 5 ani), M =vechime
medie(5-20 de ani), M = vechime mare(peste 20 de ani), atunci aceasta este o
caracteristica calitativa.

II. Clasificarea in raport cu forma de prezentare a domeniului de valori.

Caracteristicile statistice, in raport cu modul in care se defineste domeniul de
valori, sunt impartite in caracteristici discrete si continue.
i)Caracteristicile discrete sunt definite prin intermediul unui set izolat de valori.
In raport cu forma de exprimare exista doua tipuri de variabile discrete: numerice si
nenumerice.
- Variabile discrete numerice. De exmplu numarul de someri dintr-un judet,
numarul angajatilor de la o firma, numarul pacientilor dintr-un spital, etc.
De exmplu, caracteristica varsta, constituita pentru o pupulatie formata din 1000 de
persoane se prezinta sub forma tabelului urmator:
Tabelul 1.1. Caracteristica varsta
Persoana 1 2 3 1000
Varsta 19 21 7 30
1 2
3
18

- Variabile discrete nenumerice , in acest caz modalitatile nu sunt exprimate
numeric.
De exemplu, pentru populatia constituita din 10 persoane, caracteristica stare civila
se reprezinta sub forma tabelului urmator:
Tabelul 2.2. Caracteristica starea civila
Persoana 1 2 3 4 5 6 7 8 9 1 0
Starea
civila C Ce V D C D N Ce C C

ii) Caracteristicile continue se exprima printr-o multime reprezentata de un intervale
valori de pe dreapta reala.

In general, toate caracteristicile care exprima unitatile de spatiu(lungime, latime,
inaltime, suprafata, volumul), de timp(varsta, durata de viata), de masa(greutatea) sau
oricare alta combinative a acestora(viteza, aceleratia, densitatea) sunt variabile
statistice continue.
Pentru unele caracteristici pot fi considerate exemple din care sa rezulte ca acestea
pot fi continue sau discrete. De exemplu, daca pentru un grup de 50 de persoane s-au
inregistrat varstele in ani intregi, atunci se de fineste o caracteristica numerica
discrete. Daca persoanele sunt clasificate pe grupele de varsta , (75,
peste 75), atunci se obtine o caracteristica continua.

III.Clasificarea caracteristicilor in functie de numarul valorilor inregistrate.
In practica statistica caracteristicile sunt regasite in una dintre urmatoarele forme:

i) Caracteristici dihotomice sau binare(bipolare), sunt acele caracteristici care
exprima doua forme de manifestare De exmplu, caracteristica sex are doua forme,
masculin si feminin. Salariatii unei companii pot fi impartiti in doua clase disjuncte:
una ce incadreaza pe cei care au salariul mediu lunar mai mic decat salariul mediu la
nivelul companiei, iar alta care include persoanele ce au venit cel putin egal sau mai
mare cu media.
ii) Caracteristici cu trei sau mai multe forme de manifestare. O astfel de caracteristica
poate fi cea a starii civile a unei persoane: Celibatar(Ce), Casatorit , (C ), Vaduv( V)
, Divortat (D), Nedeclarat (N).
Pentru o caracteristica stastica, prin operatia de regrupare a claselor se poate trece de
la un numar mai mare de clase la un numar mai restras, in functie de cerintele
cercetarii.

2.3.MASURAREA INFORMATIILOR DE MARKETING
Concepte, definitii si particularitati.
( | 5 , 0 ( |...... 10 , 5
19
Analiza datelor, se desfasoara asupra informatiilor rezultate prin masurarea unei
diversitati de caracteristici a unui obiect, fenomen sau proces; printre aceste caracteristici,
exemplificam: opinii, atitudini sau preferinte fata de un anumit aspect (denumit stimul),
intentii de cumparare sau de consum, caracteristici sociodemografice sau
economice.Alegerea modalitatilor de masurare si scalare (pozitionarea pe o scala a
caracteristicilor elementelor cercetate), obiecte, fenomene sau procese reprezinta o etapa
importanta in analiza informatiilor de marketing. In functie de aceste procedee alese, se
decide asupra instrumentele de culegere a informatiilor si metodele de analiza a
acestora.Masurarea reprezinta exprimarea simbolica, numerica sau nenumerica a
gradului in care un obiect, fenomen sau proces poseda o anumita caracteristica sau
proprietate.
Masurarea presupune urmatoarele activitati:
- identificarea caracteristicilor obiectului, fenomenului sau procesului desfasurat in
cadrul pietei;
- realizarea unei corespondente intre simboluri si marimea (intensitatea) caracteristicilor
obiectului, fenomenului sau procesului cercetat;
- stabilirea unor reguli prin care se atribuie valori (numere reale sau simboluri) in raport
cu marimea caracteristicii (lor) cercetate.
Prin masurare se urmareste de fapt cuantificarea gradului in care un anumit obiect,
fenomen sau proces cercetat poseda o anumita caracteristica, sau altfel spus,
determinarea nivelului la care ajunge in privinta caracteristicii respective.
Elementele cercetate pot fi definite printrun anumit numar de caracteristici. Dar care
sunt cele mai semnificative si cum le alegem este o problema care depinde foarte mult de
obiectivele propuse, de ipotezele emise de cercetator inaintea oricarui studiu, de abilitatea
de a estima si, nu in ultimul rand, de resursele financiare si umane de care se dispune.
Interdependenta si consistenta acestora sunt verificate apoi prin tehnici statistice.
Trebuie retinut ca acele caracteristici, ale caror valori nu prezinta variatie de la caz
la caz, nu sunt purtatoare de informatie. Ele se identifica, practic, prin valori egale si pot
fi eliminate fara a aduce prejudicii problemei in ansamblu.
20
Exprimarile simbolice (numerice sau nenumerice) folosite la masurare, trebuie alese
in asa fel incat sa poata fi adunate sau sa se poata opera cu ele ca subiecte in propozitii,
ori sa se poata folosi intro informare grafica.
Masurarea in informatiilor de marketing se realizeaza cu ajutorul unui instrument,
denumit scala, definita astfel: Scala reprezinta o modalitate de ordonare, intrun spatiu
liniar unidimensional continuu sau intrun spatiu multidimensional, a intensitatilor pe
care le cunoaste (cunosc) una sau mai multe caracteristici ale unui obiect, fenomen sau
proces din sfera pietei, de la o extrema (minim) la cealalta extrema (maxim).
Intensitatea caracteristicii se determina prin masurare iar pozitionarea pe o scala a
valorii masurate se numeste scalare. Deoarece valoarea masurata se determina pe baza
raspunsurilor, procesul mai este denumit si scalarea raspunsurilor.
In cazul caracteristicilor de tip atribut (calitative,atributive), frecvent intalnite,
concomitent sau dupa masurare, valorile categoriale rezultate ale masurarii, trebuie
transformate in numere reale (procesul de scalare), activitate ce comporta diferite
dificultati.
Scala poate fi realizata dintrun instrument fizic, cum sunt cele pentru masurarea
greutatii, lungimii sau dintro constructie prezenta in instrumentarul de culegere a
datelor de natura calitativa (ca in cazul masurarii atitudinilor, preferintelor, imaginii si
altor componente ale comportamentului consumatorilor).
Mai trebuie mentionat faptul ca masurarea caracteristicilor tangibile(cantitative) este
relativ mai usor de realizat decat in cazul caracteristicilor intangibile(calitative).
Important este ca in toate situatiile, sa se utilizeze un sistem de exprimare compatibil cu
caracteristicile care sunt supuse masurarii. Scalele, ca instrumente de masura, se regasesc
in chestionar, sub forma intrebarilor si variantelor de raspuns.
Astfel, o serie de caracteristici ale produselor (obiecte) supuse schimbului de
marfuri pe piata sau ale purtatorilor cererii, ce se manifesta in acest cadru, (subiecti) pot
fi masurate (de exemplu: greutatea, volumul, pretul etc. ale unui produs sau varsta,
marimea veniturilor, numarul de persoane din familie etc.).
Alte caracteristici ale acelorasi elemente (obiecte sau subiecti) pot fi doar evaluate
(culoarea, mirosul, gustul etc. ale unui produs; sexul, temperamentul, starea de spirit,
imaginea despre sine ale unui cumparator; imaginea unei marfi sau unei organizatii pe
piata).
Tipuri de scale si utilizarea acestora
Clasificarea scalelor
Exista o larga varietate de scale, clasificabile dupa urmatoarele criterii:
21
A. Dupa numarul starilor variabilei scalate, se disting:
Scala dihotomica, care permite doar una din doua variante posibile de raspuns
(uninivel); se foloseste exclusiv la intrebarile dihotomice (cu raspuns posibil: da sau
nu);
Scala multinivel, tip de scala utilizata pentru masurarea a mai mult de doua stari ale
variabilei scalate.
B. Dupa proprietatile lor, statisticomatematice, se identifica patru tipuri de scale,
propuse de Stevens S.S.:
nominale, ordinale, interval si proportionale, denumite scale de masura.
Descrierea scalelor de masura
1. Scalele nominale (categoriale) sunt cele mai simple scale de masura, acestea
presupunand gruparea componentilor unei colectivitati cercetate, dupa o caracteristica a
acestora, incat sa rezulte o clasificare. Componentii colectivitatii cercetate(indivizii) sunt
incadrati in grupele definite prin scalare, iar componentii unei grupe nu se deosebesc intre
ei din punctul de vedere al caracteristicii respective, decat prin alternativa variabilei
scalate.
Scala nominala presupune repartizarea arbitrara a unui numar fiecarei grupari, cu
scopul identificarii sau clasificarii lor, respectiv indicarii categoriei de raspuns aleasa si
nu evidentierii importantei lor; de exemplu:
Care este profesia dvs.?
__________ ___________ ____________ ___________
electrician (1) profesor (2) medic (3) actor (4)
- din punct de vedere al analizei datelor, scala nominala este mai putin performanta,
permitand doar calcularea frecventelor si procentelor (numar absolut si relativ de
inregistrari, din fiecare grupa);
2. Scalele ordinale permit ordonarea componentilor populatiei cercetate, in raport
cu o anumita variabila, realizanduse o ierarhizare a grupurilor rezultate: primul, al doilea,
al treilea etc. Spre exemplu, respondentilor li se poate solicita sa ordoneze marcile de
automobile clasa A, din punct de vedere al preferintelor pentru o anumita marca (Pop Al.
N., 2001, p. 91). Marca ce intruneste cele mai multe preferinte va ocupa prima pozitie, iar
marca cu cele mai putine preferinte, ultima pozitie. Pozitia marcii, din punct de vedere a
preferintei, va fi simbolizata cifric, astfel: (1) Mercedes A Klasse; (2) Fiat Punto; (3)
Peugeot 206; (4) Renault Clio; (5) Opel Corsa; (6) Toyota Yaris; (7) Seat Ibiza.
22
Pe total esantion cercetat (respondenti), vor putea fi calculate frecvente (cati au plasat
fiecare marca pe un anumit loc) si vor putea fi calculati indicatorii, precum: modulul
(frecventa cu valoarea cea mai mare) sau mediana (valoarea care imparte seria de date in
doua parti egale de termeni). Insa ierarhizarea conform scalei ordinale nu spune nimic
despre distantele existente intre marci, intrucat scala nu le cuantifica. Masurarea cu
ajutorul scalei ordinale poate fi aplicata in cazul educatiei, preferintelor, gustului etc.
In privinta utilizarii scalei ordinale, evidentiem urmatoarele aspecte:
- valorile masurate si scalate ordinal permit operatii aritmetice simple (adunare,
scadere, impartirea la un scalar, inmultirea cu un scalar) si pot fi utilizate pentru calculul
unor indicatori statistici de complexitate medie, precum: mediana, diferenta
interquartilica, coeficientii de corelatie a rangurilor (Mann-Whitney, Kendal), analiza
neparametrica a variatiei;
- scalele ordinale permit obtinerea unui volum insemnat de date si informatii
calitative privind educatia, perceptiile, reactiile, atitudinile, convingerile si preferintele
cumparatorilor;

Cum apreciati calitatea serviciilor bancii noastre?
Foarte buna Buna Medie Slaba Foarte scazuta
1 2 3 4 5
raspunsul Foarte buna nu inseamna comparativ cu raspunsul Medie si servicii de o
calitate de doua ori mai buna, desi intre cele doua raspunsuri sunt doua unitati de
interval, asa cum nici intre raspunsurile Foarte scazuta si Medie nu se poate spune ca
este o distanta egala cu cea dintre Foarte buna si Medie; acest aspect trebuie avut in
vedere de catre cercetatori la prelucrarea datelor si informatiilor si la fundamentarea
concluziilor.
Din cele prezentate, privind primele doua scale, nominala si ordinala, rezulta ca
acestea nu permit cuantificarea distantelor dintre grupurile rezultate, motiv pentru care
sunt considerate scale nemetrice. Acestea sunt cele mai elementare din punct de vedere
al capacitatii de masurare si cel mai putin restrictive din punct de vedere statistico-
matematic. Fiind preferate de catre respondenti, datorita simplitatii lor, sunt larg folosite
in cercetarea de marketing.
3. Scalele interval (de distanta) stabilesc pozitia variabilei pe scala si masoara
distanta respectivei pozitii fata de alte pozitii, cu ajutorul unor unitati de masura egale.
Originea scalei (punctul zero), cat si marimea unitatii de masura sunt stabilite de catre
cercetator. Un exemplu comun il reprezinta scalele interval folosite pentru masurarea
temperaturii: scalele Celsius, Fahrenheit sau Kelvin; punctul zero al fiecareia din scale
are semnificatii diferite. Se mai poate sustine ca 10C reprezinta cu cinci grade mai mult
23
decat 5C si ca intre 30C si 20C este aceeasi diferenta ca si intre 10C si 0C, dar nu se
poate sustine ca la 30C este de doua ori mai cald decat la 10C.
O frecventa utilizare a scarii interval o reprezinta indicele (preturi, cantitati etc.). Un
indice necesita un punct zero (arbitrar) si intervale egale intre valorile scarii. O utilizare
curenta o au scarile interval, pentru masurarea atributelor de ordin psihologic (de
exemplu, atitudinilePentru prelucrarea datelor si informatiilor obtinute prin scalarea
interval, pot fi utilizati si indicatori statistici de complexitate mai mare, precum: media,
dispersia, coeficienti de corelatie si regresie, tehnici de analiza multifactoriala etc.
4. Scalele proportionale sunt cele mai complexe si mai performante din punct de
vedere al posibilitatilor de analiza a datelor, dar si mai dificil de utilizat, fata de scalele
prezentate anterior; aceste scale au, ca si scalele interval, distante egale intre treptele sale
si suplimentar, un punct de origine care corespunde valorii zero (origine absoluta).
Scalele proportionale permit efectuarea tuturor operatiunilor admise de celelalte scale,
inclusiv inmultirea sau impartirea unui numar de pe scala cu altul. Avand in vedere
caracteristicile lor, ce permit aplicarea valorilor cantitative de masurare si a celor mai
performante tehnici de analiza statistica, scalele interval si cele proportionale sunt
considerate scale metrice.
In baza caracteristicilor esentiale ale fiecareia din cele patru scale de masura, in fig.
2.1. se prezinta algoritmul de selectie a unei scale de
masura.
Figura 2.1: Algoritmul de selectie a unei scale de masura.
24
Sursa:( Foltean, 2000, p. 79)
Analiza informatiilor poate fi realizata cu ajutorul unor instrumente
statisticomatematice, a caror alegere se face in baza urmatoarelor criterii (Catoiu
coordonator, 2002, p. 151):
- tipul scalei utilizate;
- raportul intre esantioanele si/sau variabilele supuse cercetarii cand sunt doua sau
mai multe:
- de dependenta: ca in cazul cercetarilor longitudinale de tip panel, al unor
experimente de marketing etc.;
- de independenta.
In cazul esantioanelor si/sau variabilelor independente unele fata de altele, de altfel
cele mai frecvente cazuri, analiza statistico-matematica a datelor si informatiilor obtinute
cu ajutorul celor patru tipuri de scale de masura, poate fi realizata cu ajutorul
instrumentelor prezentate in tabelul 1.2.
In cele ce urmeaza se exemplifica modul de utilizare a diferentialei semantice:
Daca, de exemplu, vrem sa masuram opinia cumparatorilor despre un produs cu
ajutorul unei scale cu cinci niveluri, se vor parcurge urmatoarele faze:
a. se construieste scala intre perechea de atribute extreme:
Foarte
favorabil

Favorabil

Indiferent

Nefavorabil

Foarte
nefavorabil

b. pentru a usura prelucrarea si interpretarea datelor, se pot inlocui nivelele scalei cu
cifre (scoruri), intr-una din urmatoarele structuri:
5 4 3 2 1
sau
2 1 0 -1 -2
c. persoana cercetata marcheaza cu X acel nivel al scalei sau incercuieste scorul
aferent, care corespunde cu opinia sa despre produsul supus investigatiei;
25
In cazul anumitor produse si indeosebi in cazul serviciilor, nivelurilor scalei
semantice li se pot atribui denumiri, conform urmatorului exemplu:
In privinta modului in care ati fost tratat in hotelul nostru, sunteti:
foarte
multumit
multumit
nici multumit
nici nemultumit
nemultumit foarte nemultumit
Analiza datelor si informatiilor obtinute cu o astfel de scala este conditionata de
acordarea unei valori (cifre) fiecarui nivel. De regula, marimile cifrice au numai
proprietati ordinale, deoarece nu masoara o distanta intre nivele.
In cazul unui esantion, dupa ce fiecare respondent a marcat nivelul (numarul) care
exprima aprecierea sa in legatura cu calitatea serviciilor hoteliere, se poate realiza o
medie aritmetica ponderata a tuturor aprecierilor, care va reflecta, prin intermediul unui
scor mediu, aprecierea globala a intregului esantion. Acest scor mediu se poate compara
cu scorurile medii corespunzatoare altor caracteristici ale ofertei hoteliere (redate in fig.
1.2.) si astfel se poate realiza ordonarea sau ierarhizarea acestor caracteristici, in raport cu
criteriul stabilit.
Presupunand ca rezultatele centralizate ale unei cercetari, care a intervievat 100 de
clienti, sunt urmatoarele:
F.multumit
5
Multumit
4
Nici multumit
nici
Nemultumit
3
Nemultumit
2
f. nemultumit
1
20 50 10 15 5
Scorul mediu se calculeaza dupa formula mediei ponderate:

Scorul mediu obtinut ne indica faptul ca in medie, clientii sunt multumiti de
calitatea serviciilor.Daca intro cercetare se compara mai multe caracteristici bipolare,
scorurile medii obtinute pentru fiecare caracteristica se pot uni, obtinanduse astfel si o
imagine grafica a opiniilor esantionului, asa cum ilustreaza figura 2.2. in cazul serviciilor
hoteliere. Aceasta figura poate ilustra imaginile grafice ale opiniilor esantionului, in
legatura cu mai multe produse (in acest caz, mai multe hoteluri, cu ofertele lor).
26

Figura 2.2. Imaginea grafica a opiniilor esantionului de clienti
Media aritmetica ponderata corespunzatoare caracteristicii unui anumit produs sau
serviciu poate fi comparata cu mediile obtinute pentru alte produse sau servicii, cu
mediile altor esantioane sau cu media aceluiasi esantion, obtinuta in alta perioada de
timp.














27
TEMA 3.

ANALIZA PRELIMINARA A INFORMATIILOR DE MARKETING
3.1. METODE DE ANALIZA UNIVARIATA
Cea mai simpla procedura de analiza este aceea cand se are in vedere statistica
descriptiva in cazul unei singure variabile si a unui singur esantion. Aceasta
inseamna o prelucrare a datelor obtinute din raspunsurile date la fiecare din intrebarile
esantionului. In functie de scala folosita in masurarea datelor, vor fi utilizate, ca un prim
nivel de aprofundare a investigatiei, urmatoarele metode de analiza univariata:
o daca variabila a fost masurata cu scala nominala, descrierea acesteia se va
realiza calculand frecventele absolute si relative (inclusiv procentele) pe
categorii, incluse intr-un tabel, si stabilind apoi modulul;
o daca variabila a fost masurata cu scala ordinala, analiza acesteia va consta in
realizarea unei ordonari pe baza scorurilor medii, si apoi stabilirea medianei
sau a intervalului median;
o daca variabila a fost masurata cu scala interval, se va determina media
aritmetica, dispersia (varianta) si abaterea standard; pot fi utilizate si
metodele anterioare specifice variabilelor calitative;
- variabila masurata cu scala proportionala, va oferi, in plus, fata de metodele
mentionate anterior, si calculul mediei geometrice sau a celei armonice.
- Rezulta din mentionarile deja facute ca o scala mai evoluata permite
utilizarea statisticii descriptive specifice scalelor anterioare.
3.2. METODE DE ANALIZA BIVARIATE
Un al doilea nivel de aprofundare a investigatiei datelor de marketing este acela
care presupune punerea in corelatie a unei variabile cu o alta variabila. Aceasta analiza a
legaturii dintre doua variabile, care este o expresie a analizei bivariate, se poate face
avand in vedere doua situatii, si anume:
- ca o analiza a unei legaturi posibile intre o variabila, respectiv o intrebare,
si o alta variabila, respectiv o alta intrebare, alta decat o variabila de
caracterizare a subiectilor;
- ca o analiza a unei legaturi posibile intre o variabila a cercetarii si o
variabila de caracterizare a subiectilor (sex, educatie, venituri, profesie, stare
civila etc.)
28
Pentru evidentierea acestor legaturi, ca statistica descriptiva, se poate utiliza
metoda tabelarii incrucisate(tabele de contingenta)
Ea consta in dispunerea in cadrul unor tabele a datelor aferente celor doua
variabile, pe grupuri, categorii sau clase cu scopul de a face comparatii.
Pentru a sesiza mai usor rezultatele obtinute in cazul acestei analize preliminarii,
ca statistica a esantionului, pot fi utilizate reprezentarile grafice. Acestea sunt adecvate
tipurilor de analiza si se obtin cel mai lesnicios de catre calculator, ca de altfel si
prelucrarea statistica mentionata anterior.
In prezent sunt o serie de programe specializate de prelucrare a datelor de
marketing ce acopera practic toate metodele de analiza statistica a datelor de marketing.
In acest sens, unul din cele mai performante pachete de programe este SPSS sub diferitele
sale variante: SPSS 7.5, SPSS 8.5 for Windows, SPSSX etc. Alte pachete de programe
mai sunt: EVIEWS, SAS, SYSTAT, MINITAB, EDUSTAT, STATPAK.Sunt si o serie
de programe de genul Spreadsheet Pakages precum LOTUS 1-2-3, QUATTRO PRO sau
EXCEL (97 sau 2000) care sunt utile managementului bazelor de date si care au
incorporate unele programe pentru analiza descriptiva, analiza pe baza de grafice si o
analiza statistica limitata. Deosebit de important este faptul ca programul SPSS, spre
exemplu, poate prelua si apoi prelucra datele introduse in programele EXCEL.
3.3.TEHNICI UTILIZATE IN PRELUCRAREA PRIMARA A DATELOR
STATISTICE

Primul demers realizat in urma unei ANALIZE A INFORMATIILR de marketing este
cel al sistematizarii seriilor de date prin folosirea unor forme adecvate de grupare si
clasificare.
O sistematizare adecvata a datelor creeaza premisele aplicarii unor operatori adecvati
pentru obtinerea unor indicatori sintetitici adecvati. In constituirea clasificarilor si
gruparilor de date se recomanda organizarea convenabila a seriilor de date astfel incat sa
permita apoi aplicarea\unor programe statistice specifice.


I. Clasificarea/gruparea

Potrivit definitiilor, clasificarea este o operatie logica prin care unitati statistice
cu un grad mai mic de generalitate sunt reunite, pornind de la anumite criterii esentiale
pentru scopul analizei, in clase sau grupe cu un grad de generalitate mai mare decat la
inceput. Gradul de asemanare a unitatilor unei grupe este mai mare decat cel al deosebirii
unitatilor din clase sau grupe diferite.
Clasificarea reprezinta, in cadrul oricarei teorii stiintifice, una dintre metodele cele mai
simple si eficace de organizare a datelor si informatiilor. Unul dintre exemplele cele mai
cunoscute este clasificarea lui Mendeleev din chimie.
29
Aceasta sistematizare a elementelor chimice dupa greutatea atomic a fost esentiala in
dezvoltarea ulterioara a cercetarii din acest domeniu de cunoastere.

La structurarea datelor pe clase sau grupe trebuie respectate urmatoarele principii:

-principiul completitudinii, fiecare unitate inregistrata trebuie repartizata intr-o anumita
clasa sau grupa;
-principiul unicitatii, potrivit caruia o unitate din cadrul seriei se include numai intr-o
singura grupa de valori;
-principiul omogenitatii, presupune ca unitatile care apartin aceleeasi clase sau grupe sa
fie asemanatoare intre ele;
-principiul organizarii ierarhice a grupelor, ce recomanda acea forma de organizare a
claselor care sa permita agregari successive de clase adiacente.

In general, pentru efectuarea operatiei de grupare se tine seama de urmatoarele:

a) Definirea unui numar adecvat de grupe. De cele mai multe ori, numarul grupelor
se stabileste dupa anumite formule de calcul. Mentionam mai jos pe cele mai
importante:
- Propunerea lui D.V.Huntsbergers:

P = 1 + 3,3 log n, unde p= nr. De grupe, iar n = nr.total de observatii din cadrul
seriei de date;
- O alta varianta este oferita de Brooks si Carruthers:

P< 5 log n
- A treia propunere a fost facuta de Croxton si Cowden. In aceasta varianta de
calcul, numarul intervalelor se recomanda sa fie cuprins intre sase si saisprezece.
Avand in vedere faptul ca pentru definirea numarului de clase intervin o serie de
indicatori statistic ice vor fi prezentai pe parcursul lucrarii vom aminti si alte
modalitati pentru definirea numarului de grupe.

b)Definirea grupelor. Se considera ca fiecare grupa este complet definite daca sunt
precizate cele doua limite extreme. Se defines limitele inferioare ale grupelor prin :

, , iar limitele superioare prin


Pentru fiecare grupa, pe baza celor doua valori extreme, se calculeaza amplitudinea
conform relatiei:




inf
t
x k t , 1 = k t x
t
, 1 ,
sup
=
inf sup
t t t
x x h =
30
Pentru o grupare pe interval egale, daca se specifica numarul de interval, lungimea
intervalului se calculeaza pe baza relatiei




b) Calcularea frecventelor absolute pe fiecare grupa, in conditiile in care fiecare
valoare din cadrul seriei se aloca la una dintre grupele definite. Se noteaza
frecventa fiecarei grupe prin

, numita frecventa absoluta a grupei.



3.4. PREZENTAREA DATELOR STATISTICE


1. Tabele statistice /matrice de date

Tabelele statistice reprezinta forma cea mai rationala si cea mai adecvata
pentru prezentarea datelor statistice si sunt utilizate in toate etapele cercetarii statistice.
Ele sunt utilizate in dublu scop: pentru sistematizarea datelor in vederea
prelucraii si obtinerii indicatorilor sintetici; pentru prezentarea rezultatelor analizei.
Cercetatorul in analiza datelor are ca sarcina sa extraga din acest tabel
(matrice) de datecat mai multa informatie semnificativa sub formaa numerica sau
grafica si sa o prezinte intr-o forma cat mai restransaa pcat mai putine linii si coloane.
Odata acest deziderat realizat, orice decizie viitoare privind comportamentul populatiei
studiate poate fi explicata prin argumente stiintifice.
In functie de scopul analizei si a prelucrarii se elaboreaza si se utilizeaza o multitudine
de tabele statistice, din care enumeram:

-tabele simple, descriptive;
-tabele utilizate in prelucrare;
-tabele de prezentare a datelor structurate pe grupe/ clase de variati;
- tabele de contingenta. Acestea sunt tabele cu dubla intrare care contin un numar de p
grupe formate dupa o caracteristica factoriala(cauzala) si k grupe formate dupa o
caracteristica rezultativa(efect)


Exemple practice:
Exemplul 1. Problema unui dealer de autoturisme:
Tabelul contine datele a 4 caracteristici masurate asupra 26 de marci de
autoturisme.
p
x x
h
t t
t
inf sup

=
k i n
i
, 1 , =
31
Informatiile de care dispune un dealer de autoturisme sunt prezentate in
tabelul 3.1.

Model/cod Pretul(Eu) Cap.
Cilindrica(cmc)
Viteza
(km/h)
Consumul(litrila100
km)
1.A.AustinMetro
Special
12000 998 140 6.2
2.C.CitroenAX10RE 13275 954 145 5.6
3.D.DaihatsuChardeTS 14625 993 145 6.7
4.FI.FiatUno45Fire 13475 999 145 6.2
5.F2.FiatUnoTurboTE 25005 1301 200 8.9
6.F3.FiatUno70SL 17845 1302 165 7.7
7.F4.FordFiestaJunior 13050 1117 137 7.0
8.FS.FordFiestaXR-2 21743 1597 180 9.3
9.N.NissanMicra1.0.DX 12400 988 140 6.4
10.O.OpelCorsaSwing 13050 993 143 7.2
11.P1.Peugeot20SXE 13260 954 134 6.8
12.P2.Peugeot20SGL 15780 1124 142 5.8
13.P3.Peugeot20SGT 18965 1360 170 9.2
14.P4.Peugeot20SGTI 25175 1580 190 8.7
15.R1. Renoult4TL 12981 956 115 6.3
16.R2. Renoult4GTL 13806 1108 120 6.3
17.R3. Renoult5SL 14156 1108 143 5.8
18.R4. Renoult5GTT 17250 1397 167 7.9
19.R5. Renoult5GTS 25319 1397 200 8.7
20.S1.SEATIbizaGLX 19283 1461 175 8.8
21.S2. SEATMarbella 10970 903 131 7.3
22.S3.SuzukiSwiftGA 12115 993 145 6.4
23.S4. SuzukiSwiftGL 14655 1324 163 6.5
24.ToyotaStarlettL 14000 999 150 6.1
25. ToyotaStarlettXL 16850 1295 170 6.8
26.VolKswgen Polo 18045 1272 170 8.0

Acest tabel contine caracteristicile unor marci de autoturisme oferite spre vanzare.
Tabelul(matricea) are 26 de linii corespunzatoare marcilor de autoturisme analizate si 4
coloane, reprezentand pretul si alte caracteristici tehnice si de confort ale autoturismelo:
Pret, Capacitate cilindrica, Viteza maxima, Consum. Dealerul doreste sa afle, folosind
tamelul de date, ce caracteristici ale masinilor sunt definitorii in decizia unui client de a
cumpara un autoturism. Exista oare in viziunea cumparatorului clase (grupe) de
autoturisme? Daca da, care sunt acestea?
Exemplul 2. Informatii dintr-un chestionar.
Analiza datelor reprezinta un suport foarte important pentru deciziile privind marketingul
stiintific. Perceperea unui produs de catre un segment de cumparatori , gradul de
saturatie al pietei produsului si decizia de lansare a unui nou produs (sau intr-o forma
noua) sunt materializate folosind tehnica chestionarului si analiza datelor(vezi anexa).
32

Exemplul 2. Analiza gradului de neocupare afortei de munca.
Se pune problema aflarii diferitilor factori care influenteaza ocuparea
(neocuparea) fortei de munca la nivel teritorial. Daca consideram ca posibile variabile
factoriale (efect), numarul firmelor active in domeniul, constructii, industrie, servicii,
soldul migratiei internationale, al migratiei urban-rural, cheltuieliele cu somajul, numarul
absolventilor din fiecare judet intr-un an, putem constata ca dintre acestia ase desprind
anumiti factori cu o influenta semnificativa iar altii cu o mai slaba influenta asupra
somajului din Romania. Deasemenea, diferiti factori pot grupa judetele in zone cu mari
asemanari din punct de vedere al evolutiei fortei de munca ocupate, desi geografic nu
fac parte din acceasi regiune. Se poate realiza o ierarhizare a judetelor tarii in functie de
diferite variabile luate in calcul(vezi anexa).


Transformari in matricele de date

Considerand o matrice de forma X( n x p), unde n, reprezinta numarul
indivizilor asupra carora s-au evaluat p caracteristici, adica p variabile.
- fiecarui individ i ii corespunde in matricea X o linie, adica un vector cu p
elemente :
- fiecarei variabile j, ii corespunde in matricea X o coloana cu n elemente,
care va fi notata :

a) Transformari pe coloana:
Se calculeaza pentru fiecare variabila din tabelul de date, valoarea
medie si abaterea medie patratica(abaterea standard).

si


Astfel, din orice matrice X, se poate obtine o noua matrice , ale carei elemente
sunt calculate dupa cum urmeaza: , pentru orice linie i, si coloana j.


Aceasta transformare asupra variabilelor este recomandata pentru a evita discrepantele
intre valori ce ar putea fi datorate unitatilor de masura diferite. Aceasta transformare, face
ca informatiile sa fie prezentate in forma satndardizata, in unitati standard.

Observatie: Media valorilor standardizate este zero, iar dispersia este unu.
Exemplu:
Consideram datele din tabelul 1, ce contine patru caracteristici inregistrate pentru cele 26
de marci de masini.
) 3 2 1
,..... , , (
ip i i i i
x x x x L=
) . ,......... , (
2 1 nj j j j
x x x C=

=
=
n
i
ij j
x
n
m
1
1

=
n
j ij j
m x
n
s
1
2
) (
1
1
) (
' '
ij
x X=
j
j ij
ij
s
m x
x

=
'
33

Pretul Capacitatea
cilindrica
Viteza Consumul
Media 16118 1172 155 7.18
Abaterea
patratica medie
4148 205 22.17 1.13

Utilizand aceste date si formulele de mai sus obtinem informatiile din tabelul 3.2.
Marca Pretul
standardizat
Cap. Cilindrica
standardizata
Viteza
standardizata
Consumul
standardizat
1.A -0.99 -0.85 -0.67 -0.86
2.C -0.681 -1.06 -0.44 -1.39
3.D -0.364 -0.87 -0.44 -0.42
4.FI -0.64 -0.84 -0.44 -0.86
5.F2 2.14 0.63 2.04 1.52
6.F3 0.42 0.63 0.46 0.46
7.F4 -0.74 -0.27 -0.80 -0.15
8.FS 1.36 2.07 1.13 1.87
9.N -0.89 -0.89 -0.66 -0.68
10.O -0.74 -0.87 -0.53 0.02
11.P1 -0.69 -1.06 -0.94 -O.33
12.P2 -0.08 -0.23 -0.58 -1.21
13.P3 0.67 0.91 0.68 1.78
14.P4 2.18 1.99 1.59 1.34
15.Ri -0.76 -1.05 -1.79 -0.77
16.R2 -0.56 -0.31 -1.57 -0.77
17.R3 -0.47 -0.31 -0.53 -1.21
18.R4 0.27 1.09 0.55 O.64
19.RS 2.22 1.09 2.04 1.34
20.S1 0.76 1.41 0.91 1.43
21.S2 -1.24 -1.31 -1.07 0.11
22.S3 -0.96 -0.87 -0.44 -0.681
23.S4 -0.35 0.74 0.37 -0.59
24.Ti -0.51 -0.84 -0.22 -0.95
25.T2 0.18 0.59 0.68 -0.33
26.V 0.46 0.49 0.68 0.72

Se observa ca, desi cele 4 variabile se exprima in unitati de masura diferite, in forma
standard valorile sunt perfect comparabile intre ele.

Matricea corelatiilor

Corelaia (liniar ) ntre dou variabile este msurat prin coeficientul de corelaie
Pearson.
34
Pentru doua variabile i i j, extragem din matricea de date
coloanele i i j, apoi calculm coeficientul de corelaie Pearson

Coeficientul de corelaie poate lua valori cuprinse n intervalul [-1; 1]. Interpretarea s se
face astfel:
- o valoare pozitiv a coeficientului de corelaie indic o legtur direct ntre cele
dou variabile (cu alte cuvinte, valorilor mari ale uneia dintre variabile tind s le
corespund tot valori mari ale celeilalte variabile). Dimpotriv, o valoare negativ
indic o legtur indirect ntre variabile (valorilor mari ale uneia dintre variabile
tind s le corespund valori mici ale celeilalte variabile). Valoarea 0 indic
absena oricrei corelaii.
Cu ct coeficientul de corelaie este mai apropiat de 1 n valoare absolut, cu att
corelaia este mai puternic
Calculnd pe rnd, pentru toate cele p variabile coeficienii de corelaie liniar,
putem nlocui matricea iniial cu o matrice de dimensiune pxp, avnd ca elemente
coeficienii de corelaie respectivi. Matricea obinut este simetric, avnd toate
elementele de pe diagonala principal egal cu unu.
Analiza elementelor matricei corelaiilor este foarte important n prelucrarea
informaiilor din din matricea X de date. Astfel, analiznd elementele extra diagonale
ale matricei, identificm perechi de variabile ntre care exist dependene liniare
puternice(n general, extragem acele variabile pentru care coeficientul de corelaie
depete 0.8), dar identificm i perechi de variabile cu coeficieni de corelaie foarte
mici(aproape de zero). Aceste informaii sunt foarte utile pentru prelucrrile ulterioare.

3.5. REPREZENTAREA GRAFICA

Preponderent ca utilizare in faza de analiz preliminar a datelor din domeniul
economico-social este analiza grafic. Utilizarea tehnicilor de analiz grafic in etapa
premergatoare analizei propriu zise, vizeaz in principal urmatoarele categorii de
probleme:
- identificarea principalelor tendine manifestate la nivelul informatiilor
disponibile;
- depistarea principalelor legaturi existente intre variabilele supuse analizei;
- detectarea valorilor extreme, izolate, a caror aparitie in multimea datelor analizate
nu se justifica din punct de vedere statistic.
Exist numeroase instrumente software, cu ajutorul crora pot fi efectuate, intr-o manier
comod i eficient cele mai complexe reprezentri grafice: STATISTICA 6.0; SPSS
10.0; SAS 8.2; EVIEWS 3.0.



p j n i ij
x X
,....., 2 , 1 ; ,.... 2 , 1
) (
= =
=
j i j i
x x
j j i i
x x
j i
j i
s ns
x x x x
s s
x x
r


= =
) ( ) ( ) , cov(
,
35
TEMA 4.

EXPLORAREA VARIABILELOR CANTITATIVE

Dup cum am artat, variabilele cantitative provin din caracteristici care exprim atribute
cantitative ale indivizilor i se exprim sub form discret sau continu. Domeniul de
msurare al variabilelor continue acoper, de regul, un interval de valori.
Informaiile apar ca matrice de date de forma indivizi x caracteristici, iar prelucrarea
lor primar se realizeaz, de regul in dou etape i anume:

1.prelucrarea independent a cte unei variabile,
2.prelucrarea comun a doua sau mai multe variabile.

4.1.Prelucrarea independent a cte unei variabile

Prelucrarea independent a cte unei variabile presupune selectarea, din matricea
de date , a cte unei coloane ce reprezint valori observate
asupra unei variabile de tip continuu.
Pentru aceast secven se fac evluari asupra tendinei centrale :

a) Media, notat cu se calculeaz cu formula:



b) Mediana este acea valoare (nu neaprat dintre valorile ) care
mparte seria ordonat cresctor n doua pri egale.
c) Modul este acea valoare cu frecvena cea mai mare de apariie(nu e neaprat unic).


Indicatorii variabilitatii

a) Varianta (dispersia), notat cu ,


Cu ct valoarea dispersiei este mai mare, cu att distribuia respectiv este mai
mprtiat. Dispersia nu are unitate de masur.

p j n i ij
x X
,....... 2 , 1 ; ,..... 2 , 1
) (
= =
=
x
m

=
=
n
i
i x
x
n
m
1
1
n
x x x . ,......... ,
2 1
2
x
s

=
n
i
x i x
m x
n
s
1
2 2
) (
1
1
36
b) Abatere medie ptratic, notat cu

Abaterea medie ptratic se noteaz uneori cu SD (de la cuvintele englezeti standard
deviation abatere standard).

De remarcat faptul c abaterea standard are aceeai unitate de msur ca i variabila.

c) Amplitudinea este calculat ca diferna ntre valoarea maxim i valoarea minim
a valorilor .

Este important ca, pentru diverse tipuri de distribuii a frecvenelor valorilor
s punem in eviden relaii de ordine ntre cei trei indicatori ai tendinei
centrale: repartitie simetrica pentru care cei trei indicatori ai tendintei centrale coincid;
repartitii asimetrice, asimetrie spre dreapta si asimetrie spre stanga, stunci cand cei trei
indicatori nu coincid.
Se calculeaz Coeficientul de asimetrie(Propus de Karl Pearson) :

; sau ;
dar, si Aplatizarea, boltirea repartiiilor de frecven:

Coeficientul a lui Pearson, denumit coeficient de boltire:

; momentul centrat de ordin 4.
Cu ct are o valoare mai mic, cu att curba este mai platicurtic si invers. Pentru
aplatiyarea curbei este identic cu cea a curbei normale.

Coeficientul R. Fischer



Exemplu:
Fie secvena de ase numere 2,5,0,9,0,7 reprezentnd observaii asupra a ase indivizi.
Secvenaa ordonat cresctor este: 0,0,2,5,7,9. Valorile ce msoar tendina central sunt:
media =3.83, mediana se afl ntre valorile 2 i 5, prin interpolare putem lua valoarea
3,5, Modul valorilor este 0(cea mai mare frecven)
Ca i indicatori de poziie, pe lng cei ai tendinei centrale putem calcula i:

=
n
i
x i x
m x
n
s
1
2
) (
1
1
n
x x x x ,..... , ,
3 2 1
n
x x x x ,..... , ,
3 2 1
s
Mo x
C
as

= 1 1 > s
as
C
s
Me x
C
as
) ( 3
= 3 3 > s
as
C
2
|
2
2
4
2

| =
4

2
|
3
2
= |
( )
2

3 3
2
2
4
2 2
= =

|
37
a) procentila de ordinul p, acea valoare, notat aici cu , care are proprietatea ca
p% dintre valorile secvenei sunt mai mici dect ea i (100-p)% dintre valori sunt
mai mari dect ea.
b) Cuartila inferioar, notat , este procentila 25;
c) Cuartila de mijloc, notat este procentila 50, tocmai mediana.
d) Cuartila superioar, notat este procentila 75.
Cuartilele se folosesc pentru a analiza dispersia valorilor secvenei
calculndu-se indicatorul numit intercuartile (notat IQR).El este calculat ca diferen
intre procentila 75 i procentila 25. n cazul unei repartiii normale a datelor acest
interval trebuie s fie aproximativ 1.35 din abaterea standard a datelor.


Regula de adunare a dispersiilor

Cu cat fenomenele sunt mai complexe, cu atat gradul de variatie a carateristicilor care la
definesc prezinta o mai mare amplitudine a variatiei.
Din aceasta cauza, unitatile ce urmeaza a fi cercetate trebuie impartite in grupe, in
functie de variatia factirilor determinanti.
Apoi se pot calcula medii pe grupe, dar si o medie a colectivitatii totale.In mod
corespunzator se calculeaza indicatorii variatiei pe fiecare grupa si pentru colectivitatea
totala.
Intre indicatorii de variatie calculati la nivelul fiecarei grupe si cei calculati la nivelul
colectivitatii exista anumite relatii bazate pe regula de adunare a dispersiilor.

Ex.
Valorile caracteristicii de
grupare
Nr unitatilor pe variantele
caracteristicii
Totalul unitatilor pe
grupe



total


Pentru o astfel de situatie se poate calcula o medie generala , dar si medii pentru fiecare
grupa (partiale) .
= nr grupelor
Pentru caracteristica y se poate calcula:
- Variatia valorilor in jurul mediei de grupa

- Variatia valorilor mediilor de grupa in jurul mediei clectivitatii

- Variatia valorilor in jurul mediei generale .
p
P
1
Q
2
Q
3
Q
n
x x x x ,..... , ,
3 2 1
i
x y
i ij
n n=

1
x
11
n
12
n
3 i
n
im
n
1
n
k
x
1 k
n
2 k
n
3 k
n
km
n
k
n
1 j
n
2 j
n
3 j
n
jm
n
i ij
n n=

y
i
y
i
j
y
i
y ( )
i j
y y
( ) y y
i

j
y y ( ) y y
j

38



Toate aceste variatii duc la calculul dispersiilor de grupe, dispersiei dintre grupe si
dispersiei totale.

a) dispersia de grupa(dispersia partiala) se calculeaza pe baza abaterilor tuturor
variantelor dintr-o grupa fata de media lor, ponderata cu frecventele de grupa pe
baza relatiei:

caracteristicii independente
media de grupa , calculate din aceste variante.
frecventele corespunzatoare fiecarei variante din interiorul grupei.


b) Dispersia dintre grupe( ) se calculeaza pe baza abaterilor mediilor de
grupa de la media colectivitatii totale si masoara gradul de influenta a factorului de
grupare asupra variatiei caracteristicii studiate.




c) Dispersia totala ,( ) reflecta variatia caracteristicii dependente generate
de actiunea factorior atat dintre grupe cat si din interiorul grupelor exercitata la
nivelul colectivitatii:

j = nr valorilor din colectivitatea studiata


dispersia din interiorul grupelor
( )( )( ) y y y y y y
i i j j
+ =
) (

=
ij
ij i j
i
n
n y y
2
2
o iantele y
j
var =
=
i
y
=
ij
n

=
j
ij
j
ij j
i
n
n y
y
2 2
x
y
o o =
(
(
)

= =
i
i
i
i
x y
i
n
n y y
2
2 2
o o

=
i
i
i
i i
n
n y
y
( )
2
o
2
y
o
) (


=
j
j
j
j j
n
n y y
2
2
o
2 2 2
o o o + =

=
i
i
i
i i
n
n
2
2
o
o
39
dispersia dintre grupe
dispersia totala

Pe baza regulii de adunare a dispersiilor se pot calcula alti doi indcatori:

- Gradul de determinatie ( )

( ) ,daca ( )>50% spune, ca factorul de grupare este
hotarator(semnificativ, determinant) pentru variatia variabilei Y

- Gradul de nedeterminatie

100
Acest indicator arata influenta tuturor factorilor care determina variabila dependenta cu
exceptia factorului de grupare.
4.2. Prelucrarea a doua variabile cantitative presupune selectare, din matricea de date
a cte dou coloane ce reprezint valori observate asupra celor dou variabile. S notm
aceste variabile cu x i y iar valorile observate asupra lor cu ( ) respectiv
( ).

1) pentru a studia corelaia (legatura liniar) ntre aceste dou variabile se calculeaz
coeficientul lui Pearson, dup formula:
, unde , covariana ntre x i y


iar , sunt abaterile standard.

Valorile coeficientului de corelaie sunt cuprinse n intervalul
Cele n perechi de valori pot fi reprezentate prin puncte ntr-un plan. Atunci
cand avem impresia ca punctele au tendina de a se alinia unei drepte, ne exprimm
spunnd c exist o corelaie liniar ntre variabilele x si y. Dac valorile lui y au
acelai sens de cretere cu valorile lui x, se spune c avem o corelaie pozitiv. Dac
valorile lui y descresc atunci cnd valorile lui x cresc, se vorbete de o corelaie
negativ .
Coeficientul Pearson se folosete pentru msurarea gradului de corelare ntre
variabilele x i y: lipsa corelrii este indicat de valori apropiate de zero, corelarea
pozitiv prin valori pozitive, iar corelarea negativ, prin valori mai apropiate de -1.
=
2
o
=
2
o
2
x y
R
2
x y
R 100
2
2
o
o
=
2
x y
R
2
2
2
o
o
=
x y
K
n
x x x . ,......... ,
2 1
n
y y y .. ,.........
2 , 1
y x
y x
y x
s s
s
r
,
,
= ) , cov(
,
y x s
y x
=

=
n
i
y i x i y x
m y m x
n
s
1
,
) )( (
1
1
2
1
) (
1
1

=
n
i
x i x
m x
n
s

=

=
n
i
i i y
m y
n
s
1
2
) (
1
1
| | 1 , 1
( )
i i
y x,
40
2).Pentru compararea comportamentului comun al celor doua variabile, pe baza
procentilelor (calculate pentru fiecare variabila), se foloseste graficul de tip box-plot
si graficul de tip Q-Q plot. Pe graficul box-plot se marcheaz de regul, valorile
minim, maxim i mediana alturi de cuantilele i pentru secvenele de valori
( ) respectiv ( ).
Pe graficul Q-Q plot, se prezint n plan perechile de valori coninnd procentilele
calculate pentru cele doua variabile. O aliniere a acestora aproximativ pe o dreapt
inseamn c repartiiile celor dou variabile sunt asemntoare.
Graficul poate fi folosit i pentru a verifica dac secvena de valori urmeaz sau nu o
repartiie normal. n aceste situaii se analizeaz perechile de valori constnd din
procentilele variabilei normale i procentilele secvenei .

Prelucrarea a mai mult de dou variabile cantitative presupune analiza simultan a
tuturor coloanelor din maricea de date
Asociem astfel matricei X (de dimensiune n x p ) o alt matrice, notat de obicei
cu R, de dimensiune p x p , ce conine coeficienii de corelaie liniara Pearson,
calculat ntre perechile de variabile. Avem, prin urmare, matricea R de forma:




cu toate elementele de pe diagonala principal egale cu unu pentrui=1,2,.....p
si j=1,2,.....p.

Se urmrete identificarea perechilor de variabile ce corespund coloanelor
din matricea X- pentru care, n matricea R a corelaiilor, coeficienii sunt mai
mari de 0,8 n valoare absolut.
n situaia cnd, n cazul apariiei unei valori mai mari de 0.95 n valoare absolut,
corelaia foarte puternic constatat ntre variabile respective ne permite s eliminm din
studiu una dintre ele (ea fiind foarte bine reprezentat de cealalt).


TEMA 5.

EXPLORAREA VARIABILELOR CALITATIVE

1
Q
3
Q
n
x x x . ,......... ,
2 1 n
y y y .. ,.........
2 , 1
()() ()
) ..... ,......... , (
2 1 n
x x x
()
p j n i
ij
x X
, , , , , , , , 2 , 1 ; ,......... , 2 , 1 = =
=
|
|
|
|
|
|
|
|
.
|

\
|
=
1 ...
..... ..........
...
....... 1
1 ... 2 `
2 22 21
1 12
p p
p
p
r r
r r r
r r
R
( ) 1 =
ij
r
j i
x x ,
ji ij
r r =
ij
r
41

In prelucrarea variabilelor categoriale, numite i calitative aflate ntr-o matrice de date
forma indivizi x caracteristici distingem de asemenea dou etape i anume:

A) Analiza pe rnd, a cte unei variabile categoriale;
B) Analiza comportamentului comun a dou sau mai multe variabile
categoriale.

A) Aa cum am menionat, o variabil categorial este descris prin modaliti
(nivele de valori).Se noteaz cu k numrul acestor modaliti i n numrul
observaiilor asupra variabilei analizate.

Primele informaii obinute despre variabila categorial sunt date de frecvenele
pe modaliti i de frecvenele relative observate.
Daca se noteaza , frecvena absolut i frecvena relativ pentru
modalitatea i, cu , putem considera tabelul de mai jos:

Modalitatea 1 2 ...... i ....... k Total
(valori
observate)
Frecvena
Absolut

...........

.......

n
Frecvena
Relativ
(proporia)

.........

........

1

Tabelul 1.7. Informaii despre variabile categoriale

Exemplu: O firma dorete s-i estimeze cota de pia a produsului su. S
presupunem c piaa este concurenial existnd 6 competitori (firme) care
comercializeaz produsul respectiv. Departamentul de cercetare n marketing al
firmei efectueaz un studiu pe baz de chestionar pe un eantion reprezentativ de n
consumatori (alei independent unul de celalalt) carora li se cere sa-i exprime
preferina unic pentru o firm din cele 6.
n expermentul propus avem o variabil categorial (firma) cu 6 modalitati - numrul
firmelor. Presupunem c eantionul este de volum n=160, rezultatul experimentului
poate fi cel din tabelul de mai jos:



Firma 1 2 3 4 5 6 Total
Valori
observate(preferintele)
21 29 22 30 31 27 160
Frecventa relativa 0.13 0.17 0.14 0.19 0.21 0.16 1
Procentul % 13 17 14 19 21 16 100
i
n
n
n
i
k i> s 1
1
n
2
n
i
n
k
n
n
n
1
n
n
2
n
n
i
n
n
k
42
Tabelul 1.8. Tabelul frecvenelor
Grafic, informaia privind rspunsul consumatorilor, adic profilul dat de linia
frecvenelor este important pentru cercettorul n marketing.

Figira nr 1. Histograma preferinelor cumprtorilor.



Figura nr.2. Structura preferinelor cumprtorilor
Analiznd graficele i cunoscnd rezultatele unor cercetri anterioare
privind cotele de pia, pe eantioane, cercettorul de marketing se poate intreba dac
preferinele consumatorilor sunt sau nu egal repartizate spre cele 6 firme i daca
diferenele nregistrate sunt semnificative statistic.
TEMA 6
MASURAREA ASOCIERII DINTRE VARIABILE
Valori observate(preferintele)
0
5
10
15
20
25
30
35
1 2 3 4 5 6
Valori
observate(preferint
ele)
Structura preferintelor cumparatorilor
1
2
3
4
5
6
43
Masurarea si testarea gradului de asociere dintre variabile se realizeaza prin
intermediul unor metode, fiecare dintre acestea avand in vedere modalitatile de masurare
a variabilelor, natura esantioanelor si numarul acestora.
Studierea asocierii dintre doua variabile are in vedere:
de a pune in evidenta existenta unei asocieri (adica a unei legaturi);
de a cunoaste directia de evolutie a variabilelor respective (variatii in acelasi
sens sau in sens contrar)- tipul legaturii;
de a masura intensitatea legaturii.

A. METODE ELEMENTARE: Metoda grafica; metoda seriilor paralele; metoda
gruparilor; metoda tabelului de corelatie(contingenta).
B. METODE STATISTICE: Metode parametrice; metode neparametrice.
Metode parametrice :
Metoda regesiei, arata cum(ca forma analitica) o variabila este
dependenta de alta variabila,
Metoda corelatiei , arata gradul in care o variabila este dependenta de alta
variabila.
Metode neparametrice :
Coeficientul de contingenta C, Coeficientul T al lui Ciuprov, Coeficientul V al lui
Cramer.
Coeficientul |, Coeficientul Q a lui Yule.
Coeficientul de corelatie a rangurilor a lui Spearman, Coeficientul t (tau) de
corelare a rangurilor a lui Kendall
6.1. MASURAREA ASOCIERII INTRE VARIABILE CALITATIVE
METODE NEPARAMETRICE
Masurarea asocierii intre variabile nominale:
a. Coeficientul de contingenta C. Se determina pe baza relatiei:

unde:
44
C = coeficientul de contingenta
_2 = valoarea calculata a lui _2 in cazul celor variabile nominale
n = marimea esantionului sau numarul total de observatii.
Cu cat C este mai mare, cu atat mai puternica este legatura dintre variabile. Cand
C = 0 se manifesta o situatie de independenta, variabilele nefiind legate intre ele (in acest
caz _2 = 0 ).
Marimea coeficientului de contingenta este o functie a numarului de celule din
tabelul de contingenta si acesta niciodata nu poate atinge valoarea maxima egala cu 1,
chiar daca intre variabile ar fi o asociere perfecta. Valoarea limita a lui _2 este egala cu
n(k-1), unde k reprezinta numarul de modalitati sub care se manifesta variabila
independenta. Valoarea maxima a lui C va fi deci,

Spre exemplu, valoarea maxima a lui C va fi 0,707 pentru un tabel 2x2; 0,816
pentru un tabel 3x3;0,866 pentru un tabel 4x4 etc. Pentru a aprecia gradul de intensitate a
legaturii, valoarea calculata a lui C se va compara cu nivelul sau maxim ce poate fi atins.

unde: O
ij
= frecventa observata in celula ij
E
ij
= frecventa asteptata in celula ij
Frecventele asteptate, notate cu E
ij,
se determina pornind de la frecventele
observate astfel:

b. Coeficientul T al lui Ciuprov.
Acest coeficient are in vedere numarul de grade de libertate existente intr-un tabel
de contingenta. Astfel, pentru un tabel cu r linii si c coloane, numarul gradelor de
libertate va fi df = (r-1)(c-1).
45
El se determina astfel:

Acest coeficient nu poate atinge valoarea 1 decat pentru tabelele care au un numar
egal de randuri si coloane. El este comparabil numai pentru tabele de aceeasi talie.
c. Coeficientul V al lui Cramer.
Daca se va nota cu t = min [(r-1), (c-1)], atunci,

Acest coeficient poate atinge valoarea 1 in functie de dimensiunile tabelului.
Masurarea asocierii intre variabile nominale binare.
In situatia in care avem doua variabile nominale dichotomice (binare) dispuse in
cadrul unui tabel 2 x 2 de forma:
x
y a b
c d
Putem determina gradul lor de asociere prin intermediul coeficientului phi | sau
prin intermediul coeficientului Q a lui Yule.
Coeficientul | este indicat, indeosebi, pentru tabele de mici dimensiuni, tip 2x2
sau cand una din dimensiuni este 2. Relatia de calcul este:

Acest coeficient poate avea valori cuprinse intre 1 si +1.Valoarea 1 va exista
numai atunci cand una din digonale va fi nula, adica a = d = 0 sau b = c = 0. Valorile
apropiate de 1 sau +1 indica o asociere intre cele doua variabile, in timp ce valorile
apropiate de zero arata inexistenta legaturii dintre variabile. Semnificatia statistica a
coeficientului | se determina folosind repartitia _2 , pe baza relatiei: _2 = n|2.
Coeficientul Q a lui Yule. Relatia de calcul este:
46

Acest coeficient ia valori cuprinse intre 1 si +1
Se impune a preciza ca cei doi coeficienti prezentati mai sus reprezinta metode
neparametrice de masurare a intensitatii legaturii dintre variabile ce exprima
aspecte de ordin calitativ.
In acest caz se pune problema de a determina daca intre doua grupuri
independente care fac o ordonare a unor obiecte avand in vedere un anumit criteriu
(preferinta spre exemplu), exista o asociere. Pentru aceasta se pot utiliza doi coeficienti:
coeficientul de corelatie a rangurilor a lui Spearman (r
s
) si coeficientul de corelatie a
rangurilor a lui Kendall, t (tau) care si ei sunt modalitati neparametrice de masurare a
asocierii.
Masurarea asocierii intre variabile ordinale
Coeficientul de corelatie a rangurilor a lui Spearman se determina astfel:

unde: d
i
= diferenta rangurilor observate intre cele doua ordonari (clasificari)
n = numarul de elemente de clasificat.
Coeficientul de corelatie a rangurilor variaza intre 1 si +1. Atunci cand exista o
asociere pozitiva perfecta, el este +1; cand asocierea este negativa, perfecta, el este 1;
cand este zero intre cele doua ordonari nu exista nici o relatie.
O testare a semnificatiei statistice a coeficientului r
s
cand n < 30 se poate face pe
baza relatiei:

care reprezinta o distributie Student (t) cu n-2 grade de libertate.
Raportul de corelatie este semnificativ din punct de vedere statistic,daca
df
t r
;
'
o
>
47
In cazul in care n > 30 se utilizeaza statistica aferenta unui raport critic pe baza
distributiei z:

Coeficientul t (tau) de corelare a rangurilor a lui Kendall
In esenta, construirea coeficientului de corelare se bazeaza pe aflarea numarului
de puncte discordante si a celor concordante dintre perechile de observari.
Doua observari sunt concordante daca x
i
< x
j
si, in acelasi timp, daca y
i
< y
j
. Ele
sunt discordante daca x
i
< x
j
, dar in schimb, y
i
> y
j
. Daca vom nota:
d
ij
= 1 cand i si j sunt concordante si
d
ij
= -1 cand i si j sunt discordante, atunci:

Relatia pe baza careia se calculeaza coeficientul de corelatie a rangurilor a lui
Kendall este:
Acest coeficient poate avea valori intre 1 si +1.


6.2.MASURAREA ASOCIERII INTRE VARIABILE CANTITATIVE
METODE PARAMETRICE

1. Metoda corelatiei
2. Metoda regresiei
1.Masurarea intensitatii dependentei liniare dintre doua variabile cantitative se
poate realiza prin intermediul coeficientului de corelatie a lui Karl Pearson, denumit
48
frecvent, coeficient de corelatie. El exprima covariatia dintre doua variabile masurate
metric si are valori cuprise intre 1 si +1.
Relatia de calcul este urmatoarea:

Valoarea absoluta a coeficientului de corelatie exprima forta sau intensitatea
asocierii liniare dintre variabila x si variabila y. Semnul coeficientului reflecta sensul de
corelare: valorile pozitive corespund variatiilor deacelasi sens, valorile negative indica
variatii de sens contrar.In practica, in functie de nivelul atins de coeficientul de corelatie,
intesitatea legaturii dintre cele doua variabile se apreciaza astfel:
0 s r < 0,2 nu exista o legatura semnificativa;
0,2 s r < 0,5 exista o legatura slaba;
0,5 s r < 0,75 exista o legatura de intensitate medie;
0,75 s r < 0,95 exista o legatura puternica;
0,95 s r < 1,00 exista o legatura perfecta (functionala).
Testul pentru coeficientul de corelatie, in ipoteza in care cele doua variabile sunt
distribuite normal, ipoteza nula indica lipsa legaturii, r = 0, iar numarul de observatii este
mai mic ca 30, se face utilizand relatia:

Pentru nivelul de semnificatie ales, pentru tipul de test si pentru n-2 grade de
libertate, se adopta regula de decizie cunoscuta: daca t
r
s t
o; df
se accepta ipoteza nula;
daca este mai mare se va respinge( coeficientul este semnificativ din punct de vedere
statistic).
2. Metoda regresiei
Analiza de regresie. Aceasta metoda descrie prin intermediul unui model, relatia
dintre o variabila dependenta si una sau mai multe variabile independente. Cand relatia
49
are in vedere o singura variabila, se utilizeaza regresia simpla, cand sunt mai multe
variabile independente, se utilizeaza regresia multipla.
Metoda regresiei utilizeaza o functie matematica numita functia de regresie.

Forma generala:

Y este variabila dependenta(efect)
, factori de influenta.
n-nr. variabilelor independente
- constanta care sintetizeaza influenta factorilor neinregistrati, variabila reziduu.

( )
n
x x x f Y ,......., ,
2 1
= c +
pendente iabileinde x x x
n
var ,..... ,
2 1

c

S-ar putea să vă placă și