Sunteți pe pagina 1din 67

Facultatea de Cibernetic, Statistic i Informatic Economic

Academia de Studii Economice


Bucureti

PROIECT
~ Inteligent computtionl ~

Prof. ndrum tor: Prof. Univ. Dr.


Irin Alexndr Georgescu
Student: Vsile Elen Vlentin
Seri: Cibernetic Economic
Grup: 1056
I. CUPRINS

1. Cuprins
2. Introducere
3. Anliz generl dtelor
4. Anliz componentelor principle
5. Anliz Cluster
6. Arbori decizionli
7. Clsifictorul Byesin
8. Retele neuronle
9. Posibile dependente ntre vribile, ecutii de regresie, coeficientii dreptelor de
regresie
II. INTRODUCERE

Proiectul const ntr-o nliz finncir cre vizez un num r de 60 de compnii


din domeniul medicl, vnd urm torele sectore: sectorul frmceutic, sectorul
biofrmceutic s i sectorul echipmentelor s i tehnologiilor medicle.

Pentru nliz u fost lute n considerre o vribil clittiv , cre reprezint


sectorele din cre fc prte ceste compnii, s i 14 vribile cntittive, const nd n
indictori finnciri i compniilor nlizte.

A. VARIABILA CALITATIVA

Vribil clittiv este reprezentt de sectorele din cre fc prte cele 60 de


compnii nlizte.

Am codifict vlorile cestei vribile stfel:

1 = Sectorul frmceutic;
2 = Sectorul biofrmceutic;
3 = Sectorul medicmentelor bioterpeutice;
4 = Sectorul echipmentelor s i tehnologiilor medicle;
5 = Sectorul serviciilor de s n tte.

B. VARIABILELE CANTITATIVE

1. MARKET CAPITALIZATION ( MCAP )

Cpitlizre de pit se refer l vlore totl de pit ctiunilor unei compnii.


Se clculez prin nmultire ctiunilor unei societ ti cu pretul curent de pit l unei
ctiuni. Comunitte de investitii utilizez cest cifr pentru determin dimensiune
unei compnii, ft de utilizre v nz rilor su cifrelor totle de ctive.
Folosire cpitliz rii de pit pentru r t dimensiune unei compnii este
importnt , deorece dimensiune compniei este un fctor determinnt de bz l
diferitelor crcteristici, inclusiv riscul, de cre investitorii sunt interesti.
Societ tile comercile pot fi clsificte n functie de cest indictor, ir formtul
generl este cel de le clsific n clitte de compnii lrge-cp, mid-cp s i smll-cp.
Compniile lrge-cp u, de obicei, o cpitlizre de pit de 10 milirde $ su mi
mult. In generl, ceste compnii mri ctivez de o lung period de timp s i sunt
juc tori importnti n industriile conscrte.
Compniile mid-cp u, n generl, o cpitlizre de pit cuprins ntre 2 milirde $
s i 10 milirde $. Aceste compnii sunt compnii recunoscute cre operez ntr-o industrie
de l cre se s tept s experimenteze cres tere rpid . Ele port un risc inerent mi
mre dec t compniile de mre dimensiune, deorece ceste nu sunt l fel de conscrte,
dr ele sunt trctive pentru potentilul lor de cres tere.
Compniile smll-cp u, de obicei, o cpitlizre de pit cuprins ntre 300 de
milione $ s i 2 milirde $. Aceste compnii mici r pute fi tinere pe pit s i / su r pute
servi pietele de nis s i noi industrii. Aceste societ ti sunt considerte investitii de risc mi
ridict din cuz v rstei lor, pietelor pe cre le deservesc, precum s i dimensiunii lor.
Compniile mi mici cu mi putine resurse sunt mi sensibile l ncetinirile economice.
In scopul de lu o decizie de investitii, pote fi necesr lure n clcul
cpitliz rii de pit unor investitii.
Market Cap = Shares Outstanding * Current Stock Price

2. REVENUE ( REVs )

Venitul reprezint sum de bni pe cre o compnie o primeste, de fpt, n cursul


unei numite periode, inclusiv reduceri s i deduceri pentru mrf returnt . Este "lini de
sus" ( top line ) su "venitul brut" ( gross income ), cifr din cre se scd costurile pentru
determin venitul net.

Venitul se clculez prin nmultire pretului l cre bunurile su serviciile sunt


v ndute cu num rul de unit ti v ndute su vlore v ndut .

Investitorii vor lu des n considerre venitul s i venitul net l unei societ ti seprt
pentru determin stre de s n tte unei fceri. Este posibil c venitul net s cresc
n timp ce venitul r m ne constnt, c urmre reducerii costurilor; o stfel de situtie,
ns , nu este un semn bun pentru o cres tere pe termen lung unei compnii.

Revenue = Quantity * Price

3. TOTAL ASSETS ( TASS )


Activele totle se refer l vlore totl ctivelor detinute de c tre o person
su o entitte. Activele sunt elemente de vlore economic , cre sunt consumte n timp
pentru se obtine un beneficiu pentru proprietr. In czul n cre proprietrul este o
fcere, ceste ctive sunt de obicei nregistrte n evidentele contbile s i pr n bilntul
de fceri.

Proprietrii se pot uit l totlul ctivelor lor pentru vede cre pot fi convertite
mi rpid n numerr. Un ctiv este declrt fi mi lichid, n czul n cre cest pote fi
v ndut cu us urint n numerr, ir nelichid n czul n cre cest lucru nu e posibil.

Un dob nditor potentil v cord o tentie deosebit diferitelor tipuri de ctive


listte n bilntul unei societ ti-tint . Accentul v fi pus pe preciere dc vlore
ctivelor nscris pe bilnt corespunde vlorii rele unui ctiv, su n czul n cre exist
diferente semnifictive. In czul n cre vlore rel este mi mic , dob nditorul v
reduce probbil dimensiune ofertei sle. In czul n cre un ctiv re o vlore mi mre,
dob nditorul v ve un mi mre interes n chizitionre de fceri, s i pote cres te pretul
ofertei.

Total Assets = Total Liabilities + Stockholders Equity

4. TOTAL LIABILITIES ( TLBT )

Psivele totle se refer l sum totl dtoriilor unei ntreprinderi individule su


le unei compnii s i pote fi us or clcult prin nsumre tuturor dtoriilor pe termen
scurt s i celor pe termen lung, mpreun cu orice dtorii din fr bilntului pe cre
societ tile le pot suport. Dtoriile pe termen scurt sunt de obicei psive cre sunt scdente
n termen de un n su mi putin, n timp ce dtoriile pe termen lung sunt cele cu un
orizont de timp de mturitte trecut de punctul de un n, des i dtorii precum creditele,
lesing-urile s i impozitele dtorte pot intr in oricre din cele dou ctegorii.

Total Liabilities = Total Assets - Stockholders Equity

5. OPERATING PROFIT ( OPPR )

Profitul opertionl este profitul obtinut din opertiunile normle de bz din


fcerile unei firme. Acest vlore nu include niciun profit obtinut din investitiile firmei,
cum r fi veniturile din firmele n cre societte re un interes prtil s i cel dininte
deducerii dob nzii plicbile s i txelor dtorte.

Referindu-se desemene l profitul ninte de dob nzi s i impozitre (Ernings


Before Interest nd Tx - EBIT), profitul opertionl reprezint putere de c s tig
compniei n cee ce prives te veniturile generte din opertiunile n curs de desf s urre.
Profitul opertionl serves te drept indictor pentru rentbilitte potentil fcerii cu
toti fctorii externi scos i din clcul.

Pentru investitori, exminre profitului opertionl pote permite o comprtie


mi us or ntreprinderilor cre operez n industriile cu rte de impozitre diferite su
structuri finncire, deorece cest permite o comprtie mi echitbil .

In timp ce profitul opertionl pozitiv pote exprim potentilul generl de profit l


unei fceri, cest nu grntez c fcere nu se confrunt cu pierderi. O compnie cu o
srcin mre de dtorie pote prezent un profit opertionl pozitiv, v nd, n cels i timp,
un profit net negtiv. In plus, costurile mri, dr str ine nu sunt reprezentte, put nd fis
din nou o compnie cu un profit net negtiv v nd un profit opertionl pozitiv.

Operating Profit = Operating Revenue COGS Operating Expenses


Depreciation and Amortization

6. OPERATING MARGIN ( OPMG )

Mrj opertionl este un rport de mrj utilizt pentru m sur strtegi de


stbilire preturilor unei compnii s i eficient de operre.

Mrj opertionl este o m surre procentului din veniturile unei compnii cre
r m ne dup chitre costurilor vribile de productie, cum r fi slrii, mterii prime etc.
Acest pote fi clcult prin mp rtire venitului opertionl l unei compnii ( cunoscut
sub numele de "profit opertionl" ) pe prcursul unei numite periode de v nz rile sle
nete n cursul celeis i periode. "Veniturile opertionle" ( Operting Income ) se refer
ici l profitul pe cre o societte l retine dup eliminre cheltuielilor opertionle ( cum
r fi costul bunurilor v ndute s i slriilor ) s i mortizre. "V nz rile nete" ( Net Sles ) se
refer ici l diferent dintre vlore totl v nz rilor s i vlore bunurilor returnte,
cotele pentru bunurile deteriorte s i lips s i v nz rile cu discount.

Acest indictor ofer nlis tilor o idee despre c t de mult c s tig o societte
( ninte de dob nzi s i txe ) pe fiecre dolr din v nz ri. In generl vorbind, cu c t mrj
de operre unei compnii este este mi mre, cu t t compni re o rentbilitte mi
mre. In czul n cre mrj unei compnii este n cres tere, cest c s tig mi mult pe
dolr din v nz ri.

Mrj de operre unei compnii determin de multe ori c t de bine compni


pote stisfce creditorii s i pote cre vlore pentru ctionri, prin generre fluxului de
numerr opertionl ( Operting Csh Flow ). O vlore bun indictorului este, de
semene, necesr pentru c o compnie s fie n m sur s pl tesc pentru costurile
fixe, cum r fi dob nd l dtorie, deci o mrj mre nsemn c o compnie re un risc
finncir mi mic dec t o compnie cu o mrj mic .
Operating Margin = Operating Income / Net Sales

7. RETURN ON EQUITY ( ROE )

Rt de rentbilitte finncir cpitlului propriu ( ROE ) este vlore venitului


net returnt c procent din cpitlul propriu. Rentbilitte cpitlului propriu m sor
rentbilitte unei corportii prin dezv luire m rimii profitului pe cre o compnie l
generez cu bni investiti de ctionri.

ROE este util pentru compr profitbilitte unei compnii cu ce ltor firme
din cels i sector.

Exist mi multe vrinte de formule pe cre investitorii le pot utiliz:

1.Investitorii cre doresc s vd rentbilitte comun cpitlului propriu pot


modific formul de mi sus prin sc dere dividendelor preferte din venitul net s i
sc dere cpitlului propriu prefert din cpitlurile proprii, rezult nd: Rentabilitatea
Capitalului Propriu Comun (ROCE) = Venitul Net - Dividende Prefereniale / Echitate
Comun .

2.Rentbilitte cpitlului propriu pote fi clcult prin mp rtire venitului net l


cpitlul propriu. Medi cpitlurilor proprii se clculez prin dunre vlorii
cpitlurilor proprii de l nceputul unei periode cu vlore cpitlurilor proprii l
sf rs itul periodei s i mp rtire rezulttului l doi.

3.Investitorii pot clcul, de semene, modificre ROE pentru o period folosind


nt i vlore cpitlurilor proprii le ctionrilor de l nceputul unei periode c numitor
pentru determin ROE initil. Apoi, vlore cpitlurilor proprii de l sf rs itul periodei
pote fi utilizt c numitor pentru determin ROE finl. Clculul celor dou vlori ROE
( initil s i finl ) permite unui investitor s determine schimbre rentbilit tii pe prcursul
periodei.

Return on Equity = Net Income/Shareholders Equity

8. RETURN ON TOTAL ASSETS ( ROA )

Rt de rentbilitte ctivelor totle ( ROA ) este un indictor cre rt c t de


profitbil este o compnie n rport cu totlul ctivelor sle. ROA ofer o idee despre c t de
eficient este modul de gestionre n cee ce prives te utilizre ctivelor sle pentru
gener c s tiguri. Clcult prin mp rtire veniturilor nule le unei societ ti l totlul
ctivelor sle, ROA este fis t n procente.

Acest indictor rt ce c s tiguri s-u genert din cpitlul investit. ROA pentru
compniile publice pote vri n mod substntil s i depinde n mre m sur de industrie.
Acest este motivul pentru cre tunci c nd se utilizez ROA c o m sur comprtiv , cel
mi bine este s fie comprt cu vlorile ROA nteriore le compniei respective su cu
vlore ROA unei societ ti similre.

Return on Total Assets = Net Income / Total Assets

9. PRICE TO BOOK RATIO ( PBr )

Rportul pret-to-book ( P / B Rtio ) este un rport utilizt pentru compr


vlore de pit unui stoc de l vlore s contbil . Se clculez prin mp rtire
pretului de nchidere ctul l stocului l vlore contbil pe ctiune din ultimul
trimestru.

Un rport mi mic P / B r pute nsemn c stocul este subevlut. Cu tote ceste,


r pute nsemn, de semene, c cev este fundmentl gres it n leg tur cu compni. C
s i n czul mjorit tii rportelor, cest lucru vriz n functie de industrie.

De semene, cest rport ofer o idee dc se pl tes te pre mult pentru cee ce s-r
l s n czul n cre compni r dt fliment imedit.

Rportul P / B reflect vlore pe cre prticipntii de pe pit o ts ez l


cpitlul propriu l unei societ ti n rport cu vlore contbil cpitlurilor proprii.
Vlore de pit unui stoc este o vlore orientt spre viitor, cre s reflecte fluxurile de
trezorerie viitore le unei compnii. Vlore contbil cpitlurilor proprii este o
m sur de contbilitte, cre se bzez pe principiul istoric l costurilor s i reflect
reemisiunile trecute de cpitluri proprii, m rite cu profituri su pierderi s i reduse prin
dividende s i r scump r ri de ctiuni.

Investitorii g sesc rportul P / B util, deorece vlore contbil cpitlurilor


proprii ofer o vlore reltiv stbil s i intuitiv , cre pote fi comprt cu us urint cu
pretul de pit. De semene, rportul P / B pote fi utilizt pentru firmele cu vlori
contbile pozitive s i c s tiguri negtive, deorece c s tigurile negtive fc rporturile pret-
c s tiguri inutile s i exist mi putine compnii cu vlori contbile negtive dec t compniile
cu c s tiguri negtive. Cu tote ceste, tunci c nd stndrdele de contbilitte plicte de
firme vriz , rporturile P / B pot s nu fie comprbile, n specil pentru compniile din
diferite tri. De semene, rporturile P / B pot fi mi putin utile pentru serviciile s i
compniile de tehnologie informtiei cu ctive corporle mici n bilnturile lor. In cele din
urm , vlore contbil pote deveni negtiv c urmre unei lungi serii de c s tiguri
negtive, cee ce fce rportul P / B inutil n scopuri reltive de evlure.

Price to Book Ratio = Stock Price / ( Total Assets Intangible Assets and
Liabilities )
10. PRICE TO SALES RATIO ( PSr )

Rportul price-to-sles ( P / S Rtio ) este un rport de evlure cre compr pretul


de stoc l unei compnii cu veniturile sle. Acest rport este un indictor l vlorii plste
pe fiecre dolr din v nz rile su veniturile unei compnii. Acest pote fi clcult fie prin
mp rtire vlorii cpitliz rii de pit compniei l v nz rile sle totle pe o period de
12 luni, fie pe o bz pe ctiune mp rtind pretul de stoc l v nz rile pe ctiune pentru o
period de 12 luni. L fel c tote rportele, rportul P / S este cel mi relevnt tunci
c nd este utilizt pentru compr compnii din celsi sector. Un rport sczut pote
indic o eventul subevlure, n timp ce un rport cre este cu mult peste medie pote
suger suprevlure.

Period de 12 luni utilizt pentru v nz ri n rportul P / S reprezint , n generl,


ultimele ptru trimestre su cel mi recent / ctulul n fiscl. Un rport pret - v nz ri cre
se bzez pe v nz rile prognozte pentru nul curent se numes te un rport ccelert.

C s i n orice lt rport, rportul P / S nu pote fi vizulizt n mod izolt, deorece


prezint dor o viziune forte ngust unei compnii su unui stoc. Acest rport este
deosebit de util pentru compr evlure societ tilor n stdiu incipient, cre u
venituri, dr cre nc nu sunt profitbile.

Price to Sales Ratio = Stock Price per Share / Net Sales ( Revenue ) per Share

11. ALPHA ( ALPHA )

Indictorul Alph reprezint o m sur performntei pe o bz justt n functie


de risc.

Alph, de multe ori considert rndmentul ctiv pe o investitie, m sor


performnt unei investitii n comprtie cu un indice de pit utilizt c punct de
referint, ntruc t ceste sunt dese considerte reprezent mis c rile pietei n
nsmblu.

Alph este cel mi des folosit pentru fondurile mutule s i lte tipuri de investitii
similre. Este dese reprezentt c un singur num r ( cum r fi 3 su -5 ), dr cest se
refer l o m surre procentul modului n cre portofoliul su fondul u evolut n
comprtie cu indicele de referint (dic 3%, mi bine su mi r u -5%).

Utilizre indictorului lf n m surre performntei presupune c portofoliul


este suficient de diversifict, stfel nc t s se elimine riscul nesistemtic. Pentru c lf
reprezint performnt unui portofoliu n rport cu un punct de referint, cest este
dese considert reprezent vlore pe cre un mnger de portofoliu o dug su o
sustrge de l rentbilitte unui fond. C tre, un lf egl cu 0 r indic fptul c
portofoliul su fondul este n perfect concordnt cu indicele de referint s i c mngerul
nu d ugt su nu pierdut vreo vlore.

12. BETA ( BETA )

Indictorul bet este o m sur voltilit tii su riscului sistemtic, unei grntii
su unui portofoliu n comprtie cu pit n nsmblu. Bet este utilizt n modelul
preturilor ctivelor de cpitl, cre clculez rndmentul s teptt l unui ctiv pe bz
indictorului s u bet s i rndmentul de pit s teptt.

Bet se clculez folosind nliz de regresie. Indictorul reprezint tendint


rentbilit tii unui titlu de r spunde l fluctutiile de pe pit.

O vlore indictorului bet egl cu 1 indic fptul c pretul titlului se deplsez


odt cu pit. O vlore indictorului mi mic dec t 1 nsemn c pretul titlului este,
teoretic, mi putin voltil dec t pit. O vlore indictorului mi mre dec t 1 indic
fptul c pretul titlului este, teoretic, mi voltil dect pit.

13. QUICK RATIO ( QCKR )

Rt de lichiditte imedit este un indictor l lichidit tii pe termen scurt unei


compnii. Acest rt m sor cpcitte unei compnii de -s i ndeplini obligtiile pe
termen scurt cu ctivele sle cele mi lichide. Din cest motiv, rportul exclude stocurile din
ctivele circulnte.

Rt m sor cntitte de dolri de ctive lichide disponibile pentru fiecre dolr


din dtoriile curente. Astfel, o rt de 1,5 nsemn c o societte re $ 1,50 de ctive
lichide disponibile pentru coperi fiecre 1 $ din dtoriile curente. Cu c t rt este mi
mre, cu t t mi bun poziti de lichiditte compniei.

Rt de lichiditte imedit este mi potrivit dec t rt de lichiditte generl ,


deorece exclude stocurile de ctive circulnte. Rt si deriv numele probbil din fptul c
ctive precum r numerrul s i titlurile de pit negocibile sunt surse rpide de numerr.

Quick Ratio = (current assets inventories) / current liabilities su

Quick Ratio = (cash and equivalents + marketable securities + accounts


receivable) / current liabilities

14. CURRENT RATIO ( CRTR )

Rt de lichiditte generl ( globl ) este un rport de lichiditte cre m sor


cpcitte unei compnii de -s i pl ti obligtiile pe termen scurt s i pe cele pe termen lung.
Pentru evlu cest cpcitte, rt consider ctivele totle curente le unei compnii
n rport cu totlul dtoriilor curente le societ tii.

Rt de lichiditte generl este folosit , n principl, pentru d o idee despre


cpcitte compniei de -s i pl ti dtoriile cu ctivele pe cre le detine. Cu c t rt este
mi mre, cu t t compni este mi cpbil de -s i pl ti obligtiile, ntruc t re o mi
mre proportie vlorii ctivelor n rport cu vlore psivelor sle.

Un rt mi mic dec t 1 indic fptul c psivele unei societ ti sunt mi mri dec t
ctivele sle s i sugerez c societte n cuz r fi n imposibilitte de -s i pl ti
obligtiile n czul n cre scdent r ve loc n cel moment. In timp ce o rt sub 1 rt
c societte nu este n stre bun de s n tte finncir , cest nu nsemn nep rt c
v intr n fliment. In orice cz, ns , o rt sub 1 nu este de obicei un semn bun.

Pe de lt prte, o rt de lichiditte generl mre ( peste 3 ) nu indic , totus i, n


mod necesr, c o compnie este ntr-o bun stre finncir . In functie de modul n cre
sunt locte ctivele societ tii, o rt ridict pote suger c cest societte nu utilizez
ctivele sle n mod eficient, nu grntez obtinere de finntri su nu gestionez bine
cpitlul de lucru ( fondul de rulment ).

Rportul ctul pote d un sens l eficientei ciclului de explotre l unei societ ti


su cpcitte s de trnsform produsul s u n numerr. Firmele cre u probleme cu
obtinere pltit pe crentele su u cifr de fceri de inventr lung pote rul n probleme
de lichiditte, deorece ceste sunt n imposibilitte de tenu obligtiile.

Current Ratio = Current Assets / Current Liabilities


III. ANALIZA GENERAL A DATELOR

Initil u fost importte tote dtele, cu comnd:

companii = read.table ( "date_companii_ds.txt", header = TRUE )


A. STATISTICI DESCRIPTIVE

Prin intermediul sttisticilor descriptive s-u clcult, pentru fiecre indictor n


prte, vlore minim , vlore mxim , prim s i trei curtil , medi s i medin.

Din Summry Sttistics reiese c niciun din cele 18 serii ( indictori ) nu urmez o
distributie norml , deorece vlorile mediilor sunt diferite de 0.
B. COEFICIENT I DE ASIMETRIE S I APLATIZARE

In urm clculului coeficientilor de simetrie s i pltizre, u rezultte urm torele:

. SKEWNESS

Acest indictor este folosit n nliz distributiei unei serii de dte pentru indic
deviti distributiei empirice n rport cu o distributie simetric n jurul mediei.

Interpretre:

Skewness > 0 : Distributi este nclint spre st ng, v nd mi multe vlori extreme
spre drept.

Skewness < 0 : Distributi este nclint spre drept, v nd mi multe vlori


extreme spre st ng.

Skewness = 0 : Medi = medin, distributi este simetric n jurul mediei.

Toti indictorii prezint vlori pozitive le cestui coeficient, deci distributiile sunt
nclinte spre st ng, v nd mi multe vlori extreme spre drept.

b. KURTOSIS

Acest indictor este folosit n nliz distributiei unei serii de dte pentru indic
grdul de pltizre su de scutire unei distributii.

Interpretre:

Kurtosis > 3 : Distributie leptokurtic , mi scutit dec t o distributie norml ,


v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose, cee ce
nsemn probbilit ti ridicte pentru vlorile extreme.

Kurtosis < 3 : Distributie pltikurtic , mi plt dec t o distributie norml , v nd


vlori disperste pe un intervl mi mre in jurul mediei. Probbilitte pentru
vlori extreme este mi micp dec t n czul unei distributii normle.

Kurtosis = 3: Distributie mezokurtic , de exemplu, distributi norml .


Mjoritte indictorilor prezint vlori mi mri dec t 3 le cestui coeficient, cee
ce nsemn c u distributii leptokurtice, mi scutite dec t o distributie norml , v nd
mi multe vlori concentrte n jurul mediei s i cozi mi grose, deci probbilit ti ridicte
pentru vlorile extreme. Singurul indictor cre re vlore coeficientului mi mic dec t
3 este Alph, indic nd o distributie pltikurtic , mi plt dec t o distributie norml ,
v nd vlori disperste pe un intervl mi mre n jurul mediei, deci o probbilitte pentru
vlori extreme mi mic dec t n czul unei distributii normle.

C. ALTE STATISTICI DESCRIPTIVE

. MEDIA

Media, nott cu m, este sum vlorilor, dtelor numerice, mprtit l num rul
cestor. Formul ei de definitie este m=x/N, n cre nsemn "sum de", x reprezint
vlorile su rezulttele individule, ir N constituie efectivul grupei studite.

Medi pune n evident tendint centrl rezulttelor constte ntr-o experient.


Prin clculre mediei obtinem o m sur nivelului mediu reltiv l un es ntion studit,
fpt cre permite poi comprtii ntre grupe.
b. ABATEREA STANDARD

Abaterea standard, cre se notez cu su cu s, este r d cin p trt din vlore

dispersiei: .

Indicele de dispersie cel mi exct s i mi des utilizt este, de fpt, btere stndrd,
v nd vntjul de fi exprimt n celes i unit ti de m sur c s i dtele nlizte.

Abtere stndrd se foloses te, de semene, n discutre distributiilor normle.


c. COEFICIENTUL DE VARIAT IE

Coeficientul de variaie, nott cu cv, este o exprimre n cifre reltive bterii


stndrd. Coeficientul de vritie se clculez c rport procentul ntre btere medie
linir /p trtic s i nivelul mediu.

Un coeficient cre se propie de 0 rt lips vritiei, colectivitte fiind lc tuit


din termeni forte omogeni. Dc v = 0, termenii seriei sunt egli ntre ei.

Din sttistic experimentl s- prelut preciere urm tore: dc cv este p n n


35%, se consider c intensitte vritiei este redus , colectivitte este omogen s i, n
consecint, medi este reprezenttiv . Cu c t se dep s es te prgul de 35%, cu t t
intensitte vritiei cres te, ir colectivitte este mi eterogen . In ceste conditii, medi
tinde s fie o m rime nereprezenttiv . Dc cv > 50%, vriti crcteristicii este forte
mre, colectivitte nu este omogen , medi nu este reprezenttiv s i este necesr
regrupre dtelor.
d. VARIANT A

Dispersia ( Variance - n englez ), c m sur sintetic mpr s tierii (vritiei),


reprezint medi ritmetic (simpl su pondert ) p trtelor bterilor vlorilor
individule de l tendint lor centrl . Acest nsemn c n clculul dispersiei pote fi
lut n considerre medi (cel mi uzul folosit ) su lt indictor l tendintei centrle (de
exemplu, medin).
D. HISTOGRAME

Histograma reprezint figur ntr-un sistem de coordonte rectngulre cre rt


distributi empiric prin dreptunghiuri. Histogrm este o modlitte de prezentre
vizul distributiilor de frecvente pentru vribile de intervl su de rport, n cre
ctegoriile sunt reprezentte prin colone continue cu bz egl cu limitele rele le
intervlelor de cls respectiv , n ltime fiec rei colone fiind proportionl cu procentul
de czuri din intervl.

Codul R pentru generre histogrmelor:


1. Histogrm cpitliz rii de pit

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

2. Histogrm venitului
Se observ c distributi cestui indictor este nclint spre st ng, v nd mi
multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

3. Histogrm ctivelor totle

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.
4. Histogrm psivelor totle

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

5. Histogrm profitului opertionl

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.
6. Histogrm mrjei opertionle

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

7. Histogrm rentbilit tii finncire

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

8. Histogrm rentbilit tii economice

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

9. Histogrm rportului P/B


Se observ c distributi cestui indictor este nclint spre st ng, v nd mi
multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

10. Histogrm rportului P/S

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

11. Histogrm indictorului Alph


Se observ c distributi cestui indictor este nclint spre st ng, v nd mi
multe vlori extreme spre drept, fiind o distributie pltikurtic , mi plt dec t o
distributie norml , v nd vlori disperste pe un intervl mi mre n jurul mediei, deci o
probbilitte pentru vlori extreme mi mic dec t n czul unei distributii normle.

12. Histogrm indictorului Bet

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

13. Histogrm lichidit tii imedite


Se observ c distributi cestui indictor este nclint spre st ng, v nd mi
multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

14. Histogrm lichidit tii curente ( generle )

Se observ c distributi cestui indictor este nclint spre st ng, v nd mi


multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.

E. MATRICEA DE CORELAT IE

Matricea de corelaie reprezint tehnic sttistic ce m sor s i descrie grdul de


sociere linir dintre dou su mi multe vribile cntittive continue norml distribuite.

Mtrice de coreltie este o mtrice simetric ce cuprinde coeficientul de coreltie


dintre oricre 2 vribile lute n considerre n nliz. Coeficientii de coreltie se g sesc
n intervlul [-1, 1]. Dc u semnul negtiv, leg tur dintre vribile este un invers , ir
dc semnul este pozitiv, leg tur este un direct . Intensitte coreltiei pote fi:

Forte puternic su prope perfect ( 0,90 - 0,99)

Puternic ( 0,70 - 0,99)

Modert ( 0,50 - 0,70)


Slb p n l modert( 0,30 - 0,50)

Inexistent su forte slb ( 0,01 - 0,30)

F. MATRICEA DE COVARIANT A

Matricea de covarian este similr celei de coreltie, cu deosebire c l


intersecti liniilor cu colonele sunt nscrise vlorile de covrint dintre vribile.
Mtrice de covrint crcterizez structur dependentei s i leg turilor dintre cei 6
indictori (vribile).

Covrint este considert fi o expresie numeric grdului de sociere dou


crcteristici c urmre fptului c , n tote czurile n cre dou vribile sunt
semnifictiv legte ntre ele, o vritie ntr-un sens unei dintre ele v determin o
vritie proportionl de cels i sens ( n czul leg turii directe ) su de sens contrr ( n
czul leg turii inverse ) celeillte vribile.
IV. ANALIZA COMPONENTELOR PRINCIPALE

Analiza Componentelor Principale este o tehnic de analiz a datelor care


are drept scop descompunerea variabilitii totale din spaiul cauzal iniial sub forma unui
numr redus de componente, fr ca aceast form s conina redundane informaionale.
Aceste componente exprim atribute noi i sunt construite n aa fel nct s fie necorelate ntre
ele, fiecare fiind o combinaie liniar de variabilele originale.

A. ELIMINAREA OUTLIERILOR

Pentru a putea face standardizarea datelor, este necesar s se efectueze eliminarea


outlierilor.

Eliminarea outlierilor a fost realizat n programul Excel, prin metoda intervalului


[ (mean-3sd); (mean+3sd) ]. Aceast metod presupune calculul mediei i al abaterii standard
pentru fiecare set de valori ( prin set de valori se nelege totalitatea valorilor unui indicator Y,
corespunztoare tuturor celor 60 de companii analizate ). Apoi, se calculeaz limita inferioar (
mean-3sd ) i limita superioar (mean+3sd).

Se consider outlier orice companie care are cel puin o valoare a unui indicator care nu
se ncadreaz n intervalul calculat.

n urma aplicrii acestei metode, au fost eliminate 12 observaii.

Tabelul rezultat dup eliminarea outlierilor:


B. STANDARDIZAREA DATELOR ( mean=0, sd=1 - se face cu scale )

Deoarece ordinul de mrime al datelor i unitile de masur sunt foarte diferite, este
necesar efectuarea Analizei Componentelor Principale pe date standardizate.

Operaia de standardizare a valorilor unei variabile const n substituirea valorilor


fiecrei operaii cu o nou valoare reprezentnd raportul dintre valoarea centrat a respectivei
operaii i abaterea standard a respectivei variabile.

Dup standardizare, datele nu mai au interpretare economic.


C. FUNCIE UTILIZAT PENTRU ANALIZA COMPONENTELOR PRINCIPALE

Folosirea funciei acp ( =function(setDate, k, nume, nume_obs ) a facut posibile


urmtoarele:

a. Crearea tabelului variabilelor originale standardizate:

tabel = data.frame ( companii[1], companii[2], companii[3], companii[4], companii[5],


companii[6], companii[7], companii[8], companii[9], companii[10], companii[11], companii[12],
companii[13], companii[14], companii[15], companii[16], companii[17], companii[18] ) # De la
1 la n inseamna [k].

n = nrow ( tabel ); m = ncol ( tabel ) # n = nr. linii; m = nr. coloane

write.csv ( data.frame ( tabel ), paste ( "ACP", "Var_orig_std.csv", sep="_" ) ) # Scrie n


csv datele din tabel.
b. Creare model PCA pe baza de corelatii ( acp=pca; acp e rulata pe matricea de corelatie )
pca = princomp ( tabel, cor=TRUE )
plot( pca, main="Graficul componentelor principale", col="pink3")

c. Extragerea valorilor proprii:

sdev = pca$sdev # sdev = variabila

valp = sdev*sdev # valp = valoare proprie = sdev^2

procentA = valp*100/m

procentC = cumsum ( procentA )

write.csv ( data.frame (valp, procentA, procentC), paste ( "ACP", "Valori_proprii.csv",


sep="_" ) )
d. Realizarea sreeplot-ului:
Screeplot-ul ajut la reinerea componentelor principale.

scree_plot = prcomp ( tabel )

plot ( scree_plot, type="l", main="Scree plot" )

Dup o scdere abrupt, curba tinde s se aplatizeze. Regula sugereaz c numrul de


componente principale se reine cnd curba se aplatizeaz. Vom reine, astfel, 4 componente.

e. Reinerea vectorilor proprii:


a = pca$loadings
write.csv ( a, paste ( "ACP", "Vectori_Proprii.csv", sep="_" ) )

f. Reinerea componentelor:
c = pca$scores
c2 = cbind ( c, nume_obs )
write.csv ( c2, paste ( "ACP", "Componente.csv", sep="_" ) )
g. Calculul corelaiilor factoriale:
corFact = cor ( tabel, c )
write.csv ( corFact, paste ( "ACP", "Cor.csv", sep="_" ) )

h. Reprezentarea cercului corelaiilor:


dev.new()
cerc = seq ( 0, 2*pi, length=100 )
plot ( cos(cerc), sin(cerc), type="l", col="blue", xlab="W1", ylab="W2" )
text ( corFact[,1], corFact[,2], rownames(corFact), col="red", cex=0.7 )

i. Reprezentarea graficului componentelor W1 i W2:


dev.new()
nr = m+1
plot (c2[,1], c2[,2], main="Plot componente - W1 si W2", xlab="W1", ylab="W2" )
text ( c2[,1], c2[,2], labels=c2[,nr], col="red", pos=3, cex=0.7 )
j. Crearea unui tabel din care s reias importana indivizilor:
q = array ( 0, c( n, m ) )
for ( i in 1:n )
{
for ( j in 1:m )
{
q[i,j] = c[i,j] * c[i,j] / sum ( c[i,]*c[i,] )
}
}
write.csv ( q, paste ( "ACP", "Importanta_Companii.csv", sep="_" ) )

k. Crearea unui tabel din care s reias contribuia indivizilor:


beta = array ( 0, c ( n, m ) )
for ( i in 1:n )
{
for ( j in 1:m )
{
beta[i,j] = c[i,j] * c[i,j] / sum (c[,j]*c[,j] )
}
}
write.csv ( beta, paste ( "ACP", "Contributie_companii.csv", sep="_" ) )
Apelul funciei s-a facut cu comanda:

acp ( df, k, "ACP_companii", nume_obs )


I. RECUNOATEREA NESUPERVIZAT A FORMELOR
( ANALIZA CLUSTER )

Analiza Cluster, cunoscut i ca analiza de segmentare sau de taxonomie, are ca scop


identificarea unui set de grupe omogene prin gruparea elementelor astfel nct s minimizeze
variaia n cadrul grupe i s maximizeze variaia dintre grupe. Analiza cluster este deci, o
tehnic de analiz multivariat care cuprinde un numr de algoritmi de clasificare a unor
obiecte (elemente sau indivizi) n grupe omogene. Variabilele sau cazurile sunt sortate n grupe
(clusteri) astfel nct ntre membrii aceluiai cluster s existe asemnri, similitudini ct mai
mari, iar ntre membrii unor clustere diferite s existe asemanri ct mai slabe. Pentru aceasta
se are n vedere n primul rnd alegerea distanei dintre elemente, apoi alegerea algoritmului de
grupare i n final se decide cu privire la nivelul.

Aplicnd funcia Cluster, au fost obinute urmtoarele ( se vor prezenta doar rezultatele
obinute prin metoda average ):

a. Calculul matricii distanelor:


d = dist ( as.matrix ( companii ), method = "euclidean" )
write.table ( round ( as.matrix(d), 4 ), paste ( tip, metoda, "Matricea_distantelor.txt",
sep="_" ) )

Distana este o funcie definit pe mulimea perechilor de obiecte cu ajutorul creia se


aprecieaz asemnarea sau diferenele dintre elemente. Formarea grupelor se bazeaz pe
calculul distanei dintre oricare dou obiecte.

b. Etapele clasificrii:
c. Dendogramele:

Dendograma este una dintre metodele de reprezentare a gruprilor putnd furniza o


sintez cu privire la clasificare. O dendogram care difereniaz clar grupele de obiecte va avea
distane mici la ramurile mai ndeprtate ale arborelui i diferene mari la ramurile apropiate.
Cnd distanele dintre ramurile ndeprtate sunt mari comparativ cu ramurile apropiate, atunci
gruparea nu este chiar eficace, iar dendograma va trebui interpretat cu pruden. Dendograma
poate fi util i pentru identificarea acelor obiecte care nu pot fi alturate nici unui grup fiind
excepii ale structurii de grupare i care nu se altur nici unui grup pn la ultimul pas.

Dendograma Cluster pentru setul de date scoruri, prin metoda average:


Dendograma Cluster pentru setul de date date_std, prin metoda average:

d. Algoritmul k-mens

1. Clsele k-mens
k=kmens( setDte, nr_clse )
clse=k$cluster
c1=cbind( clse, setDte )
c1

write.tble ( c1, pste ( tip, "Clse_kmens.txt", sep="_" ) )

Clsele k-mens pentru setul de dte scoruri:

Clsele k-mens pentru setul de dte dte_std:


2. Reprezentre clselor
m = data.frame ( c1 )
plot ( m[,2], m[,3], col = c ( "lightsteelblue", "navyblue", "aquamarine",
"deeppink4", "pink3", "magenta" )
[m$clase], main = "Reprezentarea claselor", xlab = colnames(m[2]), ylab =
colnames(m[3]) )
text ( m[,2], m[,3], labels = rownames(m), col="magenta", pos=3, cex=0.7 )

Reprezentre clselor pentru setul de dte scoruri:

Reprezentre clselor pentru setul de dte dte_std:


3. Descompunere vribilit tii
spat = k$totss
spaw = k$tot.withinss
spab = k$betweenss
r_cls = spab / spaw
variab = cbind ( spat, spaw, spab, r_cls )
colnames ( variab ) = c ( "SPAT", "SPAW", "SPAB", "R" )

write.table ( round(variab,4), paste ( tip,"Desc_variab.txt",sep="_") )

Descompunere vribilittii pentru setul de dte scoruri:

Descompunere vribilit tii pentru setul de dte dte_std:


4. Centroizii clselor
c = round ( k$centers, 4 )
write.table ( c, paste ( tip, "Centroizii_cls_kmeans.txt", sep="_" ) )

Centroizii clselor pentru setul de dte scoruri:

Centroizii clselor pentru setul de dte dte_std:

5. Putere de discriminre vribilelor

c2 <- c1
View(c2)
SPA_T = numeric(nr_var) # definire vector cu nr_var elemente = 0
SPA_B = numeric(nr_var)
SPA_W = numeric(nr_var)
R = numeric(nr_var)
n = numeric(100)
medie_clasa = matrix (,100,100)
medie_totala = numeric(100)
x = matrix(,100,100)
nr = nrow(c2)
for ( i in 2:(nr_var+1)) # i = nr. de variabile
{
SPA_T[i-1] = sd ( c2[,i] ) ^ 2 * ( nr-1 )
medie_totala[i-1] = mean ( c2[,i] )
for ( j in 1:nr_clase ) # j = nr. de clase
{
s = subset ( c2, clase==j )
n[j] = nrow(s)
medie_clasa[j,i-1] = mean(s[,i])
}
}
for ( i in 2:(nr_var+1) ) # i = nr. de variabile
{
for ( j in 1:nr_clase ) # j = nr. de clase
{
x[j,i-1] = n[j] * ( medie_clasa[j,i-1] - medie_totala[i-1] ) ^ 2
}
}
for ( i in 2:(nr_var+1) )
{
for ( j in 1:nr_clase )
{
SPA_B[i-1] = SPA_B[i-1] + x[j,i-1]
SPA_W[i-1] = SPA_T[i-1] - SPA_B[i-1]
R[i-1] = SPA_B[i-1] / SPA_W[i-1]
}
}
nume = colnames ( setDate )
variab_var = cbind ( SPA_T, SPA_W, SPA_B, R )
write.table ( cbind ( nume, round ( variab_var, 4 ) ), paste ( tip,
"Putere_dscrm_R.txt", sep="_" ) )
}

Putere de discriminre pentru setul de dte scoruri:


Putere de discriminre pentru setul de dte dte_std:
6. Tbel k-mens pentru setul de dte - scoruri
7. Tbel k-mens pentru setul de dte dte_std

Conform clusteriz rii k-mens se observ urm torele:

Clusterul 1 cuprinde:

Clusterul 2 cuprinde:

Clusterul 3 cuprinde:

e. Afisre siluetei

pamk.result <- pamk ( companii[,5],3 )

pamk.result
f. Reprezentre grfic clusterelor s i siluetele lor:
Se observ c :

siluet medie primului cluster este 0.27 s i contine 6 instnte.

siluet medie clusterului 2 este 0.84 s i contine 45 instnte.

siluet medie clusterului 3 este 0.00 s i contine 1 instnt.

Silueta medie global este 0.76.

g. Fuzzy C-Mens

In continure sunt prezentti centroizii clusterelor s i grdele de prtenent le


instntelor l cele 3 clustere.

rezultat <- cmeans( companii, 3, 100, m=2, method="cmeans" )

rezultat
h. Afisre grdului de prtenent l observtiilor

rezultat$membership
II. ARBORI DECIZIONALI

Se extrg 2 es ntione din num rul liniilor setului de dte - compnii, 70% fiind n
primul es ntion s i 30% n l doile es ntion. Extrgere pote s fie cu revenire su f r
revenire. In czul nostru, compniile trebuie s ib cees i s ns de fi extrse, deci
extrgere trebuie s fie cu revenire.

In continure vom fis prtenent l cele dou es ntione:

. Se creez setul de dte de ntrenre.


b. Se creez testul de testre.

c. Se construies te un rbore de decizie.


arbore <- ctree ( dependenta, data=setantrenare )
plot(arbore)
d. Se fis ez mtrice de confuzie:

e. Se fis ez rborele de decizie simplu.


plot ( arbore, type="simple" )
f. Se testez rborele pentru testul de ntrenre.

g. Se fis ez mtrice de confuzie vlorilor previzionte:

III. CLASIFICATORUL BAYESIAN


. Definire modelului
model <- naiveBayes ( companii[,3:16], factor ( companii[, 2] ) )
model
b. Predicti cu clsifictorul Byesin
predict ( model, companii[1:9,-10] )
table ( predict ( model, companii[,-10]), companii[,10], dnn=list( 'predicted', 'actual' ) )

c. Mtrice de confuzie clsifictorului Byesin


tab <- table ( predict ( model, companii[,-10]), companii[,10], dnn=list( 'predicted',
'actual' ) )
classAgreement(tab)

Rt de precizie lgorimului este de 5%.


Coeficientul lui Cohen este 0.033.
IV. RETELE NEURONALE

Retelele neuronle constituie un domeniu ce se bucur de o lrg utilizre. Motivul


cestui interes st n eficcitte, dovedit n numerose plictii prctice, de furniz
solutii, n specil de ntur predictiv , pentru probleme de mre complexitte su
voltilitte.

. Crere setului de testre


trainset <- companii [ sample ( 1:nrow(companii), size.sample), ]
trainset

nnet_train <- cbind ( trainset, trainset$SECTOR == '1')


nnet_train <- cbind ( nnet_train, trainset$SECTOR == '2')
nnet_train <- cbind ( nnet_train, trainset$SECTOR == '3')
nnet_train <- cbind ( nnet_train, trainset$SECTOR == '4')
nnet_train <- cbind ( nnet_train, trainset$SECTOR == '5')
names(nnet_train)[17] <- 'Sectorul_farmaceutic'
names(nnet_train)[18] <- 'Sectorul_biofarmaceutic'
names(nnet_train)[19] <- 'Sectorul_medicamentelor_bioterapeutice'
names(nnet_train)[20] <- 'Sectorul_echipamentelor_si_tehnologiilor_medicale'
names(nnet_train)[21] <- 'Sectorul_serviciilor_de_sanatate'
names(nnet_train)
nn <- neuralnet ( Sectorul_farmaceutic + Sectorul_biofarmaceutic +
Sectorul_medicamentelor_bioterapeutice +
Sectorul_echipamentelor_si_tehnologiilor_medicale +
Sectorul_serviciilor_de_sanatate ~ MCAP + REVs + TASS +
TLBT + OPPR + OPMG + ROE + ROA + PBr + PSr + Alpha + Beta +
QCKr + CRTr, data=nnet_train, hidden=c(3,3) )
nn

plot(nn)
V. POSIBILE DEPENDENE NTRE VARIABILE, ECUAII DE
REGRESIE, COEFICIENII DREPTELOR DE REGRESIE

S-ar putea să vă placă și