Documente Academic
Documente Profesional
Documente Cultură
PROIECT
~ Inteligent computtionl ~
1. Cuprins
2. Introducere
3. Anliz generl dtelor
4. Anliz componentelor principle
5. Anliz Cluster
6. Arbori decizionli
7. Clsifictorul Byesin
8. Retele neuronle
9. Posibile dependente ntre vribile, ecutii de regresie, coeficientii dreptelor de
regresie
II. INTRODUCERE
A. VARIABILA CALITATIVA
1 = Sectorul frmceutic;
2 = Sectorul biofrmceutic;
3 = Sectorul medicmentelor bioterpeutice;
4 = Sectorul echipmentelor s i tehnologiilor medicle;
5 = Sectorul serviciilor de s n tte.
B. VARIABILELE CANTITATIVE
2. REVENUE ( REVs )
Investitorii vor lu des n considerre venitul s i venitul net l unei societ ti seprt
pentru determin stre de s n tte unei fceri. Este posibil c venitul net s cresc
n timp ce venitul r m ne constnt, c urmre reducerii costurilor; o stfel de situtie,
ns , nu este un semn bun pentru o cres tere pe termen lung unei compnii.
Proprietrii se pot uit l totlul ctivelor lor pentru vede cre pot fi convertite
mi rpid n numerr. Un ctiv este declrt fi mi lichid, n czul n cre cest pote fi
v ndut cu us urint n numerr, ir nelichid n czul n cre cest lucru nu e posibil.
Mrj opertionl este o m surre procentului din veniturile unei compnii cre
r m ne dup chitre costurilor vribile de productie, cum r fi slrii, mterii prime etc.
Acest pote fi clcult prin mp rtire venitului opertionl l unei compnii ( cunoscut
sub numele de "profit opertionl" ) pe prcursul unei numite periode de v nz rile sle
nete n cursul celeis i periode. "Veniturile opertionle" ( Operting Income ) se refer
ici l profitul pe cre o societte l retine dup eliminre cheltuielilor opertionle ( cum
r fi costul bunurilor v ndute s i slriilor ) s i mortizre. "V nz rile nete" ( Net Sles ) se
refer ici l diferent dintre vlore totl v nz rilor s i vlore bunurilor returnte,
cotele pentru bunurile deteriorte s i lips s i v nz rile cu discount.
Acest indictor ofer nlis tilor o idee despre c t de mult c s tig o societte
( ninte de dob nzi s i txe ) pe fiecre dolr din v nz ri. In generl vorbind, cu c t mrj
de operre unei compnii este este mi mre, cu t t compni re o rentbilitte mi
mre. In czul n cre mrj unei compnii este n cres tere, cest c s tig mi mult pe
dolr din v nz ri.
ROE este util pentru compr profitbilitte unei compnii cu ce ltor firme
din cels i sector.
Acest indictor rt ce c s tiguri s-u genert din cpitlul investit. ROA pentru
compniile publice pote vri n mod substntil s i depinde n mre m sur de industrie.
Acest este motivul pentru cre tunci c nd se utilizez ROA c o m sur comprtiv , cel
mi bine este s fie comprt cu vlorile ROA nteriore le compniei respective su cu
vlore ROA unei societ ti similre.
De semene, cest rport ofer o idee dc se pl tes te pre mult pentru cee ce s-r
l s n czul n cre compni r dt fliment imedit.
Price to Book Ratio = Stock Price / ( Total Assets Intangible Assets and
Liabilities )
10. PRICE TO SALES RATIO ( PSr )
Price to Sales Ratio = Stock Price per Share / Net Sales ( Revenue ) per Share
Alph este cel mi des folosit pentru fondurile mutule s i lte tipuri de investitii
similre. Este dese reprezentt c un singur num r ( cum r fi 3 su -5 ), dr cest se
refer l o m surre procentul modului n cre portofoliul su fondul u evolut n
comprtie cu indicele de referint (dic 3%, mi bine su mi r u -5%).
Indictorul bet este o m sur voltilit tii su riscului sistemtic, unei grntii
su unui portofoliu n comprtie cu pit n nsmblu. Bet este utilizt n modelul
preturilor ctivelor de cpitl, cre clculez rndmentul s teptt l unui ctiv pe bz
indictorului s u bet s i rndmentul de pit s teptt.
Un rt mi mic dec t 1 indic fptul c psivele unei societ ti sunt mi mri dec t
ctivele sle s i sugerez c societte n cuz r fi n imposibilitte de -s i pl ti
obligtiile n czul n cre scdent r ve loc n cel moment. In timp ce o rt sub 1 rt
c societte nu este n stre bun de s n tte finncir , cest nu nsemn nep rt c
v intr n fliment. In orice cz, ns , o rt sub 1 nu este de obicei un semn bun.
Din Summry Sttistics reiese c niciun din cele 18 serii ( indictori ) nu urmez o
distributie norml , deorece vlorile mediilor sunt diferite de 0.
B. COEFICIENT I DE ASIMETRIE S I APLATIZARE
. SKEWNESS
Acest indictor este folosit n nliz distributiei unei serii de dte pentru indic
deviti distributiei empirice n rport cu o distributie simetric n jurul mediei.
Interpretre:
Skewness > 0 : Distributi este nclint spre st ng, v nd mi multe vlori extreme
spre drept.
Toti indictorii prezint vlori pozitive le cestui coeficient, deci distributiile sunt
nclinte spre st ng, v nd mi multe vlori extreme spre drept.
b. KURTOSIS
Acest indictor este folosit n nliz distributiei unei serii de dte pentru indic
grdul de pltizre su de scutire unei distributii.
Interpretre:
. MEDIA
Media, nott cu m, este sum vlorilor, dtelor numerice, mprtit l num rul
cestor. Formul ei de definitie este m=x/N, n cre nsemn "sum de", x reprezint
vlorile su rezulttele individule, ir N constituie efectivul grupei studite.
dispersiei: .
Indicele de dispersie cel mi exct s i mi des utilizt este, de fpt, btere stndrd,
v nd vntjul de fi exprimt n celes i unit ti de m sur c s i dtele nlizte.
2. Histogrm venitului
Se observ c distributi cestui indictor este nclint spre st ng, v nd mi
multe vlori extreme spre drept, fiind o distributie leptokurtic , mi scutit dec t o
distributie norml , v nd mi multe vlori concentrte n jurul mediei s i cozi mi grose,
deci probbilit ti ridicte pentru vlorile extreme.
E. MATRICEA DE CORELAT IE
F. MATRICEA DE COVARIANT A
A. ELIMINAREA OUTLIERILOR
Se consider outlier orice companie care are cel puin o valoare a unui indicator care nu
se ncadreaz n intervalul calculat.
Deoarece ordinul de mrime al datelor i unitile de masur sunt foarte diferite, este
necesar efectuarea Analizei Componentelor Principale pe date standardizate.
procentA = valp*100/m
f. Reinerea componentelor:
c = pca$scores
c2 = cbind ( c, nume_obs )
write.csv ( c2, paste ( "ACP", "Componente.csv", sep="_" ) )
g. Calculul corelaiilor factoriale:
corFact = cor ( tabel, c )
write.csv ( corFact, paste ( "ACP", "Cor.csv", sep="_" ) )
Aplicnd funcia Cluster, au fost obinute urmtoarele ( se vor prezenta doar rezultatele
obinute prin metoda average ):
b. Etapele clasificrii:
c. Dendogramele:
d. Algoritmul k-mens
1. Clsele k-mens
k=kmens( setDte, nr_clse )
clse=k$cluster
c1=cbind( clse, setDte )
c1
c2 <- c1
View(c2)
SPA_T = numeric(nr_var) # definire vector cu nr_var elemente = 0
SPA_B = numeric(nr_var)
SPA_W = numeric(nr_var)
R = numeric(nr_var)
n = numeric(100)
medie_clasa = matrix (,100,100)
medie_totala = numeric(100)
x = matrix(,100,100)
nr = nrow(c2)
for ( i in 2:(nr_var+1)) # i = nr. de variabile
{
SPA_T[i-1] = sd ( c2[,i] ) ^ 2 * ( nr-1 )
medie_totala[i-1] = mean ( c2[,i] )
for ( j in 1:nr_clase ) # j = nr. de clase
{
s = subset ( c2, clase==j )
n[j] = nrow(s)
medie_clasa[j,i-1] = mean(s[,i])
}
}
for ( i in 2:(nr_var+1) ) # i = nr. de variabile
{
for ( j in 1:nr_clase ) # j = nr. de clase
{
x[j,i-1] = n[j] * ( medie_clasa[j,i-1] - medie_totala[i-1] ) ^ 2
}
}
for ( i in 2:(nr_var+1) )
{
for ( j in 1:nr_clase )
{
SPA_B[i-1] = SPA_B[i-1] + x[j,i-1]
SPA_W[i-1] = SPA_T[i-1] - SPA_B[i-1]
R[i-1] = SPA_B[i-1] / SPA_W[i-1]
}
}
nume = colnames ( setDate )
variab_var = cbind ( SPA_T, SPA_W, SPA_B, R )
write.table ( cbind ( nume, round ( variab_var, 4 ) ), paste ( tip,
"Putere_dscrm_R.txt", sep="_" ) )
}
Clusterul 1 cuprinde:
Clusterul 2 cuprinde:
Clusterul 3 cuprinde:
e. Afisre siluetei
pamk.result
f. Reprezentre grfic clusterelor s i siluetele lor:
Se observ c :
g. Fuzzy C-Mens
rezultat
h. Afisre grdului de prtenent l observtiilor
rezultat$membership
II. ARBORI DECIZIONALI
Se extrg 2 es ntione din num rul liniilor setului de dte - compnii, 70% fiind n
primul es ntion s i 30% n l doile es ntion. Extrgere pote s fie cu revenire su f r
revenire. In czul nostru, compniile trebuie s ib cees i s ns de fi extrse, deci
extrgere trebuie s fie cu revenire.
plot(nn)
V. POSIBILE DEPENDENE NTRE VARIABILE, ECUAII DE
REGRESIE, COEFICIENII DREPTELOR DE REGRESIE