Documente Academic
Documente Profesional
Documente Cultură
CONTEDO O que entendemos como risco? Estamos acostumados a MARCO ANTONIO LEONEL CAETANO
relacionar essa palavra ao resultado negativo de eventos, Bacharel em Matemtica pela Universidade
1 processos ou tarefas. Na realidade, o risco no se refere Estadual Paulista (UNESP) e mestre e doutor em
Tratamento, quanticao e visualizao apenas a resultados negativos, mas tambm a resultados Engenharia Aeronutica pelo Instituto Tecnolgi-
de dados advindos de retornos positivos sobre diversas atividades, co de Aeronutica (ITA). Possui trabalhos em
entre elas aquelas ligadas ao mercado nanceiro. conferncias e revistas tcnicas nacionais e
2 internacionais. Professor desde 2004 no Insper,
Este livro comea descrevendo o risco como uma medida bsica de
APLICAES FINANCEIRAS
formulaes estocsticas e suas solues analtica e numrica. Com dinmicas com Microsoft Ofce Excel 2010 e VBA e
7 dados reais de aes na bolsa de valores, o livro descreve o mercado Mudanas abruptas no mercado nanceiro. Foi
Risco extremo de mudanas abruptas de opes como parte importante do entendimento do risco nas nalista do Prmio Jabuti em 2014.
calculado com wavelets aplicaes nanceiras, utilizando para isso exemplos e conceitos do
modelo Black-Scholes, operao de call, operao de put, volatilidade
8 histrica e volatilidade implcita.
Mapa de risco MARCO ANTONIO LEONEL CAETANO
9
Clculo de It
10
O risco na precicao de opes
11
O risco nal
www.blucher.com.br
Marco Antonio Leonel Caetano
ANLISE DE RISCO EM
APLICAES FINANCEIRAS
Anlise de risco em aplicaes financeiras
2017 Marco Antonio Leonel Caetano
Editora Edgard Blcher Ltda.
FICHA CATALOGRFICA
www.blucher.com.br
Bibliografia
ISBN 978-85-212-1144-0
Segundo Novo Acordo Ortogrfico, conforme
5. ed. do Vocabulrio Ortogrfico da Lngua 1. Finanas Investimentos Avaliao de riscos
Portuguesa, Academia Brasileira de Letras, 2. Administrao de risco - Matemtica 3. Sistemas de
maro de 2009. avaliao de risco de crdito (Finanas) 4. Mercado
financeiro 5. Probabilidades I. Ttulo.
2. Probabilidades............................................................................. 47
2.1 Introduo.................................................................................................. 47
2.2 Eventos e espao amostral......................................................................... 50
2.3 O que probabilidade?.............................................................................. 54
2.4 Distribuies de probabilidades................................................................. 59
2.5 Probabilidades no Excel.............................................................................. 62
3. Distribuio normal.................................................................. 65
3.1 Introduo.................................................................................................. 65
3.2 Clculo de probabilidades com distribuio normal................................... 66
3.3 Curtose........................................................................................................ 74
18 Anlise de risco em aplicaes financeiras
3.4 Assimetria................................................................................................... 77
3.5 Padro de normalidade no mercado de aes........................................... 80
Referncias........................................................................................ 261
Captulo 1
Tratamento, quantificao e
visualizao de dados
1.1 Introduo
Na divulgao de relatrios, estrategistas e analistas preocupam-se com a melhor
maneira de apresentar os dados obtidos por meio dos resultados das operaes nos
investimentos financeiros. Necessariamente, toda divulgao deve comear sempre
pela divulgao dos resultados com tcnicas estatsticas adequadas.
Na estatstica, existe um amplo campo de tcnicas para expressar e representar
resultados de investimentos em trs subreas bastante distintas e muito bem conec-
tadas: estatstica descritiva, probabilidade e inferncia estatstica. Na estatstica des-
critiva so utilizadas ferramentas como objeto de apresentao, como grficos, tabelas
e anlises de formas e estruturas de representaes dos dados. Esse tipo de estatstica
no tem valor de inferncia, ou seja, as concluses so sempre limitadas, e tambm
no permite a extenso direta dos resultados para a populao da qual foram coletadas
as amostras. No campo da probabilidade, teoremas garantem os tipos de distribuio
que regem um evento ocorrido no mercado, destacam quais so as distribuies mais
adequadas e mostram com que confiana os dados podem ser coletados de forma que
sejam representativos de uma populao de dados. Finalmente, na inferncia esta-
tstica, tcnicas garantem as concluses indicando os erros e as confiabilidades dos
resultados obtidos. Tambm nesse campo possvel fazer previses de tendncias e
correlaes entre variveis e parmetros obtidos experimentalmente.
Desse modo, realizar uma projeo ou divulgao de relatrios de investimentos
sem o devido cuidado com seu tratamento e forma de apresentao pode compro-
meter todo trabalho realizado, por falta de compreenso por parte dos leitores ou de
interpretaes incorretas de determinados resultados obtidos.
22 Anlise de risco em aplicaes financeiras
Ms 1 2 3 4 5 6 7 8 9 10 11 12
US$ 4.538 4.083 5.167 4.730 5.367 5.042 4.965 5.727 4.755 5.003 4.500 4.346
5800
5600
(milhes US$) Exportaes
5400
5200
5000
4800
4600
4400
4200
4000
0 2 4 6 8 10 12 14
Meses (2001)
Figura 1.1 Grfico de linhas com dados das exportaes brasileiras em 2001.
18 3
19 2
20 12
21 10
22 10
23 4
12
10
Frequncia
0
16 17 18 19 20 21 22 23 24
Dias teis
1.2.3 Histograma
Esse tipo de grfico consiste em retngulos justapostos que indicam, em sua base,
o intervalo dos valores de dados do experimento cuja frequncia representada pela
altura do retngulo. O sentido um pouco mais amplo que o do grfico de pontos, pois
o interesse no est em um nico valor, mas sim em um intervalo de valores amostrados.
Os valores a seguir correspondem mdia diria mensal de importaes brasileiras
de janeiro de 1999 a janeiro de 2002.
24 Anlise de risco em aplicaes financeiras
183 175 176 183 194 212 183 203 202 223
226 193 170 192 212 210 213 219 232 235
252 247 252 243 228 222 247 230 234 238
220 221 218 216 210 174 172
Histograma
9
6
Frequncia
4 Total
0
170-179 180-189 190-199 200-209 210-219 220-229 230-239 240-249 250-259
220
216
212
208
204
200
196
192
188
184
180
176
172
0 0,5 1 1,5 2 2,5 3 3,5
Frequncia observada
Exemplo 1.1
Administrao Sade
6.532 13.219
18.091 11.836
19.442 10.986
19.740 10.220
z = x + y
23.400
22.800
22.200
21.600
21.000
20.400
Sade (milhes de R$)
19.800
19.200
18.600
18.000
17.400
16.800
16.200
15.600
15.000
14.400
13.800
13.200
12.600
12.000
11.400
10.800
10.200
4.000 6.000 8.000 10.000 12.000 14.000 16.000 18.000 20.000 22.000 24.000 26.000 28.000 30.000
Figura 1.5 Isolinhas dos gastos federais representando a forma da funo z = f(x,y).
Exemplo 1.2
Li + Ls
PMi =
2
F requncia absoluta acumulada direta (Fac): a soma das frequncias absolutas
de valores inferiores ou iguais ao valor da frequncia da classe.
Frequncia relativa (f): porcentagem do nmero de dados da classe em relao ao
total de dados: f = F .
n
Uma vez colocadas essas definies, os 29 dados brutos da Tabela 1.5 podem infor-
mar melhor, como na Tabela 1.6 (tabela de classes), o nvel de desemprego no pas.
Tabela 1.6 Tabela de classes para nvel de desemprego no Brasil (janeiro de 1999 a maio de 2001)
Classes F f PM Fac
Classes F f PM Fac
Total 29 1 (100%) 29
Mdia aritmtica
ados no agrupados: sejam x1, x2, ..., xn valores da varivel x. A mdia aritmtica
D
para os dados brutos coletados em um experimento :
n
xi
i =1
x=
n
n
D
ados agrupados em tabela de frequncia:
n xi sejam x1, x2, ..., xn pontos mdios das
classes construdas para os dados
x = brutos.
i =1xi Fi Sendo as frequncias F1, F2, ..., Fn de
cada classe, a mdia para os dadosi = 1n
x = agrupados calculada por:
n
n
xi Fi
i =1
x=
n
30 Anlise de risco em aplicaes financeiras
Exemplo 1.3
14,1 4
13,7 2
13,6 2
14,5 2
16,2 1
14,9 1
12,6 1
Fonte: Serasa.
A tabela representa o nmero de cheques sem fundos devolvidos uma segunda vez
em cada mil cheques apresentados, de maio de 2001 a maio de 2002. A mdia aritm-
tica para essa tabela de 14,1 cheques entre maio de 2001 e maio de 2002 para cada
mil apresentados.
D
ados agrupados em tabela de classes: as classes so representadas pelos seus
pontos mdios, conforme a Tabela 1.6. Nesse caso, a mdia calculada por:
n
PM i Fi
i =1
x=
n
Observando a tabela de classes (Tabela 1.6), pode-se calcular sua mdia pela fr-
mula anterior, a qual fornece o valor mdio x = 7,19.
~
x
Mediana
Um valor dito mediano quando
x = divide o conjunto de dados do experimento
depois de sua ordenao, separando-o em dois subconjuntos com igual nmero de
elementos. Sua notao em geral ~
x:
x=
Dados no agrupados:
x=
5 7 8 10 14 A mediana ~
x =8
5 7 8 10 14 15 A mediana ~
x =9
Tratamento, quantificao e visualizao de dados 31
D
ados agrupados por frequncia: nesse caso, cria-se uma nova coluna de fre-
quncias acumuladas diretas para auxlio na escolha da mediana. A Tabela 1.7 se
transforma na Tabela 1.8, a seguir.
14,1 4 4
13,7 2 6
13,6 2 8
14,5 2 10
16,2 1 11
14,9 1 12
12,6 1 13
Fonte: Serasa.
Nesse caso, n = 13 mpar. Ento, (n + 1)/2 = 7, o que significa que o stimo ele-
mento corresponde ao elemento mediano desse conjunto de valores de cheques devol-
vidos. Logo, a mediana 13,6, diferente da mdia, que 14,1.
D
ados agrupados em tabela de classes: nesse caso, necessria uma frmula de
interpolao para se encontrar o elemento mediano. Deve-se ressaltar que esse
valor apenas representativo e que no necessariamente faz parte da amostra. Os
passos a seguir so:
(a) Calcula-se a ordem (n/2), no se preocupando se for par ou mpar, pois a
varivel contnua. A classe da mediana aquela cuja frequncia acumulada
at ela maior ou igual a (n/2), j a imediatamente anterior menor que n/2.
(b) Utiliza-se a seguinte frmula de interpolao:
n
f
2
~
x = Lmd + h
Fmd
~
x =8+
(14,5 8) (0,674) = 8,27
16
Existem ainda medidas alternativas para dividir os dados em quatro, dez e cem par-
tes iguais. So conhecidas como quartis, decis e percentis, respectivamente. A nica
alterao na frmula a troca de n/2 por n/4, no caso de quartis, n/10, no caso de
decis, e n/100, no caso de percentis. Os limites e as frequncias acumuladas diretas
tambm so trocados pelos limites das classes dos quartis, decis e percentis.
Moda
Quando a varivel discreta, a medida de moda representa o elemento mais fre-
quente na amostragem, ou seja, aquele que mais se repete. No entanto, para o caso em
que a varivel contnua, essa definio deixa de valer e passa-se a adotar uma medida
de densidade.
Dados no agrupados.
Exemplo 1.4
D
ados em tabela de classes: da mesma forma que na mediana se faz necessria a
interpolao dos dados para encontrar a moda, existem alguns tipos de frmulas
que se diferenciam no clculo da moda para a tabela de classes. Uma dessas fr-
mulas pode ser usada adotando-se os seguintes passos:
(a) identifica-se a classe modal, ou seja, aquela com a maior frequncia absoluta.
(b) utiliza-se a frmula:
(Fi Fi 1 )
Mo = Li + h
2 Fi Fi 1 Fi +1
Mo = 7,526 +
(13 8) 0,674 = 7,713
2 13 8 0
Amplitude total
Essa medida muito simples e constitui a primeira avaliao sobre a natureza da
amostragem. A amplitude total a diferena entre o maior valor e o menor valor dos
dados coletados. Sua utilizao bastante limitada, pois depende apenas da disperso
dos valores extremos, no sendo afetada pela disperso dos valores internos.
Varincia
Mede a disperso dos dados em torno da mdia. A ttulo de exemplo, suponha-
-se que se tenha o seguinte conjunto de dados A = {3, 4, 5, 6, 7}, em que a mdia 5.
Calculando-se o desvio das unidades do conjunto A em relao mdia, tem-se:
d1 = x1 x = 2
d 2 = x 2 x = 1
d 3 = x3 x = 0
d 4 = x4 x = 1
d 5 = x5 x = 2
Essa
5
soma de desvios poderia servir de medida de disperso se no fosse o fato de
que i=1 i 0. Ou seja, a soma de todas as diferenas dos dados de uma amostra em rela-
d =
5 5
sqd = d i2 = ( xi x )2
i =1 i =1
Porm, como est, essa medida 5cresceria5 indefinidamente medida que novos
sqd
dados fossem sendo coletados. = para
Logo, (x(xi ivalor
= 5esse
d2 i2 que xx) )2no se torne indefinidamente
2
sqd = =
crescente, pondera-se a medida sqd,i =dividindo-a
1 i =1 pelo 5 nmero de dados:
i =1
5 5 ( x 2x )2
sqd s=2=2
(x x )
= i i
5
i =1 i =1 5 1
Essa forma de medida passa a ser25chamada (x xx))2 populacional, uma vez que foi
5 2
s 2 = 2n ( x5iivarincia
ponderada por todos os termos ==d i = s
sqdamostrados.
i =1 5 (
) 2
x1i xnossa
vezes, intuio em coletar dados
nos trai em favor de alguns pontos mais
i =1 ifavorveis,
=1 i = 1 n conhecidos como vis ou tenden-
ciosidade na amostragem. Uma primeiran medida de2 correo a ser tomada dividir
(5x5i mas x ) )sim
2 2n = ( x(ix 2x x
5 2 por n1 dados. A teoria de
=25n=de
as somas dos desvios no pelo total
dados,
)2
sqd
sqd=
probabilidade prova que esse um bom d = (
x
itruque 5
n xi ) correes
de de tendenciosidade na
=s 1i =1 ( xi5:
i =1=d ii =1=i = x )2
2 2 i
amostragem. Logo, a segundasqdmedida de varincia n 1
i =1 i =1 i =1
5
( )
x 22x 2
( (( ) ))
2 2 n 5xi
(
sqd s=25=n = 5x5i x 2x x 2
x i
(
)
s =2 2 x 5xi 1 F 2
sqd s =2 == diii===11=ii=1n x1i5 xi
sqd )
1i =n1 15 amostral. De modo geral, pode-
i =1i =1 i =varincia
Nela, a nova medida passa a ser chamada
(5n
) xx 22 os dois tipos de varincia:
xxii existem
-se afirmar que, para um conjuntosde = ( ( ( ) ) )
22 n dados,
=n 5xi 5xi x 2x 2Fi2
5 x
2 2
s s== =2 ii==
(a) varincia populacional sqd =11 ni 1 x
n5 1
i =1i =1
i =1 5
n
( x x 2 )
(
2 = n5 x i xx 22 )
s = i =1 ii n
2
n n 1
i =1 5
(b) varincia amostral
2s 22 = nxi ( ( ) )
n nn x 2x 22
xii x x Fi
s = =
( )
xinx1 2
2
s =
i =1ii==11 n
n
n1
1
i =1
n
(
x x 2 Fi )
2
A varincia amostral para o sconjunto ( ( ) )
= n nxAi xdescrito
i inx
2x 2 anteriormente 2,5. No caso de
1 Fio clculo da varincia pode ser
2s 2 =
haver dados j apresentados em stabela
= i =de
1 frequncias,
1
realizado diretamente com: i =1i =1 n 1
n
(xi x )2 Fi
s =
2
i =1 n 1
Exemplo 1.5
s2 =
1
13 1
[
(14,1 14,1)2 4 + (13,7 14,1)2 2 + (13,6 14,1)2 2 + (14,5 14,1)2 2 +
+ (16,2 14,1)2 12+ (14,19 14,1)2 1 + (12
s = [ ,6 14,1)2 1]
(14,1 14,1)2 4 + (13,7 14,1)2 2 + (13,6 14,1)2 2 + (14,5 14,1)
8,44 13 1
=
12 + (16,2 14,1)2 1 + (14,9 14,1)2 1 + (12,6 14,1)2 1]
= 0,703 8,44
=
12
A ltima forma de apresentao da varincia quando se tem os dados em forma
= 0,703
de(classes. x ) caso,
n 2
de tabela PM i Nesse Fi o clculo da varincia :
s =
2
i =1 n 1
n
(PM i x )2 Fi
s2 =
i =1 n 1
Exemplo 1.6
Utilizando-se da Tabela 1.6, foi encontrada na seo anterior a mdia para a tabela
de classes de 7,19% de nvel de desemprego. A varincia amostral para esse exemplo
0,618.
Desvio-padro
Essa medida fornece ao pesquisador uma maneira de saber matematicamente a
oscilao em torno dos dados. O desvio-padro, assim como a varincia, apresenta
o grau de confiabilidade dos dados em torno da mdia e corrige um problema da
varincia quanto ao elevado grau de medida. Enquanto os valores da varincia podem
tornar-se bastante elevados, a ponderao da varincia com a extrao da raiz qua-
drada torna a medida mais tratvel do ponto de vista numrico.
No mercado financeiro, comum usar o jargo volatilidade para referir-se ao
desvio-padro. Sabe-se da extensa literatura sobre teoria da probabilidade (MEYER,
1984; PAPOULIS, 1991; MAGALHES; LIMA, 2000) que em um conjunto de dados
36 Anlise de risco em aplicaes financeiras
contnuos, para ser considerado como um conjunto de dados com distribuio normal,
68% dos dados devem estar em torno da mdia no intervalo [mdia desvio-padro;
mdia + desvio-padro]. Assim, o desvio-padro a raiz quadrada da medida da
varincia, ou dp = s 2 .
s
cv =
Coeficiente dexvariao
uma 0,786relativa da disperso em porcentagem de quanto a variabilidade
cv medida
= = 0,109
influencia na 7confiana
,19 da mdia calculada. Com um coeficiente de alto grau por
exemplo, acima de 50% , pode-se dizer que existe alto grau de disperso dos dados em
relao mdia x Mo 2
AS =encontrada. Assim, a maneira
dp = sde calcular o coeficiente de variao :
s
s
Q + Q1 2 ~
x cv =
AS = 3 x
Q3 Q1 0,786
cv = = 0,109
Exemplo 1.7 7,19
Com a Tabela 1.5, pode-se saber qual dp x Mo
o comportamento
2 dos dados em relao m-
AS == s
dia encontrada no nvel de desemprego. A mdia
s foi de 7,19% de desemprego. Sendo
o desvio-padro 0,786, o coeficiente de
s
cv variao
= :~
Q + Q 2x
AS = 3 x1
Q3 Q1
0,786
cv = = 0,109
7,19
x Mo
Sabendo que a variao de 10,9%,AS =
possvel concluir que os dados sobre o desem-
s
prego oscilam pouco em relao mdia. O cv indica que existe uma variabilidade de
11% com relao ao valor encontrado Q Q1 2 ~
3 +mdia.
pela x
AS =
Q3 Q1
s
cv =
x
Tratamento, quantificao e visualizaocv
de = 0,786
dados 37
= 0,109
7,19
dp = s2
x s Mo
AS cv
= =
xs
em que x o valor mdio, Mo cv 0,786 valor ~modal e s o desvio-padro. No
representa
= Q3 +oQ 2x
=10,109
AS = um
entanto, essa frmula pode apresentar 7,19inconveniente. Muitas vezes no se tem um
valor modal ou h muitos valores modais.QNesses
3 Q1 casos, uma frmula alternativa o
coeficiente de Pearson, que faz uso AS x
do valor Mo
= mediano e dos quartis na forma (FON-
SECA, 1992): s
Q + Q1 2 ~ x
AS = 3
Q3 Q1
em que os Q representam os quartis terceiro e primeiro e o valor mediano.
Ibovespa (2007)
70.000
65.000
60.000
55.000
50.000
45.000
40.000
O resultado .
Existe uma maneira bem mais interessante de completar as medidas descritivas
para fazer estatstica de dados tabelados em planilha do Excel. Uma utilizao inte-
ressante o do conceito de tabela dinmica. Essa funo existe em todas as ltimas
verses do Excel na verso 2010 do Microsoft Excel est na aba Inserir, conforme
Figura 1.9. O smbolo sempre muda de uma verso para outra. Aqui apresentado o
da verso 2010 (primeiro cone esquerda):
Escolhe-se, ento, todo o intervalo em que esto os dados do Ibovespa, por exem-
plo, e clica-se no boto OK. Se os dados estiverem na coluna B, como no caso do
exemplo, o preenchimento fica desta forma:
O resultado que aparece uma pequena tabela vazia e uma caixa de informao
esperando detalhes do que se deseja fazer com os dados selecionados.
Figura 1.15 Mudana da tabela dinmica para frequncia de valores nos intervalos.
42 Anlise de risco em aplicaes financeiras
Desse modo, para o intervalo de mil dados, possvel encontrar a classe modal, ou
seja, aquela na qual se encontram mais dados. No caso deste exemplo, a tabela resul-
tante seria assim:
Tabela 1.9 Dados do Ibovespa para classes com intervalo de mil dados
41.179-42.178 2
42.179-43.178 14
43.179-44.178 15
44.179-45.178 12
45.179-46.178 16
46.179-47.178 8
47.179-48.178 3
48.179-49.178 9
49.179-50.178 7
50.179-51.178 10
51.179-52.178 13
52.179-53.178 18
53.179-54.178 13
54.179-55.178 17
55.179-56.178 9
56.179-57.178 4
57.179-58.178 10
58.179-59.178 3
59.179-60.178 4
60.179-61.178 8
61.179-62.178 8
62.179-63.178 15
63.179-64.178 11
64.179-65.178 11
65.179-66.178 4
fcil verificar que a classe modal a classe dos pontos do Ibovespa no intervalo
entre 52.179 e 53.178. A quantidade de dados presentes nesse intervalo 18, maior
Tratamento, quantificao e visualizao de dados 43
que em outros intervalos. Com essa tabela resultante da tabela dinmica, possvel
fazer um histograma, como visto antes, selecionando as colunas dos intervalos e
das frequncias. O resultado est na Figura 1.16, que mostra que o intervalo de mil
dados tornou o histograma multimodal, com diversos intervalos de valores frequen-
tes muito prximos.
65179-66178
63179-64178
64179-65178
61179-62178
62179-63178
59179-60178
60179-61178
57179-58178
58179-59178
55179-56178
56179-57178
53179-54178
54179-55178
51179-52178
52179-53178
49179-50178
50179-51178
47179-48178
48179-49178
45179-46178
46179-47178
43179-44178
44179-45178
41179-42178
42179-43178
2.000
1.000
-1.000
-2.000
-3.000
-4.000
2.000 3,00%
1.000 2,50%
0 2,00%
-1.000 1,50%
-2.000 1,00%
-3.000 0,50%
Baixa variabilidade Alta variabilidade
-4.000 0,00%
Coeficiente variao-comparao
(2007-2008)
9,00%
7,00%
6,00%
5,00%
2007
4,00% 2008
3,00%
2,00%
1,00%
0,00%
106
113
120
127
134
141
148
155
162
169
176
183
190
197
204
211
218
225
232
239
15
22
29
36
43
50
57
64
71
78
85
92
99
1
8
Anlise de Risco
em Aplicaes Financeiras
Marco Antonio Leonel Caetano
ISBN: 9788521211440
Pginas: 264
Formato: 17x24 cm
Ano de Publicao: 2017