Documente Academic
Documente Profesional
Documente Cultură
CREDIBILIDAD
RESUMEN
El objetivo del presente trabajo es mostrar cmo las herramientas estadsticas pueden ser
aplicadas a las tcnicas de seguros.
El anlisis de varianza bsicamente consiste en la descomposicin de las variaciones de una
variable en variaciones atribuibles al comportamiento de un conjunto de variables explicativas y a
otras variaciones de las cuales se desconoce su origen y que reciben el nombre de variaciones
residuales o aleatorias.
A lo largo del trabajo se explica cmo surgen estas variaciones y se desarrolla el clculo de las
mismas, interpretando los resultados obtenidos.
Una vez presentada esta herramienta de anlisis de varianza, se esquematizarn los principios de
la teora de la credibilidad, tcnica sta empleada en el clculo de las tarifas de los seguros
patrimoniales.
Uno de los criterios utilizados para el clculo de los factores de credibilidad es el criterio de
Bulhmann que, justamente se basa en esta comparacin de varianzas.
Se mostrar entonces la semejanza que se observa entre las frmulas que se utilizan en el clculo
del factor de credibilidad aplicando el criterio de Bulhman y las empleadas en la tcnica de
anlisis de varianza.
Finalmente, se mostrar cmo pueden ser determinados los distintos valores mediante la
aplicacin de la herramienta Anlisis de varianza de un factor obrante en la planilla de Excel.
Las variables dependientes varan no slo en funcin del conjunto de variables independientes
incluidas en el modelo sino tambin en funcin de las variaciones que se producen en otro
conjunto de variables independientes desconocidas. El hecho de que no puedan ser incluidas
todas las variables hace que siempre exista una variabilidad aleatoria an cuando las variables
independientes consideradas se mantengan constantes-.
El fin del anlisis de varianza es estudiar esas variaciones y asignar parte de la variabilidad a
dicho conjunto de variables independientes.
De este modo, este anlisis tiene como objetivo determinar cules son las variables
independientes que estn interactuando.
12 22 k2 2
2) Cada una de las k poblaciones analizadas tiene distribucin normal.
3) Cada muestra es independiente y aleatoria, extrada de su respectiva poblacin de
tratamientos.
xij = + i + ij
Esquema de clculo
En cada una de las k poblaciones bajo anlisis, se extraen muestras al azar de acuerdo con el
siguiente esquema:
Poblacin del Poblacin del
tratamiento 1 tratamiento k
1 12 medidas correspondientes
a la poblacin k k2
n1
tamao de la muestra que se extrae nk
(x11 x12 ... x1n1) elementos de cada muestra (xk1 xk2 ... xknk)
x
j 1
1j x
j 1
2j ... x
j 1
ij ... x
j 1
kj
ni k
x
j 1 j 1
ij
xi x1 x2 ... xi ... xk x
Medias de tratamientos
ni
xij
xi
j 1 ni
Media total
k ni
xij
x (1)
i 1 j 1 N
La media total puede obtenerse tambin como promedio ponderado de las medias
correspondientes a cada uno de los tratamientos, del siguiente modo:
k k
xi ni xi ni
x k
N
i 1
n
i 1
i
i 1
k
ya que n
i 1
i N
El objetivo es conocer cunto o cmo se desvan todos y cada uno de los elementos
integrantes de los distintos tratamientos con respecto a la media total.
Esta variacin se simboliza como VT = St
VT = St = ni xij x
k ni
2
(2)
i 1 j 1
Al desarrollar el cuadrado:
x 2 x xij x 2
k ni
2
St = ij
i 1 j 1
k ni k ni k ni
St =
i 1 j 1
x 2 ij 2 x xij x 2 1
i 1 j 1 i 1 j 1
N
k ni
Como N *x =
i 1 j 1
xij 1
Se tiene que:
k ni
St =
i 1 j 1
x 2 ij 2 x ( Nx ) Nx 2
k ni
St =
i 1 j 1
x 2 ij Nx 2
1
La relacin se obtiene a partir de (1)
2
k ni k ni xij
St = x 2
ij N N
i 1 j 1 i 1 j 1
2
k ni
k ni
x ij
St =
i 1 j 1
x 2 ij
i 1 j 1 N
2
k ni
xij
i 1 j 1
Se define c = N
Con lo cual:
k ni
VT = St = i 1 j 1
x 2 ij c (3)
Por el teorema de Fisher, se demuestra que la variacin total tiene una distribucin 2 con (N-1)
grados de libertad.
2
Esto es as ya que se trata de una suma de N variables aleatorias independientes, estandarizadas
y elevadas al cuadrado. Debe recordarse que el nmero de grados de libertad es equivalente al
nmero de variables aleatorias independientes. Si bien las variables consideradas son N, al
centrar las variables se est perdiendo un grado de libertad ya que x es una combinacin lineal
de las mismas; de all, que el nmero de grados de libertad sea N-1.
Se simboliza Se. Al medir las variaciones existentes entre las distintas muestras cada una de
ellas representada por su respectiva media muestral - , debe realizarse la comparacin entre la
2
Se deja constancia que en la frmula presentada en (2) slo se trabaj con la variable centrada elevada al cuadrado. Si se estandarizase, se
obtendra la misma expresin (2) pero dividida por la constante 2 ; lo cual no alterara los resultados posteriores; ya que, como el objetivo es
construir una F Snedecor , al dividir esta 2
por otra 2
y por sus respectivos grados de libertad cada una (definicin de F de Snedecor);
quedara simplificada 2
ya que se supuso su igualdad para todas las poblaciones. Debe tenerse presente este razonamiento para todos los
desarrollos posteriores correspondientes a las distintas variaciones.
media de la muestra correspondiente a cada tratamiento en relacin a la media total. De este
modo, su frmula de clculo est dada por:
k
Se = x
i 1
i x ni
2
Se desarrolla el cuadrado:
x
k
Se = 2
i 2 x x i x 2 ni
i 1
k k k
Se = x i 1
2
ni 2 x x
i 1
i ni x 2 ni
i 1
Sabiendo que:
x n
i 1
i i N x 3
Se obtiene:
k
Se = x 2
i ni 2 x N x 2 x 2 N
i 1
k
Se = x
i 1
2
i ni N x 2
ni
xij
Como xi
j 1 ni
Se deduce que:
3
Se obtiene a partir de (1)
2
k ni
xij
Se = n ni N x 2
i 1 j 1 i
2
ni
Se = k
x ij
j 1
N x2
i 1 ni
2 2
ni
k ni
Se = k
x ij
x ij
j 1 i 1 j 1
i 1 ni N
2
ni
Se = k
x ij
j 1
c
i 1 ni
Siguiendo el mismo razonamiento que el aplicado en el caso anterior; y, teniendo en cuenta, por
lo tanto, el teorema de Fisher, se demuestra que S e tiene una distribucin 2 con k-1 grados de
libertad.
Se simboliza Sr. Al medir las variaciones existentes entre los elementos de cada una de las
distintas muestras en relacin a su respectiva media muestral, debe realizarse la comparacin
entre cada elemento de la muestra y su respectiva media. De este modo, su frmula de clculo
est dada por:
S = x xi ni x xi
k k ni
2 2
r ij ij
i 1 i 1 j 1
Al desarrollar el cuadrado:
x 2 xij xi x 2 i
k k
2
Sr = ij
i 1 j 1
Siguiendo el mismo razonamiento que el aplicado en el caso anterior; y, teniendo en cuenta, por
lo tanto, el teorema de Fisher, se demuestra que Se tiene una distribucin 2 con N-k grados de
libertad.
0 : 1 2 k
Se / (k-1)
Sr / (N-k)
4
Es el denominado anlisis de varianza
Cuanto menor sea Se, menor ser el peso de la variacin entre muestras sobre la variacin
residual; y, por lo tanto, se aceptar en este caso la hiptesis nula planteada de igualdad
entre las medias.
4) Se determina la regin crtica. En este tipo de test, la zona de rechazo de la hiptesis nula
se encuentra siempre del lado derecho. De este modo, el punto crtico se escoge a partir
de la distribucin F(k-1; N-k) en funcin del nivel de riesgo utilizado, obteniendo en
consecuencia la regla de decisin.
De este modo, el anlisis de varianza es una prueba de diferencia de medias utilizando las
varianzas; es decir, analizando las variaciones dentro de las muestras y entre las muestras.
Pueden obtenerse de este modo las siguientes conclusiones:
a) si las variaciones entre las muestras son mayores que las variaciones dentro de las
muestras; entonces, se rechaza la hiptesis nula de igualdad entre las medias; y, por lo
tanto, las variaciones se deben a las variaciones entre las muestras.
b) si las variaciones dentro de las muestras son mayores que las variaciones entre las
muestras, se acepta la hiptesis nula de igualdad entre las medias; y, por lo tanto, las
diferencias son debidas a las variaciones dentro de las muestras.
Se supone que durante un perodo de observacin tienen lugar N siniestros de cuantas X1,
X2...XN , respectvamente.
De este modo, los siniestros agregados para el perodo de observacin considerado estn dados
por:
L = ( X1 + X2 +...+XN)
La prima pura correspondiente el aporte que debe realizar cada uno de los expuestos a riesgo
para poder cubrir los siniestros esperados - est dada por
PP = ( X1 + X2 +...+XN) / Expuestos.
A modo de ejemplo, si 300 autos generan siniestros por un total de $120.000 durante un ao, la
$120.000
prima pura que surge de la observacin $400 . La prima pura tambin puede
300
obtenerse a partir del producto entre la frecuencia y la intensidad del siguiente modo:
Se concluye entonces que la prima pura puede variar tanto por variaciones producidas en la
frecuencia como por variaciones producidas en la intensidad.
La varianza de la prima pura observada para un riesgo dado que se debe a variaciones aleatorias
5
se conoce como varianza del proceso.
Credibilidad parcial
Cuando se trabaja con credibilidad total, se asigna el 100% de credibilidad a las observaciones
propias.
Sin embargo, cuando existe menos informacin que la necesaria para obtener credibilidad total,
debe asignarse menos del 100% a dichas observaciones.
Sea n el nmero esperado de siniestros para cierto volumen de informacin y n f el necesario para
credibilidad total. De este modo, la credibilidad parcial asignada est dada por:
5
Es la llamada variaciones dentro de las muestras en el anlisis de varianza, conocida tambin como. process
variante.
n
Z
nf
El factor de credibilidad propuesto por Buhlmann est dado por la siguiente expresin:
Z = N/ (N+h)
Mientras que el valor N se refiere, segn lo que se est estimando, a nmero de siniestros al
estimar costo medio - o nmero de expuestos al estimar frecuencia- .
LOCALIDAD A1 A2 A3 Ai Ar
COMPAA
6
En el modelo no es necesario establecer hiptesis alguna ni sobre la distribucin que gobierna a los riesgos
individuales ni sobre la distribucin a priori de los parmetros de riesgo.
7
Puede analizarse la frecuencia esperada, el costo medio o intensidad esperada o la prima pura esperada .
C1 X11 X21 X31 Xi1 Xr1
..
..
Media hipottica
Se define como media hipottica al promedio correspondiente a un tipo de riesgo que rene
ciertas caractersticas en particular. En el ejemplo, el promedio se refiere a la prima pura y la
caracterstica analizada es la localidad. Es decir, es la esperanza condicional dado que se
observaron las caractersticas mencionadas.
Se define como:
8
No todas las compaas aseguradoras operan en todas las localidades; con lo cual, la cantidad de datos por
localidad puede ser variable. En este caso, el esquema sera igual al presentado en anlisis de varianza.
9
Resulta equivalente a r*s si se posee informacin de todas las compaas en todas las localidades.
ni es el total de observaciones efectuadas en la localidad i.10
En consecuencia, esta varianza mide las variaciones existentes entre el promedio de la localidad
en particular respecto al promedio de todas las localidades.
De este modo, cuanto ms parecidas sean las primas puras cobradas en las distintas localidades,
menor ser el valor de esta varianza.
La mayor dispersin entre los valores cobrados se reflejar en un mayor valor de varianza de las
medias hipotticas.
Cada una de las localidades tendr un valor esperado y una varianza. El valor esperado por
localidad es la media hipottica calculada previamente.
Mide las variaciones de la prima pura cobrada por cada compaa aseguradora en la localidad i
respecto a la prima pura promedio cobrada en la mencionada localidad correspondiente a la
totalidad de las compaas aseguradoras que operan en la misma. En consecuencia, de no existir
diferencias entre lo que cobran las distintas compaas en la localidad, la varianza tender a cero.
El valor esperado de la varianza del proceso es entonces el promedio ponderado de las varianzas
del proceso de cada una de las posibles combinaciones de factores que determinan el riesgo en
nuestro ejemplo la localidad-.
VEVP = V(Ai)/r
El menor valor de este valor esperado implica que las variaciones entre las primas cobradas por
las distintas compaas en una misma localidad son pequeas.
10
Depender de la cantidad de compaas que operen en la localidad i.
De este modo, puede demostrarse que la varianza total se descompone en el valor esperado de la
varianza del proceso y la varianza de las medias hipotticas.
Varianza total = Valor esperado de la varianza del proceso + Varianza de las medias hipotticas.11
h = VEVP/VMH
De modo que h ser mayor cuanto mayor sea el valor esperado de la varianza del proceso.
Cuanto menor sea el mencionado valor, se podr explicar la mayor parte de la varianza total a
partir de las variaciones observadas entre las medias hipotticas y, en consecuencia, menor ser el
factor h y mayor credibilidad Z se dar al valor o valores observados, provenientes de nuestra
propia experiencia.
Es claro que a mayor valor de h, menor ser la credibilidad otorgada a la experiencia propia del
asegurado. Resulta absolutamente lgico entonces que el factor h surja como el cociente
mencionado ya que a mayor diferencia entre los valores esperados o medias de las distintas
localidades hiptesis - , se le da mayor peso a la experiencia propia, a menor varianza
explicada, menor credibilidad.
11
Corresponde al concepto de descomposicin de variaciones totales introducido en anlisis de varianza.
Ejemplo
1 30 30
2 33 28
3 26 31
4 31 27
5 30 24
A partir del cuadro se obtienen las primas puras promedio correspondientes a cada una de las
localidades y sus varianzas:
x1 30 33 26 31 30 5 30
x2 30 28 31 27 24 5 28
2
1 30 30 33 30 26 30 31 30 30 30 4
2 2 2 2 2
2
1 6,5
2
2 30 28 28 28 31 28 27 28 24 28 4
2 2 2 2 2
2
1 7,5
A partir de los resultados previos, se determina el valor esperado de la varianza del proceso y la
varianza de las medias hipotticas:
2
2
2 6,5 7,5 2 7
VEVP = 1 2
VMH = [ (28-29)2+(30-29) 2] * 5 = 10
VEVP 7
h= 0,70
VMH 10
5 5
Z = 0,70 5 5,70 0,877
El coeficiente obtenido de 0,877 representa la credibilidad que debe asignarse a la prima pura de
la localidad que se est analizando, mientras que el complemento de 0,123 es el peso que debe
asignarse a la prima pura exgena.
En excel existe la funcin Anlisis de varianza de un factor dentro de Anlisis de datos que
permite realizar los clculos correspondientes.
Se muestra la pantalla correspondiente:
donde:
Rango de entrada: debe introducirse la matriz de datos.
Agrupado por: depender de cmo se encuentren ordenados los datos.
En el esquema presentado en este trabajo los datos estn agrupados por columnas.
Debe luego introducirse el nivel de riesgo con el que se trabajar. Si no se introduce, la mquina
automticamente toma el valor 0.05.
Teniendo en cuenta el ejemplo presentado, el programa de excel de anlisis de varianza de un
factor devuelve la siguiente salida.
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 150 30 6,5
Columna 2 5 140 28 7,5
ANLISIS DE VARIANZA
Suma de
Origen de las cuadrado Grados de Promedio de Probabilida Valor crtico
variaciones s libertad los cuadrados F d para F
Entre grupos 10 1 10 1,4285714 0,2662241 5,25930888
Dentro de los
grupos 56 8 7
Total 66 9
Puede observarse que la variacin total (St) es 66 y se descompone en la variacin entre las
muestras (Se) de 10 y la variacin dentro de las muestras o residual (Sr) de 56.
Adems, el promedio de cuadrados entre grupos representa la varianza de las medias mientras
que el promedio de cuadrados dentro de los grupos muestra el concepto de valor esperado de la
varianza del proceso.
Conclusiones
Buhlmann analiza tambin la variabilidad de los valores a estimar comparando los datos
correspondientes a la experiencia propia con los datos correspondientes a otras localidades
externos . No existe como condicin un lmite mximo de datos; como en el caso de
credibilidad total.
Referencias
Nieto de Alba, Ubaldo y Vegas Asensio, Jess, (1993), Matemtica Actuarial, Fundacin
Mapfre Estudios, Madrid
Sarabia Alegra, Jos Mara, Gmez Dniz, Emilio y Vzquez Polo, Francisco Jos, (2007),
Estadstica Actuarial Teora y aplicaciones,Pearson Educacin, Madrid.
Sheldon Lin, (2006), Introductory Stochastic Analysis for Finance and Insurance, Wiley-
Interscience, 1 edition.
Yiu Kuen Tse, (2009), Nonlife Actuarial Models Cambridge University Press