Sunteți pe pagina 1din 13

ASIGNACIN MUESTRAL EN AUDITORA.

ESTRATIFICACIN DE UNA POBLACIN EXPONENCIAL

1. Distribucin del estimador de la media 2. Criterios de asignacin 2.1 Coincidencia de criterios que incorporan la desviacin estndar 2.2 Coincidencia de criterios no basados en la desviacin estndar 3. Estratificacin con un modelo exponencial 3.1 Estratificacin en la mediana 3.2 Estratificacin en la media 3.3 Estratificacin en la medial 3.4 Estratificacin en una proporcin de la media 3.5 Estratificacin en un percentil

Autores: Joan Bar Llins (Departamento de Economa Aplicada. Universidad de Lleida) Ma.Jess Gmez Adilln (Departamento de Economa Aplicada. Universidad de Lleida) Montserrat Mestres Du (Departamnento de Estadstica e Investigacin Operativa. Universidad Politcnica de Catalunya)

Referencia contacto: Ma. Jess Gmez Adilln Departamento de Economa Aplicada Universidad de Lleida Pza. Vctor Siurana, 1 25003 Lleida E-mail. Joan.Baro@econap.UdL.es tel. 973 702031 Fax. 973 702066

ASIGNACIN MUESTRAL EN AUDITORA. ESTRATIFICACIN DE UNA POBLACIN EXPONENCIAL

Joan Bar Llins Ma. Jess Gmez Adilln Montserrat Mestres Du

Resumen: La previa estratificacin de los apuntes constituye una prctica muy frecuente a la hora de preparar la informacin en inspeccin contable. La particin de los registros en categoras excluyentes de datos permite conseguir submuestras desde las que inferir caractersticas vlidas para toda la poblacin en las pruebas sustantivas que realiza el auditor. Aqu slo nos referimos a la estimacin del saldo medio de las cuentas y de resultas del importe total de las cuentas. Comparamos la eficiencia que se deriva de aplicar distintos criterios de fijacin de las submuestras (algunos conocidos y otros propuestos por nosotros de inters ms bien terico) correspondientes a los dos estratos en que se ha dividido la poblacin contable y particularizamos en el supuesto que la distribucin de los registros sea de naturaleza exponencial negativa y en todos los casos estudiados presentamos la ponderacin que correspondera aplicar para el clculo de los tamaos de las submuestras.

ASIGNACIN MUESTRAL EN AUDITORA. ESTRATIFICACIN DE UNA POBLACIN EXPONENCIAL

1. Distribucin del estimador de la media Consideremos una poblacin de la que deseamos estimar su media1 y que para ello contamos con dos estratos desde los que elegiremos submuestras aleatorias que permitirn obtener el estimador, el intervalo de confianza y en su caso decisiones acerca de algn contraste paramtrico. Damos por hecho que una particin de todo el colectivo de datos en tan solo dos estratos es una simplificacin de lo que puede realizar el auditor cuando aplica muestreo estadstico y que una estratificacin mltiple se acercara ms al trabajo preliminar de preparacin de la informacin en auditora. En todo caso operar con dos grupos de datos no es una prctica inusual y siempre ser mejor que aplicar directamente muestreo aleatorio puro a toda la poblacin2. As pues a pesar de contemplar parcialmente el muestreo estratificado, abarcamos un mbito que posee suficientes aplicaciones para justificar su anlisis. Es el caso de una cartera con dos categoras bien definidas de clientes, dicotoma en las imputaciones a alguna cuenta de gastos, registros que no alcanzan o por el contrario superan determinado importe, etc. La TABLA I recoge los parmetros ms significativos de cada uno de los dos estratos y de la poblacin TABLA I 1er estrato 2 estrato poblacin tamao f1 f2 1 media 1 2 cuanta q1 q2 1 variancia 12 22 2

fi, i y i2 son suficientemente conocidas y qi es la expresin de la masa de variable contenida en el i-simo intervalo, de modo que representa la fraccin del importe total de los registros fi i qi = Ambos estratos forman parte de una misma poblacin, tienen tratamiento diferenciado en la fase descriptiva de la estadstica pero consideracin conjunta en la fase inferencial. Tanto la media como la variancia de toda la poblacin satisfacen las relaciones bsicas = f1 1 + f2 2 2 = f1 12 + f2 22 + f1 ( 1- )2 + f2 ( 2- )2 El estimador por punto de la media poblacional ( ) resulta de una combinacin lineal de las medias muestrales ( X i)
= f1 X 1 + f2 X 2 tal que es insesgado y con variancia mnima E( ) = Var( ) = f12 12/n1 + f22 22/n2

2. Criterios de asignacin La particin en dos estratos de toda la poblacin admite distintos procedimientos para determinar el tamao de cada una de las dos submuestras (n1, n2) y en todos los casos sern una fraccin de la muestra total (n). La asignacin simple (SIM) fija igual tamao para cada estrato, lo que supone un criterio rpido y fcil, slo recomendable cuando los dos grupos en que se ha dividido la poblacin presentan caractersticas muy similares. En un intento de alcanzar mayor representatividad puede realizarse una asignacin proporcional al tamao de los estratos (PTE) lo que al menos garantiza una composicin muestral igual al reparto de la poblacin, cuestin que apunta una cierta lgica y es tanto ms recomendable cuanto ms desiguales sean los grupos. La dispersin que presentan los datos dentro de cada estrato podra sugerir un nuevo sistema de asignacin; esto es, adems de tener en cuenta el tamao de los grupos habra que primar aquel que tuviera mayor heterogeneidad y penalizar el bloque de datos ms homogeneos, para el que se puede conseguir informacin suficiente con menor cantidad de muestra. Este mtodo sugiere proporcionalidad con el tamao y la dispersin de cada estrato, medida a travs de la desviacin estndar y puesto que es el que proporciona menor variancia de la familia de estimadores propuestos recibe el nombre de asignacin ptima (OPT)3. La asignacin valoral (VAL) utiliza como criterio de ponderacin la masa de variable contenida en cada grupo, de tal modo que los estratos que registran mayores importes totales sern los de mayor extensin muestral. Este procedimiento es el que mejor resuelve el problema del auditor que prefiere invertir el tiempo en documentos, archivos o conglomerados de datos de cierta envergadura antes que dedicarse a otros menos relevantes4. Con el fin de ampliar la lista, que no completarla, nos referimos a dos nuevos criterios de proporcionalidad, no tanto por lo extendido de su uso como por las posibilidades que se adivinan en auditora y sobre todo como referente para compararlos con los anteriores procedimientos descritos. Nos referimos a la asignacin proporcional al tamao y a la masa de variable (PTM) y a la asignacin proporcional al tamao, desviacin estndar y masa de variable (PTDM) que tendran la consideracin de aadir a aquellos otros mtodos algo parecido a un beneficio de oportunidad por la cuanta de los estratos y que inicialmente no se haba contemplado. Conscientemente hemos renunciado a analizar la asignacin ptima con costes, procedimiento de uso muy extendido en las aplicaciones del muestreo estratificado en otros mbitos pero raramente utilizada en auditora contable. Veamos en la TABLA II las expresiones de los tamaos de cada una de las dos submuestras, en funcin de la muestra global

TABLA II submuestra del i-simo estrato (ni con i=1,2) n 2 fi n fii n fi i fi i n = qi n fiqi n fi qi fii qi n fi iqi

asignacin simple (SIM) proporcional al tamao de los estratos (PTE) ptima (OPT) valoral (VAL) proporcional al tamao y masa de variable (PTM) proporcional al tamao, desviacin estndar y masa de variable (PTDM)

En determinadas condiciones existen coincidencias claras entre los criterios de asignacin, algunas de deduccin inmediata y muy conocidas y otras no tan obvias pero fciles de resolver, por lo que nos limitamos a su resea. La TABLA III recoge las relaciones paramtricas necesarias para que dos procedimientos asignen los mismos tamaos de muestra a cada uno de los dos estratos TABLA III PTE SIM f1=f2=0,5 PTE OPT f1 1=f2 2 1=2 OPT VAL q1=q2=0,5 f1=q1; f2=q2 2 1= 1 2 VAL PTM f1=q2; f2=q1 q1=q2=0,5 q2 1=q1 2 f1=f2=0,5 PTM PTDM f1 1q1=f2 2q2 q1 1=q2 2 q1=q2=0,5 f1 1=f2 2 1=2

2.1 Coincidencia de criterios que incorporan la desviacin estndar Hagamos algunas reflexiones acerca de las condiciones de igualdad de criterios que hemos encontrado. Por lo que hace a las identidades que incorporan desviaciones estndar, tenemos que a) 1=2, exige la misma dispersin en los dos estratos, cuestin difcil de encontrar en general, salvo que se tratara de grupos construidos de forma aleatoria desde la poblacin bsica, lo cual no tiene mucho sentido prctico en auditora. b) f1 1=f2 2, al margen de otras posibilidades casuales esta condicin supone partir de una distribucin poblacional simtrica y haber construido grupos desde una ordenacin previa de todos los datos y aplicar una particin en la mediana Coeficiente de asimetra = 0 X/X<Me 1er estrato X/X>Me 2 estrato

Cabe notar que este supuesto incluye la condicin anterior cuando se utiliza la mediana como frontera entre los estratos ya que ahora f1=f2=0,5.

c) q1 1=q2 2, supone que las desviaciones estndar ponderadas por las respectivas masas de variable sean iguales en los dos estratos. Ello exige como condicin necesaria, aunque no suficiente, que el grupo que presenta mayor valor contabilizado sea tambin el de menor dispersin; hara falta adems que la relacin entre masas de variable en cada estrato fuese inversa a la que hay entre sus desviaciones estndar q1 2 = q2 1 d) f1 1q1=f2 2q2, incorpora nuevos parmetros a la relacin anterior por lo que la hace de difcil cumplimento en la prctica, salvo por puro azar e) 2 1= 1 2, exige la misma dispersin relativa en cada estrato ya que hay coincidencia en los coeficientes de variacin de Pearson que presentan 1 2 = 1 2 f) q2 1=q1 2, implica igual relacin entre las desviaciones estndar que entre los importes acumulados en cada estrato q2 2 = q1 1

2.2 Coincidencia de criterios no basados en la desviacin estndar Las identidades que no consideran la dispersin dentro de cada bloque y por tanto no incluyen las desviaciones estndar son de lectura inmediata y lo suficientemente obvias como para evitar cualquier comentario genrico. A pesar de ello, contemplaremos el caso particular de grupos construidos en funcin de que los datos sean menores o mayores a determinado umbral prefijado por el auditor; as, los registros por cuantas inferiores a pertenecern al primer estrato y los contabilizados por importes superiores a sern incluidos en el segundo estrato. La distribucin emprica de la variable objeto de estudio y sus acumulaciones podran presentar las formas descritas en los GRFICOS 1 Y 2 GRFICO 1 GRFICO 2

prim estrato er apuntes

s egundo estrato

1 q2 f2

acum. apuntes acum. v alores

q1

f1

0 valores registrados v alores registrados

Tanto la distribucin ordinaria como la acumulada responden al comportamiento de muchas cuentas: un nmero relativamente alto de registros pequeos, que va disminuyendo en intensidad cuando las cifras aumentan, hasta encontrar frecuencias muy bajas para los apuntes de mayor cuanta. Ello confiere a la mayora de las

poblaciones contables una distribucin con forma exponencial decreciente. El diagrama de concentracin responde a la funcin de Lorenz y representa el lugar geomtrico de acumulaciones de frecuencias (registros) i masa de variables (valores registrados), de tal modo que cuanto ms alejada est la funcin efectiva del reparto de la diagonal del cuadrado tanto mayor concentracin de valores est registrando (GRFICO 3)

GRFICO 3

acu v m. alores 1

f1

a cum .registros

Planteamos pues las conclusiones que se derivaran al asumir cada una de las identidades que originan equivalencia entre criterios de asignacin, con estratificacin a partir de un truncamiento de toda la poblacin en . a) f1=f2=0,5, cuando el umbral que discrimina los estratos coincide con el centro posicional de todos los valores registrados (=Me); ello supone considerar dos grupos de igual tamao, uno con los registros inferiores y el otro con los de mayor cuanta. b) q1=q2=0,5, ahora el truncamiento se produce en la medial (=Ml); en este punto los registros ordenados quedan divididos en dos bloques de igual importe acumulado y no necesariamente igual nmero de apuntes. c) f1=q1 y f2=q2, cualquiera de estas condiciones es consecuencia de la otra y ambas implican operar en una poblacin en la que no hay concentracin de datos. Determinada proporcin de registros absorbe la misma cuanta de valores, ello supondra situarnos en la bisectriz del diagrama de concentracin en la figura anterior. d) f1=q2 y f2=q1, estas identidades tambin son corolarios la una de la otra y deben interpretarse en el sentido, poco prctico, que la proporcin de apuntes de un estrato coincide con la fraccin del importe total de lo incluido en el otro estrato. El punto de truncamiento ha de ser tal que en el diagrama de concentracin el rea del rectngulo de medidas q1 y f1 sea la misma que la del rectngulo de medidas q2 y f2.

3. Estratificacin con un modelo exponencial Hemos visto en el epgrafe anterior que muchas cuentas contables presentan una distribucin de sus valores de tipo exponencial. En lo que sigue modelamos la particin de la cuenta en una ordenacin de datos basada en dicho modelo.

Las funciones de densidad f (x), de distribucin F (x) y de masa acumulada de variable q (x), definidas para valores no negativos de la variable, presentan las formas
f (x) = e- x F (x) = 1 - e- x

con

x 0 x 0 con x 0

con

q (x) = 1 e- x(1+ x)

y la curva de concentracin de Lorenz, que relaciona acumulaciones de importes y registros q (x) = [ 1 F (x)] ] ln[ 1 F (x)] [ ] + F (x)

Con esta informacin previa, para cualquier punto crtico , presentamosen la TABLA IV los parmetros de los dos estratos en que hemos dividido la poblacin TABLA IV tamao 1er estr. f1=1-e- media 1=
1 e (1+) (1 e )

cuanta q1=1 e1 (1+ )


q2=e- (1+ )

variancia 12= 1 2 e 2 (1 e )2

2 estr.

f2=e-

2=

1 + 1

22=

1 2 1 2

poblac.

2 =

Podemos comprobar que el segundo estrato presenta un desplazamiento de la media igual al nuevo origen de registros y que la variancia coincide con la de toda la poblacin. A partir de aqu es posible deducir las expresiones de los tamaos de cada una de las dos submuestras (TABLA V). El peso ponderativo o proporcin que hay que asignar a la muestra total viene dado en el siguiente cuadro, cuyas frmulas no siempre son de cmoda aplicacin TABLA V asignac. SIM PTE OPT VAL PTM peso 1er estrato 0,5
1 e
e2 e (2+ 2 2 ) 1 + e 2 e (2+ 2 2 ) 1 + 1 + 1 e (1+) e 2 e (2+) +(1+ ) 2

peso 2o estrato 0,5


e

1 e e (2+ 2 2 )+1 + 1
e (1+ )

1 + e
2

e (2 + ) + 2 1+ ) ( 1 1 + 1

e (2 + ) + 2 1+ ) ( 1

PTDM

e e2 e(2+22)+1 1+ e e2 e(2+2 2) 1 + 1+

e e 2 e (2+ 2 2 )+1 1+ 1 + 1

A continuacin presentamos expresiones ms operativas como resultado de truncamientos en puntos notables de la distribucin.

3.1 Estratificacin en la mediana Muchas veces la revisin contable parte de dos colectivos iguales de datos; registros de valores elevados y registros de menor importe, de tal modo que constituyan conglomerados con la misma extensin. La mediana es el valor de la variable que divide en dos partes iguales la distribucin (=Me) y en el modelo exponencial es ln 2 Me = La TABLA VI muestra el valor de los distintos coeficientes y medidas en el punto de corte de la mediana

TABLA VI 1 = 0,30685 2 1 1 = 1,69315 12 = 0,03909 22 = 1 2 1 2

f1=0,5 f2=0,5

q1=0,15343 q2=0,84657

y la TABLA VII contiene la fraccin de la muestra total correspondiente a cada estrato TABLA VII asignacin SIM PTE OPT VAL PTM PTDM peso 1er estrato 0,5 0,5 0,16508 0,15343 0,15343 0,03459 peso 2o estrato 0,5 0,5 0,83492 0,84657 0,84657 0,96541

3.2 Estratificacin en la media Cuando el punto de truncamiento coincide con el valor medio de los registros 1 = = encontramos nuevas medidas en la ley exponencial y las submuestras resultantes de cada criterio de asignacin (TABLAS VIII y IX) TABLA VIII 1 = 0,41802 2 = 2 1 1 12 = 0,07932 22 = 1 2 1 2

f1=0,63212 f2=0,36788

q1=0,263424 q2=0,73576

TABLA IX

asignacin SIM PTE OPT VAL PTM PTDM

peso 1er estrato 0,5 0,63212 0,32612 0,26424 0,38161 0,14807

peso 2o estrato 0,5 0,36788 0,67388 0,73576 0,61839 0,85193

3.3

Estratificacin en la medial

Si creamos los estratos a izquierda y derecha de la medial, dividimos la poblacin en dos grupos ordenados de datos que acumulan una misma cantidad de importes registrados. En el modelo exponencial despus de varias iteraciones hemos encontrado 1 = Ml = 1,67835 y los parmetros y pesos de las dos submuestras sern (TABLAS X y XI)

TABLA X 1 =0,61476 2 1 1 =2,67838 12 = 0,20505 22 = 1 2 1 2

f1=0,81332 f2=0,18668

q1=0,5 q2=0,5

TABLA XI asignacin SIM PTE OPT VAL PTM PTDM peso 1er estrato 0,5 0,81332 0,66363 0,5 0,81332 0,66363 peso 2o estrato 0,5 0,18668 0,33637 0,5 0,18668 0,33637

3.4 Estratificacin en una proporcin de la media Una extensin de la particin en la media la constituye cualquier estratificacin en un punto proporcional a la media k = k = En realidad cualquier punto de truncamiento para los dos grupos de registros puede expresarse como una proporcin de la media de todos ellos y los parmetros en cada estrato vienen dados en funcin del coeficiente multiplicador k, como muestra la TABLA XII TABLA XII 1 =
k 1 1 e (1 + k) 1 e k

f1= 1 e
f2= e k

q1=1 e

(1 + k)

12=

2k e k(2+ k 2 ) 1 1+ e

(1 e k )2

2 =

q2= e k(1 + k)

22=

1 2

Segn el valor asignado a k distinguimos distintas soluciones y cuantificamos los parmetros y pesos para cada submuestra. Acabamos de estudiar el supuesto k=1 (particin en la media); veamos tan solo otros dos casos, para no alargar intilmente la exposicin. Cuando k=2 creamos estratos a izquierda y derecha del doble de la media; el auditor podra plantearse como mtodo de trabajo el tratamiento del bloque de apuntes con importes superiores a dos veces el promedio y el resto de registros en otro bloque (TABLA XIII).

TABLA XIII asignacin SIM PTE OPT VAL PTM PTDM peso 1er estrato 0,5 0,86466 0,77043 0,59401 0,90336 0,83080 peso 2o estrato 0,5 0,13534 0,22957 0,40599 0,09664 0,16920

Si hubiramos fijado k=0,5, la particin crea dos grupos a izquierda y derecha de la mitad de la media. Ahora el bloque de registros con cifras inferiores al 50% del promedio constituira un primer estrato, probablemente residual, y el resto de apuntes el segundo conglomerado, en el que razonablemente debe caer el peso de la revisin (TABLA XIV). TABLA XIV asignacin SIM PTE OPT VAL PTM PTDM peso 1er estrato 0,5 0,39347 0,19128 0,09020 0,06043 0,02291 peso 2o estrato 0,5 0,60653 0,80872 0,90980 0,93957 0,97709

3.5 Estratificacin en un percentil Si lo que pretendemos es crear estratos de un tamao determinado que representen porcentajes complementarios del total de los apuntes debemos acudir al clculo de los centiles Cj de la distribucin ordenada. As, Cj representa el punto de segmentacin de dos subpoblaciones, la que recoge el j por ciento de los registros de menores importes y la que absorbe el el resto, esto es el 100-j por ciento de los apuntes de mayor cuanta = Cj , tal que F (Cj) = j/100

En el modelo exponencial el clculo de la j-simo centil se obtiene de inmediato sin ms que aplicar la funcin de distribucin Cj = 1 100 ln 100j

y las mediadas de los estratos resultantes de la particin vendrn dadas en funcin de Cj (TABLA XV)

TABLA XV 1 1+ + 100 j 100 j + ln j 100 1= 2= 100 j 1 1 ln 100

f1=

j 100

j q1= + 100 + 100 j 100 ln 100 j 100

12=

1 2

100 100 j ( ) 2 100 j ln 2 j 100

f2=

100 j 100

q2=

100 j 100 j 1 ln 100 100

22=

1 2

Un caso particular ya estudiado es la mediana, coincidente con el quincuagsimo centil C50 . Otros supuestos que podran darse son particiones en el primer o tercer cuartil C25 y C75 (TABLAS XVI y XVII). TABLA XVI asignacin SIM PTE OPT VAL PTM PTDM peso 1er estrato 0,5 0,25 0,0269 0,0342 0,0117 0,0009 peso 2o estrato 0,5 0,75 0,9731 0,9658 0,9883 0,9991

TABLA XVII asignacin SIM PTE OPT VAL PTM PTDM peso 1er estrato 0,5 0,75 0,3044 0,4034 0,3302 0,2281 peso 2o estrato 0,5 0,25 0,6956 0,5966 0,6698 0,7719

____________________________

Las pruebas sustantivas en auditora aplican la misma metodologa para evaluar una media que para evaluar el importe total de una cuenta. Si estamos interesados en la estimacin de un saldo total basta con multiplicar la media por el tamao de la poblacin.
2

Es sabido que el muestreo estratificado permite conseguir estimadores ms eficientes que el muestreo aleatorio puro, lo que se traduce en el requerimiento de un tamao muestral menor. Esta ventaja aade mayor eficiencia cuantos ms estratos hagamos en la poblacin.
3

La asignacin ptima tambin recibe el nombre de asignacin de Neyman. J.Neyman fue el primero en abordar la minimizacin de la variancia para un tamao muestral fijo.
4

Una aproximacin al criterio de asignacin valoral la encontramos en el muestreo de unidad monetaria.

Las pruebas sustantivas en auditora aplican la misma metodologa para evaluar una media que para evaluar el importe total de una cuenta. Si estamos interesados en la estimacin de un saldo total basta con multiplicar la media por el tamao de la poblacin. 2 Es sabido que el muestreo estratificado permite conseguir estimadores ms eficientes que el muestreo aleatorio puro, lo que se traduce en el requerimiento de un tamao muestral menor. Esta ventaja aade mayor eficiencia cuantos ms estratos hagamos en la poblacin.

S-ar putea să vă placă și