Sunteți pe pagina 1din 7

16(2):77-83; abril, 1985

EVALUACIÓN INFORMÉTRICA DE FLUJOS


INFORMACIONALES DE PUBLICACIONES SERIADAS
SOBRE LA BASE DE UNA MODELACIÓN MATEMÁTICA
MULTIDIMENSIONAL

Melvyn Morales-Morejón
Teresa Sánchez
Ernesto Menéndez

Consideraciones generales

Una de las primeras y más importantes limitaciones en las evaluaciones de


flujos internacionales aparecidas en la literatura mundial es el empleo de
una sola variable, tal cual se observa en la mayoría de los estudios
publicados en los últimos tiempos. Dicha variable puede consistir en el uso
de la frecuencia de extractación en los servicios de resumen, frecuencia de
citas en los servicios de indización (por ejemplo, incluyendo indicadores
como el factor de impacto. Índice de prontitud de cita, vida media, etc.), o la
frecuencia de uso en sala de lectura, el préstamo interbibliotecario, la
evaluación de expertos, la solicitud de reproducción de artículos de las
publicaciones seriadas, etc.

En la literatura especializada se considera que la variable de extractación de


la literatura en las fuentes es criterio suficiente para definir el conjunto de
publicaciones seriadas básicas (núcleos) en una temática dada. Estamos de
acuerdo en que se trata de un criterio seguro, que puede ser tomado en
consideración en la evaluación de un flujo informacional determinado; sin
embargo, también estimamos que absolutizar ese enfoque, por muy objetiva
que sea la variable, no nos daría una realidad totalmente objetiva, ya que no
parte de la concepción dialéctica materialista que debe regir todo proceso
informativo correctamente concebido, en particular en lo que se refiere a la
evaluación de los flujos informacionales, tal como se plantea que “. . . el
principio universal del desarrollo tiene que ser combinado, vinculado, unido
al principio universal de la unidad del mundo, de la naturaleza, del
movimiento de la materia, etc. . . “.1

El análisis de los flujos informacionales debe enfocarse como una


modelación de fenómeno no sometido a una ley prefijada, sino que tiene que
revelar sus propias leyes de formación y estructura. Si se parte de este
criterio, en necesario aplicar una modelación matemática que muestre lo
específico de la unidad de estructura de las relaciones entre los sistemas y
procesos informativos y su interrelación con las necesidades informativas de
1
Lenin V.I.. Cuadernos Filosóficos. La Habana. Editora Política, 1964.
las actividades económicas, lo que indica una gran diversidad de elementos,
en el sistema de flujo informacional, que se deben tener en cuenta para
definir aproximadamente el núcleo real de publicaciones seriadas de una
temática dada.

La combinación de un modelo matemático de las variables antes


mencionadas y de otras más, daría una mayor precisión y confiabilidad a las
publicaciones seriadas, haciéndolas para satisfacer las necesidades
informativas de una actividad económica dada, lo cual superaría la limitación
que aparece en la mayoría de los estudios sobre flujos informacionales. De
ahí que se debe buscar un modelo matemático que permita realizar dicha
evaluación, tomando en consideración varios indicadores, es decir, diversas
variables. Las características de comportamiento de los flujos
informacionales aconsejan la utilización de métodos probabilísticos-
estadísticos para definir las publicaciones seriadas que se deben garantizar
para la organización de un servicio de información. Para estos fines se debe
recurrir a una base de datos impresa o en portadores magnéticos. Por regla
general, se establece el cubrimiento óptimo en un 80%; en el peor de los
casos, por limitaciones económicas, se puede aceptar hasta el 60%. En
casos de porcentajes de cubrimiento superior a los señalados se puede
intentar superar el déficit por medio de la colaboración internacional con
homólogos en otros países, primordialmente dentro del marco del Sistema
Internacional de ICT (SIICT) de los países miembros del CAME.

Se pueden emplear diversos modelos matemáticos en el análisis de un flujo


informacional dado de publicaciones seriadas; sin embargo, es importante
señalar que “la vida del entorno de las revistas es tan dinámica, que seguir
la pista a los cambios que surgen (y lo más importante, actuar a tiempo
sobre estos cambios) es en la mayoría de los casos un problema sin
solución”,2 como ocurre en las investigaciones realizadas en el marco del
Sistema Internacional de Información Científico-Técnica para la selección de
las publicaciones seriadas relevantes con miras al intercambio de las mismas
en microfichas. A este respecto, se han realizado investigaciones en las
bases de datos del VINITI, INSPEC, BIOSIS, CAS, SCI, etc, sin descuidar los
intereses de las instituciones y la accesibilidad a las publicaciones seriadas
de los países miembros del CAME.

Aplicación de modelo matemático unidimensional: J1


cuadrado

El estudio realizado con la base de datos del INSPEC abarcó un volumen de


23 188 artículos, seleccionados de 1 426 títulos de revistas, 124 de los
cuales eran componentes de núcleo de dicho flujo. Se siguió la metodología
elaborada por especialistas del VINITI y de CINTI y se realizó un análisis
2
Karina, I. Vyjjavvlenie vnutrennnei tematicheskoi struktury periodicheskoi literatury, ovrabattyvalnoi
avtomatizirovannymi informacionnymi sistemami V Mezhdunarodnyi simpozium bazy dannyykh v oblasti NTI.
Moskva, 1982.
pormenorizado desde el punto de vista de la frecuencia con que se
distribuyen los artículos de estas revistas según las 7 principales rúbricas
temáticas utilizadas en el INPEC-C:3

1. Cuestiones generales de automatización y computación (C)


2. Teoría de dirección automática (C 1)
3. Tecnología de la dirección automática (C 3)
4. Análisis numérico y teoría de la técnica de computación (C 4)
5. Aseguramiento de equipos de computación (C 5)
6. Aseguramiento de programas para computadoras (C6)
7. Aplicación de computadoras (C 7)

En este estudio se empleó, en calidad de distancia para el análisis de


Cluster, una variable (palabras clave de los resúmenes como perfil de los
títulos de las revistas), basada en la prueba de J 1- cuadrado.

l ( Xij - eij )2 ( Xil - eil )2


dij =  +
i=1 eij eil

l
donde eij = ( Xij + Xij ) =  Xij / Njl
i=1

l
eij = ( Xil + Xil ) =  Xil / Njl
i=1

siendo j y l - dos revistas (cluster o conglomerados)

xij - frecuencia de la rúbrica tem[atica l-ésima en la revista


l
Njl (Xij + Xil )
=

i=1

l - Total de temáticas

3
Opus cit. No. 2
Aunque este estudio partió de un análisis preliminar de tres criterios, la
aplicación de J1- cuadrado se realiza sólo con el fin de revelar la estructura
temática de las publicaciones seriadas mediante clusters (conglomerados) y
en su modelación matemática se utiliza una sola variable.
Independientemente de que es válida su aplicación para el caso analizado,
se considera que este tipo de estudio debe conjugar integralmente, en una
unidad, este factor con otros (evaluación de expertos, por ejemplo) que
pongan de manifiesto su unidad y utilidad para una actividad económica
dada, con el propósito de seleccionar las publicaciones seriadas más
apropiadas para este tipo de servicio informativo. Toda selección de conjunto
de publicaciones seriadas para organizar un servicio informativo cualquiera
debe considerar varias características o variables que se integran en una
unidad para su análisis correspondiente. Con este fin, se propone la
búsqueda de un modelo matemático que considere en su unidad dialéctica
diversas variables sobre el flujo informacional que se va a evaluar.
Consecuentemente se analizaron los resultados obtenidos por Erdeljan en su
trabajo “Análisis discriminante y su aplicación” 4 y se encontró un modelo
matemático que permite evaluar un universo de publicaciones seriadas con
más de un indicador o variable.

A partir de un estudio pormenorizado del trabajo del Prof. Dr. Vitomir


Erdeljan, se determinó que su análisis comparativo sobre los métodos para
calcular la distancia es lo suficientemente exhaustivo para expresar que la I-
Distancia de Ivanovic cumple las condiciones necesarias como modelo
matemático, para evaluar flujos infomacionales a partir de varias variables
que no participan con igual medida en la discriminación de los universos
analizados.

Modelo matemático multidimensional: i-distancia de


Ivanovic

Todo lo expuesto anteriormente y la demostración matemática realizada por


Erdeljan explican la aplicación de la I-Distancia de Ivanovic a los flujos
informacionales, como caso particular de la informetría.

Si un flujo informacional de publicaciones seriadas en una base de datos


determinada se ordena el conjunto de r títulos de publicaciones seriadas,
atendiendo a n indicadores o variables (como, por ejemplo, evaluación de
expertos, frecuencia de extratactación, frecuencia de citas, factor de
impacto, índice de prontitud de citas, demanda de copias de artículos, etc.)
éste se puede expresar mediante la matriz siguiente:

PUBLICACIONES VARIABLES CONSIDERADAS


1 2 3 n

4
Erdeljan, V. “Análisis discriminante y su aplicación”. Ciencias, Serie 1 Matemática No. 7, Dic. 1973.
P1 x11 x12 x13 x1n
P2 x21 x22 x22 x2n
Pr xr1 xr2 xr3 xrn

El criterio de ordenamiento de las publicaciones seriadas se establece en


función de las distancias de cada una de ellas con respecto a una publicación
seriada patrón.

La publicación seriada patrón se puede establecer a partir de dos criterios; la


peor (P-) cuando los valores de cada una de las variables sean peores, en
nuestro caso es igual a cero y la mejor (P+) cuando los valores alcanzan los
mayores valores en cada una de las variables consideradas.

El título de la publicación seriada más relevante o importante con respecto a


(P-) es aquel cuya distancia sea mayor a la publicación patrón y en el
segundo caso es aquel título que se aproxime más a (P+).

La I-Distancia exige un ordenamiento ordenado de las variables; este criterio


de ordenamiento de las variables puede ser creciente o decreciente, de
acuerdo con los intereses u objetivos del trabajo.

La distancia de una P1 cualquiera a la publicación patrón P, según la matriz


anteriormente señalada, se define a partir de:

n Xij - Xj* j-1


D-I (F1, F*) =
  ( 1 - j k ) [1]
J=1 j k=1

donde

P: publicación seriada patrón


j: desviación típica de la variable j
jk: coeficiente de correlación de Pearson entre variables x j y xk

Los valores de j y jk se estiman a partir de los datos por:

{
n
1
Sj =  ( X – X )2
n-1 i=1 ij j
}
donde:

n
1 j k =
x
r  X j
i=1

se calcula según la expresión para determinar el coeficiente de Pearson:

n
 ( Xij - Xj ) (Xi k - Xk )
i=1
j k =


n n
 ( Xij - Xj )
2
 (Xi k - Xk )2
i=1 i=1

siendo:
n
1
X =
j
X
n i=1 ij

y
n
1
X =
k
X
n i=1 ik

Xj  1, 2, 3, 4, ..., n y n es el número total de títulos de publicaciones


seriadas evaluadas.
Para calcular la distancia D (P ij , P) de un título con respecto a la publicación
patrón, es imprescindible tener establecido el orden o criterio de importancia
de cada una de las variables. Si no se conoce el criterio de ordenamiento de
las variables, se define la más importante y a continuación se define la
siguiente en importancia según el valor del coeficiente de correlación más
alto de las variables restantes con respecto a la definida como la más
importante. La otra variable en importancia se determina en forma similar,
mediante el valor más alto del propio coeficiente de correlación, pero
calculado ahora entre la segunda variable en importancia y las n - 2
restantes, y así sucesivamente. En la expresión (3) el orden de importancia
del conjunto de las variables es X1. . . Xn1 sin que pierda el sentido general.

Sin duda se abren nuevos horizontes para la informetría y es necesario


profundizar más en la aplicación del análisis discriminante y, en particular,
de la I-Distancia del Ivanovic para evaluar flujos informacionales, pues es un
método matemático que permite realizar clasificaciones objetivas de títulos
o conjuntos de títulos de publicaciones seriadas de acuerdo con diversas
variables, ya que por medio de un resultado numérico final, integrado por las
propiedades de todas las variables consideradas, se puede establecer la
selección (núcleo) de los títulos de las publicaciones seriadas más relevantes
o importantes para una temática o actividad económica dada.

S-ar putea să vă placă și