Documente Academic
Documente Profesional
Documente Cultură
1 / Abril de 2006
Isidro F. Aguillo
Begoa Granadino
Resumen Abstract
La cibermetra es una disciplina emergente que utiliza Cybermetrics is an emerging discipline that uses quanti-
mtodos cuantitativos para describir los procesos de co- tative methods to describe communication processes on
municacin en Internet, los contenidos en la Web, sus the Internet, web contents, their interrelations and con-
interrelaciones y el consumo de esa informacin por sumption of this information by users, the structure and
parte de los usuarios, la estructura y la utilizacin de las use of search tools, invisible Internet, and the special
herramientas de bsqueda, Internet invisible o las parti- features of services based on electronic mail.
cularidades de los servicios basados en el correo electr- The presence of academic institutions, and especially
nico. that of universities, on the web generates highly useful
La presencia de las instituciones acadmicas, y muy es- information for evaluating their academic and research
pecialmente de las universidades, en la Web puede ge- activities, including not only formal activities, through
nerar informacin muy til para la evaluacin de sus ac- articles and other publications, but also those that trans-
tividades acadmicas y de investigacin, incluyendo no mit knowledge through more informal means.
slo las que generan produccin formal, por medio de There are three major groups of web indicators for cy-
artculos y de publicaciones, sino tambin las que trans- bermetric analysis: descriptive measures, which measure
miten conocimiento de manera ms informal. the number of objects found in each of the websites
Se distinguen tres grandes grupos de indicadores web (pages, media or rich files, mean number of links);
para el anlisis cibermtrico: medidas descriptivas, que measures of visibility and impact, which count the num-
miden el nmero de objetos encontrados en cada una ber and source of external links, such as Google fa-
de las sedes web (pginas, ficheros media o ricos, densi- mous PageRank; and popularity measures, which calcu-
dad de enlaces); medidas de visibilidad e impacto, que late the number and characteristics of the different
cuentan el nmero y el origen de los enlaces externos visits to web pages.
recibidos, como el famoso algoritmo PageRank de Goo- Empirical data obtained for university web domains
gle, y medidas de popularidad, donde se tiene en cuen- show that cybermetrics is an interesting tool to describe
ta el nmero y las caractersticas de las visitas que reci- the presence of academic institutions on the Internet
ben las pginas web. but that it also shows the so-called digital gap, which
Datos empricos obtenidos para dominios web universi- could lead to undesirable cultural and scientific colo-
tarios muestran que la cibermetra es una interesante nialism.
herramienta para describir la presencia en Internet de
instituciones acadmicas, pero tambin evidencia la lla- Keywords
mada brecha digital, que puede conducir a un indesea- universities, cybermetrics, web indicators, scientific
ble colonialismo cultural y cientfico. communication, Open Access
Palabras clave
universidades, cibermetra, indicadores web, comunica-
cin cientfica, Open Access
1
68
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006
1
69
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006
METODOLOGA
Unidades
El primer problema al que nos enfrentamos es la identi-
ficacin de la unidad de trabajo. En la Web las unidades
lgicas estn subordinadas al sistema fsico de almacena-
miento, que se ve reflejado ms o menos en la nomen-
clatura de las direcciones de Internet. La URL suele de- FIGURA 1. Delimitador de subdominios en Yahoo.
finir unvocamente una pgina, pero sus componentes Estrategia de bsqueda: site:ucm.es feature:index
As, la mayora de las pginas web de la Universidad Frente a lo que habitualmente se cree, el nmero de
Complutense se agrupan bajo el dominio ucm.es, motores con bases de datos propias, independientes,
aunque eventualmente algunos grupos, proyectos o que ofrezcan una cobertura alta de los contenidos web,
congresos tengan nombres independientes bajo domi- es en realidad muy reducido. Si adems excluimos aque-
nios internacionales (org, com o info). En Yahoo llos que no permiten el filtrado mediante delimitadores,
Search existe un delimitador que nos permite conocer encontramos que slo cinco son tiles para fines ciber-
el nmero de subdominios de la forma xxx.ucm.es mtricos:
que se engloban dentro de uno dado (fig. 1). Google (www.google.com)
Yahoo Search (search.yahoo.com)
Otro problema que debe tenerse en cuenta son los alias MSN Search (search.msn.com)
o dominios alternativos, que generalmente slo afectan Ask (www.ask.com)
a la sede principal. As, la Universitat Oberta de Cata- Exalead (www.exalead.com)
lunya puede localizarse tanto con el dominio uoc.edu
como bajo uoc.es. Afortunadamente estos casos son Hace ya tiempo que se sabe que ninguno de los motores
pocos y van solucionndose en los ltimos aos, aunque cubre de forma exhaustiva la totalidad de la Web, y que
fueron especialmente molestos en el caso de las univer- las causas de esta cobertura incompleta son difciles de
sidades del Reino Unido. solucionar. De hecho, los estudios muestran que el sola-
pamiento entre las diferentes bases de datos no es eleva-
Herramientas do y que por ello resulta recomendable el uso en combi-
La medida de los componentes de una sede web exige nacin de varios motores para el clculo de los
la utilizacin de un programa que visite el servidor co- indicadores.
rrespondiente e indexe sus contenidos. Este programa,
llamado robot o rastreador (crawler), es el componente Sesgos y limitaciones
principal de los motores de bsqueda. Aunque pueden Ninguno de los motores ofrece ms all de los primeros
disearse o reutilizarse robots personales, su uso es mil resultados de una bsqueda, por lo que hay que re-
complejo, difcil de interpretar y conflictivo a la hora de currir al nmero de resultados que indica el motor co-
analizar sedes ajenas. Por ello, a pesar de las limitacio- mo valor de referencia. Esta cifra suele ser representati-
nes y los sesgos de los motores de bsqueda, prefieren va del total real, pero suele ofrecerse redondeada o
70
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006
En el mbito acadmico, la utilizacin de ciertos forma- La medida de visibilidad viene dada por el nmero de
tos documentales para la comunicacin cientfica sirve enlaces externos (de terceras sedes) recibidos por un
para derivar indicadores ms ajustados de los conteni- dominio. Desafortunadamente Google no calcula enla-
dos. Los llamados ficheros ricos (doc, pdf, ps, ppt) pue- ces por dominio, por lo que podr utilizarse tanto Ya-
den recuperarse directamente de algunos motores de hoo como MSN Search, que comparten la misma estra-
bsqueda y estn ligados a actividades de publicacin tegia bsica (fig. 4).
71
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006
FIGURA 4. Visibilidad o enlaces externos recibidos. FIGURA 5. Popularidad relativa segn Alexa.
Estrategia de bsqueda: linkdomain:ub.es -site:ub.es Estrategia de bsqueda: uoc.edu
Alternativamente, resulta ms simple obtener los valores El WR es un indicador que combina la visibilidad y el ta-
relativos proporcionados por el buscador Alexa mao de una forma similar al WebIF, pero dando ms
(www.alexa.com), que intercepta visitas en todo el mun- peso al primer elemento en una proporcin 4:3 frente al
do y establece a partir de ah un ranking de populari- 1:1 del WebIF. Adems, reconoce la importancia de los
dad. El valor proporcionado, posicin en el mbito ficheros ricos como vehculo documental de la actividad
mundial, puede utilizarse en estudios comparativos re- acadmica e investigadora. La formula de clculo es:
gionalizando el anlisis, ya que hay ciertos sesgos geo-
grficos (fig. 5). WR: 2*S + 4*V + R
72
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006
donde todos los valores son rangos calculados de valo- Esta brecha digital, no ligada a condicionantes econ-
res normalizados obtenidos de los motores de bsque- micos sino de poltica cientfica, gestin de la investiga-
da: S corresponde a la mediana entre los valores de ta- cin, y actitudes y comportamientos personales, es espe-
mao de Google, Yahoo, MSN Search y Ask; V es la cialmente preocupante. Aunque el idioma puede jugar
visibilidad mediante la combinacin de enlaces en Ya- un papel relevante, hay que sealar que, al contrario que
hoo y MSN Search, y R son los ficheros ricos obtenidos en Europa, los profesores e investigadores de Estados
con Google. Unidos publican libremente sus actividades en la Web y
El anlisis de los resultados muestra, como cabra espe- participan ms en las iniciativas de Open Access. A medio
rar, que las grandes universidades estadounidenses apa- y largo plazo, la ausencia de contenidos especficamente
recen en las primeras posiciones. Sin embargo, muchas propios y la incapacidad de nuestros investigadores de co-
otras instituciones de este pas se muestran abrumadora- municar globalmente sus resultados por medio de la Web
mente entre las primeras clasificadas y relegan a pases pueden dar lugar a un colonialismo cultural y cientfico
(Francia, Italia, Japn) con una fuerte tradicin acad- sobrevenido, y dificultar los procesos de innovacin, con
mica e investigadora a posiciones ms retrasadas. el impacto industrial y econmico que ello conlleva.
BIBLIOGRAFA
AGUILLO, Isidro F. (2002). Measuring informal scientific publication in the Web. En: EASST 2002 Conference. Inter-
national Conference of the European Association for the Study of Science and Technology. Universidad de Cork (Reino Unido).
AGUILLO, Isidro F. (2005). Indicadores de contenidos para la web acadmica iberoamericana. BiD: Textos Uni-
versitaris de Biblioteconomia i Documentaci [artculo en lnea]. N. 15.
<http://www2.ub.edu/bid/consulta_articulos.php?fichero=15aguil2.htm>
AGUILLO, Isidro F.; GRANADINO, Begoa; LLAMAS, Germn (2005). Posicionamiento en el Web del sector aca-
dmico iberoamericano. Interciencia. Vol. 30, n. 12, pg. 1-5.
AGUILLO, Isidro F. [et al.] (2005). Medida de la actividad y comunicacin cientfica mediante indicadores ciber-
mtricos. En: I Jornadas de Indicadores para la Evaluacin de la Ciencia y la Tecnologa. Madrid.
<http://www.cindoc.csic.es/info/fesabid-prog.html>
AGUILLO, Isidro F. [et al.] (2005a). What the Internet says about science. Scientist. Vol. 19, n. 14, pg. 10.
BAR-ILAN, Judit (2005). Expectations versus reality Search engine features needed for Web research at mid
2005. Cybermetrics. Vol. 9, n. 1.
<http://www.cindoc.csic.es/cybermetrics/articles/v9i1p2.html>
BJORNEBORN, Lennart; INGWERSEN, Peter (2004). Towards a basic framework for webometrics. Journal of the
American Society for Information Science and Technology. N. 555, pg. 1.216-1.227.
73
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006
HARNAD, Stevan; BRODY, Tim (2004). Comparing the impact of Open Access (OA) vs. non-OA articles in the
same journals. D-Lib Magazine. Vol. 10, n. 6.
<http://www.dlib.org/dlib/june04/harnad/06harnad.html>
SWAN, Alma (2005). Open Access self-archiving: An introduction. Truro: Key Perspectives.
<http://eprints.ecs.soton.ac.uk/11006/01/jiscsum.pdf>
THELWALL, Mike (2003). Web use and peer interconnectivity metrics for academic Web sites. Journal of Informa-
tion Sciences. Vol. 29, n. 1, pg. 11-20.
WILKINSON, Davil [et al.] (2003). Motivations for academic Web site interlinking: Evidence for the Web as a novel
source of information on informal scholarly communication. Journal of Information Science. Vol. 29, n. 1, pg. 59-66.
AGUILLO, Isidro F.; GRANADINO, Begoa (2006). Indicadores web para medir la presencia de las universidades
en la Red. En: ROCA, Gens (coord.). La presencia de las universidades en la Red [monogrfico en lnea]. Revista de
Universidad y Sociedad del Conocimiento (RUSC). Vol. 3, n. 1. UOC. [Fecha de consulta: dd/mm/aa].
<http://www.uoc.edu/rusc/3/1/dt/esp/aguillo_granadino.pdf>
ISSN 1698-580X
Esta obra est bajo la licencia Reconocimiento-NoComercial-SinObraDerivada 2.5 de Creative Commons. Puede copiarla, distribuirla y comunicarla
pblicamente siempre que especifique su autor y el nombre de esta publicacin, Revista de Universidad y Sociedad del Conocimiento (RUSC); no la
utilice para fines comerciales; y no haga con ella obra derivada. La licencia completa se puede consultar en:
<http://creativecommons.org/licenses/by-nc-nd/2.5/es/deed.es>
1
74
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006
Isidro F. Aguillo
Laboratorio de Internet (Cindoc-CSIC)
isidro@cindoc.csic.es
Doctora en Ciencias Biolgicas (1986), y cientfica titular del CSIC (2000). Desde 2003 de-
sarrolla su labor de investigacin en el Cindoc, en el mbito de la Cienciometra y la Ciber-
metra.
Sus trabajos tienen por finalidad contribuir al anlisis de la produccin cientfica y tecnol-
gica, fundamentalmente en ciencias de la vida, ciencias ambientales y biotecnologa, as co-
mo al desarrollo de tcnicas cuantitativas para la descripcin y la evaluacin de los conteni-
dos en Internet en el rea de la actividad acadmica y de la investigacin cientfica-tcnica.
1
75
Isidro F. Aguillo y Begoa Granadino, 2006 1 Edicin: FUOC. Produccin: Ediciones Doyma, S.L.
www.doyma.es