Sunteți pe pagina 1din 8

Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N.

1 / Abril de 2006

www.uoc.edu/rusc ISSN 1698-580X

Indicadores web para medir la presencia


de las universidades en la Red

Isidro F. Aguillo
Begoa Granadino

Resumen Abstract

La cibermetra es una disciplina emergente que utiliza Cybermetrics is an emerging discipline that uses quanti-
mtodos cuantitativos para describir los procesos de co- tative methods to describe communication processes on
municacin en Internet, los contenidos en la Web, sus the Internet, web contents, their interrelations and con-
interrelaciones y el consumo de esa informacin por sumption of this information by users, the structure and
parte de los usuarios, la estructura y la utilizacin de las use of search tools, invisible Internet, and the special
herramientas de bsqueda, Internet invisible o las parti- features of services based on electronic mail.
cularidades de los servicios basados en el correo electr- The presence of academic institutions, and especially
nico. that of universities, on the web generates highly useful
La presencia de las instituciones acadmicas, y muy es- information for evaluating their academic and research
pecialmente de las universidades, en la Web puede ge- activities, including not only formal activities, through
nerar informacin muy til para la evaluacin de sus ac- articles and other publications, but also those that trans-
tividades acadmicas y de investigacin, incluyendo no mit knowledge through more informal means.
slo las que generan produccin formal, por medio de There are three major groups of web indicators for cy-
artculos y de publicaciones, sino tambin las que trans- bermetric analysis: descriptive measures, which measure
miten conocimiento de manera ms informal. the number of objects found in each of the websites
Se distinguen tres grandes grupos de indicadores web (pages, media or rich files, mean number of links);
para el anlisis cibermtrico: medidas descriptivas, que measures of visibility and impact, which count the num-
miden el nmero de objetos encontrados en cada una ber and source of external links, such as Google fa-
de las sedes web (pginas, ficheros media o ricos, densi- mous PageRank; and popularity measures, which calcu-
dad de enlaces); medidas de visibilidad e impacto, que late the number and characteristics of the different
cuentan el nmero y el origen de los enlaces externos visits to web pages.
recibidos, como el famoso algoritmo PageRank de Goo- Empirical data obtained for university web domains
gle, y medidas de popularidad, donde se tiene en cuen- show that cybermetrics is an interesting tool to describe
ta el nmero y las caractersticas de las visitas que reci- the presence of academic institutions on the Internet
ben las pginas web. but that it also shows the so-called digital gap, which
Datos empricos obtenidos para dominios web universi- could lead to undesirable cultural and scientific colo-
tarios muestran que la cibermetra es una interesante nialism.
herramienta para describir la presencia en Internet de
instituciones acadmicas, pero tambin evidencia la lla- Keywords
mada brecha digital, que puede conducir a un indesea- universities, cybermetrics, web indicators, scientific
ble colonialismo cultural y cientfico. communication, Open Access

Palabras clave
universidades, cibermetra, indicadores web, comunica-
cin cientfica, Open Access

1
68
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006

www.uoc.edu/rusc ISSN 1698-580X

INTRODUCCIN formativa o la divulgacin sumen en la evaluacin


personal. Desafortunadamente slo a costa de un
En los ltimos aos hemos asistido a un notable inters gran esfuerzo y en casos muy controlados es posible
en la evaluacin de la actividad cientfica que, poco a extender esta rigurosa y exhaustiva colecta a grandes
poco, se ha ido generalizando a todos los mbitos de la instituciones.
estructura acadmica-investigadora. La necesidad de
controlar el gasto pblico, de racionalizar el esfuerzo in- Una posible alternativa pasara por incrementar sus-
vestigador y de premiar a los investigadores y a los cen- tancialmente la presencia de estas actividades en un
tros de excelencia son objetivos que slo pueden cubrir- medio pblico que las aglutinara y que fuera objeto de
se con un conocimiento preciso de la produccin y de anlisis unitario. Dicho medio ya existe y se ha conver-
la productividad de profesores y cientficos. tido en el principal canal de comunicacin cientfica,
aunque todava existen reticencias sobre su uso y debe-
El proceso de evaluacin se ha afrontado desde dos vas ra potenciarse aun ms la publicacin acadmica me-
complementarias: una primera basada en la opinin de diante ste. Se trata del soporte electrnico, y ms con-
expertos, generalmente pares reunidos en comits, don- cretamente de la Web, cuya ubicuidad, accesibilidad,
de el consenso diluye los efectos de la subjetividad, y asequibilidad, sencillez y potencia abren considerable-
una segunda, basada en tcnicas cuantitativas, general- mente las posibilidades de la comunicacin universita-
mente bibliomtricas, que, adems de una cierta objeti- ria.
vidad, permite su aplicacin a amplios colectivos dada
su mayor viabilidad tcnica. La cibermetra es una disciplina emergente que, a partir
de las tcnicas y el modelo bibliomtrico, pretende ex-
La bibliometra ha demostrado ser vlida para la medi- tender la aplicacin de los mtodos cuantitativos a la
cin de los resultados formales de la actividad investiga- descripcin de los procesos de comunicacin cientfica
dora, generalmente artculos publicados en revistas de en Internet, a la determinacin del volumen y de la ti-
prestigio y monografas especializadas. El anlisis de ci- pologa de los contenidos acadmicos en la Web, y a tra-
tas ha proporcionado una herramienta eficaz para la tar de desentraar las interrelaciones sociales y el consu-
evaluacin de esa produccin, especialmente til para mo de informacin por parte de los usuarios. Otros
identificar la lite del sistema. Sin embargo, la depen- aspectos tambin susceptibles de estudio cibermtrico
dencia directa de estas tcnicas de las bases de datos bi- son la descripcin de las herramientas de bsqueda en
bliogrficas de citas producidas por el ISI ha dado lugar la Web, la llamada Internet invisible o las particularida-
a ciertos problemas derivados de los sesgos de stas. Ci- des de los servicios basados en el correo electrnico y
taremos entre los ms destacados la cobertura diferen- en los foros personales.
cial geogrfica, temtica y lingstica de las fuentes, que
determina que exista un mayor peso de las revistas pu- La herramienta fundamental son los llamados indicado-
blicadas en los pases desarrollados, en ingls y del rea res, que pueden utilizarse de forma combinada con los
de las ciencias puras sobre las sociales, humanas o tec- equivalentes bibliomtricos y que, al igual que stos, se
nolgicas. utilizan para describir distintos aspectos de los procesos
de comunicacin acadmica y cientfica. En este trabajo
Para contrarrestar dicha situacin se requiere en la se presentan indicadores web diseados para medir la
actualidad que otros muchos aspectos de la actividad presencia de universidades o centros de enseanza su-
sean tenidos en cuenta, de forma que, en el caso de perior y que se han utilizado en la elaboracin de distin-
un docente, la comunicacin informal, la direccin tos trabajos comparativos.

1
69
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006

www.uoc.edu/rusc ISSN 1698-580X

METODOLOGA

Unidades
El primer problema al que nos enfrentamos es la identi-
ficacin de la unidad de trabajo. En la Web las unidades
lgicas estn subordinadas al sistema fsico de almacena-
miento, que se ve reflejado ms o menos en la nomen-
clatura de las direcciones de Internet. La URL suele de- FIGURA 1. Delimitador de subdominios en Yahoo.
finir unvocamente una pgina, pero sus componentes Estrategia de bsqueda: site:ucm.es feature:index

fuertemente jerarquizados tambin pueden referirse a


una serie o a un conjunto de ellas, formando una sede, utilizarse stos, que no slo son de manejo ms simple,
o en el caso de reflejar una gran institucin, agrupando sino que ofrecen una cobertura ms universal, prctica-
varias sedes en un dominio institucional. mente global, del Webespacio.

As, la mayora de las pginas web de la Universidad Frente a lo que habitualmente se cree, el nmero de
Complutense se agrupan bajo el dominio ucm.es, motores con bases de datos propias, independientes,
aunque eventualmente algunos grupos, proyectos o que ofrezcan una cobertura alta de los contenidos web,
congresos tengan nombres independientes bajo domi- es en realidad muy reducido. Si adems excluimos aque-
nios internacionales (org, com o info). En Yahoo llos que no permiten el filtrado mediante delimitadores,
Search existe un delimitador que nos permite conocer encontramos que slo cinco son tiles para fines ciber-
el nmero de subdominios de la forma xxx.ucm.es mtricos:
que se engloban dentro de uno dado (fig. 1). Google (www.google.com)
Yahoo Search (search.yahoo.com)
Otro problema que debe tenerse en cuenta son los alias MSN Search (search.msn.com)
o dominios alternativos, que generalmente slo afectan Ask (www.ask.com)
a la sede principal. As, la Universitat Oberta de Cata- Exalead (www.exalead.com)
lunya puede localizarse tanto con el dominio uoc.edu
como bajo uoc.es. Afortunadamente estos casos son Hace ya tiempo que se sabe que ninguno de los motores
pocos y van solucionndose en los ltimos aos, aunque cubre de forma exhaustiva la totalidad de la Web, y que
fueron especialmente molestos en el caso de las univer- las causas de esta cobertura incompleta son difciles de
sidades del Reino Unido. solucionar. De hecho, los estudios muestran que el sola-
pamiento entre las diferentes bases de datos no es eleva-
Herramientas do y que por ello resulta recomendable el uso en combi-
La medida de los componentes de una sede web exige nacin de varios motores para el clculo de los
la utilizacin de un programa que visite el servidor co- indicadores.
rrespondiente e indexe sus contenidos. Este programa,
llamado robot o rastreador (crawler), es el componente Sesgos y limitaciones
principal de los motores de bsqueda. Aunque pueden Ninguno de los motores ofrece ms all de los primeros
disearse o reutilizarse robots personales, su uso es mil resultados de una bsqueda, por lo que hay que re-
complejo, difcil de interpretar y conflictivo a la hora de currir al nmero de resultados que indica el motor co-
analizar sedes ajenas. Por ello, a pesar de las limitacio- mo valor de referencia. Esta cifra suele ser representati-
nes y los sesgos de los motores de bsqueda, prefieren va del total real, pero suele ofrecerse redondeada o

70
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006

www.uoc.edu/rusc ISSN 1698-580X

aproximada, lo que en la prctica supone una tasa de


error no inferior al 3%.

Los motores estn sujetos a determinantes comerciales,


especialmente la garanta del servicio. De esta forma,
cuando el servicio se satura, los resultados que se ofre-
cen son aproximaciones ms groseras, que infravaloran FIGURA 2. Sintaxis combinada de Ask.
el valor real. Otras veces el servicio se ofrece desde data Estrategia de bsqueda: site:uoc.edu inurl:uoc.edu
centres (servidores de la base de datos en otros lugares)
alternativos, cuyos contenidos pueden ser ligeramente
distintos.

La recolecta de datos tambin plantea problemas, de


forma que cada uno de los robots tiene su propia idio-
sincrasia: los hay que no exploran en profundidad cier-
tas sedes, los que no actualizan la base de datos con la
frecuencia adecuada y los que, encontrando problemas
de navegacin, provocan sesgos, fundamentalmente
geogrficos. Parece demostrada la cobertura diferencial FIGURA 3. Obtencin de ficheros ricos en Google.
Estrategia de bsqueda: site:uoc.edu filetype:pdf
negativa de servidores asiticos y africanos por parte de
ciertos motores.
(el ps o Postscript es el formato estndar para fsicos,
Indicadores de contenido matemticos o ingenieros) o comunicacin (el Power-
Los principales indicadores son los que describen el vo- point o ppt es el ms popular para presentaciones en
lumen de contenidos publicados en la Web. Pueden me- congresos o transparencias para el aula). En Google el
dirse el nmero y el tamao de los objetos informticos delimitador utilizado es filetype: (fig. 3).
encontrados en cada una de las sedes, pero el segundo
dato resulta poco til porque depende de factores liga- Indicadores de visibilidad y de impacto
dos al formato y no al contenido. El carcter hipertextual de la Web ha llevado a muchos
autores a homologar la cita bibliogrfica con los enlaces
El nmero de pginas html o asimiladas (pginas din- web. Aunque las motivaciones para establecer un enla-
micas, ficheros ricos, ficheros de texto) puede calcular- ce, incluso en el mundo acadmico, son ms ricas y va-
se con el delimitador site:, que es til en todos los riadas que las que justifican una cita, las tcnicas de an-
buscadores citados excepto en Ask, donde requiere aa- lisis de citas pueden aplicarse a la descripcin del
dir inurl:dominio (fig. 2). escenario global.

En el mbito acadmico, la utilizacin de ciertos forma- La medida de visibilidad viene dada por el nmero de
tos documentales para la comunicacin cientfica sirve enlaces externos (de terceras sedes) recibidos por un
para derivar indicadores ms ajustados de los conteni- dominio. Desafortunadamente Google no calcula enla-
dos. Los llamados ficheros ricos (doc, pdf, ps, ppt) pue- ces por dominio, por lo que podr utilizarse tanto Ya-
den recuperarse directamente de algunos motores de hoo como MSN Search, que comparten la misma estra-
bsqueda y estn ligados a actividades de publicacin tegia bsica (fig. 4).

71
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006

www.uoc.edu/rusc ISSN 1698-580X

FIGURA 4. Visibilidad o enlaces externos recibidos. FIGURA 5. Popularidad relativa segn Alexa.
Estrategia de bsqueda: linkdomain:ub.es -site:ub.es Estrategia de bsqueda: uoc.edu

En el pasado se utilizaba el llamado factor de impacto


Web (WebIF), que se obtiene como cociente del nme-
ro de enlaces entre el nmero de pginas de una sede o
de un dominio. Por distintas razones, este ndice da lu-
gar a numerosos artefactos matemticos, por lo que ha
dejado de utilizarse.

Una alternativa, bastante difcil de calcular, es el ndice


que se construye de acuerdo al peso relativo de las sedes
de origen de los enlaces: es el famoso PageRank de Go-
ogle, que puede obtenerse de la barra de navegacin de
este motor, pero que no permite una segregacin eficaz FIGURA 6. Ranking mundial de universidades.
de valores (rango de nmeros enteros entre 0 y 10).

Indicadores de popularidad RESULTADOS Y APLICACIONES


El consumo de informacin puede medirse contando
el nmero y describiendo las caractersticas de los visi- Los indicadores descritos se han utilizado para construir el
tantes y las visitas que recibe una sede. Esto es nota- Webometrics ranking of world universities (www.webometrics.in-
blemente difcil de realizar porque slo pueden obte- fo), donde, a partir de datos obtenidos de un total de ms
nerse estos valores cuando se tiene acceso a todos y de diez mil universidades de todo el mundo, se ha procedi-
cada uno de los ficheros log de cada uno de los servi- do a seleccionar las tres mil primeras de acuerdo a un indi-
dores. cador combinado llamado Webometrics rank (WR) (fig. 6).

Alternativamente, resulta ms simple obtener los valores El WR es un indicador que combina la visibilidad y el ta-
relativos proporcionados por el buscador Alexa mao de una forma similar al WebIF, pero dando ms
(www.alexa.com), que intercepta visitas en todo el mun- peso al primer elemento en una proporcin 4:3 frente al
do y establece a partir de ah un ranking de populari- 1:1 del WebIF. Adems, reconoce la importancia de los
dad. El valor proporcionado, posicin en el mbito ficheros ricos como vehculo documental de la actividad
mundial, puede utilizarse en estudios comparativos re- acadmica e investigadora. La formula de clculo es:
gionalizando el anlisis, ya que hay ciertos sesgos geo-
grficos (fig. 5). WR: 2*S + 4*V + R

72
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006

www.uoc.edu/rusc ISSN 1698-580X

donde todos los valores son rangos calculados de valo- Esta brecha digital, no ligada a condicionantes econ-
res normalizados obtenidos de los motores de bsque- micos sino de poltica cientfica, gestin de la investiga-
da: S corresponde a la mediana entre los valores de ta- cin, y actitudes y comportamientos personales, es espe-
mao de Google, Yahoo, MSN Search y Ask; V es la cialmente preocupante. Aunque el idioma puede jugar
visibilidad mediante la combinacin de enlaces en Ya- un papel relevante, hay que sealar que, al contrario que
hoo y MSN Search, y R son los ficheros ricos obtenidos en Europa, los profesores e investigadores de Estados
con Google. Unidos publican libremente sus actividades en la Web y
El anlisis de los resultados muestra, como cabra espe- participan ms en las iniciativas de Open Access. A medio
rar, que las grandes universidades estadounidenses apa- y largo plazo, la ausencia de contenidos especficamente
recen en las primeras posiciones. Sin embargo, muchas propios y la incapacidad de nuestros investigadores de co-
otras instituciones de este pas se muestran abrumadora- municar globalmente sus resultados por medio de la Web
mente entre las primeras clasificadas y relegan a pases pueden dar lugar a un colonialismo cultural y cientfico
(Francia, Italia, Japn) con una fuerte tradicin acad- sobrevenido, y dificultar los procesos de innovacin, con
mica e investigadora a posiciones ms retrasadas. el impacto industrial y econmico que ello conlleva.

BIBLIOGRAFA

AGUILLO, Isidro F. (2002). Measuring informal scientific publication in the Web. En: EASST 2002 Conference. Inter-
national Conference of the European Association for the Study of Science and Technology. Universidad de Cork (Reino Unido).

AGUILLO, Isidro F. (2005). Indicadores de contenidos para la web acadmica iberoamericana. BiD: Textos Uni-
versitaris de Biblioteconomia i Documentaci [artculo en lnea]. N. 15.
<http://www2.ub.edu/bid/consulta_articulos.php?fichero=15aguil2.htm>

AGUILLO, Isidro F.; GRANADINO, Begoa; LLAMAS, Germn (2005). Posicionamiento en el Web del sector aca-
dmico iberoamericano. Interciencia. Vol. 30, n. 12, pg. 1-5.

AGUILLO, Isidro F. [et al.] (2005). Medida de la actividad y comunicacin cientfica mediante indicadores ciber-
mtricos. En: I Jornadas de Indicadores para la Evaluacin de la Ciencia y la Tecnologa. Madrid.
<http://www.cindoc.csic.es/info/fesabid-prog.html>

AGUILLO, Isidro F. [et al.] (2005a). What the Internet says about science. Scientist. Vol. 19, n. 14, pg. 10.

BAR-ILAN, Judit (2005). Expectations versus reality Search engine features needed for Web research at mid
2005. Cybermetrics. Vol. 9, n. 1.
<http://www.cindoc.csic.es/cybermetrics/articles/v9i1p2.html>

BJORNEBORN, Lennart; INGWERSEN, Peter (2004). Towards a basic framework for webometrics. Journal of the
American Society for Information Science and Technology. N. 555, pg. 1.216-1.227.

73
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006

www.uoc.edu/rusc ISSN 1698-580X

HARNAD, Stevan; BRODY, Tim (2004). Comparing the impact of Open Access (OA) vs. non-OA articles in the
same journals. D-Lib Magazine. Vol. 10, n. 6.
<http://www.dlib.org/dlib/june04/harnad/06harnad.html>

SWAN, Alma (2005). Open Access self-archiving: An introduction. Truro: Key Perspectives.
<http://eprints.ecs.soton.ac.uk/11006/01/jiscsum.pdf>

THELWALL, Mike (2003). Web use and peer interconnectivity metrics for academic Web sites. Journal of Informa-
tion Sciences. Vol. 29, n. 1, pg. 11-20.

WILKINSON, Davil [et al.] (2003). Motivations for academic Web site interlinking: Evidence for the Web as a novel
source of information on informal scholarly communication. Journal of Information Science. Vol. 29, n. 1, pg. 59-66.

Para citar este documento, puedes utilizar la siguiente referencia:

AGUILLO, Isidro F.; GRANADINO, Begoa (2006). Indicadores web para medir la presencia de las universidades
en la Red. En: ROCA, Gens (coord.). La presencia de las universidades en la Red [monogrfico en lnea]. Revista de
Universidad y Sociedad del Conocimiento (RUSC). Vol. 3, n. 1. UOC. [Fecha de consulta: dd/mm/aa].
<http://www.uoc.edu/rusc/3/1/dt/esp/aguillo_granadino.pdf>
ISSN 1698-580X
Esta obra est bajo la licencia Reconocimiento-NoComercial-SinObraDerivada 2.5 de Creative Commons. Puede copiarla, distribuirla y comunicarla
pblicamente siempre que especifique su autor y el nombre de esta publicacin, Revista de Universidad y Sociedad del Conocimiento (RUSC); no la
utilice para fines comerciales; y no haga con ella obra derivada. La licencia completa se puede consultar en:
<http://creativecommons.org/licenses/by-nc-nd/2.5/es/deed.es>

1
74
Isidro F. Aguillo y Begoa Granadino, 2006 1
Revista de Universidad y Sociedad del Conocimiento Vol. 3 - N. 1 / Abril de 2006

www.uoc.edu/rusc ISSN 1698-580X

Isidro F. Aguillo
Laboratorio de Internet (Cindoc-CSIC)
isidro@cindoc.csic.es

Trabaja en el Laboratorio de Internet en el Centro de Informacin y Documentacin Cient-


fica (Cindoc) del Consejo Superior de Investigaciones Cientficas (CSIC). Realiza tareas rela-
cionadas con el desarrollo de indicadores de la sociedad de la informacin, anlisis docu-
mental de recursos web, cibermetra y procesos de comunicacin cientfica por la Red.
Dirige o participa en varios proyectos de I+D de la Unin Europea y del Plan Nacional de In-
vestigacin Cientfica. Ha sido miembro de la Oficina Espaola de Ciencia y Tecnologa
(SOST) en Bruselas y Metcalfe visitor professor en la Universidad de Nueva Gales del Sur (Sd-
ney, Australia).
Licenciado en Biologa por la Universidad Complutense de Madrid y mster en Informacin
y documentacin por la Universidad Carlos III de Madrid. Edita la revista electrnica Cyber-
metrics desde 1997, es miembro del Comit Asesor del Profesional de la Informacin y de comi-
ts cientficos de diversos congresos nacionales e internacionales, y participa como evalua-
dor y revisor de proyectos de investigacin europeos.

Begoa Granadino Goenechea


Laboratorio de Internet (Cindoc-CSIC)
bgranadino@cindoc.csic.es

Doctora en Ciencias Biolgicas (1986), y cientfica titular del CSIC (2000). Desde 2003 de-
sarrolla su labor de investigacin en el Cindoc, en el mbito de la Cienciometra y la Ciber-
metra.
Sus trabajos tienen por finalidad contribuir al anlisis de la produccin cientfica y tecnol-
gica, fundamentalmente en ciencias de la vida, ciencias ambientales y biotecnologa, as co-
mo al desarrollo de tcnicas cuantitativas para la descripcin y la evaluacin de los conteni-
dos en Internet en el rea de la actividad acadmica y de la investigacin cientfica-tcnica.

1
75
Isidro F. Aguillo y Begoa Granadino, 2006 1 Edicin: FUOC. Produccin: Ediciones Doyma, S.L.

www.doyma.es

S-ar putea să vă placă și