Sunteți pe pagina 1din 3

lgebra Lineal y Google

Es raro el da en el que no utilizamos Google para hacer algn tipo de


bsqueda. Google es el buscador ms utilizado en Internet. Fue diseado por
Sergei Brin y Lawrence Page en 1998 cuando eran estudiantes de
Doctorado de Informtica en la Universidad de Standford (Page et al.
1998). Pues bien, el xito de Google se debe a un algoritmo llamado
Page Rank que tiene mucho que ver con el lgebra Lineal. Este
algoritmo asigna una puntuacin de importancia a cada una de las pginas
web, de modo que cuando se hace una bsqueda mediante palabras clave, el
buscador nos proporciona una serie de pginas que contienen esas
palabras clave pero que adems estn ordenadas de modo que las ms
relevantes, las ms importantes, sern mostradas en las primeras posiciones.
El algoritmo PageRank de Google asigna un valor numrico a cada
pgina Web de acuerdo a su importancia. Este valor se calcula de forma
automtica, sin intervencin humana. La importancia de una pgina Web
se cuantifica teniendo en cuenta los hiperenlaces o hipervnculos que
contienen todas las pginas Web que componen Internet. Entonces, en un
primer intento, se podra tomar como valor de la importancia ix de la pgina i
como el nmero de enlaces que se hacen desde el resto de pginas hacia i. En
este sentido, podramos construir una matriz A definida de la siguiente forma:

Supongamos que tenemos una coleccin de 4 pginas Web como la


mostrada en la figura 2:

si la importancia Xi se mide como el nmero de enlaces que recibe la pgina i.


De manera que la pgina 3 sera la ms importante, seguida de un
empate entre las pginas 1 y 4, y, por ltimo, la menos importante sera la
pgina 2. La estrategia seguida parece que no es todo lo democrtica
que debera, porque existirn pginas con muchos enlaces y pginas con
pocos. Si una pgina Pj enlaza con Nj pginas, parece lgico pensar que el
voto de Pj deber repartirse entre las Nj pginas, de modo que cada enlace
que sale de ella tendr un peso igual a 1/Nj. Esto nos lleva a considerar ms
razonable el usar la matriz normalizada siguiente:

Para el clculo de la importancia de cada pgina que compone la red de la


figura 2. Tambin parece razonable pensar que el enlace desde una pgina
importante debe tener ms peso que el enlace desde una pgina poco
importante. Entonces la importancia de cada pgina viene determinada
analizando los enlaces que se hacen hacia ella y la importancia de cada
uno de estos enlaces. Si una pgina Pj (que contiene Nj enlaces) enlaza a una
pgina i, esto debe hacer que aumente la importancia Xi de Pi con la

cantidad
Volviendo al ejemplo de la figura 2, el vector de importancias debe satisfacer:

Buscamos un vector X que verifique el sistema anterior. Este sistema es


compatible indeterminado y su solucin es:

donde k puede tomar cualquier valor. Averiguamos el valor de k de modo que


todas las componentes del vector solucin sumen 1 y obtenemos:

Observar que el ranking de pginas de la figura 2 ha cambiado. Parece


sorprendente que la pgina 3 que es enlazada desde las otras tres
pginas ha dejado de ser la ms importante. Para comprender esto, hay
que observar que la pgina 3 enlaza solamente con la pgina 1 y, por lo
tanto, dedica todo su voto a esta pgina. Esto unido al voto de la pgina 2 da
como resultado que la pgina 1 sea la ms importante en el ranking. Como
hemos visto, el problema del clculo del vector de importancias queda
reducido a la resolucin de un sistema:

S-ar putea să vă placă și