Post on 09-Jan-2015
Eduardo Rodes Pastor Pablo Rubio Arias
2º Bach. A
Google es el motor de búsqueda más utilizado en el mundo, y ya su nombre se suele asociar con internet. La razón de que sea tan famoso es su algoritmo de clasificación: el PageRank, que ordena las páginas para hacer la búsqueda más efectiva.
¿Cómo funciona el algoritmo PageRank?
B-A-C-E-D
En nuestro ejemplo, hemos usado una web hipotética con 5 páginas (Wikipedia, Desmotivaciones, Youtube, Facebook y la página web del instituto) Agrupamos los datos en esta tabla:
1
0
0
0 0
0
0
0
0
00
00
0 1 1
1 1
11
1
1
1
1
1
Youtube tiene enlaces a wikipedia: ponemos un 1
Wikipedia no tiene enlaces a Desmotivaciones: ponemos un 0
También ponemos 0 en las celdas donde coincida la misma páginaRellenamos el resto de la tabla:
Lo transformamos en una matriz A, sumamos sus columnas y dividimos cada término por la suma de la columna donde este, obteniendo A’:
( )( )0
0
0
1/2
1/2
0
0
0
1
0
0
1/3
1/3
1/3
0
1/4
1/4
1/4
0
1/4
0
1/2
0
0
1/2
Ahora tenemos que calcular un vector “v” que representa los valores del PageRank de cada página. Como no sabemos cuanto vale, usamos incógnitas:
Y lo llevamos a un problema de autovectores y autovalores, que es:
Para calcular λ hace falta hacer el determinante de A’–λId e igualarlo a 0.Como salen varias soluciones, se coge la de valor absoluto más alto, y como casi siempre obtendremos que λ = 1, usamos ese valor y sustituimos:
a= Wikipediab= Desmotivacionesc= Youtubed= Facebooke= IES Sta. Mª Alarcos
Y vemos que el órden en el que aparecerán las páginas será: Facebook, Youtube, Wikipedia, IES Sta. Mª Alarcos y Desmotivaciones.
Este ejemplo solo tenía 5 páginas que no tienen casi relación, pero Google trabaja con millones, y en una búsqueda ordena esas páginas en función de la cantidad de enlaces que llegan a ellas.