El modelo PageRank

Desde 1999 Google tiene como marca registrada la patente de su producto estrella y principal motivo de su exito, el PageRank (PR) . El objetivo de este modelo es clasificar la importancia de cada web en relación al numero de enlaces que tiene a otras paginas. El motor de busqueda de Google utiliza este sistema para poder clasificar las paginas indexadas y mostrarlas como resultado de una búsqueda.

Internamente el PR es un conjunto de algoritmos algunos de los cuales se pueden encontrar el los documentos que Larry Page y Sergey Brin presentaron en la universidad de Stanford como prototipo de su proyecto Google.
The Anatomy of a Large-Scale Hypertextual Web Search Engine.

La reflexión que lleva a Larry Page y Sergey Brin a crear este modelo de pesos fue darse cuenta de la cantidad de documentos académicos que hacían referencia a otros documentos de manera que entre más grande fuera el numero de referencias que tenia un documento, más importante es en su materia con relación a los demás. Partiendo de esta base se crea el siguiente modelo:

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Donde:

PR(A) Es el PageRank de la página A,
PR(Ti) Es el PageRank de las páginas Ti que enlazan a A,
C(Ti) Es el número de links salientes de la página Ti
d es un factor variable que puede estar entre 0 y 1.


Para poder explicar esta formula pondremos una ejemplo con un caso practico.
Imaginemos que tenemos tres paginas A,B,C y que x es el PageRank de una de ellas, en este caso de A, por otro lado tenemos f(x) que será la parte de PageRank de A que se traspasa a sus enlaces.

Por lo tanto :

Si A enlaza con B, A esta dando f(x)*1 de PR a B.
Si A enlaza con B y con C la parte PageRank que recibirán B y C sera F(x)*0.5 cada uno. Y así sucesivamente, de manera que si A enlaza con 100 paginas cada pagina enlazada recibirá un PR de f(x)*0.05. A, esta perdiendo parte de su PR siempre que enlaza a otra pagina, pero lo gana por el numero de paginas que enlazan a A.
El valor PR que tiene un web site (entre 0 y 10) no solo depende del numero de enlaces entrantes o salientes, también depende del flujo de PR que hay en internet, de la frecuencia de las actualizaciones de la pagina o de estar presente en directorios relacionados con la tematica del site.



Como consecuencia de este modelo de valoraciones, alcanzar un buen nivel PR se convierte en muchos casos una prioridad para empresas dedicadas al eComerce, ante esta demanda nace lo que hoy se conoce como SEO (Search Engine Optimization). La idea de SEO consiste en aplicar una serie de metodos que ayudan a optimizar una web site para poder aumentar su trafico, algunos de ellos serian la usabilidad, la estructura y diseño de la pagina, la programación o el contenido. Otra variante de optimización de sites pero más orientada al Marketing es el SEM (Search Engine Marketing) que busca promover un site mediante métodos como la optimización del motor de búsqueda, el pago por la colocación en buscadores PPC(pago por clic) o la publicidad contextual. A mejor, diseño y contenidos, mejor posicionamiento dentro de la red, aumento del trafico en la web los que significa más ventas.

Volviendo al PageRank hay que decir que la idea se basa en el modelo SCI (Science Citation Index )donde en la decada de los 50 en el Instituto de información científica de los Estados Unidos se pretende asignar méritos científicos, suponiendo que los investigadores cuyo factor de impacto es más alto (por sus publicaciones u otros trabajos científicos) , colaboran en mayor medida con el desarrollo de su área de investigación.

Conocer el PR que tiene una pagina web es sencillo paginas como
www.mipagerank.com ofrecen este servicio si no la ToolBar de Google también permite acceder a esta información.



No hay comentarios: