lunes, 6 de noviembre de 2006

Google: Cómo funciona?


Todo aquel que ha encendido una computadora con Internet en el mundo conoce Google, el famoso motor de búsqueda de Internet (entre otras muchas cosas); Pero, que hizo que Google se convirtiera en el buscador más famoso del mundo en tiempos donde Yahoo, Excite y Altavista, entre muchos otros regían las búsquedas en la web?

Primero explicaré los diferentes tipos de buscadores web:

Directorios: Estos son sistemas de clasificación creados por personas en el mundo. Los editores hacen jerarquías de temas muy generales a clasificaciones muy particulares. De esta manera, y como ejemplo, si estamos buscando las características de un bulldog como mascota, entonces la jerarquía sería algo como esto: Casa – mascota – perros – bulldog. Yahoo en sus inicios es su ejemplo más claro.

Motores de Búsqueda: Este tipo utiliza “robots” y “arañas” para buscar la información en la web, luego la guarda, categorizándola. Este proceso se repite sistemáticamente en el tiempo, por lo cuál la información es actualizada tanto para nuevos sitios, como para aquellos que dejaron de existir. Google y Altavista son ejemplos clásicos de este tipo de buscadores.

Buscador de buscadores: Este tipo manda la búsqueda del usuario a diferentes buscadores, para luego mostrarla. Un ejemplo es Metacrawler.

La importante ventaja que presenta Google sobre otros motores de búsqueda y buscadores web y por la cuál creció en popularidad fue la forma de jerarquizar los resultados de la búsqueda. La información es mostrada de mayor a menor importancia según una escala de parámetros incluidos en un algoritmo llamado PageRank.

PageRank utiliza una escala del 1 al 10 para jerarquizar los sitios. Uno de los más importantes parámetros que utiliza para jerarquizar la busqueda es gracias a los enlaces o links que una página A tiene a otra B. Por tanto, si la página A tiene un enlace con la página B, esto es un punto a favor para la página B. Ahora si muchas más páginas tienen en laces a la página B, entonces la calificación será más alta.

Muchas otras variables afectan la calificación; si una página con un PR muy alto tiene un enlace a otra página, entonces este enlace vale más que una página con un PR muy bajo. De igual manera afecta la cantidad de enlaces que una página tiene hacia otras, por lo que si una página tiene mas “cantidad” que “calidad” en sus enlaces, la calificación tendrá menos peso. Empresas como Apple tienen un PR de 10, El Blog de Enrique Dans y la web del Instituto de Empresa tienen un PR de 6.

Actualmente se utilizan muchas mas variables para jerarquizar la información, como es la limpieza en la programación de la página. Este algoritmo está protegido por una patente y su exacta forma no es conocida por nadie fuera de las paredes de Google.

En nuevos posts, y si el tiempo me lo permite, trataré de investigar y explicar un poco más sobre una de las empresas con un crecimiento en tiempo record de todos los tiempos.

1 comentario:

Anónimo dijo...

En realidad sí es un misterio la forma en la que Google hace sus búsquedas, por ejemplo mi página tiene PR=0 (no debería ser así dada la cantidad de enlaces que tiene y de visitas diarias), con un Page Rank tan bajo no debería de indexar bien en las búsquedas, sin embargo indexa bastante bien.
Además de esto considero que el motor de búsqueda de Google está quedando obsoleto, dado que la gran cantidad de información disponible en Internet hace que los resultados nos lleven a páginas que nada tienen que ver con los temas que estamos buscando, varios ejemplos de esto aparecen en El blog de Enrique Dans que mencionas en tu post.