Buscar en la red
Publicado por Luis González en 14 Febrero 2007
El principal problema para un navegante, que se asoma a la Red para buscar cierta información, ya sean documentos, datos o imágenes, es averiguar la dirección de la página o páginas que contienen información pertinente y relevante para sus propósitos.
Este problema se ha resuelto de dos formas: utilizando la búsqueda indexada o un motor de búsqueda.
Los buscadores indexados o directorios, utilizan los datos relativos al título y la descripción de una página web para incluirla en una base de datos indexada que, además, será verificada y actualizada por personas humanas. Estos directorios temáticos tienen la ventaja de que las búsquedas están fuertemente dirigidas hacia páginas que tratan del tema en el que estamos interesados. Entre sus inconvenientes hay que destacar que requieren más trabajo humano para su mantenimiento.
Los motores de búsqueda, robots de búsqueda o spiders son sistemas automáticos que exploran y analizan regularmente, cada cierto tiempo, todas las páginas de la Red, acumulando en sus bases de datos información sobre su contenido. Cuando queremos localizar páginas con información sobre un tema, tecleamos un cierto número de palabras clave. El robot buscará en sus bases de datos y nos entregará una lista de páginas y documentos que contienen la palabra o palabras indicadas.
Buscadores más utilizados
Hay que citar, en primer lugar, a Google como el buscador más utilizado. Google fué el trabajo de doctorado de dos estudiantes de Informática de la Universidad de Stanford, que debió su éxito inicial al uso de algoritmos de búsqueda que clasifican las páginas, con un índice llamado PageRank, en función de su relevancia en la Red.
Actualmente, Google es un soporte publicitario formidable, una máquina de hacer dinero que ya no entrega resultados ajustados sólo a criterios de relevancia sino también a sus propios intereses comerciales. Tampoco entrega resultados independientes, tras haber aceptado aplicar filtros y mecanismos de censura en países como China, en los que los ciudadanos no tienen libertad de acceso a la Red pero constituyen un mercado demasiado goloso.
Otro buscador poderoso es Yahoo Search, un buscador que utiliza un motor de búsqueda propio muy potente, junto con un clásico servicio de directorio.
Hay más buscadores interesantes: Altavista, que fué uno de los pioneros, sigue siendo un excelente buscador; Alltheweb; el excelente buscador AskJeeves, que ahora se llama simplemente Ask e incluye una interesante barra de herramientas para hacer búsquedas especializadas.
También hay metabuscadores, es decir, motores de búsqueda que lanzan una petición a varios buscadores simultáneamente y presentan los resultados ordenados. Un metabuscador interesante es Dogpile, un robot que busca en Google, Yahoo, MSN y Ask simultáneamente. Otra apuesta interesante es la de Kartoo, un metabuscador que presenta los resultados gráficamente, en función de la relevancia de las páginas encontradas.
Finalmente, también se están desarrollando soluciones de código abierto en el terreno de los buscadores. El más relevante es Nutch, un buscador de software libre que puede instalarse sobre cualquier distribución GNU/Linux, que no está atado a una licencia propietaria.
