Técnicas de búsqueda en la Red
Publicado por Luis González en 20 Febrero 2007
La capacidad de los buscadores para localizar rápidamente datos o documentos en la Red es impresionante. Esa enorme potencia proporciona, a veces, demasiados resultados y nos obliga a bucear en las páginas propuestas para descartar las que no tienen interés. Conviene por tanto comprender cómo hay que formular la búsqueda para obtener resultados útiles y relevantes para nuestros propósitos.
Elegir cuidadosamente los términos:
Lo primero que hay que tener en cuenta es que el motor de búsqueda localiza, en su base de datos, todas las páginas que contienen la palabra clave. Si introducimos, por ejemplo, una palabra clave como sopa, el buscador localizará una enorme cantidad de páginas que contienen dicha palabra, entre las que pueden encontrarse expresiones como sopa de letras, sopa boba, estar en la sopa, sopapo, hasta en la sopa, etc. Seguramente, muchos de estos resultados no nos interesan.

Podemos precisar más la búsqueda, simplemente aumentando el número de palabras clave y escribiendo sopa ajo, receta sopa ajo o receta sopa ajo castellana. Aun así, el número de páginas localizadas, aunque menor es impresionante:

Los resultados de la búsqueda se presentan poniendo en primer lugar las páginas que incluyen en su contenido todas las palabras clave y en el mismo orden en el que han sido escritas. Más adelante se mostrarán las páginas que incluyen dos o más de las palabras clave, empezando por las que aparecen en el mismo orden en que han sido escritas y, para terminar, en la lista aparecerán las páginas que incluyen una sola de las palabras clave. El buscador no entregará resultados redundantes si ya ha mostrado un número suficiente de ellos y nunca más de 1000 resultados:

Criterios de búsqueda:
Los algoritmos matemáticos de búsqueda son realmente complejos y valoran en torno a 150 criterios. Cuando busca las palabras clave en su base de datos, el robot no tiene en cuenta las palabras superfluas y elimina de los criterios de búsqueda las partículas, pronombres y preposiciones poco relevantes, las mayúsculas, los acentos y los signos de interrogación y exclamación. Si queremos que incluya en la búsqueda uno de estos términos poco relevantes, basta con poner delante el signo + escribiendo en la ventana de búsqueda, por ejemplo, quijote capítulo +I.
También tiene en cuenta criterios de relevancia, para poner en primer lugar de la lista de resultados las páginas que contienen más información sobre las palabras solicitadas, las más visitadas y las que son enlazadas más frecuentemente desde otras páginas web. El algoritmo que calcula estos criterios de relevancia, el llamado PageRank, es un secreto comercial patentado por Google.
Cuando los términos de búsqueda se ponen entre comillas, como “receta de sopa de ajo castellana” por ejemplo, el buscador entregará exclusivamente los resultados que coinciden exactamente con la frase que se busca. Esta es pues una técnica que permite ajustar mucho la búsqueda y resulta útil para localizar un documento muy concreto como, “orden 2265/2006, de 27 de diciembre, de la Consejería de Sanidad y Consumo” por ejemplo. La búsqueda se ajusta tanto, con esta técnica, que es posible que no encuentre ningún resultado si el número de palabras entre comillas es excesivo, en cuyo caso conviene reducir el número de términos:

Evitar los acrónimos:
Conviene evitar los acrónimos cuando se ordena una búsqueda, porque el número de siglas coincidentes es, a veces, causa de errores. Es preferible teclear organización mundial comercio, en lugar de teclear OMC, simplemente porque hay otros organismos y empresas cuyas siglas pueden coincidir con las siglas tecleadas como palabra clave como, por ejemplo, la Organización Médica Colegial o la emisora Onda Merlín Comunitaria. Además, conviene utilizar el nombre no castellano de una organización, World Trade Organisation en nuestro ejemplo, si queremos obtener información relevante, procedente de la propia fuente y que no haya sido publicada en nuestro idioma.
