BUSCADORES Y BÚSQUEDAS EFECTIVAS

BUSCADORES Y BÚSQUEDAS EFECTIVAS

Por lo general, un Buscador, ejecuta periódicamente un programa que se va comunicando con los sitios "Web" cuya dirección previamente ha sido inscrita en su base datos, y trae hacia sí las páginas que encuentra, siguiendo también consecutivamente los enlaces hacia otras páginas. Examinando el contenido de cada página recuperada, el programa construye una gran base de datos a manera de índice con palabras, frases o descriptores y la dirección de la páginas donde aparecen esos elementos.
Los Buscadores se pueden clasificar en dos tipos según manejen o no una clasificación temática cuando registran una nueva página en su base de datos:

-Buscadores que indexan el texto completo
-Buscadores que usan clasificaciones temáticas (llamadas taxonomías u ontologías)

La mayoría de los buscadores, actualmente, pertenecen al primer tipo. El principal ejemplo del segundo tipo de buscador es YAHOO.
Hay que tener presente que ante el crecimiento constante de Internet, ningún buscador es capaz de catalogar o indexar absolutamente todo el contenido. Por ejemplo, en un estudio publicado en la revista SCIENCE en abril de 1998, por investigadores del NEC Research Institute (Princeton, EE.UU.), para una cantidad estimada de unos 320 millones de páginas accesibles por esa época, cada uno de los mejores buscadores solo alcanzaban a cubrir, a lo sumo, una tercera parte de esa cantidad de páginas. Hay que aclarar que el número de páginas está en constante crecimiento, y que el número de páginas "posibles" es practicamente ilimitado, si pensamos que hay producción de páginas "al vuelo", que se generan en el momento de consultar, por ejemplo una base de datos o el mismo buscador: la pagina mostrada no es preexistente, sino que se genera en el momento de obtener o calcular los resultados de la consulta.
La mayoría de los buscadores construyen su base de datos o índice usando programas de computador que exploran el "web" y de manera automática van actualizando las bases de datos principalmente por la adición de nuevos sitios matriculados por los autores, o descubiertos por el programa al seguir los hiperenlaces que hay en cada página.
Existen algunos servicios de búsqueda cuyas bases de datos tienen alguna escogencia y evaluación por parte de humanos, procurando que los documentos que indexa sean de calidad o autoridad en cuanto a la información que poseen. Obviamente, dado el tamaño del "web" esta labor "manual" es demasiado dispendiosa, y cada vez lo será más.

No hay comentarios:

Publicar un comentario