La recuperación y el acceso a la información se refiere al conjunto de técnicas utilizadas para acceder a recursos externos almacenados en una base de datos o directorio y recuperarlas con un criterio específico.

Los motores de búsqueda son la principal herramienta para la recuperación y acceso a la información contenida en estas bases de datos, realizando la persona o máquina una búsqueda concreta y estos, devolviendo la información que más se asemeje a la consulta.

Los temas a tratar en este artículo se centran en la recuperación de información y la evaluación de dicha recuperación, que engloban los siguientes sub-temas:

  • Fundamentos de la recuperación en Internet
  • Optimización en motores de búsqueda (SEO)
  • Modelos de recuperación
  • Acceso, adquisición y limpieza de datos de la web semántica
  • Crawlers y scrapers
  • Métricas para evaluar la recuperación

Fundamentos de la recuperación en Internet

Recuperación y acceso a la información

Internet es la mayor base de datos existente en el mundo y como tal, necesita de buscadores que puedan acceder a los recursos almacenados en los diferentes nodos de la red.

Los buscadores web tienen dos objetivos fundamentales, indizar el contenido para permitir que este sea consultado y devolver al usuario el contenido relevante en base a las palabras clave introducidos por el mismo.

Para ello usan unos algoritmos de recuperación y posicionamiento de contenidos y proporcionan una interfaz de consulta a los usuarios. Para recuperar la información existente en los diferentes nodos, utilizan unos programas llamados crawlers que se encargan de leer y procesar el contenido que encuentran.

El buscador más usado en Internet es Google, ya que es el que más contenidos y mejor criterio de ordenación tiene. Además de poder busar por una palabra clave, es posible usar filtros de búsqueda y operadores avanzados, de tal forma que la recuperación del contenido sea más precisa.

Además de textos, Google es capaz de recuperar otros tipos de formatos de información, como puedan ser las imágenes, la música o los vídeos.

Relación entre obtención y acceso a la información y el Big Data

Existe una fuerte relación entre la recuperación y acceso a la información con lo que conocemos como Big Data. Podrás encontrar la siguiente información relativa a este tema en nuestra página web: