Modelo vectorial

En este modelo de recuperación de información, cada documento se representa a través de un vector de n dimensiones cuyas componentes son los términos que aparecen en el texto. El valor de cada componente se calcula a partir del IDF (Inverse Document Frequency) y se obtiene una representación vectorial para las consultas, que se comparan con los vectores de los documentos empleando una función de similitud. Para obtener la similitud entre un documento y su consulta se pueden utilizar algunas de las funciones siguientes:

Producto escalar:

Formula producto escalar

Distancia euclídea:

Formula distancia euclidea

Fórmula del coseno:

Formula del coseno

Entre las ventajas de este modelo de recuperación se encuentran:

  • Es posible obtener una lista ordenada de documentos que satisfacen la consulta.
  • Es posible controlar la respuesta ante una consulta, ya sea limitando el número de resultados o estableciendo un umbral de similitud.

Como principal desventaja a destacar es que se supone que los términos de indexación son independientes.

Página creada por David Miguel Campos Ramírez

Última Actualización: 07-04-2007

recuperacion y organizacion de la informacion Recuperacion y organizacion de la informacion Recuperacion y organizacion de la informacion- Nivel WAI - AA recuperacion y organizacion de la informacion TAW. Nivel doble A. WCAG 1.0 WAI Recuperacion Organizacion Informacion Cynthia Tested

Recuperacion y organizacion de la informacion Recuperacion y organizacion de la informacion Recuperacion y organizacion de la informacion Recuperacion y organizacion de la informacion

Recuperacion y organizacion de la informacion Recuperacion y organizacion de la informacion

Wiki Grupo 1 - Recuperación y Organización de la información - Modelos de Recuperación I