Thursday, July 24, 2014

Ponderación por pesos

Otra manera de procesar la información es por pesos. Supongamos que tenemos una pregunta o query q y un documento d. (q,d) con una puntuación de 0 a 1 [0,1]. Si obtenemos combinaciones lineales según la zona, cada zona del documento tiene un valor. Supongamos que hay l zonas. Tendríamos g1, g2, ... gl. La sumatoria de dichos valores debe dar 1. 

∑ l1 . F o r 1 ≤ ≤ l

El valor de si se le llama ponderación Booleana, la cual busca coincidencias entre la pregunta y la zona, es decir, se tiene un valor de 1 cuando la pregunta es verdadera y la búsqueda coincide con la zona, mientras que tiene un valor de 0 cuando no. Para obtener el peso de la zona se usa la siguiente fórmula:

                                                                                                     l
gisi. i=

En el procesamiento de un libro, por ejemplo, para 3 zonas g (autor, título, fecha) con un peso determinado g1=0.5, g2 =0.3 y g3 =0.2 (la sumatoria sería 1), se puede observar que la categoría 1, en este caso el autor, tiene más peso que la 1, la fecha. Esto tiene sentido, ya que en una búsqueda es más importante tener el autor correcto, y la fecha de publicación sería un factor adicional.

Bibliografía

No comments:

Post a Comment