Usted está aquí:
Clasificación de relevancia de búsqueda híbrida de influencia
Aumente la precisión de los resultados de consultas de índices de búsqueda y mejore la calidad de las aplicaciones RAG enviando parámetros específicos de relevancia. Utilizando SQL, puede enviar parámetros de configuración de relevancia para modelos de rango de fusión compatibles y mejorar la relevancia de resultados para su caso de uso específico.
La búsqueda híbrida admite tres modelos de clasificación de fusión: el modelo Fusión de rango recíproco (RRF) estándar del sector, un modelo Linear Fusion Ranker (LFR) personalizable y un modelo Deep Fusion Ranker (DFR) más robusto.
Una consulta de búsqueda híbrida acepta una cadena JSON que representa el parámetro de configuración de relevancia.
select * from hybrid_search(
table(<Search_index_DMO>),
‘<Search_string>’,
'<PreFilteringColumn><Operator><Value>',
'<Limit_results>',
‘<”Relevance Ranking Configuration” (JSON)>’
);
Modelo de fusión de rango recíproco
El modelo Fusión de clasificación recíproca (RRF) utiliza una fórmula de fusión de clasificación recíproca que tiene en cuenta la ponderación para cada tipo de búsqueda para obtener los resultados más relevantes.
La fórmula de fusión de rango recíproco es la suma de las puntuaciones de rango recíproco de búsqueda de palabra clave (dispersa) y búsqueda vectorial (densa) con una disminución predeterminada de k=60. La fórmula también proporciona un parámetro alfa, que controla la ponderación dispersa en una combinación convexa de las dos puntuaciones. Los resultados de la búsqueda se clasifican utilizando la suma derivada de la fórmula de fusión de rango RRF.
Por ejemplo, esta expresión de consulta de búsqueda híbrida pasa el parámetro de ponderación de búsqueda de palabra clave (disperso) para el modelo RRF.
select * from hybrid_search(
table(<Search_index_DMO>),
‘<Search String>’,
'<PreFilteringColumn><Operator><Value>',
'<Limit Results>',
‘{ "rrf": { "keyword_weight": 0.4 } }’
);
Parámetros de entrada para la configuración de relevancia:
- rrf: Activar modelo de fusión de clasificación recíproca
- keyword_weight: La importancia o ponderación del componente de búsqueda de palabra clave en la búsqueda híbrida. El intervalo está entre cero y uno. La importancia de la búsqueda vectorial se calcula automáticamente deduciendo la ponderación de la palabra clave de 1,0.
El modelo RRF también admite una fórmula avanzada que puede afectar a los factores de clasificación que configura cuando crea el índice de búsqueda. Para obtener más información sobre factores de clasificación, consulte Clasificación de fusiones de búsqueda híbrida.
Parámetros de entrada para la configuración de relevancia en la fórmula RRF avanzada:
- Alpha (a): representa la importancia dada a la búsqueda de palabras clave. El valor predeterminado es 0,5f
- Beta (B): representa la importancia dada a la búsqueda vectorial y se calcula basándose en la importancia dada a la búsqueda de palabras clave (1-alfa).
- Gamma (Y): representa la importancia de clasificar la popularidad de factores. El valor predeterminado es 0,00074478f. Máximo es 1.
- Delta (D): representa la importancia que se da a la clasificación de la recencia de factores. El valor predeterminado es 0,00028472f. Máximo es 1.
Especifique la importancia de las ponderaciones en su consulta. Ajuste y ajuste los valores en incrementos bajos para asegurarse de que alcanza la relevancia correcta para sus resultados.
Modelo de clasificación de fusión lineal
El modelo Clasificación de fusión lineal (LFR) es una forma personalizable del modelo de clasificación de fusión predeterminado, que calcula una suma ponderada de las puntuaciones transformadas desde la búsqueda vectorial (densa) y la búsqueda de palabras clave (dispersa). Los resultados de búsqueda se clasifican utilizando la suma derivada de la fórmula LFR.
De forma predeterminada, la búsqueda híbrida proporciona la mejor configuración de rango de fusión lineal utilizando transformaciones y ponderaciones basadas en experimentos internos y indicadores. Con LFR, la clasificación es más configurable utilizando las funciones de transformación para la puntuación de búsqueda de palabra clave (dispersa) y la puntuación de búsqueda vectorial (densa), y sus ponderaciones.
El modelo LFR también puede utilizar los factores de clasificación de popularidad y recencia que se pueden configurar mientras configura la búsqueda híbrida para un DMO. Los factores de clasificación adicionales son configurables utilizando ponderaciones y funciones de transformación.
Por ejemplo, esta expresión de consulta de búsqueda híbrida pasa parámetros de relevancia para el modelo LFR.
select * from hybrid_search (
table(<Search_index_DMO>),
‘<Search String>’,
'<PreFilteringColumn><Operator><Value>',
'<Limit Results>',
‘{
"lfr": {
"vector": {
"score_transform": {
"type": "reciprocal_rank",
"decay": 60
},
"weight": 0.66913
},
"keyword": {
"score_transform": {
"type": "query_min_max",
"theoretical_min": 0.1
},
"weight": 4.0343633
}
}
}’);Parámetros de entrada para la configuración de relevancia:
- lfr - Activar modelo de Clasificación de fusión lineal
- vector: Configura la clasificación para la búsqueda de vectores
- palabra clave: Configura la clasificación para la búsqueda de palabras clave
Cada una de las configuraciones de clasificación para la búsqueda de vectores y palabras clave puede tomar estos parámetros:
- score_transform: La configuración para la transformación de puntuación para el componente de búsqueda
- type: El tipo de transformación de puntuación
- reciprocal_rank
- query_min_max
- decaimiento: Admitido solo para Transformación de clasificación recíproca, el parámetro de decadencia controla el gradiente entre clasificaciones de resultados. Por ejemplo, la puntuación de clasificación recíproca entre resultados clasificados como 1 y 2 está más separada con una disminución de 10 frente a una disminución de 20.
- Si la consulta incluye un parámetro de decadencia, la puntuación = 1/(rank+decay).
- min_teórico: Admitido solo para Transformación mínima/máxima teórica, representa la puntuación mínima teórica para la función de búsqueda subyacente. Utilice este parámetro para ampliar o reducir la distribución de funciones en un intervalo entre [0,1]. Por lo tanto, seleccione un valor que sea el valor más bajo para la función para obtener el mejor resultado. Para la puntuación de búsqueda de palabra clave, 0 es el valor apropiado. No modifique este valor a menos que tenga datos que indiquen que un valor superior proporciona una mejor relevancia.
- peso: La importancia que hay que dar a este componente de la búsqueda híbrida
Modelo de Deep Fusion Ranker
El modelo Deep Fusion Ranker (DFR) mejora la relevancia de la búsqueda integrando señales tradicionales como similitud vectorial, coincidencias de palabras clave, popularidad y recencia con una comprensión más profunda del texto de la consulta. Al aprovechar técnicas de aprendizaje profundo y arquitecturas de transformador, el modelo captura interacciones de funciones complejas y puntúa conjuntamente registros. Los resultados de búsqueda son precisos, precisos y relevantes desde el punto de vista contextual. Este modelo gestiona de forma efectiva datos que faltan y que hacen ruido, lo que garantiza un rendimiento fiable en diversos escenarios de búsqueda.
Active el modelo Deep Fusion Ranker utilizando el parámetro de configuración de relevancia dfr. No hay otras personalizaciones disponibles para este modelo.
Por ejemplo, esta expresión de consulta de búsqueda híbrida pasa el parámetro relevance para el modelo Deep Fusion Ranker.
select * from hybrid_search (
table(<Search_index_DMO>),
‘<Search String>’,
'<PreFilteringColumn><Operator><Value>',
'<Limit Results>)',
‘{ "dfr": {}}’
);
Parámetros de entrada para la configuración de relevancia:
- dfr: Activar modelo de Deep Fusion Ranker

