Você está aqui:
Pesquisa híbrida
Para fornecer informações relevantes a um LLM com aplicativos de IA genérica e gerar a resposta correta, é necessário pesquisar tanto por vetor quanto por palavra-chave. A pesquisa do vetor entende semelhanças semânticas e contexto, mas não tem vocabulário de domínio específico. A pesquisa por palavra-chave se destaca em similaridade léxica, mas não em similaridade semântica. No Data 360, a pesquisa híbrida combina os pontos fortes da pesquisa vetorial sensível à semântica com a precisão e a velocidade da pesquisa por palavra-chave.
Edições obrigatórias
| Disponível em: Todas as edições suportadas pelo Data 360. Consulte Disponibilidade da edição do Data 360. |
Por exemplo, a pesquisa vetorial entende que "Como fazer login em minha conta?" e "Como posso assinar?" são consultas semelhantes. Porém, a pesquisa do vetor pode não entender que uma pesquisa em "LaserPrinter TX 400" e "LaserPrinter TX 440" também é semelhante porque não corresponde bem a números ou termos de domínio específicos, como um LaserPrinter, que a pesquisa por palavra-chave pode.
A pesquisa híbrida indexa as informações no DMO ou UDMO para recuperar resultados relevantes. Antes de criar um índice de pesquisa híbrido, os dados não estruturados armazenados em DMOs e UDMOs são divididos em blocos. A divisão em blocos divide os DMOs e UDMOs em unidades gerenciáveis e semânticamente significativas.
Em seguida, a indexação de dados gera incorporações de vetores para um índice de pesquisa vetorial e um índice de pesquisa de palavra-chave para os DMOs e UDMOs. Você gerencia a criação, a exclusão e a hidratação do índice de pesquisa usando a interface do usuário e as APIs do índice de pesquisa do Data 360.
Com a pesquisa híbrida, o índice de pesquisa vetorial é consultado para recuperar informações com base na similaridade semântica e o índice de pesquisa de palavra-chave é consultado para recuperar informações com base na similaridade léxica. A pesquisa híbrida então mescla e classifica os resultados fornecidos por ambos os tipos de pesquisa para gerar a melhor resposta. Você também pode configurar fatores de classificação adicionais, como a atualidade ou a popularidade dos registros, para influenciar os resultados da pesquisa retornados.
Depois de criar um índice de pesquisa no Data 360, você pode pesquisar esses dados em aplicativos como Criador de prompts, agentes de IA ou Tableau.
- Crie um índice de pesquisa híbrido com a configuração avançada
Configure um índice de pesquisa híbrido para um objeto de modelo de dados (DMO) ou um objeto de modelo de dados não estruturado (UDMO) para fornecer informações relevantes para aplicativos de IA generativa. O Data 360 divide os dados referenciados em partes semânticamente relacionadas e gera vetores pesquisáveis, e então gera um índice de vetor e um índice de palavra-chave. - Executar consultas de pesquisa híbridas com a API de consulta
Use a API de consulta para executar pesquisas híbridas no Data 360. Use estes exemplos como pontos de partida. - Expressões de consulta de pesquisa híbrida
Aprimore suas consultas de pesquisa híbrida com campos de pré-filtragem e junção de expressões para acessar campos. - Classificação de fusão de pesquisa híbrida
A classificação reordena os resultados da pesquisa para que os resultados mais relevantes para uma consulta do usuário estejam no topo. A pesquisa híbrida do Data 360 recupera resultados de dois índices, palavra-chave e vetor, com base na semelhança com a consulta e, em seguida, mescla (fusiona) os resultados. O modelo de classificação então classifica novamente os resultados mesclados. - Influenciar classificação de relevância da pesquisa híbrida
Aumente a precisão dos resultados da consulta de índice de pesquisa e melhore a qualidade das aplicações RAG enviando parâmetros específicos de relevância. Usando o SQL, você pode enviar configurações de ajustes de relevância para modelos de classificador de fusão com suporte e melhorar a relevância do resultado para seu caso de uso específico. - Resultados de descarte automático da pesquisa híbrida
Filtre dinamicamente os resultados que mostram uma queda acentuada nas pontuações de relevância para aumentar a precisão dos resultados da pesquisa para seus avisos e casos de uso RAG. O autodrop de pesquisa híbrida do Data 360 é um método pelo qual você pode filtrar resultados de pesquisa irrelevantes que podem enganar aplicativos a montante como Criador de prompts usando esses resultados. - Melhores práticas de pesquisa híbrida
Aprimore a recuperação de pesquisa híbrida e a relevância da pesquisa dividindo os campos corretos, selecionando campos pré-filtro e adicionando fatores de classificação. - Melhores práticas de descarte automático de pesquisa híbrida
Use estas práticas recomendadas para configurar o desvio automático para resultados de pesquisa híbridos do Data 360.

