위치:
하이브리드 검색 모범 사례
하이브리드 검색 성능과 정확도를 높이려면 올바른 필드로 청크하고 사전 필터링 필드를 선택하며 추가적인 순위 요소를 반영하는 방식을 도입합니다.
컨텍스트와 의미를 제공하는 청크 필드를 사용합니다. 데이터 청크를 위한 필드를 여러 개 선택할 수 있습니다. 검색된 결과가 생성형 AI 응용 프로그램에서 사용될 것으로 예상되는 방식을 고려합니다. 예를 들어, 레코드의 제목, 본문 또는 설명과 같은 필드를 선택합니다. 열기 또는 마감과 같은 작은 값 집합이 있는 필드는 청크에 적합하지 않습니다.
필터 필드를 추가하여 결과 범위를 좁혀 검색 결과의 정밀도를 높입니다. 응용 프로그램에 적합한 필터를 사용합니다. 예를 들어 사례 상태 필드를 사전 필터링하면 사례 대화 기록에 대한 검색 결과의 관련성을 향상할 수 있습니다.
관련성별 매개 변수를 보내 순위 모델로 결과 관련성을 구체화합니다. RRF(Reciprocal Rank Fusion) 및 LFR(Linear Fusion Ranker) 모델의 고급 수식을 사용하여 매개 변수 값을 수정하고 관련 결과를 얻습니다.
검색 색인 구성에 순위 요소를 추가하여 관련성을 높입니다.
- ViewCount를 추적하는 필드 선택과 같은 요소로 레코드의 인기도를 추가합니다. 예를 들어 CRM Knowledge 기사에서 생성된 DMO를 색인화할 때 KnowledgeArticleViewStat 엔티티를 Data 360로 가져오고 KnowledgeArticleViewStat.ViewCount를 인기도 요소로 사용합니다.
- 요소로 레코드의 최근성 추가 예를 들어 CRM Knowledge 기사에서 생성된 DMO를 색인화할 때 LastModifiedDate__C 필드를 최근 요소로 사용합니다.
{
"label": "record9357",
"developerName": "record9357",
"description": "A sample description",
"sourceDmoDeveloperName": "Knowledge_kav_Home__dlm",
"chunkDmoName": "chunk9357",
"vectorDmoName": "vector9357",
"chunkDmoDeveloperName": "chunk9357",
"vectorDmoDeveloperName": "vector9357",
"searchType": "HYBRID"
"vectorEmbedding": {
"vectorEmbeddingRelatedFields": [
{
"relatedDmoDeveloperName": "Knowledge_kav_Home__dlm",
"relatedDmoFieldDeveloperName": "ssot__Name__c",
"relationships": [
{
"sourceDmoDeveloperName": "Knowledge_kav_Home__dlm",
"sourceDmoFieldDeveloperName": "Content_c__c",
"targetDmoDeveloperName": "Knowledge_kav_Home__dlm",
"targetDmoFieldDeveloperName": "Content_c__c"
}
]
}
]
},
"rankingConfigurations": [
{
"relatedDmoDeveloperName": "Knowledge_kav_Home__dlm",
"relatedDmoFieldDeveloperName": "LastModifiedDate__c",
"rankType": "RECENCY",
"developerName": "rank_time_freshness",
"relationships": [
{
"sourceDmoDeveloperName": "Knowledge_kav_Home__dlm",
"sourceDmoFieldDeveloperName": "Content_c__c",
"targetDmoDeveloperName": "Knowledge_kav_Home__dlm",
"targetDmoFieldDeveloperName": "Content_c__c"
}
]
}
],
"chunkingConfiguration": {
"fieldLevelConfigurations": [
{
"sourceDmoDeveloperName": "Knowledge_kav_Home__dlm",
"sourceDmoFieldDeveloperName": "Content_c__c",
"config": {
"id": "passage_extraction",
"userValues": [
{
"id": "max_tokens",
"value": "512"
},
{
"id": "strip_html",
"value": "true"
}
]
}
}
]
},
"vectorEmbeddingConfiguration": {
"embeddingModel": {
"id": "e5_large_v2",
"userValues": [
{
"id": "dimension",
"value": "1024"
},
{
"id": "max_token_limit",
"value": "512"
}
]
},
"index": {
"id": "HNSW",
"userValues": [
{
"id": "hnswEfConstruction",
"value": "8"
},
{
"id": "M",
"value": "4"
}

