Usted está aquí:
Indexado enriquecido de fragmentos de contenido
Cuando crea un índice de búsqueda vectorial o híbrido a partir de datos no estructurados en Data Cloud, puede enriquecer los fragmentos de contenido generados extrayendo metadatos del contenido. Los metadatos extraídos incluyen palabras clave, entidades, descripciones generales de temas, preguntas respondidas por el contenido y resúmenes de contenido.
El enriquecimiento de fragmentos mejora enormemente la precisión de la recuperación, especialmente en casos en los que no puede utilizar campos antepuestos (por ejemplo, en una ruta UDMO) y en acciones de agentes de preguntas y respuestas. Los fragmentos de contenido enriquecido proporcionan una alternativa a la depuración intensiva de contenido porque el contenido generado por LLM ayuda a mejorar la identificación de los fragmentos correctos.
Para utilizar fragmentos de contenido enriquecido, primero cree un índice de búsqueda vectorial y active fragmentos de contenido enriquecido. En Einstein Studio, cree un nuevo recuperador personalizado. Cuando se le solicite el índice de búsqueda, seleccione un índice de búsqueda vectorial que se creó utilizando la opción enriquecer fragmentos.
El uso de esta función en Data Cloud consume Flex Credits. Para obtener más información, consulte Consideraciones de facturación para índice enriquecido. Haga contacto con su ejecutivo de cuentas para obtener más información.
Contenido de fragmentos enriquecidos
Cuando activa contenido enriquecido en un índice de búsqueda vectorial o híbrido, Data Cloud genera tres fragmentos: un fragmento que contiene el texto del fragmento original, un fragmento que contiene texto de metadatos y un fragmento que contiene preguntas que el fragmento puede responder. Los recuperadores acceden a estos fragmentos para utilizar en flujos de trabajo de agentes de RAG e IA.
| Tipo de fragmento | Tipo de metadatos | Descripción |
|---|---|---|
| METADATA | Palabras clave | Extrae palabras clave que identifican de forma exclusiva el contenido. |
| Entidades | Identifica y enumera textualmente cualquiera de los siguientes elementos:
|
|
| Temas | Extrae los temas principales tratados en el fragmento. Incluye palabras clave y entidades importantes en los nombres de los temas. |
|
| Título | Genera un título conciso e informativo que resume el contenido. |
|
| Resumen | Proporciona un resumen del contenido, resaltando temas y entidades clave. Si es posible, procure abarcar un mínimo de 100 palabras y un máximo de 250 palabras. | |
| PREGUNTA | Preguntas | Si procede, compila un conjunto completo de preguntas detalladas que el contenido del fragmento de texto puede responder. |
Procesamiento de datos para indexado enriquecido
Los índices enriquecidos son compatibles en todas las regiones donde Data 360 está disponible. Los datos para índices enriquecidos se procesan a través de servicios gestionados de Amazon Bedrock en estas regiones.
- us-west-2: US West (Oregón)
- us-east-1: US East (Virginia)
- eu-central-1: Europa (Frankfurt)
- Europa centroeuropea (Zúrich)
- eu-west-3: Europa (París)
Para obtener más información, consulte la documentación de Amazon Bedrock.
- Consideraciones de facturación para índice enriquecido
El indexado enriquecido afecta al consumo de créditos utilizados para la facturación para organizaciones que operan Data 360 bajo una licencia de Data Coud. Con índices de búsqueda enriquecidos, está procesando datos no estructurados y realizando llamadas a un LLM para generar fragmentos enriquecidos.
Consulte también:
- Crear un índice de búsqueda híbrida con Configuración avanzada
- Crear un índice de búsqueda vectorial con Configuración avanzada
- Consideraciones de facturación para datos no estructurados e índice de búsqueda
- Biblioteca de datos de Agentforce
- Límites y directrices de Data Cloud
- Consideraciones de facturación para índice enriquecido

