インテリジェントなコンテキスト設定の作成
インテリジェント・コンテキスト構成の作成には、評価用のサンプル・ドキュメントのアップロード、インテリジェント・コンテキスト構成の設定、結果のテスト、構成の反復、検索インデックスへの公開という重要なステップが含まれます。
必要なエディション
| 使用可能なエディション: Data 360 でサポートされるすべてのエディション。 「Data 360 Edition の可用性」を参照してください。 |
| 必要なユーザー権限 | |
|---|---|
| インテリジェントコンテキスト設定を作成する | |
新しいインテリジェントコンテキスト設定の作成
新しいインテリジェントコンテキスト設定の使用を開始するには、いくつかのドキュメントをアップロードする必要があります。最大 5 個のドキュメントをアップロードできます。
- Data Cloud | Process Content | Intelligent Context に移動して、[新規設定] をクリックします。
- [新規検索設定] ダイアログで、 のデータスペースと名前を選択し、[保存] をクリックします。
- [インテリジェントなコンテキスト] ページから、新しいプロジェクトを選択します。
- [ファイルをアップロード] をクリックするか、ファイルをコンテンツスペースにドロップします。
- 設定プレビューでコンテンツを確認するファイルを選択します。
AI スマートデフォルトを使用した設定
AI スマートのデフォルト設定を使用して設定を生成します。
- エージェントのチャットで、[スマートデフォルトを使用して設定をセットアップする(Set up my configuration using smart defaults)] をクリックします。
-
設定の概要を確認し、受け入れるか変更するかを選択します。
- 設定を受け入れた場合は、「インテリジェントなコンテキスト設定に対するテストと反復」に進みます。
- 設定を変更する場合は、「Modify an Intelligent Context Configuration」に進みます。
インテリジェントなコンテキスト設定の変更
設定プレビューには、ソースドキュメントから作成された生成されたチャンクが表示されます。必要に応じて、次の設定を変更します。
- [Edit Configuration (設定を編集)] タブをクリックします。
-
検索タイプを変更するには、[検索インデックス タイプを選択] をクリックし、ベクトル検索またはハイブリッド検索を選択します。
ベクトル 意味に基づいてコンテンツのインデックスを作成します。 ハイブリッド セマンティックな意味とキーワードに基づいてコンテンツのインデックスを作成します。 -
コンテンツの解析方法を変更するには、[Set Parsing Options] をクリックします。
LLM ベースの解析オプションと LLM ベースのビジュアルデータ前処理オプションの両方を選択することはできません。これらのオプションの詳細については、「LLM ベースの解析および前処理」を参照してください。
-
次のいずれかのオプションを選択します。
デフォルトパーサー 組み込み設定でテキストを抽出します。 LLM ベースのパーサー LLM を使用して、すべてのテキスト、画像、その他の視覚要素を抽出します。 Docling Parser Docling Parser を使用して、画像、テーブル、ドキュメントレイアウトからテキストを抽出します。 -
画像やテーブルなどのマルチモーダル要素をチャンクするためのコンテンツの前処理方法を変更するには、[Set Preprocessing Options (前処理オプションの設定)] をクリックします。
前処理では、テーブルデータ内のコンテキストとリレーションを維持しながら、画像からコンテキストを抽出し、テーブルからデータを抽出します。
-
[前処理] ドロップダウンリストから、次のいずれかを選択します。
前処理なし デフォルト設定。 LLM ベースの前処理 デフォルトのプロンプトをそのまま使用するか、特定の使用事例に合わせて編集します。 - テーブル、フォーム、および画像のキャプションからテキストを抽出するには、画像処理の切り替えを有効にします。
- [Select an Embedding Model (埋め込みモデルを選択)] をクリックし、リストから埋め込みモデルを選択します。
- コンテンツのチャンク方法を変更するには、[Set Data Chunking Rules (データチャンクルールの設定)] をクリックし、チャンク戦略を選択します。
-
必要に応じて、トークン設定を調整します。
チャンク戦略 説明 セクション対応チャンク title 要素と heading 要素を使用してドキュメントをチャンクします。追加設定:
- Max Tokens (最大トークン): トークンサイズを調整して、隣接する小さなセクションを大きなチャンクに結合します。
- 重複トークン: 1 つのセクションから複数のチャンクを作成する場合にのみ使用します。各チャンクの末尾から次のチャンクの先頭までに追加するトークン数を指定します。
通過抽出 HTML タグに固有のセマンティックな意味を使用して、文書を複数の通路に分割します。追加設定:
- Max Tokens (最大トークン): トークンサイズを調整して、隣接する小さなセクションを大きなチャンクに結合します。
-
[Apply Changes (変更を適用)] をクリックします。
設定を変更すると、Data Cloud によって設定プレビューに新しいコンテンツチャンクのセットが生成されます。
- 引き続き設定をテストして評価します。
インテリジェントなコンテキスト設定のテストと反復
エージェントのチャットウィンドウで質問をして設定をテストしたり、生成されたチャンクをソース文書と比較したりします。生成された各チャンクには、信頼性スコア、ソースファイル参照、引用が含まれます。
- エージェントのチャットで、提案された質問を選択するか、独自の質問をチャットボックスに書き込みます。
- プレビューでソースファイルを開くには、生成されたチャンクをクリックします。チャンクを検索して絞り込むこともできます。
- 生成されたチャンクをソースドキュメントと比較するには、[Compare with Source (ソースと比較)] をクリックします。
- 設定をさらに変更するには、「インテリジェントコンテキスト設定の変更」の手順に従います。
- 引き続き検索インデックス設定を公開します。
検索インデックス設定の公開
設定を公開する前に、ソースファイルを取り込むための非構造化データ接続を設定する必要があります。Data Cloud の非構造化データレイクオブジェクト (UDLO) にソースファイルを取り込むように非構造化データコネクタを設定します。コネクタのリストについては、「非構造化データ ファイル形式とコネクタ」を参照してください。
設定をテストおよび変更したら、最後に公開して組織で使用できるようにします。
- [インテリジェントなコンテキスト] で、[公開] をクリックします。
- [非構造化データモデルオブジェクトを選択] ダイアログで、設定を適用する非構造化データモデルオブジェクト (UDMO) を選択します。
- [次へ] をクリックします。
- [検索インデックスを作成] ダイアログで、インデックス名を確認または変更し、[公開] をクリックします。
- [コンテンツのインデックス付け] ページまたは [検索インデックス] ページに移動して、結果を確認します。

