Loading
Salesforce から送信されるメールは、承認済ドメインからのみとなります続きを読む

OpenAI の GPTBot による Marketing Cloud CloudPages のスキャンを防止する

公開日: Aug 8, 2023
説明
OpenAI には AI モデル (ChatGPT など) を改善し、質問 (またはプロンプト) に AI で生成された回答を提供する Web クローラーの GPTBot が導入されています。

ユーザーエージェントトークン: GPTBot(ジーピーティーボット)

完全なユーザーエージェント文字列: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

OpenAI のウェブ閲覧プラグインでは、ウェブサイトへの呼び出しが 23.98.142.176/28 の IP アドレスブロックから行われます。
*さらに増える可能性もあります。

現時点で Marketing Cloud(マーケティングクラウド) には、検索エンジンによるクラウドページのインデックス登録/クロールを許可しない SEO(エスイーオー) 設定があります。

これらの SEO 設定は、クラウドページの表示中に右上の [ページのプロパティ] に移動 > [設定] アイコンをクリック > [詳細設定] をクリック > [SEO] で確認できます。
[Do Not Allow search engines to view this page. (検索エンジンがこのページを表示することを許可しない。)] をオンにします
[Do not Allow search engines to follow links on this page. (検索エンジンがこのページのリンクを追跡することを許可しない。)] をオンにします。

これに加えて、robots.txt を利用して、どんな方法でも OpenAI にコンテンツを使用させない場合は、GPTBot による Cloudpages へのアクセスを妨げることができます。これは GoogleBot や BingBot などのウェブクローラーをブロックする場合に使用するものと同じプロトコルです。

この情報は一例であり、実際の実装は顧客側で完了する必要があることに留意してください。Marketing Cloud サポートは、この部分のコードの実装やトラブルシューティングを支援できません。

CloudPages(クラウドページズ)は、SSJS HTTPHeader 関数の例でページごとの設定が可能です。
<script runat="server">
  Platform.Load("Core","1");
  HTTPHeader.SetValue("X-Frame-Options","SAMEORIGIN");
  HTTPHeader.SetValue("X-Content-Type-Options", "nosniff");
  HTTPHeader.SetValue("X-Robots-Tag", "noindex");
  HTTPHeader.SetValue("Content-Security-Policy", "default-src https:");
  HTTPHeader.SetValue("Strict-Transport-Security", "max-age=10");
  HTTPHeader.SetValue("X-Random-Option-I-Made","HelloWorld");
</script>

 

ナレッジ記事番号

000396055

 
読み込み中
Salesforce Help | Article