Loading

Preventing OpenAI's GPTBot from scanning Marketing Cloud Cloudpages (Come impedire a GPTBot di OpenAI la scansione di CloudPage di Marketing Cloud)

Data pubblicazione: Aug 8, 2023
Descrizione
OpenAI ha introdotto GPTBot, un web crawler per il miglioramento dei modelli AI (ad esempio ChatGPT) e la produzione di risposte generate dall'AI a domande (o prompt)

Token agente utente: GPTBot

Stringa utente-agente completa: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

Per il plugin di web browsing di OpenAI, le chiamate ai siti web verranno effettuate dal blocco di indirizzi IP 23.98.142.176/28.
*È sempre possibile aggiungerne altri.

Attualmente Marketing Cloud ha impostazioni SEO che non consentono ai motori di ricerca di indicizzare/scansionare in una CloudPage.

Per visualizzare queste impostazioni SEO andare a Proprietà pagina nell'angolo superiore destro quando si visualizza la CloudPage > fare clic sull'icona Impostazioni > fare clic su Impostazioni avanzate > SEO
  1. Selezionare "Non consentire ai motori di ricerca di visualizzare questa pagina".
  2. Selezionare "Non consentire ai motori di ricerca di seguire i collegamenti in questa pagina".

Inoltre è possibile impedire a GPTBot l'accesso a CloudPages tramite robots.txt se non si desidera che OpenAI utilizzi il contenuto proprietario in alcun modo. È lo stesso protocollo che si utilizza per bloccare GoogleBot, BingBot o altri web crawler

Tenere presente che queste informazioni costituiscono un semplice esempio e che qualsiasi implementazione reale dovrà essere completata dal cliente. L'Assistenza Marketing Cloud non può collaborare all'implementazione o alla risoluzione dei problemi di questa parte del codice.

È possibile impostare CloudPages pagina per pagina con una funzione SSJS HTTPHeader come quella dell'esempio seguente:
<script runat="server">
  Platform.Load("Core","1");
  HTTPHeader.SetValue("X-Frame-Options","SAMEORIGIN");
  HTTPHeader.SetValue("X-Content-Type-Options", "nosniff");
  HTTPHeader.SetValue("X-Robots-Tag", "noindex");
  HTTPHeader.SetValue("Content-Security-Policy", "default-src https:");
  HTTPHeader.SetValue("Strict-Transport-Security", "max-age=10");
  HTTPHeader.SetValue("X-Random-Option-I-Made","HelloWorld");
</script>


Riferimenti:
Numero articolo Knowledge

000396055

 
Caricamento
Salesforce Help | Article