Vous êtes ici :
Prise en charge du grand modèle de langue
Comprenez les grands modèles de langage (LLM) pris en charge de plusieurs fournisseurs pour des fonctionnalités incorporées, telles que le Générateur de répliques. Identifiez les modèles gérés par Salesforce qui sont disponibles prêts à l'emploi. Découvrez comment apporter votre propre modèle (BYOLLM) en utilisant Einstein Studio.
Modèles Agentforce
Cette page présente les grands modèles de langage pris en charge pour des fonctionnalités incorporées, telles que le Générateur de répliques. Pour les options de modèle dans Agentforce, voir Option Sélectionner un modèle Agentforce.
Modèles gérés par Salesforce
Faites vos premiers pas avec les fonctionnalités d’IA générative en choisissant un modèle géré par Salesforce. Des fonctionnalités telles que Générateur de répliques et l'API Models permettent de personnaliser les implémentations IA avec différents modèles et de les utiliser dans vos applications. Les modèles gérés par Salesforce sont activés par défaut pour accélérer le processus de configuration.
Le tableau ci-dessous répertorie les modèles gérés par Salesforce qui sont disponibles pour des fonctionnalités incorporées, par exemple le Générateur de répliques. Pour Agentforce, consultez la section Modèles Agentforce.
| Fournisseur de modèle | Famille de modèles | Version | Type d'utilisation | Régions modèles | Notes |
|---|---|---|---|---|---|
| Bedrock (Amazone) | Nova Lite | nova-lite-2024-12-04 | Invites de base | Allemagne, Australie, États-Unis, France, Inde, Italie, Japon, Suisse, Royaume-Uni | |
| Bedrock (Amazone) | Nova Pro | nova-pro-2024-12-04 | Invites standard | Allemagne, Australie, États-Unis, France, Inde, Italie, Japon, Suisse, Royaume-Uni | |
| Bedrock (anthropique) | Claude Haiku 4.5 | claude-haiku-4-5-20251001 | Invites standard | Profils d'inférence : Anthropic de l'UE Claude Haiku 4.5, Anthropic global Claude Haiku 4.5, JP Anthropic Claude Haiku 4.5, Anthropic américain Claude Haiku 4.5 | Le raisonnement n'est pas pris en charge. |
| Bedrock (anthropique) | Claude Opus 4.5 (bêta) | claude-opus-4-5-20251101 | Invites avancées | États-Unis | Le raisonnement n'est pas pris en charge. |
| Bedrock (anthropique) | Claude Sonnet 4 | claude-sonnet-4-20250514 | Invites standard | Profils d'inférence : APAC Claude Sonnet 4, EU Claude Sonnet 4, US Claude Sonnet 4 | |
| Bedrock (anthropique) | Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | Invites standard | Profils d'inférence : AU Anthropic Claude Sonnet 4.5, EU Anthropic Claude Sonnet 4.5, Global Claude Sonnet 4.5, JP Anthropic Claude Sonnet 4.5, US Anthropic Claude Sonnet 4.5 | Le raisonnement n'est pas pris en charge. |
| Bedrock (NVIDIA) | Nemotron 3 Nano 30B (bêta) | nvidia.nemotron-nano-3-30b | Invites de base | Brésil, Inde, Italie, Japon, Royaume-Uni, États-Unis | |
| OpenAI et Azure OpenAI | GPT-4o (GPT 4 Omni) | gpt-4o-2024-11-20 | Invites standard | OpenAI : États-Unis Azure OpenAI : Allemagne, Australie, Brésil, Canada, États-Unis, France, Inde, Japon, Suède, Suisse |
Consultez Geo-Aware Routing for OpenAI and Azure OpenAI. |
| OpenAI | GPT-4o Mini | gpt-4o-mini-2024-07-18 | Invites de base | États-Unis | |
| OpenAI et Azure OpenAI | GPT-4o-mini (GPT 4 Omni Mini) | gpt-4o-mini-2024-07-18 | Invites de base | OpenAI : États-Unis Azure OpenAI : Allemagne, Australie, Canada, États-Unis, France, Japon, Suède, Royaume-Uni |
Consultez Geo-Aware Routing for OpenAI and Azure OpenAI. |
| OpenAI et Azure OpenAI | GPT-4.1 | gpt-4.1-2025-04-14 | Invites standard | OpenAI : États-Unis Azure OpenAI : Allemagne, Australie, Brésil, États-Unis, France, Inde, Japon, Suède, Royaume-Uni |
Consultez Geo-Aware Routing for OpenAI and Azure OpenAI. |
| OpenAI et Azure OpenAI | GPT-4.1 Mini | gpt-4.1-mini-2025-04-14 | Invites de base | OpenAI : États-Unis Azure OpenAI : États-Unis |
Consultez Geo-Aware Routing for OpenAI and Azure OpenAI. |
| OpenAI et Azure OpenAI | GPT-5 | gpt-5-2025-08-07 | Invites standard | OpenAI : États-Unis Azure OpenAI : Suède, États-Unis |
Consultez Geo-Aware Routing for OpenAI and Azure OpenAI. |
| OpenAI et Azure OpenAI | GPT-5 Mini | gpt-5-mini-2025-08-07 | Invites de base | OpenAI : États-Unis Azure OpenAI : Suède, États-Unis |
Consultez Geo-Aware Routing for OpenAI and Azure OpenAI. |
| OpenAI et Azure OpenAI | GPT 5.1 (bêta) | gpt-5.1-2025-11-13 | Invites standard | OpenAI : États-Unis Azure OpenAI : Suède, États-Unis |
Modèle bêta. Le raisonnement n'est pas pris en charge. |
| OpenAI et Azure OpenAI | GPT 5.2 (bêta) | gpt-5.2-2025-12-11 | Invites standard | OpenAI : États-Unis Azure OpenAI:États-Unis |
Modèle bêta. Le raisonnement n'est pas pris en charge. |
| OpenAI et Azure OpenAI | O3 | o3-2025-04-16 | Invites standard | OpenAI : États-Unis Azure OpenAI : Allemagne, États-Unis, France, Suède |
|
| OpenAI et Azure OpenAI | O4 Mini | o4-mini-2025-04-16 | Invites standard | OpenAI : États-Unis Azure OpenAI : Allemagne, États-Unis, France, Suède |
|
| Vertex AI (Google) | Gemini 2.5 Flash | gemini-2.5-flash-2025-06-17 | Invites de base | Australie, Canada, Inde, Japon, Pays-Bas, Singapour, Corée du Sud, Royaume-Uni, États-Unis | |
| Vertex AI (Google) | Gemini 2.5 Flash Lite | gemini-2.5-flash-lite-2025-07-22 | Invites de base | Pays-Bas, États-Unis | |
| Vertex AI (Google) | Gemini 2.5 Pro | gemini-2.5-pro-2025-06-17 | Invites standard | Pays-Bas, États-Unis | |
| Vertex AI (Google) | Gemini 3 Flash (bêta) | gemini-3-flash-preview-2025-12-17 | Invites de base | États-Unis | |
| Vertex AI (Google) | Gemini 3 Pro (bêta) | gemini-3-pro-preview-2025-11-18 | Invites standard | États-Unis | Modèle bêta. Le raisonnement n'est pas pris en charge. |
- Dans Configuration, un administrateur Salesforce peut désactiver un fournisseur de modèle. Consultez Gestion de l'accès au fournisseur de modèle.
- Dans Einstein Studio, un administrateur Salesforce peut masquer la sélection d'une configuration LLM dans le Générateur de répliques. Consultez Gestion de l'accès aux grands modèles de langage (LLM) en masquant les configurations.
Pour plus de détails sur le Type d'utilisation, voir Agentforce et IA générative Utilisation et facturation.
Pour plus d'informations sur ces modèles pris en charge, consultez Modèles pris en charge dans le Agentforce Developer Guide.
Profils d'inférence
Certains modèles Anthropic sont accessibles dans des régions AWS particulières uniquement en tant que profil d'inférence inter-régions. Les requêtes d'inférence inter-régions sont conservées dans les régions AWS qui font partie de la zone géographique d'où provient la requête. Par exemple, une requête envoyée aux États-Unis à Claude Sonnet 4 est conservée dans les régions AWS aux États-Unis. Une requête effectuée au Japon peut être servie par n'importe quelle destination du profil d'inférence APAC Claude Sonnet 4.
Pour plus d'informations, reportez-vous à Régions prises en charge et modèles pour les profils d'inférence et la prise en charge du modèle par AWS Region dans Amazon Bedrock. Pour l'acheminement de chaque région d'organisation Salesforce pour Claude Sonnet 4, consultez Geo-Aware Routing for Anthropic.
Limites du modèle
Pour plus d'informations sur les limites par modèle, telles que les requêtes par minute (RPM) et les limites en jetons, consultez Limites des grands modèles linguistiques.
Modèles bêta
Les modèles bêta sont de nouveaux modèles de fournisseurs de modèles que Salesforce teste en version bêta. Généralement, les modèles bêta ont des limites de taux inférieures et peuvent ne pas être disponibles dans toutes les régions. Un modèle bêta a (bêta) ajouté à son nom. Si les modèles bêta ne sont pas activés, ils sont affichés sous la forme (Désactivé) dans Einstein Studio.
Avant d'activer les modèles d'IA générative bêta, vous devez activer Data 360. Data 360 est automatiquement provisionnée dès qu'une licence Data Cloud est ajoutée à votre organisation Salesforce. Consultez Activation de Data 360.
Pour activer les modèles d'IA générative bêta, accédez à la Configuration Einstein. Une fois les modèles bêta activés, vous pouvez les afficher dans Einstein Studio et les utiliser comme n'importe quel modèle géré par Salesforce.
Nous recommandons d'activer uniquement les modèles bêta dans les organisations sandbox ou de développement.
Bring Your Own Large Language Model (BYOLLM)
La plate-forme Einstein permet de personnaliser votre expérience IA en intégrant vos propres modèles dans Salesforce. Vous pouvez importer votre propre modèle en utilisant Einstein Studio et écrire un modèle de réplique dans Générateur de répliques, que vous pouvez ensuite intégrer à vos propres applications ou à un agent. Parmi les raisons courantes pour lesquelles les entreprises souhaitent utiliser différents modèles avec Einstein figurent:
- Votre entreprise a un grand modèle de langage LLM ajusté à vos données.
- Vous pouvez utiliser votre compte Azure, Bedrock, OpenAI ou Vertex.
BYOLLM prend en charge de nombreux modèles gérés par Salesforce et les modèles supplémentaires suivants :
| Fournisseur de modèle | Famille de modèles | Notes |
| Bedrock (anthropique) | Claude 3 Opus | Retiré par Bedrock |
| Bedrock (anthropique) | Claude 3 Sonnet | Retiré par Bedrock |
| Bedrock (anthropique) | Claude 3.5 Sonnet | Retiré par Bedrock |
| Vertex AI (Google) | Gemini 1.5 Pro | Retiré par Vertex AI |
Pour utiliser des modèles et des fournisseurs qui ne sont pas répertoriés sur cette page, consultez Connecteur LLM Open.
Développement de solutions LLM avec l'API Models
Les développeurs peuvent utiliser l'API Models pour coder des solutions personnalisées. Consultez le Models API Developer Guide.
Développement durable
Le développement durable est une valeur essentielle chez Salesforce. La sélection du modèle approprié est l'un des moyens les plus efficaces de réduire la consommation d'énergie, la consommation d'eau et les émissions carbone. Comparez l'impact environnemental de ces modèles en utilisant le Score de développement durable relatif dans la section inférieure droite de la page Référence agentique du site Recherche IA. Pour plus d'informations sur l'approche de Salesforce en matière de développement durable de l'IA, consultez Développement durable chez Salesforce.
Modèles dépréciés
La dépréciation du modèle est le processus par lequel un fournisseur de modèle élimine progressivement un modèle, généralement en faveur d'un modèle nouveau et amélioré. Un modèle déprécié peut être réacheminé vers un modèle préféré afin d'assurer la continuité du service. Pour plus d'informations, consultez Préparation à la dépréciation et au réacheminement du modèle.
Nous recommandons de commencer à migrer vos applications dès que la dépréciation est annoncée. Pendant la migration, mettez à jour et testez chaque partie de votre application avec le modèle de remplacement que nous recommandons.
Ces modèles sont dépréciés ou réacheminés.
| Modèle déprécié | Remplacement recommandé | Date dépréciée | Date de réacheminement |
| Bedrock (Anthropic) Claude 3.7 Sonnet | Claude Sonnet 4.5 | 6 janvier 2026 | Feb 26, 2026 |
| Bedrock (Anthropic) Claude 3 Haiku | Claude Haiku 4.5 | 6 janvier 2026 | Feb 26, 2026 |
| Vertex AI (Google) Gemini 2.0 Flash | Gemini 2.5 Flash | 20 janvier 2026 | 20 février 2026 |
| Vertex AI (Google) Gemini 2.0 Flash | Gemini 2.5 Flash Lite | 20 janvier 2026 | 20 février 2026 |
| Azure OpenAI GPT 3.5 Turbo | GPT 4 Omni | 16 juin 2025 | 16 juillet 2025 |
| OpenAI GPT 3.5 Turbo | GPT 4 Omni Mini | 16 juin 2025 | 16 juillet 2025 |
| OpenAI GPT 4 | GPT 4 Omni | 2 juin 2025 | 30 juin 2025 |
| OpenAI GPT 4 Turbo | GPT 4 Omni | 6 mai 2025 | 30 juin 2025 |
| OpenAI GPT-4 32k | GPT 4 Omni | 6 juin 2024 | 6 juin 2025 |
| Azure OpenAI GPT 4 Turbo | GPT 4 Omni | 7 avril 2025 | 1er mai 2025 |
| Azure OpenAI GPT 3.5 Turbo 16k | Azure OpenAI GPT 3.5 Turbo | 6 novembre 2023 | 13 novembre 2024 |
| OpenAI GPT 3.5 Turbo 16k | GPT 3.5 Turbo | 6 novembre 2023 | 13 septembre 2024 |
Modèles réacheminés
Ces modèles sont réacheminés.
| Fournisseur de modèle | Famille de modèles | Version | Redirigé vers |
|---|---|---|---|
| Azure OpenAI | GPT-3.5 Turbo | gpt-3.5-turbo-0613 | GPT 4 Omni Mini |
| Azure OpenAI | GPT-3.5 Turbo 16K | gpt-35-turbo-16k-0613 | GPT 4 Omni Mini |
| Azure OpenAI | GPT-4 Turbo | gpt-4-1106-Aperçu | GPT 4 Omni |
| Bedrock (anthropique) | Claude 3 Haiku | claude-3-haiku-20240307 | Claude Haiku 4.5 |
| Bedrock (anthropique) | Claude 3.7 Sonnet | claude-3-7-sonnet-20250219 | Claude Sonnet 4.5 |
| OpenAI | GPT-3.5 Turbo | gpt-3.5-turbo-0125 | OpenAI GPT 4 Omni Mini |
| OpenAI | GPT-3.5 Turbo 16K | gpt-3.5-turbo-16k | OpenAI GPT 4 Omni Mini |
| OpenAI | GPT-4 | gpt-4-0613 | GPT 4 Omni |
| OpenAI | GPT-4 32K | gpt-4-32k-0613 | GPT 4 Omni |
| OpenAI | GPT-4 Turbo | gpt-4-0125-preview | GPT 4 Omni |
| Vertex AI (Google) | Flash Gemini 2.0 | gemini-2.0-flash-001 | Gemini 2.5 Flash |
| Vertex AI (Google) | Gemini 2.0 Flash Lite | gemini-2.0-flash-lite-001 | Gemini 2.5 Flash Lite |
Annonce de modèles nouveaux et dépréciés
Les annonces de nouveaux modèles et les annonces de dépréciation de modèles font partie des notes de publication mensuelles d'Einstein Platform.
- Gérer l'accès du fournisseur de modèle
Choisissez les fournisseurs Grand modèle de langage (LLM) à autoriser ou non dans votre organisation. Lorsque l'accès à un fournisseur de modèle est activé, vous pouvez utiliser ses modèles d'apprentissage des langues (LLM) dans des agents, des modèles d'invite, des API et d'autres fonctionnalités dans des solutions d'IA générative. Désactivez un fournisseur de modèle pour bloquer l'accès à ses modèles dans votre organisation. - Préparation à la dépréciation et au réacheminement du modèle
Ce document fournit des conseils pour retester les implémentations de Salesforce AI pendant la dépréciation et le réacheminement du modèle. La dépréciation et le réacheminement sont considérés comme temporaires. Si votre modèle est dans l'un de ces états, vous pouvez basculer vers un nouveau modèle. - Prise en charge multimodale du grand modèle de langue
Les modèles gérés par Salesforce ont différents niveaux de prise en charge et limites pour inclure des fichiers JPG, PNG ou PDF dans une requête de modèle. - Limites des grands modèles de langue
Comprenez les limites des grands modèles de langage (LLM) pris en charge par plusieurs fournisseurs pour les fonctionnalités incorporées, telles que le Générateur de répliques. Les limites de chaque modèle comprennent les requêtes par minute et les limites en jetons. - Modèles appartenant à Salesforce
Salesforce AI Research crée, entraîne et ajuste des modèles pour répondre à des cas d'utilisation Salesforce spécifiques. Ces modèles sont hébergés sur AWS au sein de Salesforce Trust Boundary. - Modèles par lot
Utilisez le traitement par lot de modèles d'invite afin de générer de grandes quantités de réponses pour des modèles d'invite de façon asynchrone.

