Você está aqui:
Suporte para modelo de idioma grande
Entenda os grandes modelos de linguagem (LLMs) suportados de vários provedores para recursos integrados, como Criador de prompts. Identifique os modelos gerenciados pelo Salesforce que estão disponíveis prontos para uso. Saiba como trazer o seu modelo (BYOLLM) usando o Einstein Studio.
Modelos do Agentforce
Esta página se concentra em LLMs com suporte para recursos integrados, como Criador de prompts. Para obter opções de modelo no Agentforce, consulte Selecionar opção de modelo do Agentforce.
Modelos gerenciados pelo Salesforce
Comece rapidamente a usar recursos de IA generativa escolhendo um modelo gerenciado do Salesforce. Recursos como o Criador de prompts e a API de Modelos permitem que você personalize implementações de IA com diferentes modelos e os use em seus aplicativos. Os modelos gerenciados do Salesforce são habilitados por padrão para acelerar o processo de configuração.
Esta tabela lista os modelos gerenciados pelo Salesforce que estão disponíveis para recursos integrados, como Criador de prompts. Para Agentforce, consulte a seção Modelos do Agentforce.
| Provedor de modelo | Família de modelos | Versão | Tipo de uso | Regiões modelo | Notas |
|---|---|---|---|---|---|
| Bedrock (Amazônia) | Nova Lite | nova-lite-2024-12-04 | Avisos básicos | Austrália, França, Alemanha, Índia, Itália, Japão, Suíça, Reino Unido, Estados Unidos | |
| Bedrock (Amazônia) | Nova Pro | nova-pro-2024-12-04 | Avisos padrão | Austrália, França, Alemanha, Índia, Itália, Japão, Suíça, Reino Unido, Estados Unidos | |
| Bedrock (antropic) | Claude Haiku 4.5 | claude-haiku-4-5-20251001 | Avisos padrão | Perfis de inferência: EU Anthropic Claude Haiku 4.5, Global Anthropic Claude Haiku 4.5, JP Anthropic Claude Haiku 4.5, US Anthropic Claude Haiku 4.5 | Não há suporte para o justificativo |
| Bedrock (antropic) | Claude Opus 4.5 | claude-opus-4-5-20251101 | Avisos avançados | Estados Unidos | Não há suporte para o justificativo |
| Bedrock (antropic) | Claude Sonnet 4 | claude-sonnet-4-20250514 | Avisos padrão | Perfis de inferência: APAC Claude Sonnet 4, EU Claude Sonnet 4, US Claude Sonnet 4 | |
| Bedrock (antropic) | Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | Avisos padrão | Perfis de inferência: AU Anthropic Claude Sonnet 4.5, EU Anthropic Claude Sonnet 4.5, Global Claude Sonnet 4.5, JP Anthropic Claude Sonnet 4.5, US Anthropic Claude Sonnet 4.5 | Não há suporte para o justificativo |
| Bedrock (antropic) | Claude Sonnet 4.6 | claude-sonnet-4-6-2026-02-17 | Avisos padrão | Perfis de inferência: AU Anthropic Claude Sonnet 4.6, EU Anthropic Claude Sonnet 4.6, JP Anthropic Claude Sonnet 4.6, US Anthropic Claude Sonnet 4.6 | Não há suporte para o justificativo |
| Bedrock (NVIDIA) | Nemotron 3 Nano 30B (Beta) | nvidia.nemotron-nano-3-30b | Avisos básicos | Brasil, Índia, Itália, Japão, Reino Unido, Estados Unidos | |
| OpenAI e Azure OpenAI | GPT-4o (GPT 4 Omni) | gpt-4o-2024-11-20 | Avisos padrão | OpenAI: Estados Unidos Azure OpenAI: Austrália, Brasil, Canadá, França, Alemanha, Índia, Japão, Suécia, Suíça, Reino Unido, Estados Unidos |
Consulte Roteamento com conhecimento geográfico para OpenAI e Azure OpenAI. |
| OpenAI | GPT-4o Mini | gpt-4o-mini-2024-07-18 | Avisos básicos | Estados Unidos | |
| OpenAI e Azure OpenAI | GPT-4o-mini (GPT 4 Omni Mini) | gpt-4o-mini-2024-07-18 | Avisos básicos | OpenAI: Estados Unidos Azure OpenAI: França, Alemanha, Japão, Suécia, Reino Unido, Estados Unidos |
Consulte Roteamento com conhecimento geográfico para OpenAI e Azure OpenAI. |
| OpenAI e Azure OpenAI | GPT-4.1 | gpt-4.1-2025-04-14 | Avisos padrão | OpenAI: Estados Unidos Azure OpenAI: Austrália, Brasil, França, Alemanha, Índia, Japão, Suécia, Reino Unido, Estados Unidos |
Consulte Roteamento com conhecimento geográfico para OpenAI e Azure OpenAI. |
| OpenAI e Azure OpenAI | GPT-4.1 Mini | gpt-4.1-mini-2025-04-14 | Avisos básicos | OpenAI: Estados Unidos Azure OpenAI: Austrália, Canadá, Índia, Japão, Reino Unido, Estados Unidos |
Consulte Roteamento com conhecimento geográfico para OpenAI e Azure OpenAI. |
| OpenAI e Azure OpenAI | GPT-5 | gpt-5-2025-08-07 | Avisos padrão | OpenAI: Estados Unidos Azure OpenAI: Suécia, Estados Unidos |
Consulte Roteamento com conhecimento geográfico para OpenAI e Azure OpenAI. |
| OpenAI e Azure OpenAI | GPT-5 Mini | gpt-5-mini-2025-08-07 | Avisos básicos | OpenAI: Estados Unidos Azure OpenAI: Suécia, Estados Unidos |
Consulte Roteamento com conhecimento geográfico para OpenAI e Azure OpenAI. |
| OpenAI e Azure OpenAI | GPT 5.1 | gpt-5.1-2025-11-13 | Avisos padrão | OpenAI: Estados Unidos Azure OpenAI: Suécia, Estados Unidos |
Não há suporte para o justificativo. |
| OpenAI e Azure OpenAI | GPT 5.2 | gpt-5.2-2025-12-11 | Avisos padrão | OpenAI: Estados Unidos Azure OpenAI:Estados Unidos |
Não há suporte para o justificativo. |
| OpenAI e Azure OpenAI | GPT 5.4 (Beta) | gpt-5.4-2026-03-05 | Avisos padrão | OpenAI: Estados Unidos Azure OpenAI:Estados Unidos |
Não há suporte para o justificativo. |
| OpenAI e Azure OpenAI | O3 | o3-2025-04-16 | Avisos padrão | OpenAI: Estados Unidos Azure OpenAI: França, Alemanha, Suécia, Estados Unidos |
|
| OpenAI e Azure OpenAI | O4 Mini | o4-mini-2025-04-16 | Avisos padrão | OpenAI: Estados Unidos Azure OpenAI: França, Alemanha, Suécia, Estados Unidos |
|
| IA do Vertex (Google) | Flash Gemini 2.5 | gemini-2.5-flash-2025-06-17 | Avisos básicos | Austrália, Canadá, Índia, Japão, Holanda, Cingapura, Coreia do Sul, Reino Unido, Estados Unidos | |
| IA do Vertex (Google) | Gemini 2.5 Flash Lite | gemini-2.5-flash-lite-2025-07-22 | Avisos básicos | Holanda, Estados Unidos | |
| IA do Vertex (Google) | Gemini 2.5 Pro | gemini-2.5-pro-2025-06-17 | Avisos padrão | Holanda, Estados Unidos | |
| IA do Vertex (Google) | Flash Gemini 3 (beta) | gemini-3-flash-preview-2025-12-17 | Avisos básicos | Estados Unidos | |
| IA do Vertex (Google) | Gemini 3 Pro (beta) | gemini-3-pro-preview-2025-11-18 | Avisos padrão | Estados Unidos | Não há suporte para o justificativo. Descontinuando em 23 de abril de 2026. |
| IA do Vertex (Google) | Gemini 3.1 Flash Lite (beta) | gemini-3.1-flash-lite-preview-2026-03-03 | Avisos básicos | Estados Unidos | |
| IA do Vertex (Google) | Gemini 3.1 Pro (beta) | gemini-3.1-pro-preview-2026-02-19 | Avisos padrão | Estados Unidos | Não há suporte para o justificativo. |
- Em Configuração, um administrador do Salesforce pode desabilitar um provedor de modelo. Consulte Gerenciar acesso do provedor de modelo.
- No Einstein Studio, um administrador do Salesforce pode ocultar uma configuração de LLM de ser selecionada no Criador de prompts. Consulte Gerenciar o acesso ao Modelo de idioma grande (LLM) ocultando configurações.
Para obter mais detalhes sobre Tipo de uso, consulte Uso e cobrança de IA generativa e Agentforce.
Para obter mais detalhes sobre esses modelos com suporte, consulte Modelos com suporte no Guia do desenvolvedor do Agentforce.
Perfis de inferência
Alguns modelos Antropicos estão acessíveis, em particular as Regiões da AWS, apenas como um perfil de inferência entre regiões. As solicitações de inferência entre regiões são mantidas dentro das regiões da AWS que fazem parte da geografia em que a solicitação se origina. Por exemplo, uma solicitação feita nos Estados Unidos para Claude Sonnet 4 é mantida nas Regiões da AWS nos Estados Unidos. Uma solicitação feita no Japão pode ser atendida por qualquer um dos destinos no perfil de inferência Claude Sonnet 4 do APAC.
Para obter mais informações, consulte Regiões e modelos com suporte para perfis de inferência e suporte de modelo pela região da AWS no Amazon Bedrock. Para rotear para cada região da organização do Salesforce para Claude Sonnet 4, consulte Roteamento com conhecimento geográfico para Anthropic.
Limites do modelo
Para obter informações sobre limites por modelo, como solicitações por minuto (RPM) e limites de token, consulte Limites de modelo de idioma grande.
Modelos beta
Modelos beta são novos modelos de provedores de modelo que o Salesforce está testando em beta. Os modelos beta geralmente têm limites de taxa mais baixos e podem não estar disponíveis em todas as regiões. Um modelo beta tem (beta) anexado ao seu nome. Se os modelos beta não estiverem ativados, eles aparecerão como (Desabilitado) no Einstein Studio.
Antes de ativar modelos de IA generativa beta, você deve ativar o Data 360. O Data 360 é provisionado automaticamente assim que uma licença do Data Cloud é adicionada à sua organização do Salesforce. Consulte Ativar o Data 360.
Para ativar modelos de IA generativa beta, acesse Configuração do Einstein. Depois que os modelos beta forem habilitados, você poderá vê-los no Einstein Studio e usá-los como qualquer modelo gerenciado pelo Salesforce.
Recomendamos que você habilite modelos beta apenas em organizações de sandbox ou de desenvolvimento.
Traga seu próprio modelo de idioma grande (BYOLLM)
A plataforma Einstein permite que você personalize sua experiência de IA trazendo seus próprios modelos para o Salesforce. Você pode trazer seu próprio modelo usando o Einstein Studio e escrever um modelo de prompts no Criador de prompts, que você pode integrar em seus próprios aplicativos ou um agente. Algumas razões comuns pelas quais as empresas querem usar modelos diferentes com o Einstein incluem:
- Sua empresa tem um LLM ajustado aos seus dados.
- Você pode usar sua conta do Azure, Bedrock, OpenAI ou Vertex.
O BYOLLM oferece suporte a muitos dos modelos gerenciados pelo Salesforce e a estes modelos adicionais:
| Provedor de modelo | Família de modelos | Notas |
| Bedrock (antropic) | Claude 3 Opus | Descontinuado por Bedrock |
| Bedrock (antropic) | Claude 3 Sonnet | Descontinuado por Bedrock |
| Bedrock (antropic) | Claude 3.5 Sonnet | Descontinuado por Bedrock |
| IA do Vertex (Google) | Gemini 1.5 Pro | Descontinuado pelo Vertex AI |
Para usar modelos e provedores não listados nesta página, consulte Conector aberto de LLM.
Desenvolva soluções de LLM com a API de modelos
Os desenvolvedores podem usar a API de modelos para codificar soluções personalizadas. Consulte o Guia do desenvolvedor da API de modelos.
Sustentabilidade
A sustentabilidade é um valor essencial no Salesforce. Selecionar o modelo adequado é uma das maneiras mais eficazes de reduzir o consumo de energia, o uso de água e as emissões de carbono. Compare o impacto ambiental desses modelos usando a Pontuação de sustentabilidade relativa na seção inferior direita da página Agent Benchmark no site de Pesquisa de IA. Para obter mais detalhes sobre a abordagem da Salesforce para a sustentabilidade da IA, consulte Sustentabilidade no Salesforce.
Modelos descontinuados
A descontinuação do modelo é o processo pelo qual um provedor de modelo elimina gradualmente um modelo, geralmente em favor de um modelo novo e aprimorado. Um modelo descontinuado pode ser roteado novamente para um modelo preferencial para garantir a continuidade do serviço. Para saber mais, consulte Prepare-se para descontinuação e reencaminhamento de modelo.
Recomendamos que você comece a migrar seus aplicativos assim que a descontinuação for anunciada. Durante a migração, atualize e teste cada parte do seu aplicativo com o modelo de substituição que recomendamos.
Esses modelos foram descontinuados ou reencaminhados.
| Modelo descontinuado | Substituição recomendada | Data de descontinuação | Data de redirecionamento |
| Vertex AI (Google) Gemini 3 Pro (Beta) | Gemini 3.1 Pro (beta) | 23 de março de 2026 | N/A. Descontinuando em 23 de abril de 2026. |
| Bedrock (antropic) Claude 3.7 Sonnet | Claude Sonnet 4.5 | 6 de janeiro de 2026 | 26 de fevereiro de 2026 |
| Bedrock (antropic) Claude 3 Haiku | Claude Haiku 4.5 | 6 de janeiro de 2026 | 26 de fevereiro de 2026 |
| Vertex AI (Google) Gemini 2.0 Flash | Flash Gemini 2.5 | 20 de janeiro de 2026 | 20 de fevereiro de 2026 |
| Vertex AI (Google) Gemini 2.0 Flash | Gemini 2.5 Flash Lite | 20 de janeiro de 2026 | 20 de fevereiro de 2026 |
| Azure OpenAI GPT 3.5 Turbo | Omni do GPT 4 | 16 de junho de 2025 | 16 de jul. de 2025 |
| OpenAI GPT 3.5 Turbo | Omni Mini do GPT 4 | 16 de junho de 2025 | 16 de jul. de 2025 |
| OpenAI GPT 4 | Omni do GPT 4 | 2 de junho de 2025 | 30 de junho de 2025 |
| OpenAI GPT 4 Turbo | Omni do GPT 4 | 6 de maio de 2025 | 30 de junho de 2025 |
| OpenAI GPT 4 32k | Omni do GPT 4 | 6 de junho de 2024 | 6 de junho de 2025 |
| Azure OpenAI GPT 4 Turbo | Omni do GPT 4 | 7 de abril de 2025 | 1o de maio de 2025 |
| Azure OpenAI GPT 3.5 Turbo 16k | Azure OpenAI GPT 3.5 Turbo | 6 de novembro de 2023 | 13 de novembro de 2024 |
| OpenAI GPT 3.5 Turbo 16k | GPT 3.5 Turbo | 6 de novembro de 2023 | 13 de setembro de 2024 |
Modelos roteados novamente
Esses modelos são roteados novamente.
| Provedor de modelo | Família de modelos | Versão | Redirecionado para |
|---|---|---|---|
| Azure OpenAI | GPT-3.5 Turbo | gpt-3.5-turbo-0613 | Omni Mini do GPT 4 |
| Azure OpenAI | GPT-3.5 Turbo 16K | gpt-35-turbo-16k-0613 | Omni Mini do GPT 4 |
| Azure OpenAI | GPT-4 Turbo | gpt-4-1106-Preview | Omni do GPT 4 |
| Bedrock (antropic) | Claude 3 Haiku | claude-3-haiku-20240307 | Claude Haiku 4.5 |
| Bedrock (antropic) | Sonnet Claude 3.7 | claude-3-7-sonnet-20250219 | Claude Sonnet 4.5 |
| OpenAI | GPT-3.5 Turbo | gpt-3.5-turbo-0125 | OpenAI GPT 4 Omni Mini |
| OpenAI | GPT-3.5 Turbo 16K | gpt-3.5-turbo-16k | OpenAI GPT 4 Omni Mini |
| OpenAI | GPT-4 | gpt-4-0613 | Omni do GPT 4 |
| OpenAI | GPT-4 32K | gpt-4-32k-0613 | Omni do GPT 4 |
| OpenAI | GPT-4 Turbo | gpt-4-0125-preview | Omni do GPT 4 |
| IA do Vertex (Google) | Flash Gemini 2.0 | gemini-2.0-flash-001 | Flash Gemini 2.5 |
| IA do Vertex (Google) | Gemini 2.0 Flash Lite | gemini-2.0-flash-lite-001 | Gemini 2.5 Flash Lite |
Anúncio de modelos novos e descontinuados
Novos anúncios de modelo e anúncios de descontinuação de modelo fazem parte das notas de lançamento mensais da Plataforma Einstein.
- Gerenciar o acesso do provedor de modelo
Escolha quais provedores de Modelo de idioma grande (LLM) permitir ou não permitir na sua organização. Quando o acesso a um provedor de modelo está ativado, você pode usar seus modelos de aprendizado de idioma (LLMs) em agentes, modelos de prompt, APIs e outros recursos em soluções de IA generativa. Desative um provedor de modelo para bloquear o acesso a seus modelos na sua organização. - Preparar-se para descontinuação e redirecionamento de modelo
Este documento fornece orientação sobre como testar novamente as implementações de IA do Salesforce durante a descontinuação e o novo roteamento do modelo. A descontinuação e o novo roteamento são considerados temporários. Se seu modelo estiver em um desses estados, considere mudar para um novo modelo. - Suporte multimodal de modelo de idioma grande
Os modelos gerenciados pelo Salesforce têm diferentes níveis de suporte e limites para incluir arquivos JPG, PNG ou PDF em uma solicitação de modelo. - Limites de modelo de idioma grande
Entenda os limites de grandes modelos de linguagem (LLMs) suportados de vários provedores para recursos integrados, como Criador de prompts. Os limites de cada modelo incluem solicitações por minuto e limites de token. - Modelos de propriedade da Salesforce
A pesquisa de IA do Salesforce cria, treina e ajusta modelos para lidar com casos de uso específicos do Salesforce. Esses modelos são hospedados na AWS dentro do Salesforce Trust Limit. - Modelos em lote
Use o Processamento em lote de modelo de prompt para gerar grandes quantidades de respostas para modelos de prompt de modo assíncrono.

