您位於此處:
大型語言模型限制
瞭解多個提供者針對內嵌功能 (例如提示詞產生器) 所支援的大型語言模型 (LLM) 的限制。每個模型的限制包括每分鐘的要求和權杖限制。
比率限制
針對生產組織中的許多模型,每個組織的預設比率限制為每分鐘 (RPM) 1,000 個 LLM 產生要求。不過,視模型的使用情況和模型提供者的可用容量而定,RPM 限制會因模型而有所不同。如需個別模型的每個組織 RPM 限制,請參閱「Salesforce 受管理模型限制」一節。
針對 Sandbox,預設比率限制為每個組織每分鐘產生 500 個要求。
Salesforce 受管理模型限制
此表格列出適用於內嵌功能 (例如提示詞產生器) 的 Salesforce 受管理模型限制。
| 模型提供者 | 模型系列 | 每分鐘的要求上限 (RPM) | 每分鐘權杖上限 (TPM)1 | 輸入權杖上限 | 輸出權杖上限 |
|---|---|---|---|---|---|
| 基礎岩 (Amazon) | Nova Lite | 500 | 300 萬 | 300,000 | 5000 |
| 基礎岩 (Amazon) | Nova Pro | 500 | 300 萬 | 300,000 | 5000 |
| 基礎岩 (南太平洋) | Claude Haiku 4.5 | 250 | 300 萬 | 200000 | 8,192 |
| 基礎岩 (南太平洋) | Claude Opus 4.5 | 300 | 1 百萬 | 200000 | 8,192 |
| 基礎岩 (南太平洋) | Claude Opus 4.6 | 300 | 1 百萬 | 1,000,000 | 128,000 |
| 基礎岩 (南太平洋) | Claude Opus 4.7 (Beta 版) | 300 | 1 百萬 | 1,000,000 | 128,000 |
| 基礎岩 (南太平洋) | Claude Sonnet 4.5 | 500 | 300 萬 | 200000 | 8,192 |
| 基礎岩 (南太平洋) | Claude Sonnet 4.6 | 500 | 300 萬 | 200000 | 8,192 |
| 基礎岩 (NVIDIA) | Nemotron 3 Nano 30B (Beta 版) | 1000 | 500 萬 | 256,000 | 8,192 |
| 基礎岩 (NVIDIA) | Nemotron 3 Super 120B (Beta 版) | 1000 | 500 萬 | 256,000 | 32000 |
| OpenAI 與 Azure OpenAI | GPT-4o (GPT 4 Omni) | 1000 | 500 萬 | 128,000 | 16,384 |
| OpenAI | GPT-4o Mini | 1000 | 500 萬 | 128,000 | 16,384 |
| OpenAI 與 Azure OpenAI | GPT-4o-mini (GPT 4 Omni Mini) | 1000 | 500 萬 | 128,000 | 16,384 |
| OpenAI 與 Azure OpenAI | GPT-4.1 | 500 | 200 萬 | 128,000 | 32,768 |
| OpenAI 與 Azure OpenAI | GPT-4.1 Mini | 500 | 200 萬 | 128,000 | 32,768 |
| OpenAI 與 Azure OpenAI | GPT-5 | 500 | 200 萬 | 272,000 | 128,000 |
| OpenAI 與 Azure OpenAI | GPT-5 Mini | 500 | 200 萬 | 272,000 | 128,000 |
| OpenAI 與 Azure OpenAI | GPT 5.1 | 300 | 200 萬 | 272,000 | 128,000 |
| OpenAI 與 Azure OpenAI | GPT 5.2 | 300 | 200 萬 | 272,000 | 128,000 |
| OpenAI 與 Azure OpenAI | GPT 5.4 | 250 | 200 萬 | 1,050,000 | 128,000 |
| OpenAI 與 Azure OpenAI | GPT 5.4 迷你版 (Beta 版) | 250 | 200 萬 | 400,000 | 128,000 |
| OpenAI 與 Azure OpenAI | GPT 5.5 (Beta 版) | 250 | 200 萬 | 1,050,000 | 128,000 |
| OpenAI 與 Azure OpenAI | O3 | 500 | 200 萬 | 200000 | 100,000 |
| OpenAI 與 Azure OpenAI | O4 迷你 | 500 | 200 萬 | 200000 | 100,000 |
| Vertex AI (Google) | Gemini 2.5 Flash | 250 | 200 萬 | 1,048,576 | 65,536 |
| Vertex AI (Google) | Gemini 2.5 Flash Lite | 250 | 200 萬 | 1,048,576 | 65,536 |
| Vertex AI (Google) | Gemini 2.5 Pro | 250 | 1 百萬 | 1,048,576 | 65,536 |
| Vertex AI (Google) | Gemini 3 Flash (Beta 版) | 100 | 200 萬 | 1,048,576 | 65,536 |
| Vertex AI (Google) | Gemini 3 Pro (Beta 版) | 50 | 1 百萬 | 1,048,576 | 65,536 |
| Vertex AI (Google) | Gemini 3.1 Flash Lite (Beta 版) | 100 | 200 萬 | 1,048,576 | 65,536 |
| Vertex AI (Google) | Gemini 3.1 Pro (Beta 版) | 50 | 1 百萬 | 1,048,576 | 65,536 |
系統會根據輸入與輸出權杖的總和測量「每分鐘 1最大權杖 (TPM)」。
資料遮罩權杖限制
當在 Einstein Trust 圖層中開啟資料遮蔽時,所有模型目前限制為 65,536 個權杖的內容大小。若要關閉資料遮蔽並使用完整內容視窗,請參閱 設定 Einstein Trust 層級。

