大型語言模型限制

瞭解多個提供者針對內嵌功能 (例如提示詞產生器) 所支援的大型語言模型 (LLM) 的限制。每個模型的限制包括每分鐘的要求和權杖限制。

比率限制

針對生產組織中的許多模型,每個組織的預設比率限制為每分鐘 (RPM) 1,000 個 LLM 產生要求。不過,視模型的使用情況和模型提供者的可用容量而定,RPM 限制會因模型而有所不同。如需個別模型的每個組織 RPM 限制,請參閱「Salesforce 受管理模型限制」一節。

針對 Sandbox,預設比率限制為每個組織每分鐘產生 500 個要求。

Salesforce 受管理模型限制

此表格列出適用於內嵌功能 (例如提示詞產生器) 的 Salesforce 受管理模型限制。

模型提供者	模型系列	每分鐘的要求上限 (RPM)	每分鐘權杖上限 (TPM)¹	輸入權杖上限	輸出權杖上限
基礎岩 (Amazon)	Nova Lite	500	300 萬	300,000	5000
基礎岩 (Amazon)	Nova Pro	500	300 萬	300,000	5000
基礎岩 (南太平洋)	Claude Haiku 4.5	250	300 萬	200000	8,192
基礎岩 (南太平洋)	Claude Opus 4.5	300	1 百萬	200000	8,192
基礎岩 (南太平洋)	Claude Opus 4.6	300	1 百萬	1,000,000	128,000
基礎岩 (南太平洋)	Claude Opus 4.7 (Beta 版)	300	1 百萬	1,000,000	128,000
基礎岩 (南太平洋)	Claude Sonnet 4.5	500	300 萬	200000	8,192
基礎岩 (南太平洋)	Claude Sonnet 4.6	500	300 萬	200000	8,192
基礎岩 (NVIDIA)	Nemotron 3 Nano 30B (Beta 版)	1000	500 萬	256,000	8,192
基礎岩 (NVIDIA)	Nemotron 3 Super 120B (Beta 版)	1000	500 萬	256,000	32000
OpenAI 與 Azure OpenAI	GPT-4o (GPT 4 Omni)	1000	500 萬	128,000	16,384
OpenAI	GPT-4o Mini	1000	500 萬	128,000	16,384
OpenAI 與 Azure OpenAI	GPT-4o-mini (GPT 4 Omni Mini)	1000	500 萬	128,000	16,384
OpenAI 與 Azure OpenAI	GPT-4.1	500	200 萬	128,000	32,768
OpenAI 與 Azure OpenAI	GPT-4.1 Mini	500	200 萬	128,000	32,768
OpenAI 與 Azure OpenAI	GPT-5	500	200 萬	272,000	128,000
OpenAI 與 Azure OpenAI	GPT-5 Mini	500	200 萬	272,000	128,000
OpenAI 與 Azure OpenAI	GPT 5.1	300	200 萬	272,000	128,000
OpenAI 與 Azure OpenAI	GPT 5.2	300	200 萬	272,000	128,000
OpenAI 與 Azure OpenAI	GPT 5.4	250	200 萬	1,050,000	128,000
OpenAI 與 Azure OpenAI	GPT 5.4 迷你版 (Beta 版)	250	200 萬	400,000	128,000
OpenAI 與 Azure OpenAI	GPT 5.5 (Beta 版)	250	200 萬	1,050,000	128,000
OpenAI 與 Azure OpenAI	O3	500	200 萬	200000	100,000
OpenAI 與 Azure OpenAI	O4 迷你	500	200 萬	200000	100,000
Vertex AI (Google)	Gemini 2.5 Flash	250	200 萬	1,048,576	65,536
Vertex AI (Google)	Gemini 2.5 Flash Lite	250	200 萬	1,048,576	65,536
Vertex AI (Google)	Gemini 2.5 Pro	250	1 百萬	1,048,576	65,536
Vertex AI (Google)	Gemini 3 Flash (Beta 版)	100	200 萬	1,048,576	65,536
Vertex AI (Google)	Gemini 3 Pro (Beta 版)	50	1 百萬	1,048,576	65,536
Vertex AI (Google)	Gemini 3.1 Flash Lite (Beta 版)	100	200 萬	1,048,576	65,536
Vertex AI (Google)	Gemini 3.1 Pro (Beta 版)	50	1 百萬	1,048,576	65,536

系統會根據輸入與輸出權杖的總和測量「每分鐘 ¹最大權杖 (TPM)」。

資料遮罩權杖限制

當在 Einstein Trust 圖層中開啟資料遮蔽時,所有模型目前限制為 65,536 個權杖的內容大小。若要關閉資料遮蔽並使用完整內容視窗,請參閱設定 Einstein Trust 層級。

另請參照：

此文章是否解決您的問題？

請讓我們知道，以便我們改進！

此文已使用 Salesforce 機器翻譯系統翻譯。更多詳細資料請參見此處。

大型語言模型限制

比率限制

Salesforce 受管理模型限制

資料遮罩權杖限制

另請參照：

General Information

Required Cookies

Functional Cookies

Advertising Cookies

General Information

Required Cookies

Functional Cookies

Advertising Cookies

Cookie List

此文已使用 Salesforce 機器翻譯系統翻譯。更多詳細資料請參見此處。切換至英文不要現在

產品區域

功能影響

版本

經驗

大型語言模型限制

比率限制

Salesforce 受管理模型限制

資料遮罩權杖限制

另請參照：

此文已使用 Salesforce 機器翻譯系統翻譯。更多詳細資料請參見此處。