Você está aqui:
Einstein solicita tipos de uso faturáveis
O uso de determinados recursos de IA generativa afeta o consumo de crédito em relação aos subtipos do tipo de uso faturável Solicitações do Einstein. O uso é calculado com base no número de chamadas ao gateway LLM. Os tipos de uso de Solicitação do Einstein se aplicam a recursos de IA generativa integrados, como Respostas de serviço, que envolvem solicitações diretas ao LLM para tarefas específicas.
O Einstein solicita tipos de uso
As Solicitações do Einstein podem ser consumidas com Conversas do Agentforce ou Créditos flexíveis quando o uso envolve chamadas diretas para o gateway LLM.
| Categoria de faturamento | Descrição |
|---|---|
| Avisos de início | O uso é calculado com base em dois fatores: o número de solicitações diretas para o LLM por meio do gateway do LLM e se o gateway usa um modelo Traga seu próprio idioma grande (BYOLLM). Cada prompt inicial inclui o processamento de até 2.000 tokens. O uso de prompts é contado em blocos de 2 mil tokens, arredondados para cima. Os avisos que excedem esse limite serão medidos como vários avisos, contando cada bloco adicional de 2 mil tokens como um novo aviso. Por exemplo, um aviso com um total de 6.500 tokens de entrada e saída será medido como quatro avisos. Tokens são unidades de dados processadas pelos modelos de IA. |
Avisos padrão Avisos básicos Avisos avançados |
O uso é calculado com base em dois fatores: o número de solicitações diretas para o LLM por meio do gateway de LLM e se o gateway usa um modelo de idioma grande gerenciado pelo Salesforce. A categoria específica depende do modelo usado. Consulte Suporte de modelo de idioma grande para descobrir quais tipos de uso se aplicam. Todos os avisos padrão, básico e avançado processam até 2.000 tokens por aviso. O uso de token é arredondado para cima em incrementos de 2 mil tokens. Todos os avisos Padrão, Básico e Avançado que excedem esse limite serão medidos como vários avisos, contando cada bloco adicional de 2 mil tokens como um novo aviso. Por exemplo, um aviso com um total de 6.500 tokens de entrada e saída será medido como quatro avisos. Tokens são unidades de dados processadas pelos modelos de IA. |

