Você está aqui:
Execução do tempo de execução do modelo de prompt
Invocar um modelo de prompt no tempo de execução aciona uma cadeia de eventos. O ciclo de vida de tempo de execução de um modelo de prompt começa com o carregamento do modelo de prompt com entrada e termina com o encaminhamento da resposta gerada pelo LLM para o agente ou aplicativo que está chamando.
Visualização de tempo de design
Quando você projeta um modelo de prompt, o recurso de visualização do Criador de prompts permite simular uma experiência de tempo de execução completa. Você visualiza o modelo de prompt, fornece entrada, visualiza o prompt resolvido e, em seguida, obtém a resposta gerada retornada do LLM.
Execução de prompt no tempo de execução
Quando um agente ou aplicativo invoca um modelo de prompt ativado no tempo de execução, ele aciona a mesma cadeia de eventos. Vamos dividi-lo em etapas mais detalhadas.
Etapas de execução de modelo de prompt
| Etapa | Descrição |
|---|---|
| 1 | O modelo de prompt é chamado com entrada de um agente, fluxo, Apex ou aplicativo. |
| 2 | A resolução rápida começa com recuperações de dados seguras. Os valores para campos de mesclagem (registros, fluxos, Apex) são adicionados ao aviso. O acesso aos dados de mesclagem é controlado pelas permissões do usuário executor. Para a fundamentação dinâmica, informações relevantes de dados estruturados e não estruturados no Data Cloud são recuperadas usando recursos como recuperadores de pesquisa, fluxos e consultas SOQL. |
| 3 | O aviso resolvido então passa por mais proteções usando recursos habilitados na Camada Einstein Trust. O mascaramento de dados baseado em padrão é aplicado automaticamente, enquanto o mascaramento de dados baseado em campo é aplicado se ativado. A Camada de Trust do Einstein aplica medidas de defesa imediata usando políticas do sistema do Salesforce. |
| 4 | O aviso seguro é enviado ao LLM por meio do gateway do LLM. O LLM retorna sua resposta gerada por meio do gateway LLM.
Para provedores de modelo externos, nossa política de retenção de dados zero garante que os dados enviados para o LLM do Salesforce não sejam retidos, mas sejam excluídos depois de uma resposta ser enviada de volta ao Salesforce. |
| 5 | A resposta gerada pelo LLM é registrada para auditoria e feedback. |
| 6 | A Camada de Trust do Einstein aplica políticas do sistema à resposta gerada pelo LLM. Se habilitado, recursos como detecção de toxicidade ajudam a reduzir a probabilidade de resultados indesejados ou prejudiciais. Se o mascaramento de dados estiver habilitado, a Camada de Trust do Einstein desmascarará todos os dados mascarados, substituindo espaços reservados pelos valores subjacentes. |
| 7 | A resposta gerada é retornada ao agente ou aplicativo solicitante em um formato bruto ou estruturado. |

