将文本转换为语音操作 (Beta)
将“将文本转换为语音”操作添加到流,以将文本转换为口语音频。
所需的 Edition
| 查看支持的版本。 |
在 Flow Builder 中,将操作元素添加到流。在操作字段中,搜索将文本转换为语音,并选择将文本转换为语音。
设置输入值
| 字段 | 备注 |
|---|---|
| 输入文本 | 必需。要转换为口语音频的文本。 |
| 语速 | 可选。生成的语音的播放速度。 |
| 语音稳定性 | 可选。生成的语音的稳定性和一致性。较低的值可以产生更具表现力的语音,而较高的值可以产生更稳定的语音输出。 |
| 语音 ID | 可选。用于生成口语音频的语音标识符。 |
存储输出值
| 字段 | 备注 |
|---|---|
| 已转换音频 | 从输入文本生成的口语音频,以 Base64 编码的输出形式返回。 |
在流中使用此操作将文本转换为 Base64 编码格式的口语音频,然后在后续流元素或自定义播放组件中使用生成的音频输出。
注意事项
- 该操作根据适用的费率卡通过 Digital Wallet 消耗 Flex Credits。
- 该操作受每分钟调用限制。超过限制的请求会失败。
- 调用限制为每分钟 100 个请求。
- 该操作返回 Base64 编码的音频字符串,并且不会自动播放或存储生成的音频。
- 处理时间因输入大小和系统负载而异。
本文章是否解决您的问题?
请与我们共享您的想法,以便我们进行改进!

