LLM
Create a response
POST
使用 OpenAI Responses API 格式创建流式或非流式响应。
认证
Bearer 令牌。在 Authorization 请求头中使用您的 API 密钥作为 Bearer 令牌。格式:
Bearer <SUNRA_KEY>请求
此端点接受一个 JSON 对象。用于生成响应的模型 ID。在 sunra.ai/models 浏览可用模型。
响应请求的输入。可以是字符串或输入项数组。
在模型上下文的第一个项目中插入系统(或开发者)消息。与
input 一起使用时,指令会插入到输入的开头。如果设置为
true,将使用服务器发送事件(SSE)流式传输响应。输出令牌数的上限,包括可见输出令牌和推理令牌。
采样温度,介于 0 到 2 之间。较高的值增加随机性。
核采样参数。温度采样的替代方案。
介于 -2.0 和 2.0 之间的数字。正值会根据新令牌在文本中的现有频率进行惩罚。
介于 -2.0 和 2.0 之间的数字。正值会根据新令牌是否已出现在文本中进行惩罚。
模型可以调用的工具数组。
控制工具选择行为。支持的字符串值:
none、auto、required。也可以指定特定函数。是否允许模型并行运行工具调用。
文本响应格式的配置。
推理输出的配置。
是否存储生成的响应以供后续检索。
可附加到响应的 16 个键值对集合。键为最长 64 个字符的字符串。值为最长 512 个字符的字符串。
代表您的最终用户的唯一标识符。最长 128 个字符。
响应
成功的响应对象。唯一响应标识符。
对象类型。始终为
response。响应创建时的 Unix 时间戳(秒)。
响应的状态。可能的值:
completed、failed、in_progress、cancelled。用于生成响应的模型。
模型生成的内容项数组。
响应的令牌使用统计。
使用的采样温度。
使用的核采样值。
使用的最大输出令牌数设置。
如果生成失败,则为错误对象。