端点 | 方法 | 描述 |
---|---|---|
api.sunra.ai/v1/queue/{model-id} | POST | 将请求添加到队列 |
api.sunra.ai/v1/queue/requests/{request_id}/status | GET | 检索请求的状态 |
api.sunra.ai/v1/queue/requests/{request_id}/status/stream | GET | 流式传输状态直到完成 |
api.sunra.ai/v1/queue/requests/{request_id} | GET | 获取请求的响应 |
api.sunra.ai/v1/queue/requests/{request_id}/cancel | PUT | 取消请求 |
request_id
的示例响应:
request_id
并提供检查状态、取消或检索响应的 URL,简化您的工作流程而无需额外的端点开发。
queue_position
:显示您在队列中的位置。response_url
:处理完成后检索响应的 URL。logs
:详细日志(如果启用)显示处理步骤。response_url
:最终响应将可用的位置。logs
:详细说明整个过程的日志。response_url
:您已完成响应的直接链接。message
:事件描述。level
:严重程度(例如,INFO、ERROR)。source
:日志来源。timestamp
:生成日志的时间。text/event-stream
格式的实时状态更新,直到请求完成。
COMPLETED
,使用以下方式检索响应:
端点类型 | 速率限制 | 突发限制 |
---|---|---|
提交到队列 | 10 请求/秒 | 100 请求/分钟 |
所有其他端点 | 100 请求/秒 | 1,800 请求/分钟 |
403 Forbidden
响应。我们建议实施具有指数退避的重试机制来处理这些情况。