Point de terminaison | Méthode | Description |
---|---|---|
api.sunra.ai/v1/queue/{model-id} | POST | Ajoute une requête à la file d’attente |
api.sunra.ai/v1/queue/requests/{request_id}/status | GET | Récupère l’état d’une requête |
api.sunra.ai/v1/queue/requests/{request_id}/status/stream | GET | Diffuse l’état jusqu’à la fin |
api.sunra.ai/v1/queue/requests/{request_id} | GET | Récupère la réponse d’une requête |
api.sunra.ai/v1/queue/requests/{request_id}/cancel | PUT | Annule une requête |
request_id
:
request_id
et fournit des URL pour vérifier l’état, annuler ou récupérer la réponse, rationalisant votre flux de travail sans développement de point de terminaison supplémentaire.
queue_position
: Affiche votre place dans la file d’attente.response_url
: URL pour récupérer la réponse une fois le traitement terminé.logs
: Journaux détaillés (si activés) montrant les étapes de traitement.response_url
: Où la réponse finale sera disponible.logs
: Journaux détaillant l’ensemble du processus.response_url
: Lien direct vers votre réponse terminée.message
: Description de l’événement.level
: Gravité (par exemple, INFO, ERROR).source
: Origine du journal.timestamp
: Heure à laquelle le journal a été généré.text/event-stream
jusqu’à ce que la requête soit terminée.
COMPLETED
, récupérez la réponse en utilisant :
Type de point de terminaison | Limite de taux | Limite de rafale |
---|---|---|
Soumettre à la file d’attente | 10 requêtes/seconde | 100 requêtes/minute |
Tous les autres points de terminaison | 100 requêtes/seconde | 1 800 requêtes/minute |
403 Forbidden
. Nous vous recommandons de mettre en œuvre un mécanisme de nouvelle tentative avec un backoff exponentiel pour gérer ces cas.