LLM
Create a response
POST
Crée une réponse en streaming ou non-streaming en utilisant le format de l’API OpenAI Responses.
Authentification
Jeton Bearer. Utilisez votre clé API comme jeton Bearer dans l’en-tête Authorization.Format :
Bearer <SUNRA_KEY>Requête
Cet endpoint attend un objet.ID du modèle utilisé pour générer la réponse. Parcourez les modèles disponibles sur sunra.ai/models.
Entrée pour la requête de réponse. Peut être une chaîne de caractères ou un tableau d’éléments d’entrée.
Insère un message système (ou développeur) comme premier élément dans le contexte du modèle. Lorsqu’il est utilisé avec
input, les instructions sont insérées au début de l’entrée.Si défini sur
true, la réponse sera diffusée en streaming via des événements server-sent (SSE).Une limite supérieure pour le nombre de tokens de sortie, y compris les tokens de sortie visibles et les tokens de raisonnement.
Température d’échantillonnage entre 0 et 2. Des valeurs plus élevées augmentent le caractère aléatoire.
Paramètre d’échantillonnage par noyau. Une alternative à l’échantillonnage par température.
Nombre entre -2.0 et 2.0. Les valeurs positives pénalisent les nouveaux tokens en fonction de leur fréquence existante dans le texte.
Nombre entre -2.0 et 2.0. Les valeurs positives pénalisent les nouveaux tokens en fonction de leur apparition préalable dans le texte.
Un tableau d’outils que le modèle peut appeler.
Contrôle le comportement de sélection d’outils. Valeurs de chaîne prises en charge :
none, auto, required. Peut également spécifier une fonction particulière.Indique s’il faut autoriser le modèle à exécuter des appels d’outils en parallèle.
Configuration pour le format de réponse textuelle.
Configuration pour la sortie de raisonnement.
Indique si la réponse générée doit être stockée pour une récupération ultérieure.
Ensemble de 16 paires clé-valeur pouvant être attachées à la réponse. Les clés sont des chaînes de 64 caractères maximum. Les valeurs sont des chaînes de 512 caractères maximum.
Un identifiant unique représentant votre utilisateur final. Maximum de 128 caractères.
Réponse
Objet de réponse réussi.Identifiant unique de la réponse.
Le type d’objet. Toujours
response.Horodatage Unix (en secondes) de la création de la réponse.
Le statut de la réponse. Valeurs possibles :
completed, failed, in_progress, cancelled.Le modèle utilisé pour générer la réponse.
Un tableau d’éléments de contenu générés par le modèle.
Statistiques d’utilisation des tokens pour la réponse.
La température d’échantillonnage utilisée.
La valeur d’échantillonnage par noyau utilisée.
Le paramètre de tokens de sortie maximum utilisé.
Un objet d’erreur si la génération a échoué.