Create a message - Sunra.ai

curl -X POST https://api-llm.sunra.ai/v1/messages \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic/claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'

{
  "id": "msg_01XFDUDYJgAACzvnptvVoYEL",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Hello! I'm doing well, thank you for asking. How can I help you today?"
    }
  ],
  "model": "anthropic/claude-sonnet-4-20250514",
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 12,
    "output_tokens": 19
  }
}

POST

messages

curl -X POST https://api-llm.sunra.ai/v1/messages \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic/claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'

{
  "id": "msg_01XFDUDYJgAACzvnptvVoYEL",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Hello! I'm doing well, thank you for asking. How can I help you today?"
    }
  ],
  "model": "anthropic/claude-sonnet-4-20250514",
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 12,
    "output_tokens": 19
  }
}

Crée un message en utilisant le format de l’API Anthropic Messages. Prend en charge le texte, les images, les PDF, les outils et la réflexion étendue.

Authentification

Authorization

string

requis

Jeton Bearer. Utilisez votre clé API comme jeton Bearer dans l’en-tête Authorization.Format : Bearer <SUNRA_KEY>

Requête

Cet endpoint attend un objet.

model

string

requis

Le modèle qui complétera votre prompt. Parcourez les modèles disponibles sur sunra.ai/models.

messages

object[]

requis

Messages d’entrée. Chaque message d’entrée a un role et un content.

Afficher propriétés

role

string

requis

Le rôle de l’auteur du message. Valeurs prises en charge : user, assistant.

content

string | object[]

requis

Le contenu du message. Peut être une simple chaîne de caractères ou un tableau de blocs de contenu.

Afficher types de blocs de contenu

type

string

requis

Le type de bloc de contenu. Valeurs prises en charge : text, image, tool_use, tool_result.

text

string

Contenu textuel. Utilisé lorsque le type est text.

source

object

Source de l’image. Utilisé lorsque le type est image.

Afficher propriétés

type

string

requis

Le type de source. Valeurs prises en charge : base64, url.

media_type

string

requis

Le type de média de l’image. Par exemple, image/jpeg, image/png, image/gif, image/webp.

data

string

Données d’image encodées en base64. Requis lorsque le type de source est base64.

url

string

URL de l’image. Requis lorsque le type de source est url.

max_tokens

integer

requis

Le nombre maximum de tokens à générer avant l’arrêt. Notez que le modèle peut s’arrêter avant d’atteindre ce maximum.

system

string | object[]

Prompt système. Un prompt système est un moyen de fournir du contexte et des instructions au modèle. Peut être une chaîne de caractères ou un tableau de blocs de contenu.

stream

boolean

défaut:false

Indique si la réponse doit être diffusée de manière incrémentale en utilisant des événements server-sent (SSE).

temperature

number

défaut:1

Quantité de hasard injectée dans la réponse. Varie de 0.0 à 1.0. Utilisez une temperature plus proche de 0.0 pour les tâches analytiques/à choix multiples, et plus proche de 1.0 pour les tâches créatives et génératives.

top_p

number

Utilise l’échantillonnage par noyau. Dans l’échantillonnage par noyau, nous calculons la distribution cumulative sur toutes les options pour chaque token suivant par ordre décroissant de probabilité et la coupons une fois qu’elle atteint une probabilité particulière spécifiée par top_p.

top_k

integer

Échantillonne uniquement parmi les K meilleures options pour chaque token suivant. Utilisé pour supprimer les réponses à faible probabilité de la « longue traîne ». Recommandé pour les cas d’utilisation avancés uniquement.

stop_sequences

string[]

Séquences de texte personnalisées qui provoqueront l’arrêt de la génération par le modèle. Le texte retourné ne contiendra pas la séquence d’arrêt.

tools

object[]

Définitions des outils que le modèle peut utiliser.

Afficher propriétés

name

string

requis

Nom de l’outil.

description

string

Description de ce que fait cet outil.

input_schema

object

requis

Schéma JSON pour l’entrée de cet outil. Ceci définit la forme de l’input que votre outil accepte.

tool_choice

object

Comment le modèle doit utiliser les outils fournis.

Afficher propriétés

type

string

requis

Valeurs prises en charge : auto (par défaut, le modèle décide), any (le modèle doit utiliser un outil), tool (le modèle doit utiliser un outil spécifique).

name

string

Le nom de l’outil à utiliser. Requis lorsque le type est tool.

metadata

object

Un objet décrivant les métadonnées de la requête.

Afficher propriétés

user_id

string

Un identifiant externe pour l’utilisateur associé à la requête.

thinking

object

Configuration pour la réflexion étendue. Lorsqu’elle est activée, le modèle réfléchira avant de répondre.

Afficher propriétés

type

string

requis

Doit être enabled.

budget_tokens

integer

requis

Le nombre maximum de tokens à utiliser pour la réflexion. Doit être supérieur ou égal à 1024.

Réponse

Réponse de message réussie.

string

Identifiant unique du message, par exemple msg_01XFDUDYJgAACzvnptvVoYEL.

type

string

Type d’objet. Toujours message.

role

string

Rôle conversationnel du message généré. Toujours assistant.

content

object[]

Contenu généré par le modèle. Il s’agit d’un tableau de blocs de contenu.

Afficher propriétés

type

string

Le type de bloc de contenu. Peut être text, tool_use ou thinking.

text

string

Le texte généré. Présent lorsque le type est text.

string

L’ID du bloc d’utilisation d’outil. Présent lorsque le type est tool_use.

name

string

Le nom de l’outil. Présent lorsque le type est tool_use.

input

object

L’entrée de l’outil. Présent lorsque le type est tool_use.

thinking

string

Le contenu de la réflexion. Présent lorsque le type est thinking.

model

string

Le modèle qui a traité la requête.

stop_reason

string | null

La raison pour laquelle le modèle a cessé de générer. Peut être end_turn (le modèle a atteint un point d’arrêt naturel), max_tokens (a dépassé max_tokens ou le maximum du modèle), stop_sequence (une de vos séquences d’arrêt personnalisées a été générée) ou tool_use (le modèle a invoqué un ou plusieurs outils).

stop_sequence

string | null

La séquence d’arrêt personnalisée qui a été générée, le cas échéant.

usage

object

Utilisation pour la facturation et les limites de débit.

Afficher propriétés

input_tokens

integer

Le nombre de tokens d’entrée utilisés.

output_tokens

integer

Le nombre de tokens de sortie utilisés.

cache_creation_input_tokens

integer

Le nombre de tokens d’entrée utilisés pour créer l’entrée de cache.

cache_read_input_tokens

integer

Le nombre de tokens d’entrée lus depuis le cache.

curl -X POST https://api-llm.sunra.ai/v1/messages \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic/claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'

{
  "id": "msg_01XFDUDYJgAACzvnptvVoYEL",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Hello! I'm doing well, thank you for asking. How can I help you today?"
    }
  ],
  "model": "anthropic/claude-sonnet-4-20250514",
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 12,
    "output_tokens": 19
  }
}

Create a chat completion Create a response

​Authentification

​Requête

​Réponse

Authentification

Requête

Réponse