LLM
Create a message
POST
Cria uma mensagem usando o formato da API Anthropic Messages. Suporta texto, imagens, PDFs, ferramentas e pensamento estendido.
Autenticação
Token Bearer. Use sua chave de API como token Bearer no cabeçalho Authorization.Formato:
Bearer <SUNRA_KEY>Requisição
Este endpoint espera um objeto.O modelo que completará seu prompt. Navegue pelos modelos disponíveis em sunra.ai/models.
Mensagens de entrada. Cada mensagem de entrada tem um
role e content.O número máximo de tokens a gerar antes de parar. Note que o modelo pode parar antes de atingir este máximo.
Prompt do sistema. Um prompt do sistema é uma forma de fornecer contexto e instruções ao modelo. Pode ser uma string ou um array de blocos de conteúdo.
Indica se a resposta deve ser transmitida de forma incremental usando eventos server-sent (SSE).
Quantidade de aleatoriedade injetada na resposta. Varia de 0.0 a 1.0. Use
temperature mais próxima de 0.0 para tarefas analíticas/de múltipla escolha, e mais próxima de 1.0 para tarefas criativas e generativas.Usa amostragem por núcleo. Na amostragem por núcleo, calculamos a distribuição cumulativa sobre todas as opções para cada token seguinte em ordem decrescente de probabilidade e a cortamos quando atinge uma probabilidade particular especificada por
top_p.Amostra apenas entre as K melhores opções para cada token seguinte. Usado para remover respostas de baixa probabilidade da “cauda longa”. Recomendado apenas para casos de uso avançados.
Sequências de texto personalizadas que farão o modelo parar de gerar. O texto retornado não conterá a sequência de parada.
Definições de ferramentas que o modelo pode usar.
Como o modelo deve usar as ferramentas fornecidas.
Um objeto descrevendo os metadados da requisição.
Configuração para o pensamento estendido. Quando habilitado, o modelo pensará antes de responder.
Resposta
Resposta de mensagem bem-sucedida.Identificador único da mensagem, por exemplo
msg_01XFDUDYJgAACzvnptvVoYEL.Tipo de objeto. Sempre
message.Papel conversacional da mensagem gerada. Sempre
assistant.Conteúdo gerado pelo modelo. Este é um array de blocos de conteúdo.
O modelo que processou a requisição.
A razão pela qual o modelo parou de gerar. Pode ser
end_turn (o modelo atingiu um ponto de parada natural), max_tokens (excedeu max_tokens ou o máximo do modelo), stop_sequence (uma de suas sequências de parada personalizadas foi gerada) ou tool_use (o modelo invocou uma ou mais ferramentas).Qual sequência de parada personalizada foi gerada, se alguma.
Uso para faturamento e limites de taxa.