LLM
Create a response
POST
Cria uma resposta em streaming ou não-streaming usando o formato da API OpenAI Responses.
Autenticação
Token Bearer. Use sua chave de API como token Bearer no cabeçalho Authorization.Formato:
Bearer <SUNRA_KEY>Requisição
Este endpoint espera um objeto.ID do modelo usado para gerar a resposta. Navegue pelos modelos disponíveis em sunra.ai/models.
Entrada para a requisição de resposta. Pode ser uma string ou um array de itens de entrada.
Insere uma mensagem de sistema (ou desenvolvedor) como primeiro item no contexto do modelo. Quando usado com
input, as instruções são inseridas no início da entrada.Se definido como
true, a resposta será transmitida em streaming via eventos server-sent (SSE).Um limite superior para o número de tokens de saída, incluindo tokens de saída visíveis e tokens de raciocínio.
Temperatura de amostragem entre 0 e 2. Valores mais altos aumentam a aleatoriedade.
Parâmetro de amostragem por núcleo. Uma alternativa à amostragem por temperatura.
Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base na sua frequência existente no texto.
Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base em se já aparecem no texto.
Um array de ferramentas que o modelo pode chamar.
Controla o comportamento de seleção de ferramentas. Valores de string suportados:
none, auto, required. Também pode especificar uma função particular.Indica se deve permitir que o modelo execute chamadas de ferramentas em paralelo.
Configuração para o formato de resposta de texto.
Configuração para a saída de raciocínio.
Indica se a resposta gerada deve ser armazenada para recuperação posterior.
Conjunto de 16 pares chave-valor que podem ser anexados à resposta. As chaves são strings com máximo de 64 caracteres. Os valores são strings com máximo de 512 caracteres.
Um identificador único representando seu usuário final. Máximo de 128 caracteres.
Resposta
Objeto de resposta bem-sucedido.Identificador único da resposta.
O tipo de objeto. Sempre
response.Marca temporal Unix (em segundos) de quando a resposta foi criada.
O status da resposta. Valores possíveis:
completed, failed, in_progress, cancelled.O modelo usado para gerar a resposta.
Um array de itens de conteúdo gerados pelo modelo.
Estatísticas de uso de tokens para a resposta.
A temperatura de amostragem utilizada.
O valor de amostragem por núcleo utilizado.
A configuração de tokens de saída máximos utilizada.
Um objeto de erro se a geração falhou.