LLM
Create a response
POST
Crea una respuesta en streaming o no-streaming utilizando el formato de la API OpenAI Responses.
Autenticación
Token Bearer. Use su clave API como token Bearer en el encabezado Authorization.Formato:
Bearer <SUNRA_KEY>Solicitud
Este endpoint espera un objeto.ID del modelo utilizado para generar la respuesta. Explore los modelos disponibles en sunra.ai/models.
Entrada para la solicitud de respuesta. Puede ser una cadena de texto o un array de elementos de entrada.
Inserta un mensaje de sistema (o desarrollador) como primer elemento en el contexto del modelo. Cuando se usa con
input, las instrucciones se insertan al inicio de la entrada.Si se establece en
true, la respuesta se transmitirá en streaming mediante eventos server-sent (SSE).Un límite superior para el número de tokens de salida, incluyendo tokens de salida visibles y tokens de razonamiento.
Temperatura de muestreo entre 0 y 2. Valores más altos aumentan la aleatoriedad.
Parámetro de muestreo por núcleo. Una alternativa al muestreo por temperatura.
Número entre -2.0 y 2.0. Los valores positivos penalizan los nuevos tokens según su frecuencia existente en el texto.
Número entre -2.0 y 2.0. Los valores positivos penalizan los nuevos tokens según si ya aparecen en el texto.
Un array de herramientas que el modelo puede llamar.
Controla el comportamiento de selección de herramientas. Valores de cadena admitidos:
none, auto, required. También puede especificar una función particular.Indica si se debe permitir que el modelo ejecute llamadas a herramientas en paralelo.
Configuración para el formato de respuesta de texto.
Configuración para la salida de razonamiento.
Indica si la respuesta generada debe almacenarse para su recuperación posterior.
Conjunto de 16 pares clave-valor que se pueden adjuntar a la respuesta. Las claves son cadenas de máximo 64 caracteres. Los valores son cadenas de máximo 512 caracteres.
Un identificador único que representa a su usuario final. Máximo de 128 caracteres.
Respuesta
Objeto de respuesta exitoso.Identificador único de la respuesta.
El tipo de objeto. Siempre
response.Marca de tiempo Unix (en segundos) de cuándo se creó la respuesta.
El estado de la respuesta. Valores posibles:
completed, failed, in_progress, cancelled.El modelo utilizado para generar la respuesta.
Un array de elementos de contenido generados por el modelo.
Estadísticas de uso de tokens para la respuesta.
La temperatura de muestreo utilizada.
El valor de muestreo por núcleo utilizado.
La configuración de tokens de salida máximos utilizada.
Un objeto de error si la generación falló.