LLM
Create a message
POST
Crea un mensaje utilizando el formato de la API Anthropic Messages. Soporta texto, imágenes, PDFs, herramientas y pensamiento extendido.
Autenticación
Token Bearer. Use su clave API como token Bearer en el encabezado Authorization.Formato:
Bearer <SUNRA_KEY>Solicitud
Este endpoint espera un objeto.El modelo que completará su prompt. Explore los modelos disponibles en sunra.ai/models.
Mensajes de entrada. Cada mensaje de entrada tiene un
role y content.El número máximo de tokens a generar antes de detenerse. Tenga en cuenta que el modelo puede detenerse antes de alcanzar este máximo.
Prompt del sistema. Un prompt del sistema es una forma de proporcionar contexto e instrucciones al modelo. Puede ser una cadena de texto o un array de bloques de contenido.
Indica si la respuesta debe transmitirse de forma incremental mediante eventos server-sent (SSE).
Cantidad de aleatoriedad inyectada en la respuesta. Varía de 0.0 a 1.0. Use
temperature más cercana a 0.0 para tareas analíticas/de opción múltiple, y más cercana a 1.0 para tareas creativas y generativas.Usa muestreo por núcleo. En el muestreo por núcleo, calculamos la distribución acumulativa sobre todas las opciones para cada token siguiente en orden decreciente de probabilidad y la cortamos una vez que alcanza una probabilidad particular especificada por
top_p.Solo muestrea entre las K mejores opciones para cada token siguiente. Se utiliza para eliminar respuestas de baja probabilidad de la “cola larga”. Recomendado solo para casos de uso avanzados.
Secuencias de texto personalizadas que harán que el modelo deje de generar. El texto devuelto no contendrá la secuencia de parada.
Definiciones de herramientas que el modelo puede usar.
Cómo el modelo debe usar las herramientas proporcionadas.
Un objeto que describe los metadatos de la solicitud.
Configuración para el pensamiento extendido. Cuando está habilitado, el modelo pensará antes de responder.
Respuesta
Respuesta de mensaje exitosa.Identificador único del mensaje, por ejemplo
msg_01XFDUDYJgAACzvnptvVoYEL.Tipo de objeto. Siempre
message.Rol conversacional del mensaje generado. Siempre
assistant.Contenido generado por el modelo. Este es un array de bloques de contenido.
El modelo que procesó la solicitud.
La razón por la que el modelo dejó de generar. Puede ser
end_turn (el modelo alcanzó un punto de parada natural), max_tokens (excedió max_tokens o el máximo del modelo), stop_sequence (se generó una de sus secuencias de parada personalizadas) o tool_use (el modelo invocó una o más herramientas).Qué secuencia de parada personalizada se generó, si alguna.
Uso para facturación y límites de tasa.