Создаёт потоковый или непотоковый ответ в формате API OpenAI Responses.
Аутентификация
Bearer-токен. Используйте ваш API-ключ в качестве Bearer-токена в заголовке Authorization. Формат: Bearer <SUNRA_KEY>
Запрос
Этот эндпоинт принимает объект.
Идентификатор модели для генерации ответа. Просмотрите доступные модели на sunra.ai/models .
Входные данные для запроса ответа. Может быть строкой или массивом входных элементов. Показать properties (when array)
Тип входного элемента. Поддерживаемые значения: message, item_reference.
Роль автора сообщения. Поддерживаемые значения: user, assistant, system.
Содержание входного сообщения. Может быть строкой или массивом частей контента.
Идентификатор элемента. Обязателен для сообщений assistant в истории беседы.
Статус элемента. Обязателен для сообщений assistant в истории беседы.
Вставляет системное (или разработческое) сообщение в качестве первого элемента в контексте модели. При использовании с input инструкции вставляются в начало ввода.
stream
boolean
по умолчанию: false
Если установлено значение true, ответ будет передаваться в потоковом режиме с использованием Server-Sent Events (SSE).
Верхний предел количества выходных токенов, включая видимые выходные токены и токены рассуждений.
Температура сэмплирования от 0 до 2. Более высокие значения увеличивают случайность.
Параметр nucleus-сэмплирования. Альтернатива сэмплированию по температуре.
Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их существующей частоты в тексте.
Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их предыдущего появления в тексте.
Массив инструментов, которые модель может вызвать. Тип инструмента. Поддерживаемые значения: function, web_search_preview.
Имя функции. Обязательно, когда type — function.
Объект JSON Schema, определяющий параметры функции.
strict
boolean
по умолчанию: false
Включено ли строгое соблюдение схемы.
Управляет поведением выбора инструментов. Поддерживаемые строковые значения: none, auto, required. Также можно указать конкретную функцию.
Разрешить ли модели выполнять вызовы инструментов параллельно.
Конфигурация формата текстового ответа. Конфигурация текстового формата. Тип формата. Поддерживаемые значения: text, json_object, json_schema.
Имя формата ответа. Обязательно, когда type — json_schema.
JSON-схема. Обязательно, когда type — json_schema.
Включено ли строгое соблюдение схемы.
Конфигурация вывода рассуждений. Ограничивает усилия на рассуждения. Поддерживаемые значения: low, medium, high.
Сохранять ли сгенерированный ответ для последующего извлечения.
Набор из 16 пар ключ-значение, которые можно прикрепить к ответу. Ключи — строки длиной до 64 символов. Значения — строки длиной до 512 символов.
Уникальный идентификатор вашего конечного пользователя. Максимум 128 символов.
Ответ
Успешный объект ответа.
Уникальный идентификатор ответа.
Тип объекта. Всегда response.
Unix-временная метка (в секундах) создания ответа.
Статус ответа. Возможные значения: completed, failed, in_progress, cancelled.
Модель, использованная для генерации ответа.
Массив элементов контента, сгенерированных моделью. Тип выходного элемента. Например, message.
Уникальный идентификатор выходного элемента.
Статус сообщения. Например, completed.
Содержание выходного сообщения. Тип контента. Например, output_text.
Сгенерированный текстовый контент.
Аннотации к контенту (например, цитаты из веб-поиска).
Статистика использования токенов для ответа. Количество входных токенов.
Количество выходных токенов.
Общее количество токенов.
Детализация входных токенов. Количество кэшированных токенов.
Детализация выходных токенов. Количество токенов рассуждений.
Использованная температура сэмплирования.
Использованное значение nucleus-сэмплирования.
Использованная настройка максимальных выходных токенов.
Объект ошибки, если генерация не удалась.
curl -X POST https://api-llm.sunra.ai/v1/responses \
-H "Authorization: Bearer <SUNRA_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-4o",
"input": [
{
"type": "message",
"role": "user",
"content": "Hello, how are you?"
}
]
}'
{
"id" : "resp-abc123" ,
"object" : "response" ,
"created_at" : 1704067200 ,
"status" : "completed" ,
"model" : "openai/gpt-4o" ,
"output" : [
{
"type" : "message" ,
"id" : "msg_abc123" ,
"role" : "assistant" ,
"status" : "completed" ,
"content" : [
{
"type" : "output_text" ,
"text" : "Hello! I'm doing well, thank you for asking. How can I help you today?" ,
"annotations" : []
}
]
}
],
"temperature" : 1.0 ,
"top_p" : 1.0 ,
"max_output_tokens" : null ,
"usage" : {
"input_tokens" : 15 ,
"output_tokens" : 18 ,
"total_tokens" : 33 ,
"input_tokens_details" : {
"cached_tokens" : 0
},
"output_tokens_details" : {
"reasoning_tokens" : 0
}
},
"error" : null
}