Перейти к основному содержанию
POST
/
v1
/
responses
curl -X POST https://api-llm.sunra.ai/v1/responses \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "input": [
      {
        "type": "message",
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'
{
  "id": "resp-abc123",
  "object": "response",
  "created_at": 1704067200,
  "status": "completed",
  "model": "openai/gpt-4o",
  "output": [
    {
      "type": "message",
      "id": "msg_abc123",
      "role": "assistant",
      "status": "completed",
      "content": [
        {
          "type": "output_text",
          "text": "Hello! I'm doing well, thank you for asking. How can I help you today?",
          "annotations": []
        }
      ]
    }
  ],
  "temperature": 1.0,
  "top_p": 1.0,
  "max_output_tokens": null,
  "usage": {
    "input_tokens": 15,
    "output_tokens": 18,
    "total_tokens": 33,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  },
  "error": null
}
Создаёт потоковый или непотоковый ответ в формате API OpenAI Responses.

Аутентификация

Authorization
string
обязательно
Bearer-токен. Используйте ваш API-ключ в качестве Bearer-токена в заголовке Authorization.Формат: Bearer <SUNRA_KEY>

Запрос

Этот эндпоинт принимает объект.
model
string
обязательно
Идентификатор модели для генерации ответа. Просмотрите доступные модели на sunra.ai/models.
input
string | object[]
Входные данные для запроса ответа. Может быть строкой или массивом входных элементов.
instructions
string | null
Вставляет системное (или разработческое) сообщение в качестве первого элемента в контексте модели. При использовании с input инструкции вставляются в начало ввода.
stream
boolean
по умолчанию:false
Если установлено значение true, ответ будет передаваться в потоковом режиме с использованием Server-Sent Events (SSE).
max_output_tokens
integer
Верхний предел количества выходных токенов, включая видимые выходные токены и токены рассуждений.
temperature
number
по умолчанию:1
Температура сэмплирования от 0 до 2. Более высокие значения увеличивают случайность.
top_p
number
по умолчанию:1
Параметр nucleus-сэмплирования. Альтернатива сэмплированию по температуре.
frequency_penalty
number
по умолчанию:0
Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их существующей частоты в тексте.
presence_penalty
number
по умолчанию:0
Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их предыдущего появления в тексте.
tools
object[]
Массив инструментов, которые модель может вызвать.
tool_choice
string | object
Управляет поведением выбора инструментов. Поддерживаемые строковые значения: none, auto, required. Также можно указать конкретную функцию.
parallel_tool_calls
boolean
по умолчанию:true
Разрешить ли модели выполнять вызовы инструментов параллельно.
text
object
Конфигурация формата текстового ответа.
reasoning
object
Конфигурация вывода рассуждений.
store
boolean
по умолчанию:true
Сохранять ли сгенерированный ответ для последующего извлечения.
metadata
object
Набор из 16 пар ключ-значение, которые можно прикрепить к ответу. Ключи — строки длиной до 64 символов. Значения — строки длиной до 512 символов.
user
string
Уникальный идентификатор вашего конечного пользователя. Максимум 128 символов.

Ответ

Успешный объект ответа.
id
string
Уникальный идентификатор ответа.
object
string
Тип объекта. Всегда response.
created_at
number
Unix-временная метка (в секундах) создания ответа.
status
string
Статус ответа. Возможные значения: completed, failed, in_progress, cancelled.
model
string
Модель, использованная для генерации ответа.
output
object[]
Массив элементов контента, сгенерированных моделью.
usage
object
Статистика использования токенов для ответа.
temperature
number
Использованная температура сэмплирования.
top_p
number
Использованное значение nucleus-сэмплирования.
max_output_tokens
integer | null
Использованная настройка максимальных выходных токенов.
error
object | null
Объект ошибки, если генерация не удалась.
curl -X POST https://api-llm.sunra.ai/v1/responses \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "input": [
      {
        "type": "message",
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'
{
  "id": "resp-abc123",
  "object": "response",
  "created_at": 1704067200,
  "status": "completed",
  "model": "openai/gpt-4o",
  "output": [
    {
      "type": "message",
      "id": "msg_abc123",
      "role": "assistant",
      "status": "completed",
      "content": [
        {
          "type": "output_text",
          "text": "Hello! I'm doing well, thank you for asking. How can I help you today?",
          "annotations": []
        }
      ]
    }
  ],
  "temperature": 1.0,
  "top_p": 1.0,
  "max_output_tokens": null,
  "usage": {
    "input_tokens": 15,
    "output_tokens": 18,
    "total_tokens": 33,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  },
  "error": null
}