Create a response

curl -X POST https://api-llm.sunra.ai/v1/responses \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "input": [
      {
        "type": "message",
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'

{
  "id": "resp-abc123",
  "object": "response",
  "created_at": 1704067200,
  "status": "completed",
  "model": "openai/gpt-4o",
  "output": [
    {
      "type": "message",
      "id": "msg_abc123",
      "role": "assistant",
      "status": "completed",
      "content": [
        {
          "type": "output_text",
          "text": "Hello! I'm doing well, thank you for asking. How can I help you today?",
          "annotations": []
        }
      ]
    }
  ],
  "temperature": 1.0,
  "top_p": 1.0,
  "max_output_tokens": null,
  "usage": {
    "input_tokens": 15,
    "output_tokens": 18,
    "total_tokens": 33,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  },
  "error": null
}

POST

responses

curl -X POST https://api-llm.sunra.ai/v1/responses \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "input": [
      {
        "type": "message",
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'

{
  "id": "resp-abc123",
  "object": "response",
  "created_at": 1704067200,
  "status": "completed",
  "model": "openai/gpt-4o",
  "output": [
    {
      "type": "message",
      "id": "msg_abc123",
      "role": "assistant",
      "status": "completed",
      "content": [
        {
          "type": "output_text",
          "text": "Hello! I'm doing well, thank you for asking. How can I help you today?",
          "annotations": []
        }
      ]
    }
  ],
  "temperature": 1.0,
  "top_p": 1.0,
  "max_output_tokens": null,
  "usage": {
    "input_tokens": 15,
    "output_tokens": 18,
    "total_tokens": 33,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  },
  "error": null
}

Создаёт потоковый или непотоковый ответ в формате API OpenAI Responses.

Аутентификация

Authorization

string

обязательно

Bearer-токен. Используйте ваш API-ключ в качестве Bearer-токена в заголовке Authorization.Формат: Bearer <SUNRA_KEY>

Запрос

Этот эндпоинт принимает объект.

model

string

обязательно

Идентификатор модели для генерации ответа. Просмотрите доступные модели на sunra.ai/models.

input

string | object[]

Входные данные для запроса ответа. Может быть строкой или массивом входных элементов.

Показать properties (when array)

type

string

Тип входного элемента. Поддерживаемые значения: message, item_reference.

role

string

Роль автора сообщения. Поддерживаемые значения: user, assistant, system.

content

string | object[]

Содержание входного сообщения. Может быть строкой или массивом частей контента.

string

Идентификатор элемента. Обязателен для сообщений assistant в истории беседы.

status

string

Статус элемента. Обязателен для сообщений assistant в истории беседы.

instructions

string | null

Вставляет системное (или разработческое) сообщение в качестве первого элемента в контексте модели. При использовании с input инструкции вставляются в начало ввода.

stream

boolean

по умолчанию:false

Если установлено значение true, ответ будет передаваться в потоковом режиме с использованием Server-Sent Events (SSE).

max_output_tokens

integer

Верхний предел количества выходных токенов, включая видимые выходные токены и токены рассуждений.

temperature

number

по умолчанию:1

Температура сэмплирования от 0 до 2. Более высокие значения увеличивают случайность.

top_p

number

по умолчанию:1

Параметр nucleus-сэмплирования. Альтернатива сэмплированию по температуре.

frequency_penalty

number

по умолчанию:0

Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их существующей частоты в тексте.

presence_penalty

number

по умолчанию:0

Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их предыдущего появления в тексте.

tools

object[]

Массив инструментов, которые модель может вызвать.

Показать properties

type

string

обязательно

Тип инструмента. Поддерживаемые значения: function, web_search_preview.

name

string

Имя функции. Обязательно, когда type — function.

description

string

Описание функции.

parameters

object

Объект JSON Schema, определяющий параметры функции.

strict

boolean

по умолчанию:false

Включено ли строгое соблюдение схемы.

tool_choice

string | object

Управляет поведением выбора инструментов. Поддерживаемые строковые значения: none, auto, required. Также можно указать конкретную функцию.

parallel_tool_calls

boolean

по умолчанию:true

Разрешить ли модели выполнять вызовы инструментов параллельно.

text

object

Конфигурация формата текстового ответа.

Показать properties

format

object

Конфигурация текстового формата.

Показать properties

type

string

обязательно

Тип формата. Поддерживаемые значения: text, json_object, json_schema.

name

string

Имя формата ответа. Обязательно, когда type — json_schema.

schema

object

JSON-схема. Обязательно, когда type — json_schema.

strict

boolean

Включено ли строгое соблюдение схемы.

reasoning

object

Конфигурация вывода рассуждений.

Показать properties

effort

string

Ограничивает усилия на рассуждения. Поддерживаемые значения: low, medium, high.

store

boolean

по умолчанию:true

Сохранять ли сгенерированный ответ для последующего извлечения.

metadata

object

Набор из 16 пар ключ-значение, которые можно прикрепить к ответу. Ключи — строки длиной до 64 символов. Значения — строки длиной до 512 символов.

user

string

Уникальный идентификатор вашего конечного пользователя. Максимум 128 символов.

Ответ

Успешный объект ответа.

string

Уникальный идентификатор ответа.

object

string

Тип объекта. Всегда response.

created_at

number

Unix-временная метка (в секундах) создания ответа.

status

string

Статус ответа. Возможные значения: completed, failed, in_progress, cancelled.

model

string

Модель, использованная для генерации ответа.

output

object[]

Массив элементов контента, сгенерированных моделью.

Показать properties

type

string

Тип выходного элемента. Например, message.

string

Уникальный идентификатор выходного элемента.

role

string

Роль. Всегда assistant.

status

string

Статус сообщения. Например, completed.

content

object[]

Содержание выходного сообщения.

Показать properties

type

string

Тип контента. Например, output_text.

text

string

Сгенерированный текстовый контент.

annotations

object[]

Аннотации к контенту (например, цитаты из веб-поиска).

usage

object

Статистика использования токенов для ответа.

Показать properties

input_tokens

integer

Количество входных токенов.

output_tokens

integer

Количество выходных токенов.

total_tokens

integer

Общее количество токенов.

input_tokens_details

object

Детализация входных токенов.

Показать properties

cached_tokens

integer

Количество кэшированных токенов.

output_tokens_details

object

Детализация выходных токенов.

Показать properties

reasoning_tokens

integer

Количество токенов рассуждений.

temperature

number

Использованная температура сэмплирования.

top_p

number

Использованное значение nucleus-сэмплирования.

max_output_tokens

integer | null

Использованная настройка максимальных выходных токенов.

error

object | null

Объект ошибки, если генерация не удалась.

curl -X POST https://api-llm.sunra.ai/v1/responses \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "input": [
      {
        "type": "message",
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'

{
  "id": "resp-abc123",
  "object": "response",
  "created_at": 1704067200,
  "status": "completed",
  "model": "openai/gpt-4o",
  "output": [
    {
      "type": "message",
      "id": "msg_abc123",
      "role": "assistant",
      "status": "completed",
      "content": [
        {
          "type": "output_text",
          "text": "Hello! I'm doing well, thank you for asking. How can I help you today?",
          "annotations": []
        }
      ]
    }
  ],
  "temperature": 1.0,
  "top_p": 1.0,
  "max_output_tokens": null,
  "usage": {
    "input_tokens": 15,
    "output_tokens": 18,
    "total_tokens": 33,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  },
  "error": null
}

Create a message JavaScript / TypeScript

​Аутентификация

​Запрос

​Ответ

Аутентификация

Запрос

Ответ