LLM
Create a response
POST
Создаёт потоковый или непотоковый ответ в формате API OpenAI Responses.
Аутентификация
Bearer-токен. Используйте ваш API-ключ в качестве Bearer-токена в заголовке Authorization.Формат:
Bearer <SUNRA_KEY>Запрос
Этот эндпоинт принимает объект.Идентификатор модели для генерации ответа. Просмотрите доступные модели на sunra.ai/models.
Входные данные для запроса ответа. Может быть строкой или массивом входных элементов.
Вставляет системное (или разработческое) сообщение в качестве первого элемента в контексте модели. При использовании с
input инструкции вставляются в начало ввода.Если установлено значение
true, ответ будет передаваться в потоковом режиме с использованием Server-Sent Events (SSE).Верхний предел количества выходных токенов, включая видимые выходные токены и токены рассуждений.
Температура сэмплирования от 0 до 2. Более высокие значения увеличивают случайность.
Параметр nucleus-сэмплирования. Альтернатива сэмплированию по температуре.
Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их существующей частоты в тексте.
Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их предыдущего появления в тексте.
Массив инструментов, которые модель может вызвать.
Управляет поведением выбора инструментов. Поддерживаемые строковые значения:
none, auto, required. Также можно указать конкретную функцию.Разрешить ли модели выполнять вызовы инструментов параллельно.
Конфигурация формата текстового ответа.
Конфигурация вывода рассуждений.
Сохранять ли сгенерированный ответ для последующего извлечения.
Набор из 16 пар ключ-значение, которые можно прикрепить к ответу. Ключи — строки длиной до 64 символов. Значения — строки длиной до 512 символов.
Уникальный идентификатор вашего конечного пользователя. Максимум 128 символов.
Ответ
Успешный объект ответа.Уникальный идентификатор ответа.
Тип объекта. Всегда
response.Unix-временная метка (в секундах) создания ответа.
Статус ответа. Возможные значения:
completed, failed, in_progress, cancelled.Модель, использованная для генерации ответа.
Массив элементов контента, сгенерированных моделью.
Статистика использования токенов для ответа.
Использованная температура сэмплирования.
Использованное значение nucleus-сэмплирования.
Использованная настройка максимальных выходных токенов.
Объект ошибки, если генерация не удалась.