LLM
Create a chat completion
POST
Отправляет запрос на получение ответа модели для указанной чат-беседы. Поддерживает как потоковый, так и непотоковый режимы. Совместим с форматом API OpenAI Chat Completions.
Аутентификация
Bearer-токен. Используйте ваш API-ключ в качестве Bearer-токена в заголовке Authorization.Формат:
Bearer <SUNRA_KEY>Запрос
Этот эндпоинт принимает объект.Список сообщений для беседы.
Модель, используемая для завершения. Просмотрите доступные модели на sunra.ai/models.
Если установлено значение
true, частичные дельты сообщений будут отправляться как Server-Sent Events (SSE).Максимальное количество токенов для генерации в завершении. Общая длина входных токенов и сгенерированных токенов ограничена длиной контекста модели.
Температура сэмплирования от 0 до 2. Более высокие значения, такие как 0.8, делают вывод более случайным, более низкие значения, такие как 0.2, делают его более сфокусированным и детерминированным.
Параметр nucleus-сэмплирования (0-1). Альтернатива сэмплированию по температуре, при которой модель учитывает токены с массой вероятности top_p.
Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их существующей частоты в тексте, уменьшая вероятность дословного повторения одной и той же строки.
Число от -2.0 до 2.0. Положительные значения штрафуют новые токены на основе их присутствия в тексте, увеличивая вероятность того, что модель затронет новые темы.
До 4 последовательностей, при которых API прекратит генерацию дальнейших токенов.
Сколько вариантов завершения чата генерировать для каждого входного сообщения.
Возвращать ли логарифмические вероятности выходных токенов. Если true, возвращает логарифмические вероятности каждого выходного токена, возвращённого в содержании сообщения.
Целое число от 0 до 20, определяющее количество наиболее вероятных токенов, возвращаемых в каждой позиции токена.
logprobs должен быть установлен в true при использовании этого параметра.Объект, определяющий формат, который должна выводить модель.
Если указано, система приложит максимум усилий для детерминированного сэмплирования, чтобы повторные запросы с одинаковым seed и параметрами возвращали одинаковый результат.
Список инструментов, которые модель может вызвать. В настоящее время в качестве инструмента поддерживаются только функции.
Управляет тем, какой (если есть) инструмент вызывается моделью.
none означает, что модель не будет вызывать никаких инструментов. auto означает, что модель может выбирать между генерацией сообщения и вызовом инструментов. required означает, что модель должна вызвать один или несколько инструментов. Также можно указать конкретную функцию через {"type": "function", "function": {"name": "my_function"}}.Разрешить ли параллельные вызовы функций во время использования инструментов.
Уникальный идентификатор вашего конечного пользователя, который может помочь в мониторинге и обнаружении злоупотреблений.
Ответ
Успешный ответ завершения чата.Уникальный идентификатор завершения чата.
Тип объекта. Всегда
chat.completion.Unix-временная метка (в секундах) создания завершения чата.
Модель, использованная для завершения чата.
Список вариантов завершения чата. Может быть более одного, если
n больше 1.Статистика использования для запроса завершения.
Этот отпечаток представляет конфигурацию бэкенда, на которой работает модель. Может использоваться с параметром
seed для отслеживания изменений в бэкенде.