LLM
Create a message
POST
Создаёт сообщение в формате API Anthropic Messages. Поддерживает текст, изображения, PDF, инструменты и расширенное мышление.
Аутентификация
Bearer-токен. Используйте ваш API-ключ в качестве Bearer-токена в заголовке Authorization.Формат:
Bearer <SUNRA_KEY>Запрос
Этот эндпоинт принимает объект.Модель, которая завершит ваш промпт. Просмотрите доступные модели на sunra.ai/models.
Входные сообщения. Каждое входное сообщение имеет
role и content.Максимальное количество токенов для генерации перед остановкой. Обратите внимание, что модель может остановиться до достижения этого максимума.
Системный промпт. Способ предоставления контекста и инструкций модели. Может быть строкой или массивом блоков контента.
Передавать ли ответ в потоковом режиме с использованием Server-Sent Events (SSE).
Степень случайности, добавляемая в ответ. Диапазон от 0.0 до 1.0. Используйте
temperature ближе к 0.0 для аналитических задач/задач с множественным выбором и ближе к 1.0 для творческих и генеративных задач.Использовать nucleus-сэмплирование. При nucleus-сэмплировании мы вычисляем кумулятивное распределение по всем вариантам для каждого последующего токена в порядке убывания вероятности и обрезаем его, когда оно достигает определённой вероятности, заданной
top_p.Сэмплирование только из верхних K вариантов для каждого последующего токена. Используется для удаления маловероятных ответов из «длинного хвоста». Рекомендуется только для продвинутых случаев использования.
Пользовательские текстовые последовательности, которые заставят модель прекратить генерацию. Возвращённый текст не будет содержать стоп-последовательность.
Определения инструментов, которые модель может использовать.
Как модель должна использовать предоставленные инструменты.
Объект, описывающий метаданные запроса.
Конфигурация расширенного мышления. При включении модель будет думать перед ответом.
Ответ
Успешный ответ сообщения.Уникальный идентификатор сообщения, например
msg_01XFDUDYJgAACzvnptvVoYEL.Тип объекта. Всегда
message.Роль сгенерированного сообщения в беседе. Всегда
assistant.Контент, сгенерированный моделью. Это массив блоков контента.
Модель, обработавшая запрос.
Причина остановки модели. Может быть
end_turn (модель достигла естественной точки остановки), max_tokens (превышен max_tokens или максимум модели), stop_sequence (сгенерирована одна из ваших пользовательских стоп-последовательностей) или tool_use (модель вызвала один или несколько инструментов).Какая пользовательская стоп-последовательность была сгенерирована, если таковая имеется.
Использование для выставления счетов и ограничения скорости.