메인 콘텐츠로 건너뛰기
POST
/
v1
/
messages
curl -X POST https://api-llm.sunra.ai/v1/messages \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic/claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'
{
  "id": "msg_01XFDUDYJgAACzvnptvVoYEL",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Hello! I'm doing well, thank you for asking. How can I help you today?"
    }
  ],
  "model": "anthropic/claude-sonnet-4-20250514",
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 12,
    "output_tokens": 19
  }
}
Anthropic Messages API 형식을 사용하여 메시지를 생성합니다. 텍스트, 이미지, PDF, 도구 및 확장 사고를 지원합니다.

인증

Authorization
string
필수
Bearer 토큰. API 키를 Authorization 헤더의 Bearer 토큰으로 사용하세요.Format: Bearer <SUNRA_KEY>

요청

이 엔드포인트는 JSON 객체를 받습니다.
model
string
필수
프롬프트를 완성할 모델. 사용 가능한 모델은 sunra.ai/models에서 확인하세요.
messages
object[]
필수
입력 메시지. 각 입력 메시지에는 rolecontent가 있습니다.
max_tokens
integer
필수
중단 전에 생성할 최대 토큰 수. 모델이 이 최대값에 도달하기 전에 중단할 수 있습니다.
system
string | object[]
시스템 프롬프트. 모델에 컨텍스트와 지침을 제공하는 방법입니다. 문자열 또는 콘텐츠 블록 배열을 지정할 수 있습니다.
stream
boolean
기본값:false
서버 전송 이벤트(SSE)를 사용하여 응답을 점진적으로 스트리밍할지 여부.
temperature
number
기본값:1
응답에 주입되는 무작위성의 양. 0.0에서 1.0 범위. 분석/객관식 작업에는 0.0에 가까운 temperature를, 창의적이고 생성적인 작업에는 1.0에 가까운 값을 사용하세요.
top_p
number
핵 샘플링을 사용합니다. 핵 샘플링에서는 확률이 감소하는 순서로 각 후속 토큰의 모든 옵션에 대한 누적 분포를 계산하고 top_p로 지정된 특정 확률에 도달하면 중단합니다.
top_k
integer
각 후속 토큰에 대해 상위 K개의 옵션에서만 샘플링합니다. 확률이 낮은 “롱테일” 응답을 제거하는 데 사용됩니다. 고급 사용 사례에만 권장됩니다.
stop_sequences
string[]
모델의 생성을 중단시키는 사용자 정의 텍스트 시퀀스. 반환된 텍스트에는 중단 시퀀스가 포함되지 않습니다.
tools
object[]
모델이 사용할 수 있는 도구 정의.
tool_choice
object
모델이 제공된 도구를 어떻게 사용할지 지정합니다.
metadata
object
요청에 대한 메타데이터를 설명하는 객체.
thinking
object
확장 사고 구성. 활성화하면 모델이 응답하기 전에 사고합니다.

응답

메시지 성공 응답.
id
string
고유 메시지 식별자. 예: msg_01XFDUDYJgAACzvnptvVoYEL.
type
string
객체 유형. 항상 message.
role
string
생성된 메시지의 대화 역할. 항상 assistant.
content
object[]
모델이 생성한 콘텐츠. 콘텐츠 블록의 배열입니다.
model
string
요청을 처리한 모델.
stop_reason
string | null
모델이 중단한 이유. end_turn(모델이 자연스러운 중단점에 도달), max_tokens(max_tokens 또는 모델의 최대값 초과), stop_sequence(사용자 정의 중단 시퀀스 중 하나가 생성됨), 또는 tool_use(모델이 하나 이상의 도구를 호출함)일 수 있습니다.
stop_sequence
string | null
생성된 사용자 정의 중단 시퀀스(해당하는 경우).
usage
object
청구 및 속도 제한 사용량.
curl -X POST https://api-llm.sunra.ai/v1/messages \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic/claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'
{
  "id": "msg_01XFDUDYJgAACzvnptvVoYEL",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Hello! I'm doing well, thank you for asking. How can I help you today?"
    }
  ],
  "model": "anthropic/claude-sonnet-4-20250514",
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 12,
    "output_tokens": 19
  }
}