LLM
Create a message
POST
Anthropic Messages API 형식을 사용하여 메시지를 생성합니다. 텍스트, 이미지, PDF, 도구 및 확장 사고를 지원합니다.
인증
Bearer 토큰. API 키를 Authorization 헤더의 Bearer 토큰으로 사용하세요.Format:
Bearer <SUNRA_KEY>요청
이 엔드포인트는 JSON 객체를 받습니다.프롬프트를 완성할 모델. 사용 가능한 모델은 sunra.ai/models에서 확인하세요.
입력 메시지. 각 입력 메시지에는
role과 content가 있습니다.중단 전에 생성할 최대 토큰 수. 모델이 이 최대값에 도달하기 전에 중단할 수 있습니다.
시스템 프롬프트. 모델에 컨텍스트와 지침을 제공하는 방법입니다. 문자열 또는 콘텐츠 블록 배열을 지정할 수 있습니다.
서버 전송 이벤트(SSE)를 사용하여 응답을 점진적으로 스트리밍할지 여부.
응답에 주입되는 무작위성의 양. 0.0에서 1.0 범위. 분석/객관식 작업에는 0.0에 가까운
temperature를, 창의적이고 생성적인 작업에는 1.0에 가까운 값을 사용하세요.핵 샘플링을 사용합니다. 핵 샘플링에서는 확률이 감소하는 순서로 각 후속 토큰의 모든 옵션에 대한 누적 분포를 계산하고
top_p로 지정된 특정 확률에 도달하면 중단합니다.각 후속 토큰에 대해 상위 K개의 옵션에서만 샘플링합니다. 확률이 낮은 “롱테일” 응답을 제거하는 데 사용됩니다. 고급 사용 사례에만 권장됩니다.
모델의 생성을 중단시키는 사용자 정의 텍스트 시퀀스. 반환된 텍스트에는 중단 시퀀스가 포함되지 않습니다.
모델이 사용할 수 있는 도구 정의.
모델이 제공된 도구를 어떻게 사용할지 지정합니다.
요청에 대한 메타데이터를 설명하는 객체.
확장 사고 구성. 활성화하면 모델이 응답하기 전에 사고합니다.
응답
메시지 성공 응답.고유 메시지 식별자. 예:
msg_01XFDUDYJgAACzvnptvVoYEL.객체 유형. 항상
message.생성된 메시지의 대화 역할. 항상
assistant.모델이 생성한 콘텐츠. 콘텐츠 블록의 배열입니다.
요청을 처리한 모델.
모델이 중단한 이유.
end_turn(모델이 자연스러운 중단점에 도달), max_tokens(max_tokens 또는 모델의 최대값 초과), stop_sequence(사용자 정의 중단 시퀀스 중 하나가 생성됨), 또는 tool_use(모델이 하나 이상의 도구를 호출함)일 수 있습니다.생성된 사용자 정의 중단 시퀀스(해당하는 경우).
청구 및 속도 제한 사용량.