LLM
Create a chat completion
POST
지정된 채팅 대화에 대한 모델 응답 요청을 보냅니다. 스트리밍 및 비스트리밍 모드를 모두 지원합니다. OpenAI Chat Completions API 형식과 호환됩니다.
인증
Bearer 토큰. API 키를 Authorization 헤더의 Bearer 토큰으로 사용하세요.Format:
Bearer <SUNRA_KEY>요청
이 엔드포인트는 JSON 객체를 받습니다.대화의 메시지 목록.
완성에 사용할 모델. 사용 가능한 모델은 sunra.ai/models에서 확인하세요.
true로 설정하면 부분 메시지 델타가 서버 전송 이벤트(SSE)로 전송됩니다.완성에서 생성할 최대 토큰 수. 입력 토큰과 생성된 토큰의 총 길이는 모델의 컨텍스트 길이에 의해 제한됩니다.
0에서 2 사이의 샘플링 온도. 0.8과 같은 높은 값은 출력을 더 무작위로 만들고, 0.2와 같은 낮은 값은 더 집중적이고 결정론적으로 만듭니다.
핵 샘플링 매개변수(0-1). temperature 샘플링의 대안으로, 모델이 top_p 확률 질량을 가진 토큰을 고려합니다.
-2.0에서 2.0 사이의 숫자. 양수 값은 텍스트에서의 기존 빈도를 기반으로 새 토큰에 페널티를 부과하여, 모델이 같은 문장을 그대로 반복할 가능성을 줄입니다.
-2.0에서 2.0 사이의 숫자. 양수 값은 텍스트에 이미 나타났는지 여부를 기반으로 새 토큰에 페널티를 부과하여, 모델이 새로운 주제에 대해 이야기할 가능성을 높입니다.
API가 추가 토큰 생성을 중단하는 최대 4개의 시퀀스.
각 입력 메시지에 대해 생성할 채팅 완성 선택지 수.
출력 토큰의 로그 확률을 반환할지 여부. true인 경우, 메시지 내용에 반환된 각 출력 토큰의 로그 확률을 반환합니다.
각 토큰 위치에서 반환할 가장 가능성 높은 토큰 수를 지정하는 0에서 20 사이의 정수. 이 매개변수를 사용하려면
logprobs를 true로 설정해야 합니다.모델이 출력해야 하는 형식을 지정하는 객체.
지정된 경우, 시스템은 동일한 seed와 매개변수를 가진 반복 요청이 동일한 결과를 반환하도록 최선의 노력으로 결정론적 샘플링을 수행합니다.
모델이 호출할 수 있는 도구 목록. 현재 함수만 도구로 지원됩니다.
모델이 어떤 도구를 호출할지(호출하는 경우) 제어합니다.
none은 모델이 도구를 호출하지 않음을 의미합니다. auto는 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다. required는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다. {"type": "function", "function": {"name": "my_function"}}을 통해 특정 함수를 지정할 수도 있습니다.도구 사용 시 병렬 함수 호출을 활성화할지 여부.
최종 사용자를 나타내는 고유 식별자로, 남용 모니터링 및 감지에 도움이 될 수 있습니다.
응답
채팅 완성 성공 응답.채팅 완성의 고유 식별자.
객체 유형. 항상
chat.completion.채팅 완성이 생성된 시점의 Unix 타임스탬프(초 단위).
채팅 완성에 사용된 모델.
채팅 완성 선택지 목록.
n이 1보다 큰 경우 둘 이상일 수 있습니다.완성 요청의 사용량 통계.
모델이 실행되는 백엔드 구성을 나타내는 핑거프린트.
seed 매개변수와 함께 사용하여 백엔드 변경 사항을 파악할 수 있습니다.