Create a chat completion

curl -X POST https://api-llm.sunra.ai/v1/chat/completions \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "What is the capital of France?"
      }
    ]
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1677652288,
  "model": "openai/gpt-4o",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The capital of France is Paris."
      },
      "finish_reason": "stop",
      "logprobs": null
    }
  ],
  "system_fingerprint": "fp_44709d6fcb",
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 8,
    "total_tokens": 33
  }
}

POST

chat

completions

curl -X POST https://api-llm.sunra.ai/v1/chat/completions \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "What is the capital of France?"
      }
    ]
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1677652288,
  "model": "openai/gpt-4o",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The capital of France is Paris."
      },
      "finish_reason": "stop",
      "logprobs": null
    }
  ],
  "system_fingerprint": "fp_44709d6fcb",
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 8,
    "total_tokens": 33
  }
}

दिए गए चैट वार्तालाप के लिए मॉडल प्रतिक्रिया का अनुरोध भेजता है। स्ट्रीमिंग और नॉन-स्ट्रीमिंग दोनों मोड का समर्थन करता है। OpenAI Chat Completions API प्रारूप के साथ संगत है।

प्रमाणीकरण

Authorization

string

आवश्यक

Bearer टोकन। Authorization हेडर में अपनी API कुंजी को bearer टोकन के रूप में उपयोग करें।प्रारूप: Bearer <SUNRA_KEY>

अनुरोध

यह एंडपॉइंट एक ऑब्जेक्ट स्वीकार करता है।

messages

object[]

आवश्यक

वार्तालाप के लिए संदेशों की सूची।

दिखाएं properties

role

string

आवश्यक

संदेश लेखक की भूमिका। समर्थित मान: system, user, assistant, tool।

content

string | object[]

आवश्यक

संदेश की सामग्री। मल्टीमोडल इनपुट के लिए एक स्ट्रिंग या सामग्री भागों की एक सरणी हो सकती है।

name

string

प्रतिभागी के लिए एक वैकल्पिक नाम। समान भूमिका वाले प्रतिभागियों के बीच अंतर करने के लिए मॉडल को जानकारी प्रदान करता है।

tool_calls

object[]

मॉडल द्वारा उत्पन्न टूल कॉल, जैसे फ़ंक्शन कॉल। केवल assistant संदेशों में मौजूद।

tool_call_id

string

वह टूल कॉल जिसका यह संदेश जवाब दे रहा है। केवल tool संदेशों में मौजूद।

model

string

आवश्यक

पूर्णता के लिए उपयोग किया जाने वाला मॉडल। उपलब्ध मॉडल sunra.ai/models पर देखें।

stream

boolean

डिफ़ॉल्ट:false

यदि true पर सेट किया जाता है, तो आंशिक संदेश डेल्टा को server-sent events (SSE) के रूप में भेजा जाएगा।

max_tokens

integer

पूर्णता में उत्पन्न करने के लिए टोकन की अधिकतम संख्या। इनपुट टोकन और उत्पन्न टोकन की कुल लंबाई मॉडल की संदर्भ लंबाई द्वारा सीमित है।

temperature

number

डिफ़ॉल्ट:1

0 और 2 के बीच सैंपलिंग तापमान। 0.8 जैसे उच्च मान आउटपुट को अधिक यादृच्छिक बनाते हैं, 0.2 जैसे निम्न मान इसे अधिक केंद्रित और निर्धारक बनाते हैं।

top_p

number

डिफ़ॉल्ट:1

न्यूक्लियस सैंपलिंग पैरामीटर (0-1)। तापमान सैंपलिंग का एक विकल्प जहां मॉडल top_p प्रायिकता द्रव्यमान वाले टोकन पर विचार करता है।

frequency_penalty

number

डिफ़ॉल्ट:0

-2.0 और 2.0 के बीच की संख्या। सकारात्मक मान नए टोकन को उनकी मौजूदा आवृत्ति के आधार पर दंडित करते हैं, जिससे मॉडल की एक ही पंक्ति को शब्दशः दोहराने की संभावना कम हो जाती है।

presence_penalty

number

डिफ़ॉल्ट:0

-2.0 और 2.0 के बीच की संख्या। सकारात्मक मान नए टोकन को इस आधार पर दंडित करते हैं कि वे अब तक के पाठ में दिखाई दिए हैं या नहीं, जिससे मॉडल की नए विषयों पर बात करने की संभावना बढ़ जाती है।

stop

string | string[]

अधिकतम 4 अनुक्रम जहां API आगे टोकन उत्पन्न करना बंद कर देगा।

integer

डिफ़ॉल्ट:1

प्रत्येक इनपुट संदेश के लिए कितने चैट पूर्णता विकल्प उत्पन्न करने हैं।

logprobs

boolean

डिफ़ॉल्ट:false

आउटपुट टोकन की लॉग प्रायिकताएं लौटानी हैं या नहीं। यदि true है, तो संदेश की सामग्री में लौटाए गए प्रत्येक आउटपुट टोकन की लॉग प्रायिकताएं लौटाता है।

top_logprobs

integer

0 और 20 के बीच का एक पूर्णांक जो प्रत्येक टोकन स्थिति पर लौटाए जाने वाले सबसे संभावित टोकन की संख्या निर्दिष्ट करता है। इस पैरामीटर का उपयोग करने पर logprobs को true पर सेट करना आवश्यक है।

response_format

object

एक ऑब्जेक्ट जो मॉडल द्वारा आउटपुट किए जाने वाले प्रारूप को निर्दिष्ट करता है।

दिखाएं properties

type

string

आवश्यक

प्रतिक्रिया प्रारूप का प्रकार। समर्थित मान: text, json_object, json_schema।

json_schema

object

JSON स्कीमा ऑब्जेक्ट। type json_schema होने पर आवश्यक।

seed

integer

यदि निर्दिष्ट किया गया है, तो सिस्टम निर्धारक रूप से सैंपल करने का सर्वोत्तम प्रयास करेगा, ताकि समान seed और पैरामीटर वाले बार-बार के अनुरोध समान परिणाम लौटाएं।

tools

object[]

उन टूल की सूची जिन्हें मॉडल कॉल कर सकता है। वर्तमान में, केवल फ़ंक्शन को टूल के रूप में समर्थित किया जाता है।

दिखाएं properties

type

string

आवश्यक

टूल का प्रकार। वर्तमान में, केवल function समर्थित है।

function

object

आवश्यक

फ़ंक्शन परिभाषा।

दिखाएं properties

name

string

आवश्यक

कॉल किए जाने वाले फ़ंक्शन का नाम।

description

string

फ़ंक्शन क्या करता है इसका विवरण।

parameters

object

फ़ंक्शन द्वारा स्वीकार किए जाने वाले पैरामीटर, JSON Schema ऑब्जेक्ट के रूप में वर्णित।

strict

boolean

डिफ़ॉल्ट:false

सख्त स्कीमा पालन सक्षम करना है या नहीं।

tool_choice

string | object

नियंत्रित करता है कि मॉडल द्वारा कौन सा (यदि कोई) टूल कॉल किया जाता है। none का अर्थ है कि मॉडल कोई टूल कॉल नहीं करेगा। auto का अर्थ है कि मॉडल संदेश उत्पन्न करने या टूल कॉल करने के बीच चुन सकता है। required का अर्थ है कि मॉडल को एक या अधिक टूल कॉल करने होंगे। {"type": "function", "function": {"name": "my_function"}} के माध्यम से एक विशेष फ़ंक्शन भी निर्दिष्ट कर सकते हैं।

parallel_tool_calls

boolean

डिफ़ॉल्ट:true

टूल उपयोग के दौरान समानांतर फ़ंक्शन कॉलिंग सक्षम करनी है या नहीं।

user

string

आपके अंतिम-उपयोगकर्ता का प्रतिनिधित्व करने वाला एक अद्वितीय पहचानकर्ता, जो दुरुपयोग की निगरानी और पहचान में मदद कर सकता है।

प्रतिक्रिया

सफल चैट पूर्णता प्रतिक्रिया।

string

चैट पूर्णता के लिए एक अद्वितीय पहचानकर्ता।

object

string

ऑब्जेक्ट प्रकार। हमेशा chat.completion।

created

integer

चैट पूर्णता बनाए जाने का Unix टाइमस्टैम्प (सेकंड में)।

model

string

चैट पूर्णता के लिए उपयोग किया गया मॉडल।

choices

object[]

चैट पूर्णता विकल्पों की सूची। यदि n 1 से अधिक है तो एक से अधिक हो सकते हैं।

दिखाएं properties

index

integer

विकल्पों की सूची में विकल्प का अनुक्रमांक।

message

object

मॉडल द्वारा उत्पन्न चैट पूर्णता संदेश।

दिखाएं properties

role

string

इस संदेश के लेखक की भूमिका। हमेशा assistant।

content

string | null

संदेश की सामग्री।

tool_calls

object[]

मॉडल द्वारा उत्पन्न टूल कॉल, जैसे फ़ंक्शन कॉल।

दिखाएं properties

string

टूल कॉल का ID।

type

string

टूल का प्रकार। वर्तमान में, केवल function समर्थित है।

function

object

मॉडल द्वारा कॉल किया गया फ़ंक्शन।

दिखाएं properties

name

string

कॉल किए जाने वाले फ़ंक्शन का नाम।

arguments

string

फ़ंक्शन को कॉल करने के लिए तर्क, मॉडल द्वारा JSON प्रारूप में उत्पन्न।

finish_reason

string

मॉडल ने टोकन उत्पन्न करना क्यों बंद किया। stop, length, tool_calls, या content_filter हो सकता है।

logprobs

object | null

विकल्प के लिए लॉग प्रायिकता जानकारी।

usage

object

पूर्णता अनुरोध के लिए उपयोग आँकड़े।

दिखाएं properties

prompt_tokens

integer

प्रॉम्प्ट में टोकन की संख्या।

completion_tokens

integer

उत्पन्न पूर्णता में टोकन की संख्या।

total_tokens

integer

अनुरोध में उपयोग किए गए कुल टोकन की संख्या (प्रॉम्प्ट + पूर्णता)।

system_fingerprint

string | null

यह फिंगरप्रिंट उस बैकएंड कॉन्फ़िगरेशन का प्रतिनिधित्व करता है जिसके साथ मॉडल चलता है। seed पैरामीटर के साथ उपयोग करके यह समझा जा सकता है कि बैकएंड में कब परिवर्तन किए गए हैं।

curl -X POST https://api-llm.sunra.ai/v1/chat/completions \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "What is the capital of France?"
      }
    ]
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1677652288,
  "model": "openai/gpt-4o",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The capital of France is Paris."
      },
      "finish_reason": "stop",
      "logprobs": null
    }
  ],
  "system_fingerprint": "fp_44709d6fcb",
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 8,
    "total_tokens": 33
  }
}

LLM क्विकस्टार्ट Create a message

​प्रमाणीकरण

​अनुरोध

​प्रतिक्रिया

प्रमाणीकरण

अनुरोध

प्रतिक्रिया