curl -X POST https://api-llm.sunra.ai/v1/chat/completions \ -H "Authorization: Bearer <SUNRA_KEY>" \ -H "Content-Type: application/json" \ -d '{ "model": "openai/gpt-4o", "messages": [ { "role": "system", "content": "You are a helpful assistant." }, { "role": "user", "content": "What is the capital of France?" } ] }'
Copy
{ "id": "chatcmpl-abc123", "object": "chat.completion", "created": 1677652288, "model": "openai/gpt-4o", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "The capital of France is Paris." }, "finish_reason": "stop", "logprobs": null } ], "system_fingerprint": "fp_44709d6fcb", "usage": { "prompt_tokens": 25, "completion_tokens": 8, "total_tokens": 33 }}
Chat
Create a chat completion
POST
/
v1
/
chat
/
completions
Copy
curl -X POST https://api-llm.sunra.ai/v1/chat/completions \ -H "Authorization: Bearer <SUNRA_KEY>" \ -H "Content-Type: application/json" \ -d '{ "model": "openai/gpt-4o", "messages": [ { "role": "system", "content": "You are a helpful assistant." }, { "role": "user", "content": "What is the capital of France?" } ] }'
Copy
{ "id": "chatcmpl-abc123", "object": "chat.completion", "created": 1677652288, "model": "openai/gpt-4o", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "The capital of France is Paris." }, "finish_reason": "stop", "logprobs": null } ], "system_fingerprint": "fp_44709d6fcb", "usage": { "prompt_tokens": 25, "completion_tokens": 8, "total_tokens": 33 }}
दिए गए चैट वार्तालाप के लिए मॉडल प्रतिक्रिया का अनुरोध भेजता है। स्ट्रीमिंग और नॉन-स्ट्रीमिंग दोनों मोड का समर्थन करता है। OpenAI Chat Completions API प्रारूप के साथ संगत है।
-2.0 और 2.0 के बीच की संख्या। सकारात्मक मान नए टोकन को उनकी मौजूदा आवृत्ति के आधार पर दंडित करते हैं, जिससे मॉडल की एक ही पंक्ति को शब्दशः दोहराने की संभावना कम हो जाती है।
-2.0 और 2.0 के बीच की संख्या। सकारात्मक मान नए टोकन को इस आधार पर दंडित करते हैं कि वे अब तक के पाठ में दिखाई दिए हैं या नहीं, जिससे मॉडल की नए विषयों पर बात करने की संभावना बढ़ जाती है।
0 और 20 के बीच का एक पूर्णांक जो प्रत्येक टोकन स्थिति पर लौटाए जाने वाले सबसे संभावित टोकन की संख्या निर्दिष्ट करता है। इस पैरामीटर का उपयोग करने पर logprobs को true पर सेट करना आवश्यक है।
यदि निर्दिष्ट किया गया है, तो सिस्टम निर्धारक रूप से सैंपल करने का सर्वोत्तम प्रयास करेगा, ताकि समान seed और पैरामीटर वाले बार-बार के अनुरोध समान परिणाम लौटाएं।
नियंत्रित करता है कि मॉडल द्वारा कौन सा (यदि कोई) टूल कॉल किया जाता है। none का अर्थ है कि मॉडल कोई टूल कॉल नहीं करेगा। auto का अर्थ है कि मॉडल संदेश उत्पन्न करने या टूल कॉल करने के बीच चुन सकता है। required का अर्थ है कि मॉडल को एक या अधिक टूल कॉल करने होंगे। {"type": "function", "function": {"name": "my_function"}} के माध्यम से एक विशेष फ़ंक्शन भी निर्दिष्ट कर सकते हैं।
यह फिंगरप्रिंट उस बैकएंड कॉन्फ़िगरेशन का प्रतिनिधित्व करता है जिसके साथ मॉडल चलता है। seed पैरामीटर के साथ उपयोग करके यह समझा जा सकता है कि बैकएंड में कब परिवर्तन किए गए हैं।
कॉपी करें
curl -X POST https://api-llm.sunra.ai/v1/chat/completions \ -H "Authorization: Bearer <SUNRA_KEY>" \ -H "Content-Type: application/json" \ -d '{ "model": "openai/gpt-4o", "messages": [ { "role": "system", "content": "You are a helpful assistant." }, { "role": "user", "content": "What is the capital of France?" } ] }'
कॉपी करें
{ "id": "chatcmpl-abc123", "object": "chat.completion", "created": 1677652288, "model": "openai/gpt-4o", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "The capital of France is Paris." }, "finish_reason": "stop", "logprobs": null } ], "system_fingerprint": "fp_44709d6fcb", "usage": { "prompt_tokens": 25, "completion_tokens": 8, "total_tokens": 33 }}