LLM
Create a chat completion
POST
दिए गए चैट वार्तालाप के लिए मॉडल प्रतिक्रिया का अनुरोध भेजता है। स्ट्रीमिंग और नॉन-स्ट्रीमिंग दोनों मोड का समर्थन करता है। OpenAI Chat Completions API प्रारूप के साथ संगत है।
प्रमाणीकरण
Bearer टोकन। Authorization हेडर में अपनी API कुंजी को bearer टोकन के रूप में उपयोग करें।प्रारूप:
Bearer <SUNRA_KEY>अनुरोध
यह एंडपॉइंट एक ऑब्जेक्ट स्वीकार करता है।वार्तालाप के लिए संदेशों की सूची।
पूर्णता के लिए उपयोग किया जाने वाला मॉडल। उपलब्ध मॉडल sunra.ai/models पर देखें।
यदि
true पर सेट किया जाता है, तो आंशिक संदेश डेल्टा को server-sent events (SSE) के रूप में भेजा जाएगा।पूर्णता में उत्पन्न करने के लिए टोकन की अधिकतम संख्या। इनपुट टोकन और उत्पन्न टोकन की कुल लंबाई मॉडल की संदर्भ लंबाई द्वारा सीमित है।
0 और 2 के बीच सैंपलिंग तापमान। 0.8 जैसे उच्च मान आउटपुट को अधिक यादृच्छिक बनाते हैं, 0.2 जैसे निम्न मान इसे अधिक केंद्रित और निर्धारक बनाते हैं।
न्यूक्लियस सैंपलिंग पैरामीटर (0-1)। तापमान सैंपलिंग का एक विकल्प जहां मॉडल top_p प्रायिकता द्रव्यमान वाले टोकन पर विचार करता है।
-2.0 और 2.0 के बीच की संख्या। सकारात्मक मान नए टोकन को उनकी मौजूदा आवृत्ति के आधार पर दंडित करते हैं, जिससे मॉडल की एक ही पंक्ति को शब्दशः दोहराने की संभावना कम हो जाती है।
-2.0 और 2.0 के बीच की संख्या। सकारात्मक मान नए टोकन को इस आधार पर दंडित करते हैं कि वे अब तक के पाठ में दिखाई दिए हैं या नहीं, जिससे मॉडल की नए विषयों पर बात करने की संभावना बढ़ जाती है।
अधिकतम 4 अनुक्रम जहां API आगे टोकन उत्पन्न करना बंद कर देगा।
प्रत्येक इनपुट संदेश के लिए कितने चैट पूर्णता विकल्प उत्पन्न करने हैं।
आउटपुट टोकन की लॉग प्रायिकताएं लौटानी हैं या नहीं। यदि true है, तो संदेश की सामग्री में लौटाए गए प्रत्येक आउटपुट टोकन की लॉग प्रायिकताएं लौटाता है।
0 और 20 के बीच का एक पूर्णांक जो प्रत्येक टोकन स्थिति पर लौटाए जाने वाले सबसे संभावित टोकन की संख्या निर्दिष्ट करता है। इस पैरामीटर का उपयोग करने पर
logprobs को true पर सेट करना आवश्यक है।एक ऑब्जेक्ट जो मॉडल द्वारा आउटपुट किए जाने वाले प्रारूप को निर्दिष्ट करता है।
यदि निर्दिष्ट किया गया है, तो सिस्टम निर्धारक रूप से सैंपल करने का सर्वोत्तम प्रयास करेगा, ताकि समान seed और पैरामीटर वाले बार-बार के अनुरोध समान परिणाम लौटाएं।
उन टूल की सूची जिन्हें मॉडल कॉल कर सकता है। वर्तमान में, केवल फ़ंक्शन को टूल के रूप में समर्थित किया जाता है।
नियंत्रित करता है कि मॉडल द्वारा कौन सा (यदि कोई) टूल कॉल किया जाता है।
none का अर्थ है कि मॉडल कोई टूल कॉल नहीं करेगा। auto का अर्थ है कि मॉडल संदेश उत्पन्न करने या टूल कॉल करने के बीच चुन सकता है। required का अर्थ है कि मॉडल को एक या अधिक टूल कॉल करने होंगे। {"type": "function", "function": {"name": "my_function"}} के माध्यम से एक विशेष फ़ंक्शन भी निर्दिष्ट कर सकते हैं।टूल उपयोग के दौरान समानांतर फ़ंक्शन कॉलिंग सक्षम करनी है या नहीं।
आपके अंतिम-उपयोगकर्ता का प्रतिनिधित्व करने वाला एक अद्वितीय पहचानकर्ता, जो दुरुपयोग की निगरानी और पहचान में मदद कर सकता है।
प्रतिक्रिया
सफल चैट पूर्णता प्रतिक्रिया।चैट पूर्णता के लिए एक अद्वितीय पहचानकर्ता।
ऑब्जेक्ट प्रकार। हमेशा
chat.completion।चैट पूर्णता बनाए जाने का Unix टाइमस्टैम्प (सेकंड में)।
चैट पूर्णता के लिए उपयोग किया गया मॉडल।
चैट पूर्णता विकल्पों की सूची। यदि
n 1 से अधिक है तो एक से अधिक हो सकते हैं।पूर्णता अनुरोध के लिए उपयोग आँकड़े।
यह फिंगरप्रिंट उस बैकएंड कॉन्फ़िगरेशन का प्रतिनिधित्व करता है जिसके साथ मॉडल चलता है।
seed पैरामीटर के साथ उपयोग करके यह समझा जा सकता है कि बैकएंड में कब परिवर्तन किए गए हैं।