LLM
Create a response
POST
OpenAI Responses API प्रारूप का उपयोग करके स्ट्रीमिंग या नॉन-स्ट्रीमिंग प्रतिक्रिया बनाता है।
प्रमाणीकरण
Bearer टोकन। Authorization हेडर में अपनी API कुंजी को bearer टोकन के रूप में उपयोग करें।प्रारूप:
Bearer <SUNRA_KEY>अनुरोध
यह एंडपॉइंट एक ऑब्जेक्ट स्वीकार करता है।प्रतिक्रिया उत्पन्न करने के लिए उपयोग किया जाने वाला मॉडल ID। उपलब्ध मॉडल sunra.ai/models पर देखें।
प्रतिक्रिया अनुरोध के लिए इनपुट। एक स्ट्रिंग या इनपुट आइटम की एक सरणी हो सकती है।
मॉडल के संदर्भ में पहले आइटम के रूप में एक सिस्टम (या डेवलपर) संदेश सम्मिलित करता है।
input के साथ उपयोग करने पर, निर्देश इनपुट की शुरुआत में डाले जाते हैं।यदि
true पर सेट किया जाता है, तो प्रतिक्रिया server-sent events (SSE) का उपयोग करके स्ट्रीम की जाएगी।आउटपुट टोकन की संख्या के लिए एक ऊपरी सीमा, जिसमें दृश्य आउटपुट टोकन और तर्क टोकन शामिल हैं।
0 और 2 के बीच सैंपलिंग तापमान। उच्च मान यादृच्छिकता बढ़ाते हैं।
न्यूक्लियस सैंपलिंग पैरामीटर। तापमान के साथ सैंपलिंग का एक विकल्प।
-2.0 और 2.0 के बीच की संख्या। सकारात्मक मान नए टोकन को पाठ में उनकी मौजूदा आवृत्ति के आधार पर दंडित करते हैं।
-2.0 और 2.0 के बीच की संख्या। सकारात्मक मान नए टोकन को इस आधार पर दंडित करते हैं कि वे पहले से पाठ में दिखाई दिए हैं या नहीं।
उन टूल की सरणी जिन्हें मॉडल कॉल कर सकता है।
टूल चयन व्यवहार को नियंत्रित करता है। समर्थित स्ट्रिंग मान:
none, auto, required। एक विशेष फ़ंक्शन भी निर्दिष्ट कर सकते हैं।मॉडल को समानांतर में टूल कॉल चलाने की अनुमति देनी है या नहीं।
टेक्स्ट प्रतिक्रिया प्रारूप के लिए कॉन्फ़िगरेशन।
तर्क आउटपुट के लिए कॉन्फ़िगरेशन।
बाद में पुनर्प्राप्ति के लिए उत्पन्न प्रतिक्रिया को संग्रहीत करना है या नहीं।
16 कुंजी-मान जोड़े का सेट जो प्रतिक्रिया से जोड़ा जा सकता है। कुंजियां अधिकतम 64 वर्णों वाली स्ट्रिंग हैं। मान अधिकतम 512 वर्णों वाली स्ट्रिंग हैं।
आपके अंतिम-उपयोगकर्ता का प्रतिनिधित्व करने वाला एक अद्वितीय पहचानकर्ता। अधिकतम 128 वर्ण।
प्रतिक्रिया
सफल प्रतिक्रिया ऑब्जेक्ट।अद्वितीय प्रतिक्रिया पहचानकर्ता।
ऑब्जेक्ट प्रकार। हमेशा
response।प्रतिक्रिया बनाए जाने का Unix टाइमस्टैम्प (सेकंड में)।
प्रतिक्रिया की स्थिति। संभावित मान:
completed, failed, in_progress, cancelled।प्रतिक्रिया उत्पन्न करने के लिए उपयोग किया गया मॉडल।
मॉडल द्वारा उत्पन्न सामग्री आइटम की सरणी।
प्रतिक्रिया के लिए टोकन उपयोग आँकड़े।
उपयोग किया गया सैंपलिंग तापमान।
उपयोग किया गया न्यूक्लियस सैंपलिंग मान।
उपयोग की गई अधिकतम आउटपुट टोकन सेटिंग।
यदि जनरेशन विफल हुआ तो एक त्रुटि ऑब्जेक्ट।