LLM
Create a chat completion
POST
Sendet eine Anfrage für eine Modellantwort für die gegebene Chat-Konversation. Unterstützt sowohl Streaming- als auch Nicht-Streaming-Modi. Kompatibel mit dem OpenAI Chat Completions API-Format.
Authentifizierung
Bearer-Token. Verwenden Sie Ihren API-Schlüssel als Bearer-Token im Authorization-Header.Format:
Bearer <SUNRA_KEY>Anfrage
Dieser Endpunkt erwartet ein JSON-Objekt.Das Modell, das für die Vervollständigung verwendet werden soll. Verfügbare Modelle finden Sie unter sunra.ai/models.
Liste der Nachrichten für die Konversation.
Wenn auf
true gesetzt, werden partielle Nachrichtendeltas als Server-Sent Events (SSE) gesendet.Die maximale Anzahl der zu generierenden Tokens in der Vervollständigung.
Sampling-Temperatur zwischen 0 und 2. Höhere Werte wie 0.8 machen die Ausgabe zufälliger, niedrigere Werte wie 0.2 machen sie fokussierter und deterministischer.
Nucleus-Sampling-Parameter (0-1). Eine Alternative zum Temperatur-Sampling, bei der das Modell die Tokens mit der top_p-Wahrscheinlichkeitsmasse berücksichtigt.
Zahl zwischen -2.0 und 2.0. Positive Werte bestrafen neue Tokens basierend auf ihrer bestehenden Häufigkeit im bisherigen Text und verringern die Wahrscheinlichkeit, dass das Modell dieselbe Zeile wörtlich wiederholt.
Zahl zwischen -2.0 und 2.0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie im bisherigen Text vorkommen, und erhöhen die Wahrscheinlichkeit, dass das Modell über neue Themen spricht.
Bis zu 4 Sequenzen, bei denen die API die weitere Token-Generierung stoppt.
Antwort
Erfolgreiche Chat-Vervollständigungs-Antwort.Eindeutiger Vervollständigungs-Bezeichner.
Objekttyp. Immer
chat.completion.Unix-Zeitstempel der Erstellung.
Das für die Vervollständigung verwendete Modell.
Liste der Vervollständigungsoptionen.
Token-Nutzungsstatistiken.