LLM
Create a chat completion
POST
Invia una richiesta per una risposta del modello per la conversazione chat specificata. Supporta sia la modalità streaming che non-streaming. Compatibile con il formato dell’API OpenAI Chat Completions.
Autenticazione
Token Bearer. Utilizza la tua chiave API come token Bearer nell’header Authorization.Format:
Bearer <SUNRA_KEY>Richiesta
Questo endpoint si aspetta un oggetto JSON.Il modello da utilizzare per il completamento. Sfoglia i modelli disponibili su sunra.ai/models.
Lista dei messaggi per la conversazione.
Se impostato su
true, i delta parziali dei messaggi verranno inviati come Server-Sent Events (SSE).Il numero massimo di token da generare nel completamento.
Temperatura di campionamento tra 0 e 2. Valori più alti come 0.8 rendono l’output più casuale, valori più bassi come 0.2 lo rendono più focalizzato e deterministico.
Parametro di campionamento nucleus (0-1). Un’alternativa al campionamento per temperatura in cui il modello considera i token con massa di probabilità top_p.
Numero tra -2.0 e 2.0. I valori positivi penalizzano i nuovi token in base alla loro frequenza esistente nel testo finora, diminuendo la probabilità che il modello ripeta la stessa riga alla lettera.
Numero tra -2.0 e 2.0. I valori positivi penalizzano i nuovi token in base alla loro presenza nel testo finora, aumentando la probabilità che il modello parli di nuovi argomenti.
Fino a 4 sequenze in cui l’API smetterà di generare ulteriori token.
Risposta
Risposta di completamento chat riuscita.Identificatore univoco del completamento.
Tipo di oggetto. Sempre
chat.completion.Timestamp Unix della creazione.
Modello utilizzato per il completamento.
Lista delle opzioni di completamento.
Statistiche di utilizzo dei token.