LLM
Create a response
POST
Membuat respons streaming atau non-streaming menggunakan format OpenAI Responses API.
Autentikasi
Bearer token. Gunakan kunci API Anda sebagai bearer token di header Authorization.Format:
Bearer <SUNRA_KEY>Permintaan
Endpoint ini menerima sebuah objek.ID model yang digunakan untuk menghasilkan respons. Jelajahi model yang tersedia di sunra.ai/models.
Input untuk permintaan respons. Dapat berupa string atau array item input.
Menyisipkan pesan sistem (atau pengembang) sebagai item pertama dalam konteks model. Ketika digunakan dengan
input, instruksi disisipkan di awal input.Jika diatur ke
true, respons akan di-streaming menggunakan server-sent events (SSE).Batas atas untuk jumlah token output, termasuk token output yang terlihat dan token penalaran.
Temperatur sampling antara 0 dan 2. Nilai lebih tinggi meningkatkan keacakan.
Parameter nucleus sampling. Alternatif untuk sampling dengan temperatur.
Angka antara -2.0 dan 2.0. Nilai positif menghukum token baru berdasarkan frekuensi kemunculannya dalam teks.
Angka antara -2.0 dan 2.0. Nilai positif menghukum token baru berdasarkan apakah mereka sudah muncul dalam teks.
Array alat yang dapat dipanggil oleh model.
Mengontrol perilaku pemilihan alat. Nilai string yang didukung:
none, auto, required. Dapat juga menentukan fungsi tertentu.Apakah mengizinkan model menjalankan panggilan alat secara paralel.
Konfigurasi untuk format respons teks.
Konfigurasi untuk output penalaran.
Apakah menyimpan respons yang dihasilkan untuk pengambilan nanti.
Set 16 pasangan kunci-nilai yang dapat dilampirkan ke respons. Kunci adalah string dengan maksimal 64 karakter. Nilai adalah string dengan maksimal 512 karakter.
Pengenal unik yang mewakili pengguna akhir Anda. Maksimal 128 karakter.
Respons
Objek respons yang berhasil.Pengenal respons unik.
Tipe objek. Selalu
response.Timestamp Unix (dalam detik) kapan respons dibuat.
Status respons. Nilai yang mungkin:
completed, failed, in_progress, cancelled.Model yang digunakan untuk menghasilkan respons.
Array item konten yang dihasilkan oleh model.
Statistik penggunaan token untuk respons.
Temperatur sampling yang digunakan.
Nilai nucleus sampling yang digunakan.
Pengaturan token output maksimum yang digunakan.
Objek error jika pembuatan gagal.