LLM
Create a chat completion
POST
Mengirim permintaan respons model untuk percakapan chat yang diberikan. Mendukung mode streaming dan non-streaming. Kompatibel dengan format OpenAI Chat Completions API.
Autentikasi
Bearer token. Gunakan kunci API Anda sebagai bearer token di header Authorization.Format:
Bearer <SUNRA_KEY>Permintaan
Endpoint ini menerima sebuah objek.Daftar pesan untuk percakapan.
Model yang digunakan untuk penyelesaian. Jelajahi model yang tersedia di sunra.ai/models.
Jika diatur ke
true, delta pesan parsial akan dikirim sebagai server-sent events (SSE).Jumlah maksimum token yang akan dihasilkan dalam penyelesaian. Total panjang token input dan token yang dihasilkan dibatasi oleh panjang konteks model.
Temperatur sampling antara 0 dan 2. Nilai lebih tinggi seperti 0.8 membuat output lebih acak, nilai lebih rendah seperti 0.2 membuatnya lebih terfokus dan deterministik.
Parameter nucleus sampling (0-1). Alternatif untuk temperature sampling di mana model mempertimbangkan token dengan massa probabilitas top_p.
Angka antara -2.0 dan 2.0. Nilai positif menghukum token baru berdasarkan frekuensi kemunculannya dalam teks sejauh ini, mengurangi kemungkinan model mengulangi baris yang sama secara verbatim.
Angka antara -2.0 dan 2.0. Nilai positif menghukum token baru berdasarkan apakah mereka muncul dalam teks sejauh ini, meningkatkan kemungkinan model membahas topik baru.
Hingga 4 urutan di mana API akan berhenti menghasilkan token lebih lanjut.
Berapa banyak pilihan penyelesaian chat yang dihasilkan untuk setiap pesan input.
Apakah akan mengembalikan probabilitas log dari token output. Jika true, mengembalikan probabilitas log dari setiap token output yang dikembalikan dalam konten pesan.
Bilangan bulat antara 0 dan 20 yang menentukan jumlah token paling mungkin yang dikembalikan di setiap posisi token.
logprobs harus diatur ke true jika parameter ini digunakan.Objek yang menentukan format yang harus dikeluarkan oleh model.
Jika ditentukan, sistem akan melakukan upaya terbaik untuk melakukan sampling secara deterministik, sehingga permintaan berulang dengan seed dan parameter yang sama akan mengembalikan hasil yang sama.
Daftar alat yang dapat dipanggil oleh model. Saat ini, hanya fungsi yang didukung sebagai alat.
Mengontrol alat mana (jika ada) yang dipanggil oleh model.
none berarti model tidak akan memanggil alat apa pun. auto berarti model dapat memilih antara menghasilkan pesan atau memanggil alat. required berarti model harus memanggil satu atau lebih alat. Dapat juga menentukan fungsi tertentu melalui {"type": "function", "function": {"name": "my_function"}}.Apakah akan mengaktifkan pemanggilan fungsi paralel selama penggunaan alat.
Pengenal unik yang mewakili pengguna akhir Anda, yang dapat membantu memantau dan mendeteksi penyalahgunaan.
Respons
Respons penyelesaian chat yang berhasil.Pengenal unik untuk penyelesaian chat.
Tipe objek. Selalu
chat.completion.Timestamp Unix (dalam detik) kapan penyelesaian chat dibuat.
Model yang digunakan untuk penyelesaian chat.
Daftar pilihan penyelesaian chat. Dapat lebih dari satu jika
n lebih besar dari 1.Statistik penggunaan untuk permintaan penyelesaian.
Sidik jari ini mewakili konfigurasi backend tempat model berjalan. Dapat digunakan dengan parameter
seed untuk memahami kapan perubahan backend telah dilakukan.