LLM
Create a message
POST
Membuat pesan menggunakan format Anthropic Messages API. Mendukung teks, gambar, PDF, alat, dan pemikiran diperluas.
Autentikasi
Bearer token. Gunakan kunci API Anda sebagai bearer token di header Authorization.Format:
Bearer <SUNRA_KEY>Permintaan
Endpoint ini menerima sebuah objek.Model yang akan menyelesaikan prompt Anda. Jelajahi model yang tersedia di sunra.ai/models.
Pesan input. Setiap pesan input memiliki
role dan content.Jumlah maksimum token yang akan dihasilkan sebelum berhenti. Perhatikan bahwa model mungkin berhenti sebelum mencapai maksimum ini.
Prompt sistem. Cara untuk memberikan konteks dan instruksi kepada model. Dapat berupa string atau array blok konten.
Apakah akan melakukan streaming respons secara bertahap menggunakan server-sent events (SSE).
Jumlah keacakan yang disuntikkan ke dalam respons. Berkisar dari 0.0 hingga 1.0. Gunakan
temperature mendekati 0.0 untuk tugas analitis/pilihan ganda, dan mendekati 1.0 untuk tugas kreatif dan generatif.Gunakan nucleus sampling. Dalam nucleus sampling, kami menghitung distribusi kumulatif atas semua opsi untuk setiap token berikutnya dalam urutan probabilitas menurun dan memotongnya ketika mencapai probabilitas tertentu yang ditentukan oleh
top_p.Hanya ambil sampel dari K opsi teratas untuk setiap token berikutnya. Digunakan untuk menghapus respons probabilitas rendah “ekor panjang”. Disarankan hanya untuk kasus penggunaan lanjutan.
Urutan teks kustom yang akan menyebabkan model berhenti menghasilkan. Teks yang dikembalikan tidak akan berisi urutan berhenti.
Definisi alat yang dapat digunakan oleh model.
Bagaimana model harus menggunakan alat yang disediakan.
Objek yang mendeskripsikan metadata tentang permintaan.
Konfigurasi untuk pemikiran diperluas. Ketika diaktifkan, model akan berpikir sebelum merespons.
Respons
Respons pesan yang berhasil.Pengenal pesan unik, misalnya
msg_01XFDUDYJgAACzvnptvVoYEL.Tipe objek. Selalu
message.Peran percakapan dari pesan yang dihasilkan. Selalu
assistant.Konten yang dihasilkan oleh model. Ini adalah array blok konten.
Model yang menangani permintaan.
Alasan model berhenti. Dapat berupa
end_turn (model mencapai titik berhenti alami), max_tokens (melebihi max_tokens atau maksimum model), stop_sequence (salah satu urutan berhenti kustom Anda dihasilkan), atau tool_use (model memanggil satu atau lebih alat).Urutan berhenti kustom mana yang dihasilkan, jika ada.
Penggunaan penagihan dan batas laju.