Langsung ke konten utama
POST
/
v1
/
responses
curl -X POST https://api-llm.sunra.ai/v1/responses \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "input": [
      {
        "type": "message",
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'
{
  "id": "resp-abc123",
  "object": "response",
  "created_at": 1704067200,
  "status": "completed",
  "model": "openai/gpt-4o",
  "output": [
    {
      "type": "message",
      "id": "msg_abc123",
      "role": "assistant",
      "status": "completed",
      "content": [
        {
          "type": "output_text",
          "text": "Hello! I'm doing well, thank you for asking. How can I help you today?",
          "annotations": []
        }
      ]
    }
  ],
  "temperature": 1.0,
  "top_p": 1.0,
  "max_output_tokens": null,
  "usage": {
    "input_tokens": 15,
    "output_tokens": 18,
    "total_tokens": 33,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  },
  "error": null
}
Membuat respons streaming atau non-streaming menggunakan format OpenAI Responses API.

Autentikasi

Authorization
string
wajib
Bearer token. Gunakan kunci API Anda sebagai bearer token di header Authorization.Format: Bearer <SUNRA_KEY>

Permintaan

Endpoint ini menerima sebuah objek.
model
string
wajib
ID model yang digunakan untuk menghasilkan respons. Jelajahi model yang tersedia di sunra.ai/models.
input
string | object[]
Input untuk permintaan respons. Dapat berupa string atau array item input.
instructions
string | null
Menyisipkan pesan sistem (atau pengembang) sebagai item pertama dalam konteks model. Ketika digunakan dengan input, instruksi disisipkan di awal input.
stream
boolean
default:false
Jika diatur ke true, respons akan di-streaming menggunakan server-sent events (SSE).
max_output_tokens
integer
Batas atas untuk jumlah token output, termasuk token output yang terlihat dan token penalaran.
temperature
number
default:1
Temperatur sampling antara 0 dan 2. Nilai lebih tinggi meningkatkan keacakan.
top_p
number
default:1
Parameter nucleus sampling. Alternatif untuk sampling dengan temperatur.
frequency_penalty
number
default:0
Angka antara -2.0 dan 2.0. Nilai positif menghukum token baru berdasarkan frekuensi kemunculannya dalam teks.
presence_penalty
number
default:0
Angka antara -2.0 dan 2.0. Nilai positif menghukum token baru berdasarkan apakah mereka sudah muncul dalam teks.
tools
object[]
Array alat yang dapat dipanggil oleh model.
tool_choice
string | object
Mengontrol perilaku pemilihan alat. Nilai string yang didukung: none, auto, required. Dapat juga menentukan fungsi tertentu.
parallel_tool_calls
boolean
default:true
Apakah mengizinkan model menjalankan panggilan alat secara paralel.
text
object
Konfigurasi untuk format respons teks.
reasoning
object
Konfigurasi untuk output penalaran.
store
boolean
default:true
Apakah menyimpan respons yang dihasilkan untuk pengambilan nanti.
metadata
object
Set 16 pasangan kunci-nilai yang dapat dilampirkan ke respons. Kunci adalah string dengan maksimal 64 karakter. Nilai adalah string dengan maksimal 512 karakter.
user
string
Pengenal unik yang mewakili pengguna akhir Anda. Maksimal 128 karakter.

Respons

Objek respons yang berhasil.
id
string
Pengenal respons unik.
object
string
Tipe objek. Selalu response.
created_at
number
Timestamp Unix (dalam detik) kapan respons dibuat.
status
string
Status respons. Nilai yang mungkin: completed, failed, in_progress, cancelled.
model
string
Model yang digunakan untuk menghasilkan respons.
output
object[]
Array item konten yang dihasilkan oleh model.
usage
object
Statistik penggunaan token untuk respons.
temperature
number
Temperatur sampling yang digunakan.
top_p
number
Nilai nucleus sampling yang digunakan.
max_output_tokens
integer | null
Pengaturan token output maksimum yang digunakan.
error
object | null
Objek error jika pembuatan gagal.
curl -X POST https://api-llm.sunra.ai/v1/responses \
  -H "Authorization: Bearer <SUNRA_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o",
    "input": [
      {
        "type": "message",
        "role": "user",
        "content": "Hello, how are you?"
      }
    ]
  }'
{
  "id": "resp-abc123",
  "object": "response",
  "created_at": 1704067200,
  "status": "completed",
  "model": "openai/gpt-4o",
  "output": [
    {
      "type": "message",
      "id": "msg_abc123",
      "role": "assistant",
      "status": "completed",
      "content": [
        {
          "type": "output_text",
          "text": "Hello! I'm doing well, thank you for asking. How can I help you today?",
          "annotations": []
        }
      ]
    }
  ],
  "temperature": 1.0,
  "top_p": 1.0,
  "max_output_tokens": null,
  "usage": {
    "input_tokens": 15,
    "output_tokens": 18,
    "total_tokens": 33,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  },
  "error": null
}