sunra API を使用して音声をテキストに変換するには、適切なエンドポイントに必要な入力パラメータを指定してリクエストを送信する必要があります。API は、事前にトレーニングされたモデルを活用して音声ファイルをテキストに書き起こし、音声ファイルを提供するだけでシームレスな変換を可能にします。 sunra API を使用して音声からテキストへの変換を行う方法は次のとおりです。
import { sunra } from "@sunra/client";

const result = await sunra.subscribe("elevenlabs/scribe-v1/speech-to-text", {
  input: {
    audio: 'https://assets.sunra.ai/uploads/1749243418768-74d68e25.wav',
    language: 'English',
    tag_audio_events: true,
    speaker_diarization: false
  },
  logs: true,
  onQueueUpdate: (update) => {
    console.log(update)
  },
});
console.log(result.data);
console.log(result.requestId);

適切なモデルの選択

sunra は、さまざまなニーズに合わせてさまざまな音声からテキストへのモデルを提供しています。精度とパフォーマンスの要件に基づいてモデルを選択してください。 利用可能なオプションの一部を次に示します。
  • elevenlabs/scribe-v1: 99 言語の音声からテキストへの変換、単語レベルのタイムスタンプとダイアライゼーションを備えています。これは同社で最も正確な ASR です。
特定のモデルを使用するには, 例に示すように subscribe メソッドでその ID を指定します。その他のモデルと詳細については, 音声からテキストへのモデル ページをご覧ください。