要使用 Sunra API 将语音转换为文本,您需要向适当的端点发送包含所需输入参数的请求。该 API 利用预训练模型将音频文件转录为文本,只需提供音频文件即可实现无缝转换。 以下是如何使用 Sunra API 进行语音转文本转换的方法:
import { sunra } from "@sunra/client";

const result = await sunra.subscribe("elevenlabs/scribe-v1/speech-to-text", {
  input: {
    audio: 'https://assets.sunra.ai/uploads/1749243418768-74d68e25.wav',
    language: 'English',
    tag_audio_events: true,
    speaker_diarization: false
  },
  logs: true,
  onQueueUpdate: (update) => {
    console.log(update)
  },
});
console.log(result.data);
console.log(result.requestId);

选择合适的模型

Sunra 提供一系列语音转文本模型,以满足不同的需求。根据您对准确性和性能的要求选择模型。 以下是一些可用选项:
  • elevenlabs/scribe-v1:支持 99 种语言的语音转文本,具有词级时间戳和说话人分离功能——这是该公司迄今为止最准确的 ASR。
要使用特定模型,请在 subscribe 方法中指定其 ID,如示例所示。有关更多模型和详细信息,请访问语音转文本模型页面。