Para converter fala em texto usando a API da sunra, você precisa enviar uma solicitação ao endpoint apropriado com os parâmetros de entrada necessários. A API utiliza modelos pré-treinados para transcrever arquivos de áudio em texto, permitindo uma conversão perfeita simplesmente fornecendo um arquivo de áudio. Veja como você pode usar a API da sunra para conversão de fala em texto:
import { sunra } from "@sunra/client";

const result = await sunra.subscribe("elevenlabs/scribe-v1/speech-to-text", {
  input: {
    audio: 'https://assets.sunra.ai/uploads/1749243418768-74d68e25.wav',
    language: 'English',
    tag_audio_events: true,
    speaker_diarization: false
  },
  logs: true,
  onQueueUpdate: (update) => {
    console.log(update)
  },
});
console.log(result.data);
console.log(result.requestId);

Escolhendo o Modelo Certo

A sunra oferece uma variedade de modelos de conversão de fala em texto para atender a diferentes necessidades. Selecione um modelo com base em seus requisitos de precisão e desempenho. Aqui estão algumas opções disponíveis:
  • elevenlabs/scribe-v1: conversão de fala em texto em 99 idiomas com carimbos de data/hora no nível da palavra e diarização — o ASR mais preciso da empresa até o momento.
Para usar um modelo específico, especifique seu ID no método subscribe, como mostrado no exemplo. Para mais modelos e detalhes, visite a página Modelos de Fala para Texto.