Per convertire la voce in testo utilizzando l’API di sunra, è necessario inviare una richiesta all’endpoint appropriato con i parametri di input richiesti. L’API sfrutta modelli pre-addestrati per trascrivere i file audio in testo, consentendo una conversione senza interruzioni semplicemente fornendo un file audio. Ecco come è possibile utilizzare l’API di sunra per la conversione da voce a testo:
import { sunra } from "@sunra/client";

const result = await sunra.subscribe("elevenlabs/scribe-v1/speech-to-text", {
  input: {
    audio: 'https://assets.sunra.ai/uploads/1749243418768-74d68e25.wav',
    language: 'English',
    tag_audio_events: true,
    speaker_diarization: false
  },
  logs: true,
  onQueueUpdate: (update) => {
    console.log(update)
  },
});
console.log(result.data);
console.log(result.requestId);

Scelta del modello giusto

sunra fornisce una gamma di modelli da voce a testo per soddisfare esigenze diverse. Seleziona un modello in base alle tue esigenze di accuratezza e prestazioni. Ecco alcune opzioni disponibili:
  • elevenlabs/scribe-v1: da voce a testo in 99 lingue con timestamp a livello di parola e diarizzazione, l’ASR più accurato dell’azienda fino ad oggi.
Per utilizzare un modello specifico, specificarne l’ID nel metodo subscribe come mostrato nell’esempio. Per ulteriori modelli e dettagli, visitare la pagina Modelli da voce a testo.