Pour convertir de la parole en texte à l’aide de l’API sunra, vous devez envoyer une requête au point de terminaison approprié avec les paramètres d’entrée requis. L’API s’appuie sur des modèles pré-entraînés pour transcrire des fichiers audio en texte, permettant une conversion transparente en fournissant simplement un fichier audio. Voici comment vous pouvez utiliser l’API sunra pour la conversion de la parole en texte :
import { sunra } from "@sunra/client";

const result = await sunra.subscribe("elevenlabs/scribe-v1/speech-to-text", {
  input: {
    audio: 'https://assets.sunra.ai/uploads/1749243418768-74d68e25.wav',
    language: 'English',
    tag_audio_events: true,
    speaker_diarization: false
  },
  logs: true,
  onQueueUpdate: (update) => {
    console.log(update)
  },
});
console.log(result.data);
console.log(result.requestId);

Choisir le bon modèle

sunra propose une gamme de modèles de conversion de la parole en texte pour répondre à différents besoins. Sélectionnez un modèle en fonction de vos exigences en matière de précision et de performance. Voici quelques options disponibles :
  • elevenlabs/scribe-v1 : Conversion de la parole en texte en 99 langues avec horodatage au niveau du mot et diarisation — l’ASR la plus précise de l’entreprise à ce jour.
Pour utiliser un modèle spécifique, spécifiez son ID dans la méthode subscribe comme indiqué dans l’exemple. Pour plus de modèles et de détails, visitez la page Modèles de parole vers texte.