Для преобразования речи в текст с помощью API sunra необходимо отправить запрос на соответствующую конечную точку с необходимыми входными параметрами. API использует предварительно обученные модели для преобразования аудиофайлов в текст, обеспечивая бесшовное преобразование путем простой передачи аудиофайла. Вот как можно использовать API sunra для преобразования речи в текст:
import { sunra } from "@sunra/client";

const result = await sunra.subscribe("elevenlabs/scribe-v1/speech-to-text", {
  input: {
    audio: 'https://assets.sunra.ai/uploads/1749243418768-74d68e25.wav',
    language: 'English',
    tag_audio_events: true,
    speaker_diarization: false
  },
  logs: true,
  onQueueUpdate: (update) => {
    console.log(update)
  },
});
console.log(result.data);
console.log(result.requestId);

Выбор подходящей модели

sunra предоставляет ряд моделей преобразования речи в текст для удовлетворения различных потребностей. Выберите модель в зависимости от ваших требований к точности и производительности. Вот некоторые доступные варианты:
  • elevenlabs/scribe-v1: преобразование речи в текст на 99 языках с временными метками на уровне слов и диаризацией — самая точная на сегодняшний день ASR компании.
Чтобы использовать конкретную модель, укажите ее идентификатор в методе subscribe, как показано в примере. Дополнительные модели и подробности см. на странице Модели преобразования речи в текст.