Whisper導入

概要

  • Whisperは、OpenAIが文字起こしサービスとして公開した無料の音声認識モデルです。
    • WhisperはWebから収集した68万時間分の多言語音声データを教師付きデータで学習させており、高い精度で入力した音声を文字起こしすることが可能になっています。

導入

【ローカル環境】Audacity + Whisperで文字起こし【無料】

  • https://qiita.com/aDAVISk/items/8e94077791c25f81ed6b

VALL-E-XでWhisperを利用して文字起こし

  • 調査中・・・