Windows上のOpenAI Whisperで音声ファイルのロードに失敗するときの対応

この記事は公開から2年以上経過しています。

Windows 10上で

import whisper

model = whisper.load_model('base')

try:
    result = model.transcribe('input.wav')
    print(result['text'])
except Exception as e:
    print(e)

のようなOpenAI Whisperのコードを試したところ、音声ファイルを正しい位置に配置していても音声ファイルの読み込みでエラーが発生する問題に遭遇したため、その際の対応についての備忘録。


問題

Windows 10上でOpenAI Whisperのモデルのtranscribe()関数を実行すると

[WinError 2] 指定されたファイルが見つかりません。

といったエラーが発生して、モデルに音声ファイルをロードすることができない。


原因

システム上にFFmpegが導入されていない、またはパスが通っていない。


対応

システムにFFmpegを導入する(以下は2022.10.12時点の流れ)。

  1. FFmpeg公式サイトGet packages & executable filesWindows EXE FilesにあるWindows builds from gyan.devからリンク先に移動し、release buildslatest releaseにあるffmpeg-release-full.7zをクリックしてWindows版の最新のFFmpegバイナリ一式をダウンロードする。

  2. ダウンロードしたFFmpegバイナリ一式を、任意の場所に解凍する。

  3. 解凍後のフォルダ内にあるbinフォルダ(ffmpeg.exe等のあるフォルダ)にパスを通す。


参考ウェブサイトなど

以上です。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする