この記事は公開から2年以上経過しています。
Windows 10上で
import whisper
model = whisper.load_model('base')
try:
result = model.transcribe('input.wav')
print(result['text'])
except Exception as e:
print(e)
のようなOpenAI Whisperのコードを試したところ、音声ファイルを正しい位置に配置していても音声ファイルの読み込みでエラーが発生する問題に遭遇したため、その際の対応についての備忘録。
問題
Windows 10上でOpenAI Whisperのモデルのtranscribe()
関数を実行すると
[WinError 2] 指定されたファイルが見つかりません。
といったエラーが発生して、モデルに音声ファイルをロードすることができない。
原因
システム上にFFmpeg
が導入されていない、またはパスが通っていない。
対応
システムにFFmpegを導入する(以下は2022.10.12時点の流れ)。
-
FFmpeg公式サイトの
Get packages & executable files
のWindows EXE Files
にあるWindows builds from gyan.dev
からリンク先に移動し、release builds
のlatest release
にあるffmpeg-release-full.7z
をクリックしてWindows版の最新のFFmpegバイナリ一式をダウンロードする。 -
ダウンロードしたFFmpegバイナリ一式を、任意の場所に解凍する。
-
解凍後のフォルダ内にあるbinフォルダ(ffmpeg.exe等のあるフォルダ)にパスを通す。
参考ウェブサイトなど
- GitHub
openai/whisper
以上です。