工作好きな情報系の雑記

MacでJuliusを使って音声認識する

Raspberry Piでオフラインで音声認識させたいと思って調べたところ、Juliusというソフトを使うのが定番らしい。
これを使って「テレビ消して」「電気つけて」といった音声を認識させられるようだ。

ただ、今回僕が作ってる装置にも使えるかは少し怪しい。
というのも、僕の装置ではどういう音声を認識させれば良いか決まっていないからだ。
Juliusはあらかじめいくつかの音声のパターンを覚えさせておき、聞き取った音声がどのパターンに一番近いかを判断して認識を行うソフトだ。
数パターンの文章しか話さないことを想定してるならうまく動くと思う。
でも今回の場合、どういう文を認識させるか決まってないからきちんと認識できるか分からない。

一応事前にパターンを教えなくても(精度は下がるが)認識はできるようなので、まずはMacで認識精度を確かめてみることにした。

ダウンロード/インストール

巷では32bitでしか動かないからCFLAGを使って32bitでMakefile作って・・・なんてやってるみたいだけど、結局それでも動かない。

色々調べてた結果、GitHubリポジトリからダウンロードしてインストールするのが正解だったっぽい。
くっそー、手こずらせやがって。

さらにここからディクテーション用キットをダウンロード。
展開したディクテーションキットの中で以下のコマンドを叩くと音声認識が使えるようになる。

JavaScript(HTML5)/Objective-C(iOS)/Java(Android)/C#(WinRT,Windows8) 他、ウェブサービス、アプリ開発のチュートリアルメモ。
Terminal (macOS): Julius で音声認識をする | snippets.feb19.jp - snippets.feb19.jp

結果

ダメダメだった。
全くもって役に立たない。
やっぱ事前のデータがないんじゃ難しいよね・・・

音声認識を組み込むのは諦めるかぁ。
これでAPIでも使えるならまた話は変わるんだろうけど。

モバイルバージョンを終了