I2C接続顔モジュールの形がほぼ定まってきたので,
なんとかしてRasPiと会話したい.
いろいろ調べた結果,音声認識にJulius,音声合成にopen Jtalkを
使用している例が多かったので,今回はこれらを導入したいと思います.
カメラ・マイクはLOGICOOL ウェブカム HD画質 120万画素 C270
スピーカーは外部電源の取れるものをイヤフォンジャックから出力しています.
・Julius
導入は参考サイトが多くあるので省略します.
ただ一点だけjuliusインストール時に./configureが実行できませんでした.
どうやらautomakeを使うらしい.
以下を実行すると無事makeできました.
$aclocal && libtoolize --force && automake --add-missing && autoreconf
ちょっと試してみます
$cd julius-kits/dictation-kit-v4.3.1-linux
$ALSADEV="plughw:0,0" ~/julius-4.4.2/julius/julius -C ~/julius-kits/dictation-kit-v4.4/main.jconf -C ~/julius-kits/dictation-kit-v4.4/am-gmm.jconf -nostrip
撮影環境が悪くて動画がブレブレです笑
精度がかなり高くて驚きました.
・Open Jtalk
こちらも導入は省略.
適当なテキストファイルを用意しました.
voice.txt
ハロー ラズベリーパイ オープンジェイトーク デモ
ついでにインストールした女性(mei)の声でwavファイルに変換します.
$open_jtalk -m /usr/share/hts-voice/mei/mei_normal.htsvoice -x /var/lib/mecab/dic/open-jtalk/naist-jdic -ow test.wav voice.txt
aplayコマンドで再生します.
$aplay -Dhw:1,0 test.wav
思ったより自然な声です.
個人的にはもっと落ち着いた声がいいななんて.
次回からこれらを用いて具体的なソフトの製作をしたいと思います.
参考にさせていただいたサイト
http://qiita.com/t_oginogin/items/f0ba9d2eb622c05558f4
http://www.pentacreation.com/blog/2016/12/161223.html
http://qiita.com/lutecia16v/items/8d220885082e40ace252
0 件のコメント:
コメントを投稿