Snips – オフラインで高性能な音声認識ができるだとう!?

VUI(Voice User Interface)が急速に普及している昨今、Amazon EchoやGoogle Home、Line Clovaという単語を聞いたことが無い人の方が少ないだろう。

それらは使うときには常にインターネットにつながっている必要があるが、一般家庭ではインターネット環境が無いことはほぼ無いから気にする人はほとんどいないはず。

ただ、米国では気づかないうちにスマートスピーカーが他人に電話をかけ、夫婦の会話が他人に丸聞こえだった、なんていうトラブルが現実に起きていることもあり、スマートスピーカーを使うことに「本当に大丈夫なの?」と二の足を踏んでいる人も多いと思う。

そこで今回ご紹介するのは、オフライン環境でもそこそこ賢く「Al●xaよりも認識精度が良い」とさえいわれるソフトウェアライブラリ「Snips」だ。

Snipsには次のような特徴がある。

  • オフラインで音声認識できる。
  • 「抹茶を3杯飲みたいな~」など、会話の音声を認識してくれる。
  • 「Hey, Snips!」や、自作した言葉をウェイクワードに設定できる。
  • 日本語、英語、中国語、フランス語、ドイツ語、韓国語など、様々な言語に対応している。
  • Linux上で動作する。
    • Raspbianでも動くので、Raspberry Pi 3にインストールして使える。OSはRaspbian Stretch Lite推奨。
    • Androidでも動く。
  • Amazon Alexaでいう「スキル」のような拡張機能を自作できる。しかも簡単。

Snipsの使い方の公式ドキュメントは、Raspberry Pi 3(OSはRaspbian Stretch Lite)を対象にしたものが充実している。ただし英語。

今後少しずつ、自分が実践してみて引っかかったポイントなどを解説していこうと思う。

コメントする