機械が人間と同じように情報を取得し、考えることで、人間の行動を支援する。この未来を実現するカギの1つが、VUI(Voice User Interface)だ。
VUIとは音声インタフェースのことを指し、最近では「Amazon Eco」や「Google Home」などのスマートスピーカーが、代表的な事例だ。
Global Market Insightsの調査結果によると、スマートスピーカーの市場規模は、2017年の5,000億円から2024年には約3.4兆円まで成長すると予測されるほど、業界は盛り上がりを見せている。VUIは、わたしたちの体験にどのような変化をもたらすのだろうか。
9月4日に虎ノ門ヒルズで開催された、CX(顧客体験)について考えるイベント「CX DIVE」の「Next Interface×CX」セッションでは、音声認識・音声対話技術を開発するFairy Devices代表取締役の藤野真人氏が登壇。
成長市場である音声認識技術の歴史と未来予測から、VUIの発展がもたらすであろう新しい顧客体験を語った。
機械の中に妖精がいるようなVUIの開発を
Fairy Devicesは、「使う人の心を温かくする一助となる技術開発」という理念を掲げて、2007年4月に創業した。同社では、機械が音声認識システムを構築するためのソフトウェアスタック「mimi®」や、mimiに最適化されたハードウェア製品「Fairy I/O™」シリーズを開発。2017年には、Fairy I/O最初の製品であるスマートスピーカー「Tumbler」を発表した。
スマートスピーカーを筆頭に注目されるVUIだが、藤野氏によると、1970~1980年代から技術的な試みは行われてきた。カーナビゲーションなどですでに実用化されていたが、音声認識の精度が悪く、利用者の評判は良くなかったという。
しかし、ディープラーニングの研究が進んだことで、2012年頃には周囲の雑音と認識したい音を区別できるようになるなど、認識の精度が向上。ここ数年でVUIが注目されるようになったのは、このように機械にとっての“耳”が進化したからだと藤野氏は考える。
藤野「スマートフォンの普及によって、モバイルファーストの時代を迎えました。それが、VUIの発展によって『ボイスファースト』の時代を迎えると私は考えています」
居酒屋やホテルなど、さまざまな業界へ導入が進むVUI
VUIが、これまでのGUI(Graphical User Interface)と比較して優れている点は「脳に与える負荷が小さいこと」と藤野氏は指摘する。キーボードやマウス、スクリーンへのタッチと比較して、声はもっとも自然で直感的な機械とのコミュニケーションだからという。
また、VUIにはGUIのような一覧性がないのも特徴だ。たとえば、コールセンターの自動音声応答で複数の選択肢をすべて聞いてから選択することに対して「無駄な時間がかかる」と思ったことがある人もいるだろう。その点、GUIは複数の選択肢を一度に表示できる利点がある。つまり、VUIはGUIに取って代わるものではなく、相互補完することで、その強みを活かすことができる。
ここで藤野氏は居酒屋の注文時における顧客体験が変化する可能性を紹介した。
藤野「注文用のタブレット端末を導入する居酒屋は増えました。便利な一方で、客単価が下がるというデータが出たようなんです。何を注文するか吟味できる上、何度か確認ステップが必要となるので、注文までのハードルが高くなる。
ここで、VUIを活用すると、メニューを一覧で見ることはできませんが、店員さんに頼むように声だけで注文が完結できる。実際、渋谷にある居酒屋では、注文時にAmazonのスマートスピーカー『Amazon Echo』を活用した実証実験が行われたそうです」
VUIのメリットは、コミュニケーションが楽になることだけではない。得られた音声データをクラウドに蓄積していくことで、ユーザーが求めるものを把握することができ、顧客体験をより豊かにするために用いることも可能になる。藤野氏はホテルでの利用例を出しながら、VUIの可能性にも言及した。
藤野「たとえば、エアコンの設定温度や照明の設定の好みを、部屋に設置したスマートスピーカーが記憶してくれれば、ホテルへ宿泊する際に自動で同様の設定をしてくれることも可能になるでしょう」
実際、中国のAlibabaグループは、こうした動きに乗り出している。Alibabaは、2017年8月にザ・リッツ・カールトンやシェラトンなどを展開するMarriott Internationalと合弁会社を設立。Alibabaグループのスマートスピーカー「Tmall Genie」を、中国内のホテルに10万台設置することを発表している。ホテルにおける顧客体験にVUIが大きく貢献する日はそう遠くはなさそうだ。
より人間に優しいVUIの体験を
これまで紹介してきたように、スマートスピーカーを中心に、VUIは徐々に私たちの生活に浸透し始めている。2020年までに全検索の50%が音声になるという調査結果も出るなど、この傾向は衰えることなく、VUIは第一次ブームを迎えたといわれている。
しかし、現状スマートスピーカーで可能な体験はそこまで多くない。「いつまで第一次ブームが続くのか」という疑問の声も少なからずある、と藤野氏は指摘する。
藤野「Experian Insightsの調査によると、Amazon Echoの活用の仕方に関するランキングでは、第1位が目覚まし時計、第2位が音楽再生となっていました。つまり、スマートスピーカーは現状、さまざまな機能があるにも関わらず、少し値段の高い目覚まし時計と認識されてしまっているのです。このままでは第一次ブームで終わってしまうでしょう」
第一次ブームを超えるためには、「一問一答の壁」を克服する必要があると藤野氏は言葉を続ける。一問一答モデルで達成可能な会話は限られたもので、人間と比較するとまだまだ遠い。この一問一答の壁を超えられる人工知能が開発されれば、VUIは更なる成長を描いていけると藤野氏は指摘する。
その先の未来で同氏が構想するのは、より人間に優しいVUIの体験だ。
藤野「たとえば、眠そうな声で『会議に間に合うかな』と話した場合、現在時刻や声の様子から判断して『10分後の電車でギリギリ!』と機械が答えてくれると、VUIはより身近な存在になると私は考えています。つまり、非言語の情報を機械が理解できるようになる。そのとき、私たちにとってVUIの体験はもう一歩先へ進むのではないでしょうか」
まだまだ技術として発展途上のVUI。GUIとの併存関係や、第1次ブームで終了してしまう危惧など乗り越えなければいけない壁はいくつも存在する。ただ、非言語情報も理解し会話できる状態にたどり着けば、VUIを通した顧客体験はより高度で、身近なものへと変化していくのではないだろうか。