クラウド技術の進化が引き起こすその先の世界を、機械学習、VR / AR、IoT などの領域で活躍されているスタートアップの方々と一緒に議論するイベント「
INEVITABLE ja night」。2018 年 5 月 23 日に開催された第 4 回目は「
VUI がもたらす UX(ユーザー体験)の不可避な流れ」がテーマでした。この記事では Shiftall CEO の岩佐琢磨氏と、Still Day One 代表の小島英揮氏の対談セッションのサマリー(前編)をお伝えします。
岩佐琢磨氏 株式会社 Shiftall 代表取締役 CEO(写真右)
小島英揮氏 Still Day One 合同会社 代表社員 パラレルマーケター・エバンジェリスト(写真左)
小島 : 本日は、家電などデジタル機器と VUI(Voice User Interface)との融合による UX(User Experience)の不可避な流れをテーマに話を進めます。私は小島と申します。某クラウドベンダーに 7 年ほどおりました。今はパラレルマーケターとして複数の会社のマーケティングのお手伝いをさせていただいています。
岩佐 : 岩佐と申します。元パナソニック、当時は松下電器産業でしたが、そこに 5 年ほどいました。2008 年にCerevoという IoT に特化した会社を設立して、小ロット量産&グローバル販売をひたすらやってきました。小ロットというのは 500 台から 1 万台程度までの範囲です。2018 年 3 月末までに 30 数製品を作り、70 カ国以上で販売しました。すべての製品がインターネットまたはスマートフォンとのコネクテッド(接続機能あり)です。家電業界よりも、IoT 業界、インターネットにつながったデバイスの業界が長い人間です。
100 台から数千台という「アジャイル量産」
小島 : 生産台数 1 万台は小ロットなんですね?
岩佐 : それについて面白い話があって、3,000 台を作る方法と 1 万台を作る方法は変わらないんです。それより生産台数が少ない 100 台から数千台くらいまでの生産台数で、エンドユーザーの皆さんに届く量産品を作るテクノロジーやノウハウは意外と世の中にありません。Cerevoでは、こうした大メーカーが手を出しにくい領域を主にやっていました。
ただしCerevoでも製品によっては数万台を製造販売しています。生産台数が 5、6 万台ぐらいを上回ると、また作り方が変わってきます。
小島 : 少ない台数で作れる会社がなくて、グレートニッチだったと。そこの需要がCerevoさんに行っていたという理解でいいですか?
岩佐 : たくさん仕事を頂いて、たくさんのユーザーに支持していただけました。そこがCerevoの財産だったと思っています。
そこで次のステップとして、Shiftall という新しい会社を立ち上げました。Cerevoの一部を切り出す形で 2 つに分けて、片方は別の会社に株主になってもらう。その株主が、なんと最初にいた会社のパナソニックでした。
小島 : 出戻り、いや凱旋ですね。
岩佐 : 元いたパナソニックのグループに戻る形で、新しい IoT 製品を小ロット生産する事業を、2018 年 4 月からやっています。
小島 : パナソニックも、小ロットでアジャイルにモノを作ることを欲する状態になってきたということですか?
岩佐 : そうですね。公式発表では「アジャイル量産」と表現しました。アジャイルに試作品を作るのは誰でもできる。でもアジャイルに量産品を作るノウハウは世の中に欠如しています。そのノウハウはパナソニックとしても必要だ、一緒にやりましょう、という流れです。
スマートスピーカー登場には布石があった
小島 : VUI は音声でいろいろなものをコントロールします。皆さんは、これをそんなに突拍子もないものとは思っていないのではないでしょうか? なぜかといえば、昔から見てきたはずだからです。
(1980 年代に作られた SF ドラマ『ナイトライダー』に登場する)K.I.T.T をご存知でしょうか。クルマの中の AI はなんでも声で言ってくれるし、場合によっては反論したり諭したりしてくれます。声を出して呼びかけると音声で反応が返ってくる AI の最終形のイメージは、実はかなり前に共有されているんですよね。
最近では、新型 AIBO があります。これは音声だけじゃなくて画像認識も入っていて、インタラクションとして「動き」があります。これが今のところ、家電の世界では技術的にかなり先端だと思って良いですよね。
岩佐: 少なくともホームロボットという観点では、アクチュエータやヒューマンインタラクションまで含めて、先端を行っています。個別の要素技術が先端かというと、そこは結構複雑な話になってきます。
小島: このコストで、実際に家庭で買える形になっているのが大きいということですか。
岩佐: びっくりするような値段ですけど。
小島: もうちょっと身近なものですと、カーナビがあります。私が初めて現実に VUI 的なものと感じたのは、たぶんカーナビです。音声でコントロールできるので喜び勇んでやったんですけど、マイクの取り付け位置のフィッティングが結構大変なんですよね。こちらの声をまったく認識してくれなくて、2 日で使わなくなりました。
こういった限定用途の世界がぐっと変わったのが、(Apple が iPhone に搭載した)Siri が出てきた頃かと思います。岩佐さんから聞いて面白いと思ったのが、Siri の発話が最近は大きく進化したというお話です。
子供も含めて誰もが使えるスマートスピーカー
岩佐 : iOS9 と iOS11 の端末を並べて、同じ言葉の英語の発音を聞いてみると、iOS11 では驚くほど良くなっているんです。気持ち悪いぐらい人間っぽくなっています。
小島 : 手元のデバイスで音声でやりとりすることが、一気にパーソナル&モバイルの領域で普及して、大量のデータが吸い上げられるようになりました。おかげで、AI 側の進化もすごく速くなりました。発話も良くなり、返す内容も良くなり、クラウド AI が、VUI の進化の 1 つの大きなエンジンだったことは間違いないですね。
それがもっと身近になって、ハードウェアとの連携が鮮明になったのがスマートスピーカーだと思います。2014 年秋に Amazon Echo が出て、2016 年には Google Home が出ました。また、Amazon Echo の Alexa の「スキル」のように、すべてを一社で作るのではなく周囲の人々や会社がこぞって「スキル」を作っています。エコシステムとしての VUI が拡大している点がそれまでと決定的に違っています。
岩佐 : もうひとつ変わった点が、使う場所です。パーソナル&モバイルからホームへと場所が変わったことがすごく大きいですね。スマートフォンの場合、お父さんが使っていたとしても、子供が音声入力する訳ではありません。それが、スマートスピーカーでは子供も含めて世の中にいる誰もが使えるようになりました。
小島 : オーディエンスが変わるということですか。対象者が変わってマーケットが変わると言ってもいいですか?
岩佐 : 全部が変わったんじゃないでしょうか。もちろん対象者も変わって「いい歳のおっちゃん」だけが使う訳ではない世界になったわけです。子供や主婦層も使うようになった。使う場所が変われば、当然ユースケースも変わります。
Apple は、クラウド AI によるパーソナル&モバイル化を一番最初にやりました。だけど、スマートスピーカーは Amazon が最初にやって。プレイヤーが変わり、使う場所も変わりました。パーソナル以外の領域になったところが大きいと言えます。
業務用端末などでは VUI が既存 UI を侵食していく
小島 : コンピューティングリソースをどう使うかということでいうと、私はバリバリのキーボード世代でブラインドタッチできる奴が偉いという価値観でした。でも、 VUI で少しこの価値観が変わりました。VUI は子供でも簡単に使えるし、お年寄りでも使えます。「ながら」がやりやすいところが今までになかった世界かなと思っています。
岩佐 : VUI が来たからキーボードがなくなるかといえば、もちろん違います。過去にもスマートフォンの静電容量式タッチパネルがきたらキーボードがなくなると言われましたが、まだ、そうはなっていません。
この図では、キーボード+モニタの領域はもっと大きいですね。そこにはスマートフォンのタッチパネルなり、IME(日本語入力)なりがあります。その大きかった領域を、ここ 3 年で VUI がじわじわと侵食していったわけです。ただ、どこかにこれ以上は侵食できない固い殻があって、たとえば、マインクラフトで一番下にある掘れない岩盤がありますが、これ以上は侵食できない領域があるはずです。でも、どこまで掘れば固い殻にたどり着くのかわからないというところでしょうか。
小島 : どちらかというと、侵食されてしまう領域は結構あるわけですね。
岩佐 : 毎年のように VUI が進化して、特に 2014 年にスマートスピーカーが出てからは急速に従来型のキーボード+モニタ型の UI を VUI が侵食していると感じています。
小島 : 汎用の PC や、業務用の端末の UI を VUI が侵食していく可能性もありますか?
岩佐 : 絶対そうなると思います。僕の専門は家電業界ですが、家電の分野でもそうなると思います。
小島 : ハードウェアのスイッチを、VUI が置き換えるようなことが起きるでしょうか?
岩佐 : 例えば、従来型 UI として、テレビの赤外線リモコンのスイッチは押して使いますよね。あるいは給湯温度を変更するパネルのスイッチやタッチ型のボタン。ああいうものが、どこまで VUI に浸食されていくんだろう、そこをみんな怯えながら見ていく状況だと思います。
小島 : 逆に言えば、キーボード+モニター、あるいはスイッチのような UI を持っていない領域の会社がマーケットを取りに行ける。プレイヤーががらっと変わる可能性がある時代になっているということでしょうか。
岩佐 : はい。でも、従来型の UI と VUI の二層だけで終わる訳がなくて、その外側にも何かがあるはずです。この外側の UI は何だろうと考えると、今度はボイスすら要らない、テレパシーのようなものが出てくるかもしれません。例えば「電気をつけて」と言わなくても照明をつけてくれるようなものです。
小島 : ジェスチャーはどうですか。ジェスチャーでドローンをコントロールするものがありますよね。
岩佐 : ジェスチャーすら要らないんです。昔からある技術でいうと、人感センサー付きの照明です。カチッとスイッチを押さなくてもいいし、「OK、グーグル、トイレの電気をつけて」と言わなくてもいい。その部分だけを切り取ってみれば VUI よりはるかに先を行っています。だって面倒くさいじゃないですか。スイッチを押すのも、「トイレの電気つけて」と言うのも。
小島 : だけど汎用性はないんじゃないですか。
岩佐 : そうです。ただ、他の領域でも、トイレの人感センサー付き照明のような、VUI よりもさらに進んだ UI がこれから出てくると思います。もちろん、VUI がちょうどよくフィットする領域もあると思います。
小島 : 余談ですが、小学生の間で最近流行っているのが、算数の宿題をスマートスピーカーにやらせるという。
小島 : 「1 たす 1 は」と聞くと「2」と返ってくる。速くて正確だと。
岩佐 : 電卓も要らない(笑)。
小島 : そう、外部記憶ならぬ外部 CPU みたいな。ああいうのって大人は意外と気がつかなくて、子供がすぐに見つけるんですよ。VUI ネイティブな世代ってどんどん用途開発をしている。お子さんのヒアリングをしてみるといいですよね。
後編に続きます。