「一般向けコミュニケーションロボット2015年に続々発売予定。音声認識は今後どのように発展していくのか? これからのロボットの在り方から音声認識の未来を考えてみたい」
「Pepper(ペッパー)」、「Robi jr.(ロビジュニア)」、「Chapit(チャピット)」、「BOCCO(ボッコ)」……、これらは何の名前かご存じだろうか? Pepperは有名なので知っている方も多そうだが、2015年に一般向けに発売予定となっているコミュニケーションロボットの名前である。
Pepperは、ソフトバンクモバイルが今年2014年6月に発表したクラウドベースのコミュニケーションロボットだ。うたい文句は「人に寄り添うロボット」。最新の音声認識技術、滑らかな動きを実現する関節技術、感情認識機能などを搭載しており、人間の感情を理解してコミュニケーションするよう設計されている。一般向けには2015年2月に19万8000円(税別)という価格で発売予定だ。
http://www.softbank.jp/robot/special/pepper/
Robi jr.(以下ジュニア)は、タカラトミーが今年10月に発表したコミュニケーションロボットで、同社のオムニボットシリーズとデアゴスティーニ・ジャパンがコラボレーションしたもの。本家となるデアゴスティーニの組み立てロボット「Robi(ロビ)」に対し、ジュニアは完成品として販売される。二足歩行などの機能は省き、音声認識や人感センサーを活用するコミュニケーション機能に特化されたジュニアは、2015年1月24日に1万5000円(税別)という価格で発売予定だ。
http://www.takaratomy.co.jp/products/omnibot/robi/
Chapitは、音声認識エンジンで知られる半導体メーカーのレイトロンが2007年に発表したコミュニケーションロボット。「生活空間において家族の一員となり便利で楽しい日常を」という思いからつくられ、音声認識機能、音声合成機能、家電制御機能などを備えている。2015年には高齢者介護施設などに向けて、高齢者の自立支援に向けたぬいぐるみ型のChapitを10万円前後で発売予定とのこと。なお、Chapitについてはまだ一般向けの発売ではないが、ゆくゆくは5万円ほどで販売することも考えられているようだ。
http://www.raytron.co.jp/chapit/index.html
【参考】音声認識技術のレイトロン、自立支援向けコミュニケーションロボットを2015年に発売
BOCCOは、ロボット開発などを手がけるベンチャー企業のユカイ工学が開発したコミュニケーションロボット。インターネットに接続するためのWi-Fiと、センサーと通信するための近接無線の機能を搭載し、ドアの開閉センサーや人感センサーで感知した情報を家族のスマートフォンに通知したり、音声メッセージをやりとりしたりできる。発売予定は2015年3月で、センサーとロボット本体のセットで2万円前後の予定だ。
http://www.ux-xu.com/product/bocco
今後発売予定のロボットはまだ他にもあるが、2015年にはこのようなコミュニケーションロボットが一般市場に続々と登場予定。価格も幅はあるが一般家庭でも手に入れられない値段ではなく、何かしらのコミュニケーションロボットが一家に一台という時代もそう遠くないかもしれない。
中でも個人的に注目しているのはPepperだ。機能的に昔なら100万円以上にもなりそうだが、20万円弱という価格設定にロボット普及の可能性を感じる。一般家庭の多くが購入するとは思わないが、店舗やサービス施設などではこの価格なら導入してみようと思うところも出てくるはず。実際、既にソフトバンクショップのクルーとして活躍しているPepperだが、今年12月からは「ネスカフェ」のコーヒーマシン売り場で接客するようである。家庭内ではなくとも、ロボットに身近に触れ合える機会が今後はどんどん増えてくることだろう。ロボットのいる生活が当たり前になるのも近そうだ。
そしてもう一つ、Pepperで可能性を感じるのは、PepperがクラウドベースのAI(人工知能)を持つということだ。過去にも例えばソニーの家庭用ロボット犬「AIBO(アイボ)」など一般向けのコミュニケーションロボットが販売されているが、過去のロボットたちからPepperへの最大の変化は、常時接続の通信環境とやはりクラウドを利用していることだろう。
Pepperだけでなく、これからのロボットはネットやクラウドによって「つながる」ロボットへと進化する。人とつながるだけでなく、複数のロボットたちが例えばSNSでつながって協調することも考えられる。これからは、クラウドによってつながり、人だけでなく人も超えた膨大な情報がマシンによって集められ、ビッグデータとして蓄積されていくだろう。その先にはスマートマシンの実現が見える。
スマートマシンとは、自律的に行動し、学習を重ね、これまで人間にしかできないと思っていたことを実行するマシンである。そして、何かの記事で、スマートマシンは次の4つの力が組み合わさることで実現されると読んだ。高性能なハードウェア、ハイパフォーマンスなネットワーク、ディープラーニングや神経言語プログラミングといった新しいアルゴリズム、そして膨大な数の情報、である。
今、AIの進化に欠かせない膨大な数の情報、すなわちビッグデータを集める仕組みも構築され、それを基にした学習によりディープラーニングといったアルゴリズムも大きく進化しつつある。この進化はこれからの音声認識技術の発展を左右する重要なものとなる。AIの進化によってスマートマシンに近づくにつれ、音声認識技術も例えば人間並みの柔軟かつ高速なパターン認識ができるようになるのは、もはや時間の問題ではないだろうか。
ある説では2045年にはコンピュータの性能が人間の脳を超えると予測されている。その後は人間の滅亡か発展か……というのはSF映画さながらの未来を連想させるような話で現実味がないかもしれないが、約30年後!にどうなっているのか、そのときを楽しみに待つとしよう(そのときに何歳かは置いといて)。人間とマシンが自然に会話でき、本当に心を通わせることができる日は、きっと2045年から始まる。
【参考】日経ビジネス 2014.9.15「世界を変えるスマロボ 先行く米中 出遅れる日本」