【ピックアップ】
■感情認識ロボット「Pepper」、一般向け初回販売分1000台が1分で完売(2015/6/20)
■日本初、音声からの気分解析技術により気分チェックができるウエブサイト・オープン ?スマートメディカル社独自の音声気分解析を活用?(2015/6/15)
■認識率高めた音声システム、ニュース字幕に利用開始(2015/5/28)
≫感情認識ロボット「Pepper」、一般向け初回販売分1000台が1分で完売(2015/6/20)
【参考】ロボット一家一台の未来はもうすぐそこかも?これからのロボットの在り方から音声認識技術の未来を考える(2014/10/31)
「Pepper(ペッパー)」が遂に一般向けに販売されたが、初回販売分1000台はわずか1分で完売したとのこと。次回の販売は7月以降になる。なお、今年2月には開発者向けに300台が販売されたが、その際も1分で完売したようだ。
Pepperは、ソフトバンクが2014年6月に発表した、感情認識機能を搭載したクラウドベースのコミュニケーションロボット。14年9月には法人向けに200台を先行発売。ソフトバンク直営の携帯電話の販売店や家電量販店などで接客するPepperは話題となった。
一般向けには、当初は15年2月中の発売が予定されていたが、想定以上に引き合いが強く延期となり、6月20日に販売開始となった。なお、それに合わせてPepperは感情認識だけでなく、自らの感情を持ったロボットに進化したとのことである。
6月20日より販売開始されたPepperの一般向け初回販売分1000台は1分で完売したとのことだが、購入者はどのような方たちなのだろう。
当初に発表されていた19万8000円(税別)という価格はPepperの本体のみの価格で、それプラス、基本的に3年契約で月額1万4800円(税別)の「基本プラン」に加入する必要があり、同じく3年契約で月額9800円(税別)の故障時の修理用保険サービスと合わせると、3年間では100万円強の費用が必要となる。
毎月の支出としては税込みで26568円。これを高いと思うか安いと思うかは考え方次第だが、一般家庭ではなかなか悩ましい金額だ。
逆にソフトバンクからすると、仮にこの6月の販売分1000台がフルサービスの利用で購入されたとすると、わずか1分で約11億円を売り上げたことになる。とはいえ、ソフトバンクとしては契約の3年経過後も継続してPepperを利用してもらえるかどうかが重要だ。
この料金プランを見ると、携帯電話のビジネスモデルを思い出す。今後はPepperのほかにもクラウドの音声認識技術を活用したロボットが多く出てくるだろうが、ソフトバンクにとっては他社製ロボットに目移りせずPepperをずっと利用してもらえるかどうかがポイントとなるだろう。
そういう意味でも、一般販売に合わせてPepperに感情認識だけでなく自らの感情を持たせたことは大きい。一般家庭においてPepperにかかる毎月税込み26568円という支出は小さくないが、感情を持つPepperに、人はより愛着を持つようになるだろう。
そうすれば、Pepperを容易には手放せなくなる。Pepperを見ていると、携帯市場はもう成熟化して今後の大幅な契約増は見込めないが、ソフトバンクがそれに代わる収益源の一つとしてスマートロボット事業を見ており、力を入れていることが感じられる。
今回の販売分完売のようなこの勢いがどこまで続くかは分からないが、15年7月1日からはPepperの「アルバイト派遣」や、秋には法人向けモデルの販売も予定されている。
法人向けモデルは業種に合わせた専用アプリを提供するようだが、企業にとってPepperを導入するメリットは多くあるように感じる。話題になり集客や販売促進にも効果がありそうだし、取集したデータをビッグデータとして分析できるならばセールスパフォーマンスの改善にもつながりそうだ。
これから先どのようなところでPepperを見掛けることになるのか楽しみであるが、Pepperはまだまだ成長途中。今後は業種に合わせて、あるいは一般向けに、サイズも形状も全く違うデザインのPepperが登場することもあるかもしれない。あるいはPepperをOSとして、さまざまなモノに提供していくことも考えられないだろうか。後に低価格化も実現することだろう。
今から例えば3年後にPepperがどんな形でどれだけ普及しているかは未知数だが、Pepperの一般販売開始によってコミュニケーションロボットが一家に一台という時代の到来にまた一歩近づいたのは確かだ。
2015年6月12日、スマートメディカル株式会社は、音声から簡単に気分をチェックできるウェブサイト「声ダケノ感情認識テスト」を開設した。自分の気分が今どんな状態か、「声ダケノ感情認識テスト」では声から感情を解析し、判定された気分の状態の結果を表示できる。
「声ダケノ感情認識テスト」で活用しているのは、独自の音声気分解析技術「Empath(R)(エンパス)」。音声の高低や速度、律動、周波数などの物理的な特徴量から気分の状態を独自のアルゴリズムで判定するプログラムで、数万人の音声データベースを基に声から喜怒哀楽や気分の浮き沈みを解析する。
Empathは、実際のメンタルヘルス領域でも活用されており、事例としてはNTTドコモ復興新生支援室が実施する被災地支援事業において、被災者支援員の気分チェックに利用されたりしているよう。
また、震災後の仙台市の仮設住宅でのプロジェクトでも採用され、利用者の気分状態を検知することでストレス対処やスタッフの離職率低減に貢献しているようだ。
音声気分解析技術を活用したサービスを開発したい人向けの情報としては、現在Windows用、iOS用、Android用のEmpath SDK(開発キット)を提供中。これらのプラットフォームにおいて、あらゆるサービスの中にEmpathを活用した音声気分解析を簡単に取り入れることが可能となっている(その他のプラットフォームは問い合わせ)。
ウェブサイト「声ダケノ感情認識テスト」では実際に音声気分解析を体験することができるので、興味のある人は試してみては。ちなみに、推奨ブラウザでもパソコン、端末、アプリケーションの設定等によっては利用できない場合があるのであしからず。
NHKでは既に多くの番組で音声認識システムを利用した字幕を表示しているが、アナウンサー以外の出演者の発話に対して正しく認識する確率は、既存の技術では非常に低い。そこでNHK放送技術研究所(以下、NHK技研)は、ディープラーニング(深層学習)技術を用いて音声認識の認識率を向上させたシステムを開発した。この技術は2015年3月にNHK広島放送局でニュースの字幕表示向け技術として採用済みで、今後、全国の局でも順次採用していく方針。
ただ、今回の技術でも認識誤りは現時点でゼロではなく、一般の番組では出演者の声を直接認識させて字幕にする水準ではないとしている。字幕は特に正確性が要求されるからというのもあるだろうが、やはり話し言葉の音声認識はまだ難しいのが現状といえる。
アナウンサーのように音声認識されやすい話し方や、アナウンサーでなくても音声認識を常に意識した話し方をすれば認識率はもっと上がるだろうが、そうすると番組によっては面白味もテンポ感も何もないものになってしまうのがつらいところ。NHK技研は今後、現時点で約1000時間分のデータベースをさらに増やし、認識精度を高めていく方針とのことだ。
ちなみに、認識率の高いシステムをつくるには数千時間、語彙も何十万以上が必要だと聞く。グーグルの音声データベースは現在5000時間以上となるようだ。