【ピックアップ】
■Baiduが音声認識でGoogleを抜く、中国が人工知能で覇権を狙う(2015/7/23)
■『2015 レスポンス カーナビアンケート』の調査結果発表 スマートフォンナビの利用率急増、音声認識機能はクラウド化が普及に寄与(2015/7/28)
■世界で一体!占いをする“ビリケンさん”が梅田に登場(2015/8/16)
■Cortana 日本語版を Windows Insider 向けに提供開始(2015/8/28)
■Facebook、人工知能アシスタント「M」をテスト開始。機械と人間のハイブリッドでSiriやCortana対抗、電話や予約も代行(2015/8/27)
≫Baiduが音声認識でGoogleを抜く、中国が人工知能で覇権を狙う(2015/7/23)
Baidu(百度、バイドゥ)は中国最大の検索企業であるが、人工知能、音声認識、画像認識などの研究も進めている。人工知能ではグーグルがトップを走っているが、今回、音声認識ではBaiduがトップの座を奪った、とのこと。
というのは、200のケースで試験を行った結果、Baiduが開発している音声認識技術「Deep Speech」がアップル、Bing(マイクロソフト)、グーグル、フェイスブック(同社が買収したwit.ai)より高性能を示したよう。特に業界トップであったグーグルと比較して倍近い性能(誤認識率が半減)を示したとのことで、「Deep Speech」は業界で最も認識率の高いシステムとの評価を受けた。
この背景には、2014年5月にBaiduに入社したコンピューターサイエンティストのAndrew Ng氏の存在が大きいと思われる。Ng氏は、かつてグーグルで「Google Brain」のプロジェクトなどディープラーニングの責任者を務めていた人物で、Google Brainプロジェクトの猫を認識するニューラルネットは話題となった。Baiduの音声認識技術「Deep Speech」には彼の技術とノウハウが生かされているといえる。
Baiduは、音声認識だけでなく人工知能や画像認識などにおいても将来的にはグーグルに対抗する規模に達する可能性を秘めており、今Baiduの技術向上に大きな期待が寄せられている。
≫『2015 レスポンス カーナビアンケート』の調査結果発表 スマートフォンナビの利用率急増、音声認識機能はクラウド化が普及に寄与(2015/7/28)
株式会社イードが、カーナビゲーションをテーマとした意識調査を実施し、その調査結果を公開した。調査は、同社が運営するマイカー燃費管理サービス「e燃費」と自動車総合ニュースサイト「レスポンス」の全国のカーナビユーザーを対象に、2015年4月10日~5月11日までの期間で行ったもの。インターネットアンケートで実施し、4051の有効サンプルを集めた。
カーナビの形態別使用状況では、市販のシェアが下落し、ディーラーオプションとスマートフォン向けナビアプリ(スマホナビ)が伸張。スマホナビのシェアとしては「Googleマップナビ」と「Yahoo!カーナビ」が大きく占めているとのこと。
カーナビでの音声認識・入力の利用状況としては、「よく利用する」が11.3%、「ときどき利用する」が26.8%で、全体の約4割を占めた。ナビゲーション別で見ると、特に音声認識・入力が利用されているのはスマホナビで、音声認識の利用率は5割を超えたようだ。メーカーオプションでも4割を超えている。また、音声認識・音声入力を利用する理由としては、楽だから、早い、簡単、が挙げられる。
なお、個人的には、逆に「あまり利用しない」「まったく利用しない」理由を聞いてみたいところ。特にカーナビは音声認識が使えるのなら積極的に使いたい場面のようにも感じるが、「よく利用する」のは全体では約1割、多くてもスマホナビで約2割。音声認識の精度としてはまだまだ十分とはいえない状況か。
ただ、認識精度としては、最近ではヤフーも音声認識にディープラーニングを導入し、雑音やノイズがある場所での誤認識が大幅に改善したというニュースも。ヤフーのものだけでなく、これからカーナビの音声認識はどんどん利用しやすくなっていくはず。以前一度使ってみて使えないと感じた人も、今後もう一度使ってみると違う結果が得られるかもしれない。
≫世界で一体!占いをする“ビリケンさん”が梅田に登場(2015/8/16)
大阪・通天閣の福の神として知られるビリケンさんが、対話型の占いロボット「ビリケンロイド」となって梅田のグランフロント大阪北館にお目見えした。入場は無料で、期間は11月末までの予定。
このビリケンロイドは、画像音声認識技術を持つNTTと介護ロボットの技術を持つマッスルが共同開発したもので、声とカメラの映像で相手の性別や年齢を判断し、大阪弁で会話するという仕組み。なお、ビリケンさんは足の裏を触ると願いがかなうといわれているが、ビリケンロイドは足の裏を触られると反応して足が動くようだ。
会話は置いてある黒電話を使用して行う。そのパターンは何百通りかあるようだが、ビリケンロイドの怪しげな大阪弁の質問にいくつか答えると、ビリケンロイドが恋愛運や、その日の運勢などを占ってくれるらしい。当たるも八卦、当たらぬも八卦。興味のある方はこの機会にビリケンさんに占ってもらってみては?
マイクロソフト「Cortana」日本語版を Windows Insider 向けに提供開始、そしてフェイスブックも音声アシスタント分野に参入へ
≫Cortana 日本語版を Windows Insider 向けに提供開始(2015/8/28)
マイクロソフトの音声アシスタント機能「Cortana(コルタナ)」の日本語版が、ついにWindows 10 のプレビュー版Windows 10 Insider Preview(ビルド10532)にて使えるようになった。なお、Insider Preview版とは、PCに詳しいユーザーを対象とした開発中のソフトウェアを試せるプレビュー版のOSだ。
「Cortana」は、アップルの「Siri」やグーグルの「Google Now」と似たような機能を持つ音声アシスタント。Windows Phoneに搭載されている「Cortana」がWindows 10では標準搭載され、さらに日本語にも対応するということで、話題となっていた。なお、マイクロソフトは「Cortana」のiOS版とAndroid版のリリースも予定している。
プレビュー版で「Cortana」日本語版を試したユーザーからは続々とレビューがアップされているが、マイクロソフトの公式ブログにもあるように、日本語版の「Cortana」はまだ誕生したばかりで、できることは限られているよう。音声合成による声もまだ本来の声ではない。マイクロソフトはプレビュー版の利用者からフィードバックを集めることで、機能の改善や強化を進めていく予定としている。今後いろいろなことができるようになるだろう「Cortana」の成長が楽しみである。
そして、この音声アシスタントの分野でもう一つ、気になるニュースが。アップルの「Siri」、グーグルの「Google Now」、マイクロソフトの「Cortana」に続く、新たなプレーヤーの参入だ。
≫Facebook、人工知能アシスタント「M」をテスト開始。機械と人間のハイブリッドでSiriやCortana対抗、電話や予約も代行(2015/8/27)
フェイスブックが「M」と呼ばれる音声アシスタント機能をメッセンジャー上で提供することを目指し、テストを開始した模様。日本での提供開始時期は未定。
ユーザーのパートナーとなって日常的な質問に答え、提案し、アドバイスする、このような人工知能(AI)を基盤とした音声アシスタントの分野にフェイスブックも参入してきた。ただ、面白いのは、「M」は他の競合サービスと違い、人と機械のハイブリッドサービスであるという点だ。
というのも、「M」の競合となるアップルの「Siri」、グーグルの「Google Now」、マイクロソフトの「Cortana」は、質問の回答・対応を完全にAI(テクノロジー)に頼っている。しかし、「M」はAIだけでなく人間のスタッフが「中の人」を務めることで複雑なリクエストも理解することが特徴といえるよう。
例えば「今度の旅行先でオススメのレストランを教えて」と尋ねると、「M」ではAIがネット検索の結果を返すだけでなく、担当者がウェブサイトや電話で予約までしてくれるよう。「M」はこのような実世界タスクまでこなす、ということなのだ。質問の回答・対応を完全にAIに頼るだけでなく、「M」はAIの対応を人間が監督し、人力によるきめ細かさや対応能力も併せて提供するという点がポイントといえる。
この流れを考えると、「M」はアップルやグーグルやマイクロソフトのほか、アマゾンの家庭用音声アシスタント端末「Amazon Echo」(Alexa)もライバルとなりそうだ。ただ、「M」は人材も必要でかなりコストもかかりそうだが、それ以上にアマゾンと同様、フェイスブックも新しいビジネスを生み出す可能性を予想しているに違いない。
なお、「M」の運用にあたっては、フェイスブックに投稿された個人情報は当面使わず、メッセージのやりとりで利用者が提供した情報を基に好みなどを判断するということだが、もしフェイスブック全体のデータと「M」が連携するようなことになると、それはそれで恐ろしいと感じるのは私だけではないはずだ。