音声認識に関わる最新動向、ざっと読み(2016年1月)

音声認識に関わる最新動向、ざっと読み(2016年1月)

「音声認識関連のホットなニュースをピックアップ。ざっと読むことで音声認識に関わる最新動向をつかめます」


人工知能(AI)が囲碁のプロに初勝利。決め手はディープラーニング技術


img01

チェスや将棋などでは既にAIが人間に勝利したという過去があるが、囲碁はその複雑さからゲームの分野で最難関とされ、囲碁のプロ棋士に勝つAIの登場はまだ先になるとみられていた。そんな中、米グーグル傘下のAI開発ベンチャーが開発した囲碁のコンピューターソフト「アルファ碁」が、ソフトとして世界で初めてプロ棋士を相手に勝利を収めたとのこと(2016年1月27日発表)。

予想よりずっと早かった今回の勝利の決め手となったのは、ディープラーニングの技術だ。ディープラーニング(深層学習)とは、多層構造のニューラルネットワーク(Deep Neural Network:DNN)の機械学習のこと。人間の脳の神経回路をまねして情報を処理する手法で、大量のデータに潜む特徴を自力で見つけ出して学習する。

ディープラーニングは、ロボットの制御や医療用の画像診断など、ここ数年で急速にさまざまな分野への応用研究が進み、例えば危険を未然に察知する自動運転、不審者を見破る警備カメラ、相手の気持ちをくみ取る接客ロボットなどの実現が期待されている。音声認識では、グーグルの音声検索、アップルの「Siri」、アドバンストメディアの「VoXT(ボクスト)」などで既に採用されており、認識精度の向上を実現している。

【参考】人工知能、囲碁プロ負かす グーグル開発のソフト(2016.1.28)

【参考】棋士に勝利の新技術「ディープラーニング」の威力とは(2016.1.28)


「DNN超え」を目指すべく脳型チップの開発が加速。今後は次世代AI技術が続々登場予定か


現在脚光を浴びているDNNだが、機械学習時に大量のデータを必要とすること、予測機能の弱さなどという、今後の課題も見えてきている。そこで期待されているのがニューラルネットワークの専用ハードウエア化、つまり脳型チップの開発だ。現在多くの研究機関やメーカーがDNNの限界を超える「Beyond DNN」を目指して、脳型チップの開発を加速させ始めているとのことである。

そして予測機能の弱さなどという課題については、既存のDNNをもとにした小手先の改良ではなく、根本的な理論の見直しがなされているよう。脳科学の知見に基づいた大胆な技術提案も相次いでいるとのことで、DNNを超える次世代AI技術が今後登場する期待が高まっている。

【参考】日経エレクトロニクス2016年2月号、p.65-72「脳型チップで“DNN超え”へ、次世代AI技術が続々登場」


グーグル、AI研究者による「ディープラーニング」無料教育コースをスタート。今後さらに世界でグーグルの存在感が大きくなりそう


米グーグルがディープラーニングをテーマにした3カ月間の無料教育コースをスタートした。1週間6時間で3カ月間、大規模公開オンライン講座「MOOC(ムーク)」のユダシティーを通じて提供、グーグルのAI研究者からディープラーニングを無料で学べるという。

2015年11月、グーグルは独自の機械学習システムである「TensorFlow(テンソルフロー)」をオープンソース・ソフトウエアとして無償公開した。これはグーグルの音声認識や画像検索などの開発に使用された基盤ソフトウエアで、そのグーグルの「秘密のソース」が無償公開されるということで、非常に大きなニュースとなった。

そして今回、グーグルのAI研究者による「ディープラーニング」無料教育コースがスタート。これはディープラーニングの知識や考え方を広く行き渡らせるのが目的ということだが、この講座によりディープラーニングの知識や考え方が普及すれば、より多くの場面でグーグルの技術が使われるようになるとともに、多くの優秀な研究者や技術者によってソフトはどんどん改良されていくことだろう。

モバイルにおいてもグーグルはAndroid OSをオープンソースとして無償提供し、その市場で約8割近くのシェアを獲得、成功した。Android OS自体からは収益を得られなくても、それが搭載された機器が増えて多く使われることで得られるものは大きい。Android OSをブラッシュアップできるほか、利用されることで大量のデータを収集できるし、ユーザーの使用に連動したところ(例えば検索に連動した広告など)で莫大な収益を上げている。

このことからも同様にAI分野において今後あらゆるアプリやサービスにグーグルのAI技術が搭載されて使われていくだろうことを考えると、世界でグーグルの存在感はさらに大きくなっていきそうだ。

【参考】グーグルのAI研究者による「ディープラーニング」無料教育コースがスタート(2016.1.27)


乳児の感情を声で認識するマイクが誕生。そのうち愛猫や愛犬の感情も認識できるようになる、かも?


株式会社Cerevoホームページ、スクリーンキャプチャより
株式会社Cerevoホームページ、スクリーンキャプチャより

株式会社Cerevoは、音声から感情を認識して伝えるクラウド型スマートマイク「Listnr(リスナー)」を 1 月 22 日に発売した。価格は16,900円(税別)。

Listnrは「キモチを色に」をコンセプトにした小型IoTデバイスで、乳児の声から感情を判別しスマートフォンに通知するという基本機能と、アプリ開発のための開発者モードを備える。

乳児の声を認識する音声認識システムは、パナソニック株式会社からの提供技術をもとに開発した「xauris(ゾウリス)」を搭載。乳児の声から「泣く」「笑う」「叫ぶ」「喃語(乳児が発する言葉にならない声)」といった 4 種類の感情を認識する。

認識結果は、Listnr本体のLEDとスマートフォンのアプリにフィードバックされる。音に込められた感情を色で表現する点が特徴だ。なお、言語を覚える前の乳児の感情は世界共通であり、日本でも海外でも変わらないとのこと。どこまで正確かは分からないが、Listnrによって、言葉は発するけど感情が分からなくて乳児の対応に困ったり悩んだりすることが減るかもしれない。また、乳児とのコミュニケーションにも役立ちそうだ。

これの応用を考えると、ペットの感情が認識できるマイクの開発も可能そう。個人的な予想だが、もしかしたらそのうち愛猫や愛犬の機嫌も分かるようになる、かもしれない。

【参考】「音」を見える化するスマートマイク「Listnr」発売 (2016.01.22)