「気になる音声認識技術市場の動向は。音声認識関連の最新話題をピックアップしてお届けする」
■アップルの買収は「Siri」の強化が目的か。マイクロソフトも遅ればせながら音声アシスタント機能「Cortana(コルタナ)」を発表
≫Apple、Siri強化に向け音声認識の英企業を昨年買収か(2014/4/7)
アップルが音声認識技術の英企業であるNovauris Technologies(ノバーリス・テクノロジーズ)を昨年買収していた、とのこと。Novaurisは、音声入力技術の分野で先駆的存在である英Dragon Systemsの子会社Dragon Systems R&D U.K.から発展した会社で、自動音声認識(ASR= Automatic Speech Recognition)技術を手掛けていたよう。
現在その自動音声認識技術はすでにiOSおよびiPhoneに組み込まれているようだが、今後登場する「Siri」のバージョンに生かされるかどうかは明らかではない。ただ、「Siri」の改良に向けて買収したのではないかとも見られており、今後の展開が注目されている。
今「Siri」と同様の音声アシスタント機能としては、グーグルがAndroid向けに「Google Now」を提供しているほか、2014年4月にマイクロソフトがモバイルプラットフォームのアップデート「Windows Phone 8.1」に「Cortana(コルタナ)」を搭載することを正式に発表した。
≫Microsoft、「Cortana」発表──Siri対抗のパーソナルアシスタント(2014/4/3)
マイクロソフトはアップルとグーグルに数年の遅れをとっての参入となるが、「Cortana」には「Siri」や「Google Now」には見られない特徴があるようだ。それはユーザーの情報を書き留めておくNotebookの存在で、徹底的なパーソナライズが可能である、ということである。イメージとしては「Siri」と「Google Now」のちょうど中間のような存在と捉えていればよいようだ(違いは次の記事が参考になる)。
【参考】マイクロソフトの「Cortana(コルタナ)」は、SiriやGoogle Nowとどこが違うのか
これでiPhoneには「Siri」、Androidには「Google Now」、そしてWindows Phoneには「Cortana」が登場したことになる。お互いにライバルとなるこれらの存在であるが、今回の買収で「Siri」の強化も考えられる中、それぞれの今後の進化が期待される。
■Google Chromeの音声認識で気になるニュースを2つピックアップ
≫音声認識機能を使って英語力アップ! ― Google による「Spell Up」(2014/5/14)
グーグルが新たなプログラム「Spell Up」を開始した。「Spell Up」は、Chromeの音声認識を活用し、利用者が楽しく簡単に英語学習ができるように作られた英語学習プログラム。内容は、聞いた言葉を正しくつづり言語タワーをできるだけ高く積み上げよう、という単語ゲームで、利用者の英語力を高めることを目指す、というものだ。
≫Spell Up(※Chromeブラウザでのみ動作)
なお、「Spell Up」 は現在PC版とAndroidのスマートフォン/タブレット版の Chromeブラウザで動作するよう。実際に試してみたが、なかなか面白かった。効果音も軽やかでかわいらしく、子どもの英語学習でも好まれそうだ。
ただ、個人的な感想として、聞こえた単語のつづりをしゃべっていくのだが、1つ1つの認識が遅く待たなければいけないことと、つづりが分かっていても私の場合はなかなか「I」「L」「S」の発音がうまく認識されずタワー崩壊、ちょっとイライラ……ということも。だが、自分の苦手な発音の傾向が分かり、参考になる。
今後は他にもいろいろな英語のゲームが追加されていくのだろうか? 展開が楽しみである。興味がある方は、ぜひ試してみては。
続いては、こちらのニュースを取り上げたい。
≫Google Chromeにパソコンを盗聴器に変える脆弱性、—米メディアが報道(2014/1/23)
これは2014年1月23日の、今から約4カ月前の記事である。グーグルのWebブラウザであるChromeにおいてパソコンを盗聴器に変えてしまう脆弱性が見つかったということが、米国現地時間2014年1月22日に複数の米メディアによって報じられた。
詳細は記事を見てほしいが、当時Chromeにはバグが存在し、不正なサイトでユーザーが音声認識を有効にすると、隠れたウインドウが開き、メインのウインドウが閉じられた後に、ユーザーの許可なく音声聴取を開始するといったことができた、ということである。また、たとえユーザーがウインドウの存在に気付いたとしても、音声認識が機能していること示す目印はどこにも表示されないため、盗聴されていることは分かりにくいという問題もあった。
以前Windows Vistaの音声認識でも脆弱性があり、リモートで不正操作される可能性があるということで一時期同様に話題となったが、基本的に使用している本人はよほどの知識がないとそのことに気付かない(気付けない)のではないだろうか。そこが怖いところだ。
今はインターネットに常時接続が当たり前の世の中となり、ネットを介して外とつながっていることが当たり前となった。これらの危険は外とつながるネットを使わなければ多くを回避できるかもしれないが、ネットを使用しないというのはもう現実的ではない。このニュースは音声認識に限らず、便利さの裏には危険が潜んでいるのだということを改めて感じるものではないだろうか。
利用者としては、そういう世の中に自分は居るのだと意識し、危険を回避するためにも、被害に遭ったときにすぐ対処するためにも、自分の考えを持つだけでなく、常に情報のアンテナを伸ばしておきたい、と実感した。意識としては、まずウイルス対策は大丈夫?といった初歩的なところから改めて見直すのもいいかもしれない。
なお、この脆弱性については、現在アップデートが公開され、対処されているので安心してほしい。
≫Google Chrome安定版のアップデート公開、複数の脆弱性に対処(2014/4/30)
Chromeバージョン「34.0.1847.132」で、危険度が中程度の脆弱性として「音声認識における解放後使用」が修正されている(なお2014年5月29日現在の最新バージョンは 「35.0.1916.114」である)。