音声認識関連のホットなニュースetc.(2)

音声認識関連のホットなニュースetc.(2)

「日々進化している音声認識技術。ホットなニュースをはじめ、気になる話題をピックアップして紹介する」

(1)はこちら≫音声認識関連のホットなニュースetc. (Published:2012/11/29)

音声認識技術について、日々さまざまなニュースが出ている。ホットなニュースをはじめ、個人的に興味のある話題をいくつかピックアップしてご紹介したいと思う。

まずはこちらの話題から。

「Google Chrome 25」の安定版リリース 音声入力をサポート

米グーグルが2013年2月21日(現地時間)、Webブラウザ安定版の最新バージョンとなる「Google Chrome 25」(バージョン25.0.1364.97)をWindows、Mac、Linux向けに公開した。

そして、新機能としてWebプラットフォーム向けにJavaScriptの「Web Speech API」をサポートし、デスクトップ上で音声をテキストに変換する機能を実装できるようになった、とのことだ。

以前「Chromeブラウザで音声認識精度を検証する」という記事でフォームに音声入力機能を追加する「Speech Input API」については少し紹介したが、最新バージョンの「Chrome 25」ではWebアプリに音声認識機能を組み込める「Web Speech API」にも対応し、より広範なWebの音声入出力を扱うことができるようになった。

この「Web Speech API」を使用すれば、音声でWebアプリを操作するといったことが可能になる。例えば長文を音声入力してその文章をGmailに転送したり、ブラウザゲームのキャラクターを音声コマンドにより操作したり、さまざまなWebアプリの操作が音声でできるようになるのだ。

しかも、このAPIはJavaScirptベースであり、日本語を含む多言語対応である。そして、Windows、Macだけでなく、この分野で利用できるソフトが少ないLinux上で音声認識を利用できるという点もポイントだろう。個人的には、ワクワクするニュースだった。

なお、グーグルがデモサイトを公開しており、日本語での音声入力も試すことができる。

デモサイト: https://www.google.com/intl/en/chrome/demos/speech.html

続いての話題はこちら。

ホンダ、Appleの音声アシスタント「Siri」を一部車種に採用
トヨタの友山CIOが「走るクラウド情報端末」を披露、人・家・車・社会とつながるを強調

スマートフォンはもう当たり前になったが、音声認識もどんどん日常に取り入れられて当たり前になってくるのだろうなと個人的に実感した話題。スマートフォン等の登場とともに世の中は急速に発展しているが、一体どこまで進化するのか。不安でもあり、楽しみでもある。

次は、スマートフォンつながりでこちらの話題を取り上げたい。

スマホの盗難・紛失対策、“まさかの落とし穴”に注意

この記事でご紹介したいのは、特に「Siriの“裏切り”、指の軌跡から情報流出」に関連した内容の部分。初期設定のままではSiriに「私は誰?」と問い掛けると、持ち主の個人情報を答えてしまうのだ。

ちなみに、昔Windows Vistaが発売されたときには、その音声認識機能にセキュリティ上の問題があると指摘されていた。音声認識機能を使ってリモートから不正操作がされる可能性があったということである。

【参考】Windows Vistaの音声認識機能はセキュリティ上の脅威?(2007/03/02)

この問題について現在は改善されているようだし、Siriについてはロック中のSiriの動作をオフにすることで対処できるが、利用する際には設定や仕様をきちんと確認するなど、音声認識が悪用されないよう用心したいところである。音声認識は便利で簡単に利用できる反面、便利さの裏には危険性も潜んでいるということを忘れずにいたいものだ。