Cortana使えてますか? 音声認識関連のホットなニュースetc. (12)

Cortana使えてますか? 音声認識関連のホットなニュースetc. (12)

音声認識関連のホットなニュースから気になったものをピックアップしてお届けします

2016年7月29日にWindows 10への無償アップグレードサービスが終了した。Win10にアップグレードした場合、マイクロソフトが提供する音声アシスタントのCortana(コルタナ)を使用できる。

cortana01

タスクバーの検索ボックス(あるいはコルタナアイコン)をクリックすると、Cortanaが起動する。使い始めは必要に応じて設定の必要あり。指示に従って進みCortanaがオンになれば、Cortanaを使えるようになる。

ただ、Cortanaをオンにしてもうまく機能しない場合は、改めて音声認識の設定を見直してみよう。例えば「この言語の音声認識ができません」と表示される場合は、音声認識の言語がきちんと設定されていない可能性がある。詳細は上記記事を参照のこと。

なお、Cortanaはマイクボタンをクリックしたあと質問を声に出して話すと内容に応じた対応をしてくれるが、いちいちマイクボタンをクリックしなくてもCortanaに反応してほしい場合は、Cortana画面の左側に表示されるノートブック(上から3番目)のアイコンの設定から「コルタナさん」をオンにすることで可能。その際、自分の声を登録し、自分の声に対してCortanaが反応するように設定できる。

cortana02

7月25日、フュートレックが「VoiShredder(ボイシュレッダー)」サービスを開始した。概要を一言でいうと、秘匿性を担保する音声書き起こしサービスだ。

VoiShredder

このサービスがユニークなのは、「シュレッダー」という名のとおり、依頼された音声を約1秒という長さに分割して各作業者に作業させるというところ。その際、各作業には複数の会議や顧客の音声の断片ファイルがランダムに渡されるだけでなく、顧客や依頼音声の情報も一切提供されないため、音声の断片ファイルから前後のつながりや依頼音声の全体像を把握することが困難となっている。さらに、音声の断片ファイルの書き起こしが完了すると、テキストはユーザーのパソコンのVoiShredderアプリで統合されるため、フュートレックでは書き起こされた文字を閲覧することも音声を聞くこともできない仕組みとなっている、とのこと。

ただ、この方法であれば確かに機密は保持できそうだし短納期も魅力的ではあるが、秘匿性よりも書き起こし精度を重視する場合は、他の書き起こしサービスを検討したほうが無難だろう。このサービスである程度の精度を期待するなら、依頼する音声の音質は十分に考慮したほうがいい。逆に秘匿性の担保および短納期を精度よりも重視する場合には、便利に使える安心できるサービスかもしれない。状況によって使い分けたいサービスだ。

音声認識機能を悪用した例については以前からもいろいろと話題になっているが、今回、「特別な音」を動画に潜ませることで不特定多数のスマートフォンをハッキングできることが分かった。その「特別な音」とは、人間にとっては普通の言葉として認識しにくいノイズのようなものであるが、スマートフォンでは音声コマンドとして認識されてしまうようだ。

iOSのSiriやAndroidのGoogle Nowなどには音声コマンド機能があり、声だけで操作ができて便利だ。ただその反面、簡単さから気付かないところでコントロールされる可能性もあるなど、弱点もある。今回は音声コマンド機能の性質を悪用してスマートフォンを外部から乗っ取る手法が考案されており、音声コマンド機能の持つリスクが改めて明らかとなった形だ。

こういうことが起こり得るのはスマホに限ったことではなく、ユーザーとしては音声認識機能の持つメリットとデメリットを十分に理解し、便利に使っていきたいところ。音声コマンド機能を使って、Siriでは「Hey Siri」、Google Nowでは「OK Google」、また先に取り上げたCortanaでは「コルタナさん」と呼び掛けることで自分の声で起動できるようにもできるが、自分の声を登録しているといっても絶対に安心とは言い切れない。

例えば次はAndroidで自分の声を登録して「OK Google」を設定するときに表示される注意画面だが、この注意からも分かるように、自分の声(信頼できる音声)を登録したとしても、声の似ている人や録音された音によって解除できる可能性がある。

android-sshot

もしかしたら今回のようなコンピューターの合成音で全ての人の声に共通する特別な音も作れてしまうかもしれない。ユーザーとしては音声コマンド機能の持つリスクを改めて認識すべきだろう。