「音声認識の第2次ブームといわれる今に至るまでには何が起こっていたのか。開発を進める主な企業の歴史から音声認識技術の変遷を追う」
CPUやメモリの進化、通信回線の広帯域化、またクラウドの登場などをきっかけに音声認識の第2次ブームといわれている今、パソコンやスマートフォンに音声認識技術が組み込まれるほか、音声で操作できる家電なども続々と登場している。また、前回の記事で紹介したようなヒト型コミュニケーションロボットの開発も着々と進んでいる。
さまざまなニュースからは夢のように思われていた機器(マシン)と人が本当に対話できる世界もそう遠くないのかもしれないと感じられるが、音声技術の歴史は古く、人工知能のようにガイドしてくれるサービスの裏側には1960年代ごろからの約50年近い技術開発の積み上げがある。
その長い年月の間には何が起こっていたのか。音声認識技術の開発を進めている主な企業に焦点を当て、その歴史から音声認識技術の変遷を追ってみたい。
なお、音声認識技術の開発を進める企業は多くあるが、主な企業としてニュアンス・コミュニケーションズ、アップル、グーグル、マイクロソフト、そして国内ではアドバンスト・メディア、フュートレック、レイトロンを取り上げ、何回かにわたって紹介したいと思う。
■ニュアンス・コミュニケーションズ
ニュアンス・コミュニケーションズ(以下ニュアンス)は「ドラゴンスピーチ」でも有名だが、音声認識技術で世界の先端を走る企業の一つである。長い年月の間で音声技術に関わる企業が多く登場してきたが、その中でニュアンスはM&Aを繰り返し、多くのスピンオフの技術を吸収し、主要企業として成長してきている。
例えば、音声認識の第1次ブームは1997年ごろに起こったといわれているが、1997年6月にはドラゴンシステムズ(当時)から連続音声認識を行う世界初?のソフトウェアの「Dragon NaturallySpeaking」、また同年8月にはIBMの「ViaVoice」が発売され注目を集めた。これらの製品をご存じの方も多いだろう。そして、このドラゴンシステムズという企業は音声認識の老舗であり同分野における草分け的な存在であったが、現在はニュアンスに買収されている。
正確にいうと、ドラゴンシステムズは2000年にベルギーのL&H(Lernout & Hauspie)に買収され、そのL&Hは従来音声を手掛けていなかったスキャンソフトに買収された。ニュアンスの前身はこのスキャンソフトで、スキャンソフトはもともとOCR(光学文字認識)で知られるゼロックスからスピンオフした企業であるが、L&Hを買収することで音声事業に参画した。
そして、2005年にスキャンソフトはニュアンスを買収し、社名をニュアンスに変更している。ニュアンスはドラゴンシステムズをはじめとする多くの企業との合併によって事業拡張を遂げ、同分野のトップベンダーに躍り出たのだ。
2009年にはIBMから「ViaVoice」を含む関連特許やライセンスも取得し、IBMの音声関連技術も獲得した。現在IBMとニュアンスは協業の関係にある。
【参考】ニュアンスと IBM、協業により次世代の自然言語音声テクノロジーを強化
ちなみに、米国の音声認識関連技術の特許はニュアンスがトップ(対象期間は1980年から2012年6月末まで)とのことで、ここからも積極的な様子がうかがえる。ソニー、キヤノン、パナソニックなどの日系企業もトップ10内にランクインしているのは驚いた。
【参考】米国 音声認識関連技術、トップはアップルに技術供与のNUANCE、Google は4位 ? ソニー、キヤノン、パナソニックも上位に ?
現在ニュアンスの技術は50以上の言語に対応しており、50以上の言語に対応する技術を持つのは同社だけのようである(日経新聞より)。アップルの「Siri」の音声認識エンジンにもニュアンスの技術が活用されているが、「Siri」の対応言語の多さもうなずける。
世界の先端を走る企業に成長したニュアンスだが、文書管理ソフトや携帯電話、自動車、コールセンターなど幅広い分野で音声認識事業を展開している。特にコールセンター事業では世界で約8割のシェアを有するほど強いようだ。また、モバイルにも力を入れて取り組んでおり、さまざまなアプリをリリースしている。「認識精度が高い」といったレビューも見受けられるようだ。
さて、ニュアンスのホットな話題であるが、パナソニックのテレビ(スマートビエラ2013年モデル)にドラゴンスピーチの音声認識技術が組み込まれ、2013年4月下旬から全世界で発売される予定とのことだ。「全世界」とは、すごい。
【参考】パナソニックの新スマートビエラに搭載されるボイスインタラクション機能が、ニュアンス・コミュニケーションズ社のDragon TV機能採用により実現
【参考】地上・BS・110度CSデジタルハイビジョンプラズマテレビ スマートビエラ VT60シリーズ 2機種を発売
そのほか、音声認識技術を利用したターゲット型モバイル広告フォーマット「Voice Ads」も発表している。
【参考】音声認識技術のNuance、会話する広告フォーマット「Voice Ads」を発表
しかし、ニュアンスの歴史は本当にM&Aが多い。ここで挙げたものはほんの一部だ。多くの企業とのM&Aや技術取得によって進化してきたニュアンス、今後もさらに進化し続け、音声認識の世界を盛り上げていってくれることだろう。
次回に続く