主な企業の歴史から音声認識技術の変遷を追う(6)

主な企業の歴史から音声認識技術の変遷を追う(6)

「音声認識の第2次ブームといわれる今に至るまでには何が起こっていたのか。開発を進める主な企業の歴史から音声認識技術の変遷を追う」

ニュアンス・コミュニケーションズはこちら
アップルはこちら
グーグルはこちら
マイクロソフトはこちら
アドバンスト・メディア

引き続き、音声認識技術の開発を進めている主な企業に焦点を当て、その歴史から音声認識の変遷を追ってみたい。今回はフュートレック、次回はレイトロンという日本企業について紹介する。

フュートレックとレイトロンは、前回取り上げたアドバンスト・メディアのような音声認識専業企業ではない。LSIの設計開発を軸に音声認識技術の開発に乗り出している企業である。フュートレックといえばNTTドコモへの技術供与、レイトロンといえばシャープのロボット掃除機「ココロボ」が有名だ。

音声認識はスマートフォンの登場で一気に広まったが、今はモバイルだけにとどまらず家電や自動車などにも応用が進み、新たな市場も開拓されつつある。今後は両社の音声認識技術を利用した製品やサービスもさらに増えることだろう。その沿革から音声認識について今後の動向を探ってみたい。

■フュートレック

設立は2000年。もともと半導体の設計を請け負う受託開発でスタートしたが、受託の傍ら自社製品として携帯電話用音源LSI(音を鳴らすための半導体)の設計データの開発に取り組み、それを音源IP(知的財産)として販売開始。2005年1月にこの音源IPがNTTドコモに採用(NTTドコモのフィーチャーフォン(従来型携帯電話)の音源として採用)されたことで、経営基盤が固まった。

ポイントとしては、開発・設計したLSIデータ/組込ソフトウエアをIP化し、販売しているということ(要は製品ではなく設計図を販売)。いわばライセンス提供のようなものである。

NTTドコモの携帯電話が1台売れるごとにロイヤルティー(使用料)が入る仕組みで、収入はその販売台数に左右されるが、当時の携帯電話が順調に売れる中、同社において音源IPのロイヤルティー収入は安定した収入源となった。そして、同年12月に東証マザーズに上場する。

その後、2006年5月にNTTドコモと資本・業務提携契約を締結。NTTドコモが開発するさまざまなサービスに協力することになった。また、このころから新事業の育成に着手する。音声認識分野への事業展開である。2006年12月に音声関連技術研究のパイオニアであるATR(国際電気通信基礎技術研究所)と業務提携し、2007年5月にはATRの関連企業であるATR-Langに資本参加した(現ATR-Trek)。

フュートレックの音声関連技術は、ATRおよび連結子会社であるATR-Trekとの共同事業であり、ATR、NICT(独立行政法人情報通信研究機構)、豊橋技術科学大学、名古屋工業大学の技術が利用されている。同社の音声認識の特長は、ノイズリダクションに優れ雑音に強いこと、音声認識・合成・対話・翻訳をワンストップで提供できること、システム・音声認識辞書共にカスタマイズ可能ということだ。

これまでに音声認識では、ATR-Trekが運営する「しゃべって翻訳」や、NTTドコモが提供する「音声入力メール」、「音声クイック検索」、「しゃべってコンシェル」などで同社の技術が採用された。また、NTTドコモの2010‐2011冬春モデル(フィーチャーフォン)、2011夏モデル(スマートフォン)では音声対話の技術が採用された。

なお、NTTドコモで同社の音声認識技術が採用されたのは、アドバンスト・メディアのものなどに比べて外の環境で使ったときに雑音に強いという点が評価された、という点もあるらしい。

また、「しゃべってコンシェル」(2012年にサービス開始)はアップルのSiriとともにコンシェルジュ型サービスとして話題となったが、同社は音声認識・合成・対話といった音声言語関連技術を全て有しているため、実現できたといえる(「しゃべってコンシェル」の技術そのものはドコモR&Dセンター内の先進技術研究所で開発されたが、音声の認識エンジンはATR-Trekの技術が採用された)。現在の語彙数は約数十万語、言語の認識率もかなり高いが、今後はさらに進化していくことだろう。

音声認識事業はスマートフォンの普及とともに発展し、今では音源事業に代わって同社の中心事業となってきた。その背景には、収益源が音源から音声認識に広がる中で、携帯電話はフィーチャーフォンからスマートフォンへ急激にシフトし始めているということがある。

そのためフィーチャーフォンの減少とともに従来の音源ロイヤルティー収入は大きく減少する方向にあるが、一方でスマートフォンでは音声認識を利用する動きが一段と高まっている。同社は音声認識技術の開発に力を入れ、着々とスマートフォンに対応した製品開発を進めてきたといえる。音源から音声認識というイノベーションの連鎖は実現していると言っていいのではないだろうか。

ただ、課題もある。その一つとしては、音源、音声認識など、いずれもNTTドコモ中心の事業展開をしているという点。売上の6割近くがNTTドコモ向けとなっているのだ。よって、NTTドコモ向けを主力にするとしても、今後は事業領域と顧客を広げ、その依存度を相対的に下げることで経営基盤の強化を図りたいと考えているようである。

これは同社の最近の動きを見てもうかがえる。最近のニュースを次に挙げる。

フュートレックの「銀行業務日報ソリューション」が池田泉州銀行全店にて本格始動?フュートレックの音声認識技術vGate(ブイゲート)を利用し、音声で日報入力?(2012/08/08)

フュートレックの音声認識技術を、パイオニアのカーナビに提供(2013/05/08)

講義内容をリアルタイムで字幕表示、耳の不自由な学生の方をサポート?フュートレックの音声認識技術が、教育現場で初採用!!?(2013/05/20)

フュートレックの音声認識で、パナソニックのエアコンを操作 フュートレックの音声認識技術が、家電業界で初採用!! ?エアコンを操作する「パナソニックスマートアプリ」 ?(2013/06/19)

フュートレックの音声認識「業務日報ソリューション」が「保険市場」のアドバンスクリエイト全店で採用! ?担当者の負担を軽減して、情報共有を促進。さらなる顧客満足の向上へ?(2013/08/28)

モバイル以外でターゲットとしている市場は、家電、車、教育、そして業務支援ソリューションといったところのようだ。

今後、音声入力、音声対話でさまざまな電子機器を利用したいというニーズは一段と高まるだろう。また、ビジネスの場面においても音声を活用したいニーズはいくらでもありそうだ。新しいビジネスチャンスが広がっている。今後はこれらの領域に対して音声認識技術がもっと普及していくことになるのだろう。

なお、同社は中国語や東南アジア言語など多言語対応についても積極的に行っているとのこと。将来的には日本だけでなく市場を海外に求め、進出していくこともあるのかもしれない。今後もその動きに注目したいところである。

(続く)

【参考】音声認識・音声対話ソリューションのフュートレック

【参考】ベル企業レポート 2468 フュートレック ?音声認識技術を活かし、新たな飛躍を目指す? 2013年4月18日

【参考】ブリッジレポート(2468:東証マザーズ) フュートレック 2013年3月期業績レポート 2013年7月16日掲載