「音声認識の第2次ブームといわれる今に至るまでには何が起こっていたのか。開発を進める主な企業の歴史から音声認識技術の変遷を追う」
前回までの記事はこちら
≫ニュアンス・コミュニケーションズ
≫アップル
≫グーグル
≫マイクロソフト
≫アドバンスト・メディア
≫フュートレック
この連載の最後となる今回は株式会社レイトロン(以下レイトロン)という日本企業について紹介したい。
■レイトロン
レイトロンは1992年に設立した大阪の会社。独立系のLSIデザイン会社で、さまざまな企業の依頼を受けて用途に合わせたASIC(特定用途向けIC)やLSIを設計開発している。
音声認識については、北海道大学の宮永研究室との共同研究により、雑音環境下に強いロバスト音声認識専用のハードウェアエンジン(LSI)を開発。2007年には、このLSIが使われた「Chapit(チャピット)」と呼ばれる音声認識コミュニケーションロボットを発表した。
【参考】Chapit[チャピット]
Chapitは「生活空間において家族の一員となり便利で楽しい日常を」という思いからレイトロンが開発したロボットで、音声認識機能、音声合成機能、家電制御機能を備えている。音声認識機能は先にも述べた北海道大学の宮永研究室、音声合成機能は株式会社エーアイと、それぞれ共同開発したものが実装されているとのこと。話し掛けると言葉を認識して返事をするうえ、目と口の動きで感情を表現する。音声で命令を出すと、赤外線通信によりテレビなどの家電製品の操作も行うことができる。
レイトロンの音声認識の主な特徴としては、単語単位で認識を行う孤立単語認識方式(フレーズ認識方式)で、並列処理によりリアルタイムな応答が可能であるということ、そして、ノイズに強く実環境での使用に耐える音声認識技術となっていることが挙げられる。また「9(キュー)」と「10(ジュー)」など人でも聞き間違えるようなニュアンスが近い言葉の判定機能なども実装し、高い認識率を確保することができている。
例えばChapitは「組込みシステム開発技術展(ESEC)」などで展示されることも多く、そのような展示会場では雑音が大きいのだが、マイクを用いずに約1メートル離れたところからChapitに話し掛けても、きちんと認識してくれるということである。
高ノイズ環境下でも高い認識率を誇り他の音声認識技術にはない優位性が認められている同社の音声認識技術は、現在Chapit以外にも次のようなものに採用されている。昭和大学から発表された歯科臨床実習用患者ロボット「昭和花子2」(2011年6月発表)、シャープのお掃除ロボット「COCOROBO(ココロボ)」(2012年6月発売)、デアゴスティーニ・ジャパンの組立マガジン週刊『ロビ』(2013年2月19日創刊)で組み立てられるロボット「ロビ」などである。
≫世界初!歯科患者ロボット臨床教育への本格導入へ. 昭和花子2デビュー
≫しゃべる、つながる コミュニケーション機能|ロボット家電COCOROBO
≫組立マガジン週刊『ロビ』
シャープの「ココロボ」は、同社の音声認識が最終製品に組み込まれる初めての事例となるようだ。その音声認識の特徴を考えると、今後も家電や各種FA機器(生産現場での自動化)などのインターフェースとして採用されていくのだろう。また、同社は現状にとどまらず積極的に新たな技術の研究・開発も進めているので、その動向にも注目したいところである。
ちなみに最新ニュースとしては、アジア最大級の最先端IT・エレクトロニクス総合展である「CEATEC JAPAN(シーテックジャパン)2013」が10月1日?5日に幕張メッセで開催されるが、それにレイトロンも参加している。その出展製品情報を見るだけでも、その内容から音声認識の進化と新たな可能性を感じられる。
【参考】CEATEC JAPAN出展者詳細情報 (株)レイトロン
個人的に注目しているのは「VoiceMagicUSB & VoiceMagicBluetooth」と、Chapitの進化だ。VoiceMagicUSBは、小さなボード上にマイクやプロセッサといった音声認識のための全てを載せたデバイスで、これを接続するだけで音声認識対応機器にできるというもののよう。また、Bluetooth接続によりPC、タブレット、スマートフォンに認識結果を無線で送信も可能になるようだ。Chapitは、以前から大阪トップランナー育成事業の認定プロジェクトとしても高齢者適応型マルチモーダル(複数機能)ロボットの開発が進められていたと思われるが、その機能を満たした進化版Chapitがこの会場で披露されるのかなと期待している。
【参考】認定プロジェクト紹介 音声・画像認識による高齢者適応型マルチモーダル(複数機能)ロボットの開発
そのほか、これは数年前から開発が進められているが、悲鳴認識モジュールも個人的には興味深いところである。防犯対策として現在は監視カメラが多用されているが、それも万全ではない。この悲鳴認識モジュールは監視カメラを補うものとして期待されるだけでなく、震災など緊急事態への備えとしても注目されている。音声認識の進化と新たな可能性を感じられるところである。
ここまで音声認識の開発を進める主な企業として7社を取り上げてきたが、その歴史を見てもさまざまな視点から音声認識に取り組み、成長してきていることが分かる。それぞれの企業で方針も展開も違うとはいえ、多くの企業の思いと努力によって音声認識はここまで進化・普及してきたといえるだろう。
中でも音声認識技術を開発している主な日本企業としてここではアドバンスト・メディア、フュートレック、レイトロンという3社を紹介したが、その他にも音声認識に携わっている企業は多数ある。日本において音声認識が定着するのは、機器にしゃべり掛ける文化がないだけになかなか厳しいところもあるかもしれないが、日本での音声認識の普及に向けて日本の企業には特に頑張ってほしいところである。個人的ではあるが、応援している。
【参考】株式会社レイトロン