人気を二分する代表的な音声認識ソフトのドラゴンスピーチ11とAmiVoice SP2も今年で発売されて6年目。また、クラウド型の音声認識はここ数年でその精度が大きくアップした。このエントリーでは気になる音声認識ソフト/サービス/アプリの現況をまとめる。
ソフト編では、ドラゴンスピーチ11とAmiVoice SP2、そしてGoogleの音声認識エンジンを採用しているVoice Rep Proについて、対応OSや現在のサポート状況、後継バージョンの有無などを調査した。
【2018年10月23日追加情報】音声認識ソフト「AmiVoice SP2」は、2018年12月31日で残念ながら販売終了になりました。サポート終了は2020年3月31日予定です。
【参考】(公式HP)音声認識ソフト「AmiVoice® SP2」販売終了のお知らせ
【ソフト編 目次】
ドラゴンスピーチ11
AmiVoice SP2
Voice Rep Pro
ドラゴンスピーチ11は、音声認識で世界的に有名なニュアンス・コミュニケーションズ(以下、ニュアンス)の音声認識ソフト。スタンドアロン型で、オフラインで作業可能。音声認識エンジンは特定ユーザーの声や話し方を学習し、その人用に洗練されていく。音声入力だけでなく、音声でパソコン操作も可能なところが大きな特徴の一つだ。
ドラゴンスピーチ11の基本情報および現況
ドラゴンスピーチ11は、発売されて今年で6年目。現在「ドラゴンスピーチ11 日本語版」はまだ購入可能だが、株式会社ジャストシステム販売の「ドラゴンスピーチ 11J」は販売・サポートともに既に終了している。また、更新プログラムは2013年以降出されておらず、Windows 10は動作が保証されていない。
Windows 10については、公式サイトには2016年時点の動作検証の情報しかない。今のところWindows 10(April 2018 Update v1803、Build 17134.48)でも問題なく使えているが、購入はWindows 10に未対応であること、今後のサポートがないことも含めて検討することをおすすめする。
なお、英語版はv15まで出ているが、日本語版の後継バージョンのアナウンスは今のところ特にない。
≫【公式サイト】世界シェアNo.1の音声認識・音声入力 ソフト ドラゴンスピーチ11
≫よくあるご質問 更新プログラムのダウンロード – ニュアンス
≫ドラゴンスピーチ11 Windows 10動作確認(2016年2月10日現在)- ニュアンス
【2018年10月23日追加情報】音声認識ソフト「AmiVoice SP2」は、2018年12月31日で残念ながら販売終了になりました。サポート終了は2020年3月31日予定です。
【参考】(公式HP)音声認識ソフト「AmiVoice® SP2」販売終了のお知らせ
AmiVoice SP2は、日本における音声認識のパイオニアであるアドバンスト・メディアの音声認識ソフト。スタンドアロン型で、オフラインで作業できる。音声認識エンジンは不特定話者対応だが、特定ユーザーの声や話し方を学習し、その人用に洗練されていくのはドラゴンスピーチ11と同じ。動作はドラゴンスピーチ11より軽い。
AmiVoice SP2の基本情報および現況
■無料体験版:次のサイトからダウンロードできる(v2.06相当、一部辞書のみ、インストールから2週間利用可能)。
≫AmiVoice SP2公式オンラインストア 体験版 – ITネクスト株式会社
AmiVoice SP2も発売されて今年で6年目だが、アップデートモジュールが定期的に出されており、Windows 10にも対応しているほか、必要に応じて改善や辞書更新(新語追加やその他調整など)が行われている。サポート面でも安心だ。
別会社が運営している「AmiVoice SP2公式オンラインストア」では、お知らせでOSアップデートに伴う不具合・対処方法等の情報がアップされていたりするので、必要に応じてチェックするといいかもしれない。
最近の不具合・対処方法についての情報はこちら。
≫Windows 10でアップデート後AmiVoice SP2が使用できない現象について – 2018/5/17
※「バージョン:1808/ビルド番号:17134」と記載されているが、バージョンは「1803」の誤記だと思われる。
≫【公式サイト】音声認識ソフト AmiVoice SP2
≫AmiVoice SP2 ダウンロード 最新アップデート
≫AmiVoice SP2公式オンラインストア – ITネクスト株式会社
Voice Rep Proは、Googleの音声認識エンジンを採用した音声認識ソフト。音声認識はGoogle Chromeブラウザ上で行い、文字変換された結果をエディタに転送するという仕組み。高精度であるGoogleの音声認識で音声入力および録音音声の文字化を行うことができる。
Voice Rep Proの基本情報および現況
■最新バージョン情報:Voice Rep Pro:v1.041(2014年アップデート)、Voice Rep Pro 2:v2.010(2017年アップデート)、Voice Rep Pro 3:3.000(2018年3月リリース)
≫Voice Rep Pro アップデート – ボイステクノ
≫Voice Rep Pro 2 アップデート – ボイステクノ
■無料体験版:Voice Rep Pro 3の音声入力機能のみChromeブラウザ上で体験可能。
≫Voice Rep Pro 3体験版 – ボイステクノ
※体験版で「開始」を押すと別タブで認識用ページが立ち上がるが、そのページでは転送状態等を確認できないので、音声入力は体験ページに戻って行う。体験ページと認識用ページを左右に並べておくと、より状況が分かりやすい。
Voice Rep Proは、今のところ約2~3年でアップグレード版が出ており、現在の最新版は2018年3月にリリースした「Voice Rep Pro 3」。旧バージョンの「Voice Rep Pro」(2013年11月リリース)、「Voice Rep Pro 2」(2016年3月リリース)は現在販売を終了している。
Voice Rep Pro 3で追加・改善された主な動作や機能はこちら。
■音声認識結果がリアルタイムでエディタに転送されるようになった。
■文字化された認識結果にタイムラインが付与されるようになった(オン/オフ切替可、ワンクリックで除去も可)。
■タイムラインの音声ファイル/テキストとの連動(再生位置に移動できる)。
■音声ファイルの自動的な文字化「お任せ自動文字化」が新たに追加された。
本ソフトの仕組み上、文字変換された結果をエディタに転送するという動作が入るので、旧バージョンでは特に録音音声の文字化を行っているときに処理がうまく追い付かず、レスポンスが悪くなったりその間の認識結果が飛んだりすることが多々あった。Voice Rep Pro 3では、そこを改善すべく、録音音声の文字化がうまく処理できるよう音声の再生・停止・待機を自動で繰り返す「お任せ自動文字化」機能が追加されたといえる。実際の使い勝手等は製品版を使用した際にまたレビューしたい。
なお、Googleの音声認識エンジンは着々と成長しており、以前は苦手だった数字認識での文字変換等も現在はうまく行えるようになっている。Googleに関する認識精度の変化等については、サービス編で取り上げる。
≫【公式サイト】Voice Rep Pro 3 – 商品ホーム – ボイステクノ
≫【公式サイト】Voice Rep Pro 3 – よくある質問 – ボイステクノ
【関連記事】
≫音声認識を使ってテープ起こしを効率的にする、現在の個人的おすすめ(1~4)(2016.12.08)
≫気になる音声認識ソフト/サービスの音声認識精度等の現況、最新レポート(1~2)(2015.12.01)