【サービス編3】高精度なGoogleの音声認識を使って無料で文字起こしができる!サービスまとめ

【サービス編3】高精度なGoogleの音声認識を使って無料で文字起こしができる!サービスまとめ

Googleの音声認識はその認識精度の高さが魅力だが、Googleが提供するスマホやGoogleドキュメントの音声入力は、連続での音声認識ができず※、また日本語は音声コマンドにまだ対応していないので、文字起こしでは少し使いづらい面もある。「Googleの音声認識は使いたいけど、使い勝手が……」という人もいるのではないだろうか。

そんな悩みをお持ちなら、Googleの音声認識を採用したアプリやサービスに目を向けてみると、自分の目的や好みに合ったものが見つかるかもしれない。うまく使うと便利なサービスも増えてきた。

サービス編3では、Googleの音声認識を使って文字起こしができるウェブサービスの中から、基本的に無料で使える今おすすめのものをいくつか紹介する。

※現状、スマホのGoogle音声入力やGoogleドキュメントの音声入力は、マイクをオンにしたまま連続で音声認識できる状態にしておきたくても、少し間が空いたりする(音声が聞こえない状態が続く)と認識にタイムアウトが生じてしまうので、認識が終了してしまった場合はもう一度マイクをオンにする必要がある。

【サービス編3 目次】
(1)音声コマンドもOK!音声入力対応のウェブメモ帳系
(2)音声ファイルの自動文字起こしが現在無料で行えるウェブサービス
(3)さいごに。

(1)音声コマンドもOK!音声入力対応のウェブメモ帳系

Speechnotes

「Speechnotes」基本情報

【サービス名】Speechnotes 【サービス開始】2015年 【開発・運営元】Speechlogger&TTSReaderチーム(WellSource) 【音声認識】Google/クラウドベース 【サイトURL】https://speechnotes.co/ja/

【キーワード】音声対応のウェブメモ帳、Google音声入力、音声コマンド使用可、Chromeブラウザ、Android版アプリあり、登録不要、無償・無制限、書き出し機能

マイクオンでの連続した音声入力が可能。音声コマンドにも対応し、登録不要、無償・無制限で利用できるところが大きな魅力。音声コマンドで句読点はサポートしていないので、キーボードと併用か、ピリオドやコンマなどで代用し、後で一括変換がおすすめ。

ステレオミキサーなどを使えば録音音声の文字化も可能。マイクはオンのままで音声認識させることができ、しかも同パソコンで別の作業(別タブで作業したり別ソフトで作業したり)をしても認識がストップしないので、素晴らしい。

ただし、あとに紹介するサービスもそうだが、うまく認識できるかどうかは別問題。音声やレスポンスなど状況によって変わるので、そこは柔軟にうまく使っていこう。

なお、Speechlogger&TTSReaderチームでは、他にインスタント翻訳や音声よみあげリーダーも開発しており、そちらも意外と便利に使える。(ページフッタ部にリンクあり)

Dictanote

「Dictanote」基本情報

【サービス名】Dictanote 【サービス開始】不明(2013年にはあったと思う)【開発・運営元】dictanote.co 【音声認識】Google/クラウドベース 【サイトURL】https://dictanote.co/

【キーワード】音声対応のウェブメモ帳、Google音声入力、音声コマンド使用/自作可、キーボードショートカットあり、Chromeブラウザ、Chrome拡張機能あり、一部機能は有料(Pro)、メモ帳複数作成可、書き出し機能

アカウント登録/サインインは必要だが、マイクオンでの連続した音声入力が可能。音声コマンドが使用できるだけでなく自作でき、キーボードショートカットも使えるところが便利。音声コマンドで句読点も使えるが、例えば読点だとほぼ「てん→10」で認識されるので、そこら辺は自作で工夫したい。

音声ファイルの自動文字起こし機能もあるが、使用はPro(有料版)へのアップグレードが必要。とはいえ無料版のままでも、ステレオミキサーなどを使えば録音音声の文字化も可能。

ただ、Speechnotesと同様、マイクはオンのままで音声認識させることができ、同パソコンで別の作業をしても認識はしているが、Speechnotesのほうが認識状況を確認しやすく、安定もしている気がする。うまく起こせるかどうかは音声や状況次第といえる。

dictation.io

「dictation.io」基本情報

【サービス名】dictation.io(Voice Dictation) 【サービス開始】不明(2013年にはあったと思う)【開発・運営元】Amit Agarwal(Digital Inspiration) 【音声認識】Google/クラウドベース 【サイトURL】https://dictation.io/

【キーワード】音声対応のウェブメモ帳、Google音声入力、音声コマンド使用可、Chromeブラウザ、登録不要、無料、書き出し機能、音声読み上げ機能

マイクオンでの連続した音声入力が可能。音声コマンドにも対応し、登録不要で、無料で利用できる。音声の読み上げ機能もあり。改行は「新しい行」で認識、 句読点のサポートはないのでキーボードやコマンド代用等で対応しよう。また、閉じるボタンがない広告がメモ帳の上に出るときがあるが、その場合はブラウザのページの再読み込みで対応すべし。

ステレオミキサーなどを使えば録音音声の文字化も可能。こちらもマイクはオンのままで音声認識させることができ、同パソコンで別の作業をしても認識はしているようだが、認識結果が飛んでしまうことが多いので、認識中に別作業をするのはおすすめしない。

音声ファイルの自動文字起こしが現在無料で行えるウェブサービス

 AI起こしβ

「AI起こしβ」基本情報

【サービス名】AI起こしβ 【サービス開始】2018年7月(2018年9月現在オープンベータ版)【開発・運営元】株式会社東京アーカイブセンター 【音声認識】Google/クラウドベース 【サイトURL】https://ai-ninshiki.jp/

【キーワード】音声ファイルの自動文字起こし、マイクによる録音&その音声ファイルのアップロード可能(対応ブラウザ)、現在無料(β版)、メールで連絡、複数ブラウザ対応

音声ファイルの自動文字起こしが可能。録音音声(音声ファイル)の文字化は無料の他サービスでステレオミキサーなどを使えば可能だが、自分で環境構築・設定ができない/操作が面倒などの場合は、このサービスだと音声ファイルのアップロードだけで済むので簡単だ。詳細はサービス編2を参照。

この機能は有料または無料では短時間でのお試しとなっているサービスが多いが、「AI起こしβ」は現在オープンベータ版のため無料でサービスを利用できる。Googleの音声認識を使って長時間の自動文字起こしをしたいなら、今はこのサービスがおすすめ。利用もニックネームと連絡用のメールアドレスだけでOKだ。

 AIメーカー

「AIメーカー」基本情報

【サービス名】AIメーカー 【サービス開始】2018年7月(文字起こし機能リリースは2018年8月)【開発・運営元】@2zn01(Daichi Tsuji) 【音声認識】Google/クラウドベース 【サイトURL】https://aimaker.io/

【キーワード】画像・音声・動画ファイル・YouTubeからの自動文字起こし、マイクによる録音での文字起こし、1日1回10MB/5分以内までは無料、書き出し機能

こちらは純粋な文字起こしサービスではないが、最近文字起こし機能がリリースされ、音声ファイル等の自動文字起こしも行えるようになったので紹介。音声ファイル以外に動画ファイル等にも対応しているので、必要に応じて使うと便利。利用するにはTwitterのアカウントが必要だ。

文字起こしについては、無料での起こしは現在1日1回10MB/5分以内までに限られ、それ以上はクレジット購入が必要。動作環境を知りたかったが、サイトには記載がなかった。取りあえずPCのChromeブラウザでは全機能が問題なく使えたが、マイクによる録音での文字起こしなど、他ブラウザやスマホでも不具合なく使えるのかどうかは不明。

さいごに。

音声ファイルの文字起こしについては、他にも紹介したいサービスがあったのだが、最近有料になってしまった。録音音声の文字化は、まだどんな音声でも実用的な精度で起こせるというわけではないので、音声によって「リスピークやステミキなどを使って自分でやる」か「有料だが安くチャレンジできる音声認識サービスを使う」か「お金はかかるが確実なテープ起こしサービスを利用する」かを検討することになりそうだ。

なお、ここでは利用規約やプライバシーポリシーが確認できたもののみを取り上げているが、サービスを利用する前には各自で利用規約やプライバシーポリシーのチェックをお忘れなく。自分の目的に合った使いやすいものを見つけて、もっと楽に、効率的に文字起こしをしていこう!