株式会社東京アーカイブセンターは、2018年7月より無料公開していたベータ版の「AI文字起こしβ」を終了し、2020年9月1日から正式商用サービスとして「AI文字起こし」の提供を開始した。今回は、正式にリリースされた「AI文字起こし」について紹介したい。
※本ページの内容は、2020年9月18日現在の情報です。
【目次】
・ 正式商用サービスとして提供開始! AIによる音声の文字化サービス「AI文字起こし」とは。
・ 早速試してみよう。手順は簡単・シンプル3ステップだ!
・ [AI文字起こし]サービスの特長と基本情報まとめ
・ [最後に]文字起こし結果に誤変換が多い……? それなら次のステップ【STEP4】として、こちらはいかが。
2020年9月1日、ベータ版として公開されていた「AI文字起こしβ」は商用サービスへ移行し、「AI文字起こし」として正式にリリースされた。
「AI文字起こし」は、音声をアップロードすればAIエンジン(音声認識API)が文字起こし(音声の文字化、テープ起こし)をしてくれるという、シンプルかつ簡単操作のクラウド型音声認識サービスだ。
音声全体の文字起こし(以下、全文文字起こし)を希望する場合は依頼(全文を購入)が必要となるが、ユーザーは複数の有力なAIエンジンによる音声の冒頭60秒間の文字起こし結果を確認した上で、希望するAIエンジンを選んで依頼することができる。全文文字起こしの利用料金は、音源1分あたり30円(税別)だ。
AI文字起こし(2020年9月1日 正式リリース)
https://ai-ninshiki.jp/
商用化に伴い、AIエンジンは「Google Cloud Speech-to-Text(以下、Google)」と「Microsoft Azure Speech to Text(以下、Azure)」に加え、株式会社アドバンスト・メディア社が提供する日本語に特化したエンジン「AmiVoice Cloud Platform(以下、AmiVoice)」も採用。3つのAIエンジンが利用できるようになり、より便利になった。また、9月16日にはテキストダウンロード機能とタイムコード付与機能(AmiVoice)も追加された。
セキュリティについては、3つのAIエンジン全てにおいてログをサーバー上に保存せず、またAI文字起こしサーバー上では情報を31日間保持した後に完全消去(ユーザーによる即時消去も可能)することで、音声および文字起こしテキストのセキュリティを担保。また、音声と文字起こしテキストの確認にはワンタイムパスワードを使用することで、セキュリティを強化している。
「AI文字起こし」は、その利用に特別な環境は不要で、動作保証ブラウザにて誰でも簡単に安心して利用できるサービスとなっている。文字起こしを人の手で一からやるのは大変だが、「AI文字起こし」なら文字化したい音声ファイルをアップロードし、希望のAIエンジンを選んで決済すれば、あとは処理完了を待つだけでOKだ。もし文字起こしに困っているなら、ぜひ一度お試しあれ。
[参考]AI文字起こしに関する過去記事はこちら。
- ≫【サービス編2】録音音声の文字化が自動で完了! AIによるテープ起こしサービス「AI起こし」ベータ版が無料公開スタート(2018.08.03)
- ≫「AI文字起こし」にAzure AIが追加! 複数の最新AIによる日/英/中の自動文字起こしが可能になりました(2019.11.01)
【STEP1】まずはサイトにアクセスし、文字化したい音声ファイルをアップロードしよう。
- 推奨ブラウザは、Chrome/Firefox(Windows/iOS/Androidに対応)。
- 音声ファイルは、wav/mp3/ogg/m4a形式に対応(200MB/120分以内)。
※アップロードする音声ファイル名に括弧()が含まれているとエラーになる(「アップロード処理または解析処理の失敗」というメッセージが表示される)ようなので注意。
音声ファイルをドロップ、または「ファイルを選択」ボタンから文字化したい音声ファイルを選択すると、次の画面に切り替わる。
利用規約およびプライバシーポリシーに同意する(チェックする)と、「アップロード」ボタンがアクティブになる。
利用規約およびプライバシーポリシーに同意する場合はチェックする。また、音声ファイルで使用されている言語を選択する。「アップロード」ボタンをクリックすると、音声ファイルのアップロードが開始されるので、「アップロード完了」メッセージが表示されたら「次へ」を選択しよう。
- ※対応言語は日本語/英語/中国語だが、複数言語が混在した音声の文字起こしには対応しておらず、全ての処理は指定した言語で行われる。
- ※AmiVoiceは日本語に特化したエンジンのため、英語/中国語の音声の文字起こしには対応していない。
【STEP2】3つのAIエンジンによる冒頭60秒間の文字起こし結果を確認しよう。全文文字起こしを依頼したい場合は、希望するAIエンジンの「全文を購入」ボタンから可能だ。
「全文を購入」ボタンをクリックすると、決済情報の入力画面(下画像)が表示される。
「AI文字起こし」では、現在3つの有力AIエンジンによる冒頭60秒間の文字起こし結果を確認した上で、希望するAIエンジンを選んで全文文字起こしを依頼できる。音声全体を起こしたい場合は、希望するAIエンジンの「全文を購入」ボタンをクリックし、メールアドレスを入力の上カード決済を行えば、全文文字起こしの依頼が完了。あとは「処理完了」メールが届くのを待つだけだ。
Azure | AmiVoice | ||
---|---|---|---|
改行・句読点付与 | × | ○ | ○ |
タイムコード付与 | × | × | ○ |
タイムコード付きでDL | × | × | ○ |
テキスト形式でDL | ○ | ○ | ○ |
対応言語 | 日本語/英語/中国語 | 日本語のみ |
※DL=ダウンロード
利用料金は、音源1分あたり30円(税別)。音声の分数は1分単位に切り上げとなり、例えば1秒〜59秒までの音声は全て1分の課金、60秒(1分00秒)〜119秒(1分59秒)までの音声は全て2分の課金、……になる。
※ただし最低利用料金は100円からなので、100円未満は100円(税別)に切り上げられて請求される。
【STEP3】「処理完了」メールが届いたら、メールに記載のURLをクリック、ワンタイムパスワードを発行・入力し、処理結果ページで文字起こしテキストを確認しよう。
文字起こしテキストは「テキスト形式でダウンロードする」ボタンよりテキスト形式でダウンロードできる。
AmiVoiceでの文字起こしを選択した場合のみ、タイムコード付きの結果表示と、「タイムコード付きでダウンロードする」ボタンよりタイムコード付きのExcelファイル形式でも文字起こしテキストをダウンロードできる。
処理結果ページの閲覧には、ワンタイムパスワードの入力が必須となる。セキュアな状態で文字起こしテキストを確認することが可能だ。また、アップロードした音声ファイルや文字起こし結果のテキストは、31日間保持した後に完全消去されるが、ユーザーによる即時消去も行えるようになっている。
※メールアドレスを入力してワンタイムパスワードを発行した後は、そのページを閉じないように注意(閉じてしまうとセッション切れで再度ワンタイムパスワードの発行からやり直すことになる)。
こちらも参考にどうぞ。
≫ ご利用ガイド | AI文字起こし
≫ FAQ | AI文字起こし
【[AI文字起こし]サービスの主な特長】
- 特別な環境は不要。動作保証ブラウザにて誰でも簡単に、安心して利用可能だ。
- 短納期(依頼する音声時間と同程度の時間)で文字起こしテキストを入手できる。
- 複数の有力なAIエンジンによる冒頭60秒間の文字起こし結果を確認できる。
- 課金が発生する全文文字起こしは、AIエンジンの対応状況(文字起こしの精度や、そもそも変換処理ができているか等)を確認した上で、希望のAIエンジンを選んで依頼(購入)できる。
- 日本語以外の文字起こしにも対応している。
【サービス名】AI文字起こし 【採用AIエンジン(音声認識API)】Google Cloud Speech-to-Text、Microsoft Azure Speech to Text、AmiVoice Cloud Platform 【音声認識】クラウド型 【開発・運営元】株式会社東京アーカイブセンター 【推奨ブラウザ】Chrome/Firefox(Windows/iOS/Androidに対応)【サイトURL】https://ai-ninshiki.jp/
- 2020年9月1日から正式商用サービスとして提供開始。
- 株式会社東京アーカイブセンターは、テープ起こしの専門会社である東京反訳株式会社のグループ会社です。
≫「AI文字起こし」プライバシーポリシー
≫「AI文字起こし」利用規約
≫ テープ起こし・文字起こし・書き起こしのリーディングカンパニー 東京反訳株式会社
音声認識は便利だが、やっぱりまだまだ誤認識はつきもの。音声認識を使って文字起こしをした際、期待した結果に誤変換が多いとがっかりしてしまうが、ちょっと気分を変えて、面白誤変換ワードや、何だこれ変換を探してみるのはどうでしょう。大ごにんしき大賞、第1回!が現在開催中です。
ヒトとAIが一緒に作業をすることで生まれる「面白い世界」を大募集!
スマートスピーカーやスマートフォンからの応答に思わず笑顔になってしまった話、アセってしまった話、ホッコリした話、ムッとした話など何でもOK。音声認識中に起こったエピソードをお寄せください。★AI音声ソフトが認識した誤変換ワードも大歓迎です!
【締め切り】2020年9月30日 【発表】2020年12月1日 【賞】大賞:1名(5万円分ギフト券・記念品等)、佳作賞:5名(1万円分ギフト券・記念品等)【主催】一般社団法人文字起こし活用推進協議会
【応募方法・詳細はこちら】≫ 第1回 大ごにんしき大賞
音声認識を使ってみたものの修正が大変だ……というときは、信頼できるプロに修正をお願いするのも一つの手。中でも東京反訳は、セキュリティ重視のテープ起こしで実績多数。文字起こしテキストの修正・校正(もちろん「ケバ付き」や「整文」といった起こし方の指定等)にも対応可能だ。
≫ 音声認識結果データの校正いたします
セキュリティ重視のテープ起こし、文字起こし、書き起こしは135,087件の実績、ISMS・プライバシーマーク・ISO9001取得済の東京反訳(はんやく)へ。上場企業、官公庁、大学ご依頼実績多数。科研費対応。即日翌日納品対応しております。お気軽にご相談ください。
【公式サイト】https://8089.co.jp/