「AI文字起こし」正式商用サービスとして提供開始! Google/Azure/AmiVoiceの3エンジンで文字起こしが可能です

「AI文字起こし」正式商用サービスとして提供開始! Google/Azure/AmiVoiceの3エンジンで文字起こしが可能です

株式会社東京アーカイブセンターは、2018年7月より無料公開していたベータ版の「AI文字起こしβ」を終了し、2020年9月1日から正式商用サービスとして「AI文字起こし」の提供を開始した。今回は、正式にリリースされた「AI文字起こし」について紹介したい。

※本ページの内容は、2020年9月18日現在の情報です。

【目次】
正式商用サービスとして提供開始! AIによる音声の文字化サービス「AI文字起こし」とは。
早速試してみよう。手順は簡単・シンプル3ステップだ!
[AI文字起こし]サービスの特長と基本情報まとめ
[最後に]文字起こし結果に誤変換が多い……? それなら次のステップ【STEP4】として、こちらはいかが。

正式商用サービスとして提供開始! AIによる音声の文字化サービス「AI文字起こし」とは。

2020年9月1日、ベータ版として公開されていた「AI文字起こしβ」は商用サービスへ移行し、「AI文字起こし」として正式にリリースされた。

「AI文字起こし」は、音声をアップロードすればAIエンジン(音声認識API)が文字起こし(音声の文字化、テープ起こし)をしてくれるという、シンプルかつ簡単操作のクラウド型音声認識サービスだ。

音声全体の文字起こし(以下、全文文字起こし)を希望する場合は依頼(全文を購入)が必要となるが、ユーザーは複数の有力なAIエンジンによる音声の冒頭60秒間の文字起こし結果を確認した上で、希望するAIエンジンを選んで依頼することができる。全文文字起こしの利用料金は、音源1分あたり30円(税別)だ。


AI文字起こし(2020年9月1日 正式リリース)
https://ai-ninshiki.jp/

商用化に伴い、AIエンジンは「Google Cloud Speech-to-Text(以下、Google)」と「Microsoft Azure Speech to Text(以下、Azure)」に加え、株式会社アドバンスト・メディア社が提供する日本語に特化したエンジン「AmiVoice Cloud Platform(以下、AmiVoice)」も採用。3つのAIエンジンが利用できるようになり、より便利になった。また、9月16日にはテキストダウンロード機能とタイムコード付与機能(AmiVoice)も追加された。

セキュリティについては、3つのAIエンジン全てにおいてログをサーバー上に保存せず、またAI文字起こしサーバー上では情報を31日間保持した後に完全消去(ユーザーによる即時消去も可能)することで、音声および文字起こしテキストのセキュリティを担保。また、音声と文字起こしテキストの確認にはワンタイムパスワードを使用することで、セキュリティを強化している。

「AI文字起こし」は、その利用に特別な環境は不要で、動作保証ブラウザにて誰でも簡単に安心して利用できるサービスとなっている。文字起こしを人の手で一からやるのは大変だが、「AI文字起こし」なら文字化したい音声ファイルをアップロードし、希望のAIエンジンを選んで決済すれば、あとは処理完了を待つだけでOKだ。もし文字起こしに困っているなら、ぜひ一度お試しあれ。

[参考]AI文字起こしに関する過去記事はこちら。

早速試してみよう。手順は簡単・シンプル3ステップだ!

【STEP1】まずはサイトにアクセスし、文字化したい音声ファイルをアップロードしよう。

AI文字起こし

  • 推奨ブラウザは、Chrome/Firefox(Windows/iOS/Androidに対応)。
  • 音声ファイルは、wav/mp3/ogg/m4a形式に対応(200MB/120分以内)。

※アップロードする音声ファイル名に括弧()が含まれているとエラーになる(「アップロード処理または解析処理の失敗」というメッセージが表示される)ようなので注意。

音声ファイルをドロップ、または「ファイルを選択」ボタンから文字化したい音声ファイルを選択すると、次の画面に切り替わる。


利用規約およびプライバシーポリシーに同意する(チェックする)と、「アップロード」ボタンがアクティブになる。

利用規約およびプライバシーポリシーに同意する場合はチェックする。また、音声ファイルで使用されている言語を選択する。「アップロード」ボタンをクリックすると、音声ファイルのアップロードが開始されるので、「アップロード完了」メッセージが表示されたら「次へ」を選択しよう。

  • ※対応言語は日本語/英語/中国語だが、複数言語が混在した音声の文字起こしには対応しておらず、全ての処理は指定した言語で行われる。
  • ※AmiVoiceは日本語に特化したエンジンのため、英語/中国語の音声の文字起こしには対応していない。

【STEP2】3つのAIエンジンによる冒頭60秒間の文字起こし結果を確認しよう。全文文字起こしを依頼したい場合は、希望するAIエンジンの「全文を購入」ボタンから可能だ。


「全文を購入」ボタンをクリックすると、決済情報の入力画面(下画像)が表示される。

「AI文字起こし」では、現在3つの有力AIエンジンによる冒頭60秒間の文字起こし結果を確認した上で、希望するAIエンジンを選んで全文文字起こしを依頼できる。音声全体を起こしたい場合は、希望するAIエンジンの「全文を購入」ボタンをクリックし、メールアドレスを入力の上カード決済を行えば、全文文字起こしの依頼が完了。あとは「処理完了」メールが届くのを待つだけだ。

【AIエンジンの文字起こし対応状況】

Google Azure AmiVoice
改行・句読点付与 ×
タイムコード付与 × ×
タイムコード付きでDL × ×
テキスト形式でDL
対応言語 日本語/英語/中国語 日本語のみ

※DL=ダウンロード

【全文文字起こしの利用料金について、補足】
利用料金は、音源1分あたり30円(税別)。音声の分数は1分単位に切り上げとなり、例えば1秒〜59秒までの音声は全て1分の課金、60秒(1分00秒)〜119秒(1分59秒)までの音声は全て2分の課金、……になる。

※ただし最低利用料金は100円からなので、100円未満は100円(税別)に切り上げられて請求される。

【STEP3】「処理完了」メールが届いたら、メールに記載のURLをクリック、ワンタイムパスワードを発行・入力し、処理結果ページで文字起こしテキストを確認しよう。


文字起こしテキストは「テキスト形式でダウンロードする」ボタンよりテキスト形式でダウンロードできる。


AmiVoiceでの文字起こしを選択した場合のみ、タイムコード付きの結果表示と、「タイムコード付きでダウンロードする」ボタンよりタイムコード付きのExcelファイル形式でも文字起こしテキストをダウンロードできる。

処理結果ページの閲覧には、ワンタイムパスワードの入力が必須となる。セキュアな状態で文字起こしテキストを確認することが可能だ。また、アップロードした音声ファイルや文字起こし結果のテキストは、31日間保持した後に完全消去されるが、ユーザーによる即時消去も行えるようになっている。

※メールアドレスを入力してワンタイムパスワードを発行した後は、そのページを閉じないように注意(閉じてしまうとセッション切れで再度ワンタイムパスワードの発行からやり直すことになる)。

こちらも参考にどうぞ。
ご利用ガイド | AI文字起こし
FAQ | AI文字起こし

[AI文字起こし]サービスの特長と基本情報まとめ

【[AI文字起こし]サービスの主な特長】

  • 特別な環境は不要。動作保証ブラウザにて誰でも簡単に、安心して利用可能だ。
  • 短納期(依頼する音声時間と同程度の時間)で文字起こしテキストを入手できる。
  • 複数の有力なAIエンジンによる冒頭60秒間の文字起こし結果を確認できる。
  • 課金が発生する全文文字起こしは、AIエンジンの対応状況(文字起こしの精度や、そもそも変換処理ができているか等)を確認した上で、希望のAIエンジンを選んで依頼(購入)できる。
  • 日本語以外の文字起こしにも対応している。
「AI文字起こし」基本情報(2020年9月現在)

【サービス名】AI文字起こし 【採用AIエンジン(音声認識API)】Google Cloud Speech-to-Text、Microsoft Azure Speech to Text、AmiVoice Cloud Platform 【音声認識】クラウド型 【開発・運営元】株式会社東京アーカイブセンター 【推奨ブラウザ】Chrome/Firefox(Windows/iOS/Androidに対応)【サイトURL】https://ai-ninshiki.jp/

  • 2020年9月1日から正式商用サービスとして提供開始。
  • 株式会社東京アーカイブセンターは、テープ起こしの専門会社である東京反訳株式会社のグループ会社です。

「AI文字起こし」プライバシーポリシー
「AI文字起こし」利用規約
テープ起こし・文字起こし・書き起こしのリーディングカンパニー 東京反訳株式会社

[最後に]文字起こし結果に誤変換が多い……? それなら次のステップ【STEP4】として、こちらはいかが。

音声認識は便利だが、やっぱりまだまだ誤認識はつきもの。音声認識を使って文字起こしをした際、期待した結果に誤変換が多いとがっかりしてしまうが、ちょっと気分を変えて、面白誤変換ワードや、何だこれ変換を探してみるのはどうでしょう。大ごにんしき大賞、第1回!が現在開催中です。

第1回 大ごにんしき大賞
ヒトとAIが一緒に作業をすることで生まれる「面白い世界」を大募集!

スマートスピーカーやスマートフォンからの応答に思わず笑顔になってしまった話、アセってしまった話、ホッコリした話、ムッとした話など何でもOK。音声認識中に起こったエピソードをお寄せください。★AI音声ソフトが認識した誤変換ワードも大歓迎です!

【締め切り】2020年9月30日 【発表】2020年12月1日 【賞】大賞:1名(5万円分ギフト券・記念品等)、佳作賞:5名(1万円分ギフト券・記念品等)【主催】一般社団法人文字起こし活用推進協議会

【応募方法・詳細はこちら】≫ 第1回 大ごにんしき大賞

音声認識を使ってみたものの修正が大変だ……というときは、信頼できるプロに修正をお願いするのも一つの手。中でも東京反訳は、セキュリティ重視のテープ起こしで実績多数。文字起こしテキストの修正・校正(もちろん「ケバ付き」や「整文」といった起こし方の指定等)にも対応可能だ。

[PR]テープ起こし・文字起こしは東京反訳 | セキュリティ重視・ISMS取得
音声認識結果データの校正いたします

セキュリティ重視のテープ起こし、文字起こし、書き起こしは135,087件の実績、ISMS・プライバシーマーク・ISO9001取得済の東京反訳(はんやく)へ。上場企業、官公庁、大学ご依頼実績多数。科研費対応。即日翌日納品対応しております。お気軽にご相談ください。
【公式サイト】https://8089.co.jp/