言語数拡大 & 動画にも対応! 簡単・セキュアな音声の自動文字化サービス「AI文字起こし」がバージョンアップ

言語数拡大 & 動画にも対応! 簡単・セキュアな音声の自動文字化サービス「AI文字起こし」がバージョンアップ

「AI文字起こし」がバージョンアップし、音声だけでなく動画のファイル形式にも対応。例えばZoomやMicrosoft Teamsなどで録画したWeb会議動画の音声を書き起こしたい場合、動画ファイルをアップロードすれば処理することができるようになった。また、対応言語はこれまでの3言語から9言語に拡大。より一層利便性の高いサービスへと進化中だ。

【目次】
サービスの概要と今回のバージョンアップによる追加・変更点
「AI文字起こし」の特徴、その魅力とは。
AIエンジンの文字起こし対応状況(2020年11月10日現在)
「AI文字起こし」基本情報(2020年11月10日現在)
文字起こし結果に誤変換が多いときは。

サービスの概要と今回のバージョンアップによる追加・変更点


AI文字起こし https://ai-ninshiki.jp/

「AI文字起こし」は、2018年リリースのオープンベータ版を経て2020年9月1日に正式リリースされた、AIによる音声の文字化サービス。ファイルをアップロードすればAIエンジン(音声認識API)が自動で文字起こし(音声の文字化、テープ起こし)をしてくれるという、シンプルかつ簡単操作のクラウド型音声認識サービスだ。

これまでは日本語/英語/中国語の音声ファイルの文字起こしのみに対応していたが、今回2020年11月10日のバージョンアップで、動画ファイル形式もサポート。さらに文字起こしの対応言語は、新たに主要6言語が追加され、全9言語に拡大された。

【今回のバージョンアップによる追加・変更点】

  • 動画ファイル(mp4)からの文字起こしにも対応
  • 対応言語の拡大(日本語/英語/中国語に加え、新たにスペイン語/フランス語/韓国語/イタリア語/ドイツ語/ロシア語にも対応)

現在Web会議やウェビナーの開催などが増えているが、このバージョンアップではZoomやMicrosoft Teams、Cisco Webex、Google Meet、Skypeなどの主なWeb会議サービスで録画できるmp4形式に対応した形となる。例えばそれら動画の音声を書き起こしたいという場合は、その動画ファイルをそのままアップロードすればいい。

バージョンアップにより音声/動画ファイルの自動文字起こしに対応したが、サービスの利用手順は音声ファイルでも動画ファイルでも全く同じとなる。文字化したい音声/動画ファイルをアップロードしたら、希望するAIエンジンを選んで決済すれば、あとは処理完了のメールを待つだけだ。

ご利用ガイド | AI文字起こし
FAQ | AI文字起こし

【プレスリリース】web会議動画もAIで文字起こし可能に。対応言語を拡大し利便性を向上した「AI文字起こし」サービスを提供開始(2020.11.10)

【参考】正式リリース時の紹介記事はこちら。
「AI文字起こし」正式商用サービスとして提供開始! Google/Azure/AmiVoiceの3エンジンで文字起こしが可能です(2020.09.16)

【関連記事】

「AI文字起こし」の特徴、その魅力とは。

サービスに求めるものや重視する点は人によって違うと思うが、AIによる自動文字化サービスを検討しているのであれば、操作の容易さや、精度やセキュリティ、料金や納期は気になるところではないだろうか。ここでは次の項目に分けて「AI文字起こし」の特徴と、その魅力をまとめてみたい。

↓【簡単操作:動作保証ブラウザにて手軽に利用できる】
↓【認識精度:3つの有力AIエンジンによる自動文字起こしが可能】
↓【安全安心:セキュアなデータの取り扱いとプライバシー保護】
↓【利用料金:必要なときに必要なだけ。リーズナブルな料金体系】
↓【高速処理:短納期で結果を取得】
↓【サポート:音声/動画ファイル、全9言語の文字起こしに対応】

【簡単操作:動作保証ブラウザにて手軽に利用できる】
「AI文字起こし」は、特別な環境は不要で、動作保証ブラウザにて手軽に利用できる。文字起こしを人の手で一からやるのは大変だが、「AI文字起こし」ならファイルをアップロードし、希望するAIエンジンを選んで決済すれば、あとは処理完了を待つだけでOKだ。


ファイルをアップロード → 途中結果を確認・全文を起こしたい場合は決済 → 処理完了を待つだけの簡単ステップ。

  • ソフトのダウンロードやインストール不要。会員登録も不要
  • 推奨ブラウザ:Chrome/Firefox(Windows/iOS/Androidに対応)
【認識精度:3つの有力AIエンジンによる自動文字起こしが可能】
認識精度については、現状はまだどのサービスでも高精度で起こせるかどうかは音質(録音の状態)の良し悪しに最も左右されるといっていいと思うが、音声認識システム自体の性能としては、AI(音声認識)エンジンの性能とデータベースの品質(良質・大量のデータで学習できるか)に左右されるといえるだろう。

そのような中での「AI文字起こし」の大きな魅力は、音声認識においてその性能がトップクラスに位置するGoogle、Azure、AmiVoiceの3つのAIエンジンを使って音声の自動文字化を行えるというところだ。

また「AI文字起こし」を使えば、ユーザーはまず3つのAIによる音声の冒頭60秒間の文字起こし結果を無料で確認・比較できる。そして全文文字起こし(音声全体の文字起こし)を行いたい場合は、処理に使用するAIをユーザーのほうで選択可能だ。全文を起こす場合は依頼(全文を購入)が必要となるが、その結果を確認した上で依頼できるというのは大きなメリットであるといえる。


ファイルをアップロードすると、まずは3つのAIエンジンで音声の冒頭60秒間の文字起こし(無料)が行われる。「AmiVoice Cloud Platform」は、株式会社アドバンスト・メディア社が提供する日本語に特化したエンジンだ。

  • 採用AIエンジン:Google Cloud Speech-to-Text(Googleと表記)、Microsoft Azure Speech to Text(Azureと表記)、AmiVoice Cloud Platform(AmiVoiceと表記)
  • 3つの有力AIエンジンによる文字起こし結果の一部を確認・比較できる。
  • 課金が発生する全文文字起こしは、AIエンジンの対応状況(文字起こしの精度や、そもそも変換処理ができているか等)を確認した上で、求める精度に近いAIエンジンを選んで処理を依頼(購入)できる。
【安全安心:セキュアなデータの取り扱いとプライバシー保護】
AIエンジン側にログは一切残らず、またAI文字起こしサーバー上でも31日間経過後に情報を完全消去することでセキュリティを担保している。ユーザーが「ファイル及び結果テキストを消去する」ボタンを使用して情報を即時消去することも可能だ。


処理結果ページにある「ファイル及び結果テキストを消去する」ボタン


処理結果ページの閲覧には、ワンタイムパスワードの入力が必須となる。メールアドレスを入力してワンタイムパスワードを発行した後は、そのページを閉じないように注意(閉じてしまうとセッション切れで再度ワンタイムパスワードの発行からやり直すことになる)。

  • AIエンジン:採用AI全てにおいてログをサーバー上に保存しない設定で運用
  • AI文字起こしサーバー:情報は31日間保持した後に完全消去
  • 名前や住所等の個人情報の登録は一切不要(必要なのはメールアドレスのみ)
  • 結果の確認にはワンタイムパスワードを使用することでセキュリティを強化
【利用料金:必要なときに必要なだけ。リーズナブルな料金体系】
料金は従量課金制で、全文文字起こしを依頼(購入)した場合にのみ発生する。いつでも必要なときに必要なだけ利用可能だ。

  • 初期費用・月額利用料なし
  • 全文文字起こしの利用料金は、音源1分あたり30円(税別)の従量課金制※
  • 24時間365日、いつでも利用可能(不定期に行うメンテナンス期間を除く)


※[全文文字起こしの利用料金について、補足]音声の分数は1分単位に切り上げとなり、例えば1秒~59秒までの音声は全て1分の課金、60秒(1分00秒)~119秒(1分59秒)までの音声は全て2分の課金、……になる。また、最低利用料金は100円からとなるため、100円未満は100円(税別)に切り上げられて請求される。

【高速処理:短納期で結果を取得】

  • 短納期(依頼する音声時間と同程度の時間)で文字起こし結果を取得できる。
【サポート:音声/動画ファイル、全9言語の文字起こしに対応】

  • 音声ファイル/動画ファイルからの文字起こしに対応
  • 日本語/英語/中国語など、9カ国語の音声の文字起こしに対応
AIエンジンの文字起こし対応状況(2020年11月10日現在)
Google Azure AmiVoice
音声ファイル wav/mp3/m4a/ogg形式に対応
(200MB以内/120分以内)
動画ファイル mp4形式に対応
(1GB以内/120分以内)
改行・句読点付与 ×
タイムコード付与 × ×
タイムコード付きでダウンロード × ×
テキスト形式でダウンロード
対応言語※ 日本語を含む9言語 日本語のみ

※日本語/英語/中国語/スペイン語/フランス語/韓国語/イタリア語/ドイツ語/ロシア語。ただし複数言語が混在した音声の文字起こしには対応しておらず、全ての処理は指定した1つの言語のみで行われる。また、音声(実際の言語)と指定した言語が一致しない場合は正しく音声認識できないので注意。


AmiVoiceでの文字起こしを選択した場合のみ、タイムコード付きの結果表示もある。また、「タイムコード付きでダウンロードする」ボタンよりタイムコード付きの結果(Excelファイル形式)もダウンロード可能だ。

「AI文字起こし」基本情報(2020年11月10日現在)

【サービス名】AI文字起こし 【採用AIエンジン(音声認識API)】Google Cloud Speech-to-Text、Microsoft Azure Speech to Text、AmiVoice Cloud Platform 【音声認識】クラウド型 【開発・運営元】株式会社東京アーカイブセンター 【推奨ブラウザ】Chrome/Firefox(Windows/iOS/Androidに対応)【サイトURL】https://ai-ninshiki.jp/

  • 2018年リリースのオープンベータ版を経て2020年9月1日に正式リリース。
  • 株式会社東京アーカイブセンターは、テープ起こしの専門会社である東京反訳株式会社のグループ会社です。

「AI文字起こし」プライバシーポリシー
「AI文字起こし」利用規約
株式会社東京アーカイブセンター
テープ起こし・文字起こし・書き起こしのリーディングカンパニー 東京反訳株式会社

文字起こし結果に誤変換が多いときは。

先述したが、現状ではまだどのサービスでも高精度で起こせるかどうかは音質(録音の状態)の良し悪しに左右されてしまう。文字変換結果に精度を求めるなら、できるだけ音声認識に適した音声となるよう録音の仕方などにもこだわりたいところだ。

【参考】録音音声の自動文字化をできるだけ高精度で行うために、知っておきたいポイント(2019.05.14)

また、音声認識を使えば音声を楽に文字化はできるが、やはりどうしても修正はつきものだ。録音の状態が悪く誤変換がかなり多い場合は、信頼できるプロに修正をお願いするのも一つの手だろう。中でもテープ起こしを専門としている会社であれば、文字起こしテキストの修正・校正(もちろん「ケバ付き」や「整文」といった起こし方の指定等)にもしっかりと対応可能だ。

[PR]テープ起こし・文字起こしは東京反訳 | セキュリティ重視・ISMS取得
音声認識結果データの校正いたします

文字起こし、書き起こし会社、業者なら東京反訳(はんやく)。セキュリティ重視で、ISMS・プライバシーマーク・ISO9001取得済。上場企業、官公庁、大学さまなどから138,707件のご依頼実績がございます。科研費対応。即日翌日納品対応しております。お気軽にご相談ください。
【公式サイト】https://8089.co.jp/