AI学習用 文字起こし / 音声アノテーション代行

AI開発・ファインチューニングに欠かせない、高品質な教師データ作成をサポートします。
プロの文字起こし会社が独自のノウハウで、仕様に沿ったデータラベリングを行い、LLMの精度向上に貢献します。

Share
Share

AI音声認識の開発・活用企業さま、研究者さま向けのサービスです。

AI音声認識や自然言語処理の研究開発において、教師データ、音声アノテーションの質と量はモデルの精度を左右する重要な要素です。しかし、会話音声の書き起こしやタグ付け、タイムコード(タイムスタンプ)の挿入など、精緻なデータラベリングには多大な時間と労力が必要です。
東京反訳は、こうした課題を抱える研究者や開発者の皆様に向けて、高品質なコーパス作成を支援いたします。

仕様未定でもご相談いただけます。まずはお困りごとをお聞かせください。

東京反訳なら、これらの課題を解決できます

  1. 独自音声認識を開発をしているが、精度がなかなか上がらない
  2. 細かなタイムコード(タイムスタンプ)や話者分離など、開発用途に特化した書き起こし仕様に対応できる人材がいない
  3. LLMデータ作成のために大量の音声アノテーションが必要だが、リソースが足りない
  4. ファインチューニング音声に特化したデータセットを用意したいが、専門的な人材がいない
  5. セキュリティ要件が厳しく、外注に踏み切れない
  6. 専門業者と協業を模索しているが、信頼できる業者が見つからない

東京反訳の音声アノテーションサービスが提供する価値

1.フロー構築・作業者選定・スケジュール管理までを一括代行

フロー構築・作業者選定・スケジュール管理までを一括代行

お客様のご希望や目的に応じて、当社のプロジェクトリーダーが仕様設計から作業者の選定、チームの動線設計まで対応します。
ご要望に応じた表記ルールや書式、ラベル設計を反映しながら、プロジェクトごとに最適なフローを構築します。必要に応じて、チーム内への事前レクチャーやマニュアル展開も行い、一定の品質を担保する仕組みを整備。納品スケジュールを基にしたリソース配置・進行管理は徹底して行い、ご希望の納期を厳守します。

2.ご要望に沿った最適なチーム編成を実現

ご要望に沿った最適なチーム編成を実現

ご相談いただいた後は、当社プロジェクトリーダーが窓口となり、ご要望のヒアリングから体制構築まで一貫して対応します。
内容や難易度、目的に応じて、経験豊富な音声アノテーターを複数名選定し、プロジェクトに最適なチームを編成。アサイン後も、仕様の浸透や進行の調整を丁寧に行い、お客さまに安心してお任せいただける体制を整えます。チーム内の連携や情報共有もプロジェクトリーダーが主導し、スムーズな進行をサポート。
「要望を伝えるだけ」でスムーズに進む運用体制こそが、当社の強みの一つです。

3.ISMS・プライバシーマーク取得済の情報セキュリティ体制

ISMS・プライバシーマーク取得済の情報セキュリティ体制

当社ではISMS(ISO27001)およびプライバシーマークを取得しており、第三者認証に基づいた情報管理体制を整備しています。
人的・物理的・技術的セキュリティ対策を組み合わせ、データの取り扱いにおいて万全を期しています。
作業者はすべて秘密保持契約を締結済みで、必要に応じてセキュリティルームでの作業実施にも対応可能。
ご希望に応じてNDA(秘密保持契約)の締結や、データ削除証明書の発行も柔軟に対応いたします。

お預かりデータの取り扱いについて

当社は、お客さまよりお預かりした音声データ、テキストデータ、その他関連資料を、音声認識技術やAI等の機械学習のための学習データとして一切利用いたしません。
また、業務遂行に必要な範囲を超えて、第三者と共有・転用・再利用することもありません。
お客さまの情報資産は、プライバシーマーク(JIS Q 15001)およびISMS(ISO/IEC 27001)認証に基づき、厳格な管理体制のもとで運用されています。

ご希望の精度・納期・体制に応じたご提案が可能です。

導入実績

下記のページにて、当社プロジェクトリーダーがお客さまのご要望をお伺いし、社内体制を組み立て課題解決に至るまでの一連のプロセスをご紹介しております。

業種 案件内容 音声時間数 期間
電子機器メーカー AI自動通話対応システム用の学習用文字起こし 約30時間 約2週間
ITメーカー AI自動診断システム用の学習用文字起こし 約100時間 約4カ月
ITメーカー コールセンター向け言語処理エンジンの学習用文字起こし 約170時間 1年半
情報処理サービス コールセンター音声の文字起こしとアノテーション付与 約200時間 1年半
情報通信 音声・映像データの文字起こしとアノテーション付与 約10時間 1年

対応例

カテゴリ 対応内容 対応例
フォーマット対応 ご指定フォーマットでの入力
  • Excel、CSV、JSON、eafなどのファイル形式
  • ELAN、NVivo対応形式
  • その他ご指定フォーマットに対応
品質チェック 誤認識修正
  • 聞き取り間違い箇所の修正
  • 誤認識箇所の洗い出しと校正
文字表記の統一・整備 表記統一
  • 表記ゆれのチェック
  • 同音異義語の修正
  • カタカナ、アルファベット表記の統一
  • 数字表記と読み上げ方の統一
表記ルール
  • ご指定辞書での表記ルールに正規化
入力文字
  • 発言のカタカナ入力、ローマ字入力
構造整理 話者分け
  • 話者特定
  • 話者ごとのテキスト分割
  • 特定話者発言の抽出・文字起こし
  • 話者ラベルの付与
タイムコード(タイムスタンプ)付与
  • 発話開始・終了時に付与
  • 発話区間区切りのマージンに付与
  • 少数第三位まで特定
タグ付け
  • フィラー
  • 感動詞
  • 発言の重なり
  • 語断片 など
  • その他ご指定仕様に対応

料金

料金目安

基本文字起こし ¥450~/音声1分あたり

※音声の内容、量、納期、ご要望に応じて正式見積もりを作成いたします。
※別途プロジェクト管理費用を頂戴いたします。

納品までの流れ

お客様の業務負担を最小限に抑えつつ、ご要望には的確かつ柔軟に対応できるよう、ヒアリングから納品まで専任スタッフが一貫して対応いたします。

1お問い合わせ

お問い合わせフォームまたはお電話よりご連絡ください。
ご検討段階で仕様が未確定の場合でも、お気軽にご相談いただけます。

2ヒアリング・仕様調整

専任スタッフが、料金・納期・仕様・精度要件等について詳しくお伺いします。
納期や仕様が未定の場合でも、ヒアリングを通じて作業内容の策定やスケジュール案のご提案、概算見積の提示が可能です。

3お見積り・ご契約

お見積内容にご同意いただいた後、ご希望に応じて機密保持契約(NDA)や業務委託契約を締結し、正式な発注手続きへと進みます。
ご要望がございましたら、正式作業前にトライアル対応も承ります。

4作業開始・納品

合意した仕様に基づき、専任スタッフと実務チームにて作業を開始いたします。
品質管理体制のもと、期日通りにデータを納品いたします。

5ご入金

納品完了後、ご請求書を発行いたします。

5データ削除

全作業完了・ご入金確認後、データは当社ポリシーに基づき完全削除いたします。 ご要望がある場合には、削除完了報告書の発行も可能です。

  • 初期検討段階でのご相談も歓迎しております。
  • 仕様が未確定でも、ヒアリングを通じてご提案可能です。
  • 小ロットや試験的なご依頼にも対応いたします。
  • 研究費・助成金のご予算・スケジュールに沿ったご提案が可能です。
  • 業務提携、協業のご相談をお受けしております。

正式なご依頼前に、スケジュールや対応可否のご相談も承っております。

関連ページ

お気軽にご相談ください

ご希望に合わせて柔軟に対応いたします。
自動チャットやメール、お電話にてご質問ください。