文字起こし・テープ起こし用語集

ELANいーらん

ELANとは、音声や動画データに対して注釈(アノテーション)を付与し、多層的に分析・記述するための無料のソフトウェアです。オランダのマックス・プランク心理言語学研究所によって開発され、研究現場におけるコーパス構築や、教育・医療分野における行動分析など、さまざまな用途で活用されています。

ELANは、音声言語やマルチモーダルデータ(発話、動作、ジェスチャーなど)の詳細な分析に適しており、言語学や社会学、心理学、教育、行動観察など幅広い分野で活用されています。

最も特徴的なのは、録音・録画したデータの任意の時間区間に注釈を付け、それらを「注釈層(Tier)」という多層構造で管理できる点です。例えば、発話者別の発言内容を文字起こしとして記録し、その他に動作や翻訳、タグ付けなどの情報を注釈層ごとに分けて管理することで、複数の視点からの分析が可能になります。
こうした注釈はミリ秒単位で付与することができ、特定の区間だけを繰り返し再生したり、注釈内容を一覧表示・検索することもできます。また、注釈データはCSVファイルなど他形式へのエクスポートも可能であるため、ELANで作成したデータを別の音声分析ソフトでより詳細に解析するという使い方もできます。

東京反訳は、ELANを用いたデータ整備・記述作業の代行を行っております

東京反訳は、人力による文字起こしに特化した代行サービス会社です。AIでは難しい曖昧な発話や、話者の切り替えにも対応できる体制を整えており、熟練した作業者による高品質なデータ作成が可能です。

また、ELANの運用経験を有するスタッフによる、アノテーション作業のアウトソーシングにも対応しております。例えばELANファイル上に直接発話内容を入力する、ミリ秒単位のタイムコードを付けるといった、実務的な用途を想定した柔軟なデータ整備にも対応しています。

さらに、研究目的に応じた初期段階からの仕様整理や注釈ルールの設計もご相談いただけます。もちろん、タイムコード付き文字起こしのみのご依頼や、タグ付けを除いた工程のご相談など、必要な範囲に絞ったご依頼も可能です。

会話分析や質的研究、機械学習用の教師データ整備においてリソースや技術面でお困りの際は、研究機関・法人を問わず、どうぞお気軽にご相談ください。