テープ起こし・文字起こし用語集

あ行

相づちあいづち

複数の人が参加しているインタビューや対談、シンポジウムなどの発言の中の「はい」「うん」「へえ」「ええ」など、相手の話に調子を合わせた短い発語のことを指します。テープ起こし・文字起こしでは、特に意味をなさない「ケバ」として処理されることがほとんどです。

もっと詳しく

アノテーションあのてーしょん

アノテーションとは、音声や画像、映像データ、テキストなど、あらゆるデータにタグを付ける作業のことです。AIは、このようなタグ付けされたデータを取り込むことで、パターンを認識・学習することができます。

もっと詳しく

音声認識(音声入力)おんせいにんしき(おんせいにゅうりょく)

音声認識とは、人間の声などをコンピューターに認識させ、自動でテキスト化することや、音声の特徴を捉えて発言者を特定する機能のことを指します。

もっと詳しく

か行

外来語がいらいご

他の言語から借用され、社会的に使用が承認された言葉のことを指します。
「洋語」とも呼ばれており、有名な例として「たばこ」「ガラス」「カステラ」などがあります。日本語の場合、中国経由で入ってきた「漢語」は外来語から除外されます。

もっと詳しく

聞き取り不能ききとりふのう

発言者の話し方や録音環境などによって、文字起こし作業者がどうしても内容が聞き取れない部分のことです。
テープ起こし・文字起こし業者の仕様にもよりますが、単語などの短い場合は●(くろまる)、文章のように長い場合は<聞き取り不能>などで表されます。

もっと詳しく

●(くろまる)くろまる

テープ起こし・文字起こし作業において、単語や短い文章が聞き取れない場合に使用します。
話者の話し方や録音状態によって、文字起こし作業者がどうしても言葉が聞き取れない場合、単語や短い文章の場合は●(くろまる)、長い文章単位で聞き取れない場合は<聞き取り不能>などと記します。

もっと詳しく

〓(ゲタ)げた

テープ起こし・文字起こし原稿を作成する際、音としては聞き取れても漢字やスペルなどを確定できない単語や文章がある場合は、その部分を〓(ゲタ)と呼ばれる記号で囲みます。

もっと詳しく

ケバけば

日常会話やインタビューなど、人間の普段の会話中には、「あのー」、「えー」、「えーと」、「うーん」など、それ自体では意味をなさない短い言葉が数多く含まれています。テープ起こし・文字起こしの世界では、これらの言葉を「ケバ」と呼んでいます。

もっと詳しく

ケバ付き素起こし・ケバ取り素起こしけばつきすおこし・けばとりすおこし

「ケバ付き素起こし」とは、テープ起こし・文字起こしの際、作業者の耳に聞こえたまま、「あのー」「えー」などのそれ自体では意味をなさないケバと呼ばれる言葉もそのまま書き起こした原稿を作成することです。
「ケバ取り素起こし」とは、ケバは書き起こさないで原稿を作成することです。

もっと詳しく

校正こうせい

印刷物などの文字や内容、体裁などを原稿と照合し正すことを指します。テープ起こし・文字起こしの場合の校正は、原稿の誤字だけでなく聞き間違いなどもしっかりチェックします。

もっと詳しく

さ行

常用漢字じょうようかんじ

常用漢字とは「一般の社会生活において使用する漢字の目安」(『広辞苑』より)となる漢字を指します。現在使用されている常用漢字は平成22年内閣告示の「常用漢字表」で定められた2,136字です。

もっと詳しく

整文せいぶん

「整文」とは、テープ起こし・文字起こし作業者がインタビューや会議などの音声データや動画データを聞こえたまま書き起こすのではなく、語尾や文中の表現、倒置の修正などを行い、文章を整えて文字起こし原稿を作成する仕様のことです。「修文」と呼ぶ場合もあります。

もっと詳しく

速記そっき

速記とは、演説、会議、インタビューなどの場に同席し、速記文字といわれる記号・符号を使うことによって発言を素早く記録し、それを基に文字起こし原稿を作成することです。

もっと詳しく

た行

タイムコード・タイムスタンプたいむこーど・たいむすたんぷ

「タイムコード」「タイムスタンプ」は、テープ起こし・文字起こし業界においては、音声データや動画データをテキスト化する際に1分ごと、5分ごと、10分ごとなど決まった間隔ごとに時間情報を記載することを指します。

もっと詳しく

逐語記録ちくごきろく

「逐語」には、一語一語、すべての言葉を逐一、などという意味があります。ですから「逐語記録」とは一字一句漏らさず記録していくことです。音声を聞きながら全ての言葉を起こしていくテープ起こし・文字起こしという作業自体も、広い意味での逐語記録です。

もっと詳しく

テープ起こしてーぷおこし

テープ起こしとは、録音または録画されたスピーチや会話などの音声を文字に書き起こす作業のことを指します。この名称は記録メディアにカセットテープを使用していた頃の名残です。テープ起こしのほかに、文字起こし、書き起こし、反訳、ボイスリライトなど、さまざまな言い方で呼ばれています。

もっと詳しく

である調であるちょう

テープ起こし・文字起こしの作業では、発言者の語尾を統一して原稿を作成します。統一する方法には「ですます調」と「である調」があります。文字起こしを業者に依頼する場合には、原稿の用途に応じて適切な語尾を選択することができます。「である調」の場合は、語尾が「~である」「~といえる」など、簡潔な表現になります。

もっと詳しく

ですます調ですますちょう

「ですます調」は語尾が「〜です」「〜となります」など、丁寧で柔らかい文章になり提案書や説明文、または人物像に焦点を合わせたインタビューなどに向いています。一方「である調」の語尾は「~である」「~といえる」などを使うので、議事録や報告書などに適した文章になります。

もっと詳しく

てにをはてにをは

「てにをは」とは、日本語の品詞の一つである助詞を指す言葉です。これは日本語独特の表現で「てにをは」を変えるだけで文章の意味が異なってしまうので、文章を作成する際は正しく使う必要があります。

もっと詳しく

同音異義語どうおんいぎご

日本語には「同音異義語」といわれる、耳で聞いたときの発音は同じでも意味が異なる言葉が数多く存在します。日本語は音の数が少ないため同音異義語が多いといわれ、テープ起こし・文字起こしをする際には注意が必要です。

もっと詳しく

倒置表現とうちひょうげん

倒置とは、文章作成においてある言葉の意味を強調する効果を狙って、言葉の順番を変更することです。テープ起こし・文字起こしの際には、読みやすさのために敢えて倒置表現を通常の語順に戻して原稿を作成する場合もあります。

もっと詳しく

は行

反訳はんやく

従来は速記文字や速記記号といった速記の際に使われる特殊な符号を、言葉や文字に戻すことを指していました。ICレコーダーなど録音機器が普及した現在では、主に講演やインタビューなどの録音データを文字起こしすることを指すようになりました。

もっと詳しく

表記ゆれひょうきゆれ

表記ゆれとは、ある単語が、同じ原稿内に2通り以上の異なる表記をされていることです。表記ゆれが散見される原稿は完成度が低く読みにくいので、原稿作成や校正の段階で書き方をきちんと統一することが必要です。

もっと詳しく

や行

要約ようやく

要約とは、文章の要点を短い文にまとめたものです。サマリー(summary)ともいいます。テープ起こし・文字起こしでの要約は、発言で重要な意味を持つ箇所や要点をピックアップして、簡潔に分かりやすくまとめます。

もっと詳しく

わ行

話者立て(発言者の特定)わしゃだて(はつげんしゃのとくてい)

テープ起こし・文字起こし原稿作成の際には、音声を書き起こすと同時に、誰が発言したかということも特定する必要があります。「話者」とは発言した人間を指し、発言者を特定して原稿に記載することを「話者立て」と呼んでいます。

もっと詳しく

話者メモわしゃめも

発言者の多い会議やシンポジウムなどで、発言者の特定に役立つような情報をあらかじめ現場で記録しておき、テープ起こし・文字起こし作業の際に活用するメモ書きのことを当社では「話者メモ」と呼んでいます。

もっと詳しく