複数の人が参加しているインタビューや対談、シンポジウムなどの発言の中の「はい」「うん」「へえ」「ええ」など、相手の話に調子を合わせた短い発語のことを指します。テープ起こし・文字起こしでは、特に意味をなさない「ケバ」として処理されることがほとんどです。
もっと詳しくアノテーションとは、音声や画像、映像データ、テキストなど、あらゆるデータにタグを付ける作業のことです。AIは、このようなタグ付けされたデータを取り込むことで、パターンを認識・学習することができます。
もっと詳しく音声認識とは、人間の声などをコンピューターに認識させ、自動でテキスト化することや、音声の特徴を捉えて発言者を特定する機能のことを指します。
もっと詳しく他の言語から借用され、社会的に使用が承認された言葉のことを指します。
「洋語」とも呼ばれており、有名な例として「たばこ」「ガラス」「カステラ」などがあります。日本語の場合、中国経由で入ってきた「漢語」は外来語から除外されます。
発言者の話し方や録音環境などによって、文字起こし作業者がどうしても内容が聞き取れない部分のことです。
テープ起こし・文字起こし業者の仕様にもよりますが、単語などの短い場合は●(くろまる)、文章のように長い場合は<聞き取り不能>などで表されます。
テープ起こし・文字起こし作業において、単語や短い文章が聞き取れない場合に使用します。
話者の話し方や録音状態によって、文字起こし作業者がどうしても言葉が聞き取れない場合、単語や短い文章の場合は●(くろまる)、長い文章単位で聞き取れない場合は<聞き取り不能>などと記します。
日常会話やインタビューなど、人間の普段の会話中には、「あのー」、「えー」、「えーと」、「うーん」など、それ自体では意味をなさない短い言葉が数多く含まれています。テープ起こし・文字起こしの世界では、これらの言葉を「ケバ」と呼んでいます。
もっと詳しく「ケバ付き素起こし」とは、テープ起こし・文字起こしの際、作業者の耳に聞こえたまま、「あのー」「えー」などのそれ自体では意味をなさないケバと呼ばれる言葉もそのまま書き起こした原稿を作成することです。
「ケバ取り素起こし」とは、ケバは書き起こさないで原稿を作成することです。
常用漢字とは「一般の社会生活において使用する漢字の目安」(『広辞苑』より)となる漢字を指します。現在使用されている常用漢字は平成22年内閣告示の「常用漢字表」で定められた2,136字です。
もっと詳しく「整文」とは、テープ起こし・文字起こし作業者がインタビューや会議などの音声データや動画データを聞こえたまま書き起こすのではなく、語尾や文中の表現、倒置の修正などを行い、文章を整えて文字起こし原稿を作成する仕様のことです。「修文」と呼ぶ場合もあります。
もっと詳しく「タイムコード」「タイムスタンプ」は、テープ起こし・文字起こし業界においては、音声データや動画データをテキスト化する際に1分ごと、5分ごと、10分ごとなど決まった間隔ごとに時間情報を記載することを指します。
もっと詳しく「逐語」には、一語一語、すべての言葉を逐一、などという意味があります。ですから「逐語記録」とは一字一句漏らさず記録していくことです。音声を聞きながら全ての言葉を起こしていくテープ起こし・文字起こしという作業自体も、広い意味での逐語記録です。
もっと詳しくテープ起こしとは、録音または録画されたスピーチや会話などの音声を文字に書き起こす作業のことを指します。この名称は記録メディアにカセットテープを使用していた頃の名残です。テープ起こしのほかに、文字起こし、書き起こし、反訳、ボイスリライトなど、さまざまな言い方で呼ばれています。
もっと詳しくテープ起こし・文字起こしの作業では、発言者の語尾を統一して原稿を作成します。統一する方法には「ですます調」と「である調」があります。文字起こしを業者に依頼する場合には、原稿の用途に応じて適切な語尾を選択することができます。「である調」の場合は、語尾が「~である」「~といえる」など、簡潔な表現になります。
もっと詳しく「ですます調」は語尾が「〜です」「〜となります」など、丁寧で柔らかい文章になり提案書や説明文、または人物像に焦点を合わせたインタビューなどに向いています。一方「である調」の語尾は「~である」「~といえる」などを使うので、議事録や報告書などに適した文章になります。
もっと詳しく「てにをは」とは、日本語の品詞の一つである助詞を指す言葉です。これは日本語独特の表現で「てにをは」を変えるだけで文章の意味が異なってしまうので、文章を作成する際は正しく使う必要があります。
もっと詳しく日本語には「同音異義語」といわれる、耳で聞いたときの発音は同じでも意味が異なる言葉が数多く存在します。日本語は音の数が少ないため同音異義語が多いといわれ、テープ起こし・文字起こしをする際には注意が必要です。
もっと詳しく倒置とは、文章作成においてある言葉の意味を強調する効果を狙って、言葉の順番を変更することです。テープ起こし・文字起こしの際には、読みやすさのために敢えて倒置表現を通常の語順に戻して原稿を作成する場合もあります。
もっと詳しく従来は速記文字や速記記号といった速記の際に使われる特殊な符号を、言葉や文字に戻すことを指していました。ICレコーダーなど録音機器が普及した現在では、主に講演やインタビューなどの録音データを文字起こしすることを指すようになりました。
もっと詳しく表記ゆれとは、ある単語が、同じ原稿内に2通り以上の異なる表記をされていることです。表記ゆれが散見される原稿は完成度が低く読みにくいので、原稿作成や校正の段階で書き方をきちんと統一することが必要です。
もっと詳しく要約とは、文章の要点を短い文にまとめたものです。サマリー(summary)ともいいます。テープ起こし・文字起こしでの要約は、発言で重要な意味を持つ箇所や要点をピックアップして、簡潔に分かりやすくまとめます。
もっと詳しく