音声認識エンジン、機械学習のための[AI用学習データ作成]や、
[アノテーション作業]、[教師データの作成]を代行いたします。
業界最大級、国内約750名のワーカーを擁しています。
当社の品質基準で教育を行っており、大量の音声や急ぎのご依頼にも、品質とスピードを担保しながら対応できる体制を整えています。
全ての工程が国内作業となります。
お客さまの目的、用途に合わせたファイル形式、起こし方、タイムコードの挿入など、さまざまな仕様に対応いたします。
お客さまの利用目的、後工程を確認の上、ご要望の品質を担保する作業体制を構築いたします。
大量の案件も、当社国内750名のワーカーから適任者をアサインし、作業の仕組みにより安定した品質と納期を担保します。
最終成果物の仕様、要求品質水準、納期を確認の上、作業工程構築、作業人員アサインを行います。
作業フローは作業員により理解度のバラつきが出ないよう、作業用動画マニュアルや工程管理ツールなどを準備して作業を行います。
作業進捗を管理ツールにより把握しながら、アウトプットを複数人でチェックし、品質担保を行います。
ITツール、人間系、それぞれの特性を生かした検品で最終成果物の品質を高めます。
※ご要望に応じ、テストデータを事前に作成することも可能です。
カスタマーセンターの会話音声(日本語)を、
下記の日本語話し言葉コーパスのタグを付与しながら書き起こす。
(F): フィラー/感動詞
(D): 語断片
(?): 聞取りや語彙の判断ができない場合
オ:オペレーター
カ:カスタマー
オ:お電話ありがとうございます。
カ:(F えー)御社の○○○を使っています。
カ:(F そんで)(F あのー)録画しようとしたんですが、(F あの)ボタンを押しても、いかないんです。(F えーと)スイッチが全然利かない。
オ:ええ。
カ:選択肢の中に字はあるんだけど、矢印でやっても、できないんです。
カ:(F ま)言ってる間に、もう(F あの)録画始まってしまってるので。録画が始まるとできないのは分かっているので、(F あのー)始まったらスタートメニューのうち、(F えー)ダビングとかハードディスク、ディスクの管理はもう真っ白になってしまうので、(D 前)その前のときでもできなかった。(F で)2枚ほど試したんですができないので、どうなってるのかなと思って。
音声認識システムにて書き起こされた内容をエクセルに書き出し、再度、同音声を再度システム上で再生しながら、誤認識の校正を行う。
校正箇所をリストアップし、同音声認識システムに登録されている現行辞書と比較し、辞書登録を行う。
※機械処理を行うには要件が複雑かつ頻度が少ない場合、人間系の処理を組み合わせてローコスト、短納期で作業を行うことが可能です。
以下仕様に従い音声の書き起こしを行う。