ソリューション例
ご依頼内容の一例です。
貴社の研究・開発ニーズに合わせたソリューションに対応いたします。お気軽にご相談ください。
ELAN、Praat、Aegisubなどのソフト用発話セグメント形式の書き起こしも承ります。
作業内容:1発話に対して始端から終端の細かなタイムスタンプを挿入した区間区切り作業(発話セグメント作成)など
音声認識エンジン、機械学習のためのAI学習用データ作成や、
アノテーション作業(タグ付け)、教師データの作成を代行します。
AI音声認識の開発・活用企業さま、研究者さま向けのサービスです。
研究効率を上げる高品質なテキストデータを生成するため、独自の試験に合格した国内約750名の作業者が対応します。データの用途をお伺いし、予算・納期に合わせた最適な仕様をご提案いたします。
主な用途:音声認識用のアノテーション(タグ付け)データ・教師データ・機械学習用データ作成、テキストコーパス作成など
オンラインでのお打合せを承ります。
お打合せが必要な場合には、WEB会議・テレビ会議にても承りますので、お気軽にお申しつけください。
プロジェクトを遂行する専門担当者が対応いたします。
プロジェクト開始にあたり、経験豊富な専任担当者がお客様のご利用目的や起こし方などをヒアリングいたします。
その上でご予算、ご希望納期を担保する最適な仕様を策定いたします。
ファイル形式、起こし方、タグ付け方法、タイムコードの挿入など、さまざまな仕様に柔軟に対応いたします。
また、当社の独自テストに合格した国内約750名の文字起こしワーカーから、案件仕様に最適な人員をアサインします。
作業者用動画マニュアルの作成、検品用チェックツールの作成なども仕様に合わせて独自に行います。
人、IT両面からのチェックにて品質管理を行い、高品質なデータを作成します。
ご依頼内容の一例です。
貴社の研究・開発ニーズに合わせたソリューションに対応いたします。お気軽にご相談ください。
ELAN、Praat、Aegisubなどのソフト用発話セグメント形式の書き起こしも承ります。
作業内容:1発話に対して始端から終端の細かなタイムスタンプを挿入した区間区切り作業(発話セグメント作成)など
カスタマーセンターの会話音声(日本語)を、
下記の日本語話し言葉コーパスのタグを付与しながら書き起こす。
(F): フィラー/感動詞
(D): 語断片
(?): 聞取りや語彙の判断ができない場合
オ:オペレーター
カ:カスタマー
オ:お電話ありがとうございます。
カ:(F えー)御社の○○○を使っています。
カ:(F そんで)(F あのー)録画しようとしたんですが、(F あの)ボタンを押しても、いかないんです。(F えーと)スイッチが全然利かない。
オ:ええ。
カ:選択肢の中に字はあるんだけど、矢印でやっても、できないんです。
カ:(F ま)言ってる間に、もう(F あの)録画始まってしまってるので。録画が始まるとできないのは分かっているので、(F あのー)始まったらスタートメニューのうち、(F えー)ダビングとかハードディスク、ディスクの管理はもう真っ白になってしまうので、(D 前)その前のときでもできなかった。(F で)2枚ほど試したんですができないので、どうなってるのかなと思って。
1. 音声認識システムにて書き起こされた内容をエクセルに書き出し。
2. 同音声を再度システム上で再生しながら、誤認識の校正を行う。
3. 校正箇所をリストアップ。
4. 同音声認識システムに登録されている現行辞書と比較し、辞書登録を行う。
※機械処理を行うには要件が複雑かつ頻度が少ない場合、人間系の処理を組み合わせてローコスト、短納期で作業を行うことが可能です。
音声認識結果データの校正いたします
以下仕様に従い音声の書き起こしを行う。
まずはお問い合わせフォームより概要をお知らせください。
AI学習用教師データ作成専門の担当者が、以下のような項目をヒアリングいたします。
お打合せを重ね、以下の項目を最終確認いたします。
作業者によるバラつきを防ぐため、作業用動画マニュアルなども作成し、仕様を周知徹底します。
仕様に合わせた独自作成の工程管理ツールや検品チェックツールを使い、納期と品質を担保いたします。
ELAN、EndNote、NVivoなどの各種ソフトウェアで分析するため、看護インタビューなどの文字起こしのご依頼をご検討されている方は、会話分析用テープ起こしサービスをご利用ください。
ご希望に合わせて柔軟に対応いたします。
自動チャットやメール、お電話にてご質問ください。