今回は音声認識を使って起こしたテキストなどを整形/分析/活用したいというときに役立ちそうな、無料で使えるツールを紹介する。
【目次】
文章に読点を自動で挿入 読点「、」挿入システムβ
株式会社ユーザーローカルが提供する無料AIツール User Local AIテキストマイニング/User Local自動要約ツール
株式会社図研プリサイトが提供するスペシャルコンテンツ ナレッジラボ
テキストから筆者の性格を診断 IBM Watson – Personality Insights
「文章の読みやすさ」のレベルを確認できるツール 帯3 – 日本語テキストの難易度を測る
最後に
読点「、」挿入システムβ
文章に読点を自動で挿入してくれるツール。操作はとても簡単で、テキストエリアに処理したいテキストを入力し、「予測」ボタンを押すだけだ。
使い道の例を挙げると、句読点と改行の自動挿入に対応していない音声認識サービスやアプリ等を使って音声の自動文字起こしを行った場合、認識結果のテキストは句読点や改行が一つもない全文がつながった文章になってしまう。
句読点や改行が全くない文章は、内容は高精度で起こせていても非常に読みづらいものだが、そのときはこのツールを使って読点を挿入すると、ぐっと読みやすくなるのでおすすめだ。
なお、句点と改行については、除去するツールはあるのだが、自動で挿入してくれるツールは今のところ見つけられていない。
≫ 読点「、」挿入システムβ
User Local AIテキストマイニング/User Local自動要約ツール
テキストマイニングは、大量のテキストデータを定量的・定性的に分析・可視化するための技術。データをグラフや表などの視覚的に分かりやすい状態にすることで、新たな気付きを得られる可能性が高まる。
「User Local AIテキストマイニング」では、入力あるいはアップロードされたテキストを解析して、ワードクラウド、単語出現頻度、共起キーワード、2次元マップなどを作成可能だ。
アマゾンや楽天市場のレビューなどといった特定形式のテキストも、グローバルメニューにある前処理ツールを使えば、テキストマイニングに適した形式に整形した上で処理できるので便利。
また「User Local自動要約ツール」では、入力あるいはアップロードしたテキストの要約を自動で作成できる。AIがテキスト(10,000文字まで対応)を解析し、3種類のハイライトモードで文章の重要な部分を確認できるハイライト表示と、3行/5行/10行のダイジェストでまとめてくれる。
ナレッジラボ
ナレッジラボでは、Knowledge Explorer※に実装済み、または実装に向けて開発中の要素技術を体験できる。「①要約文の自動作成」では、Knowledge Explorerに実装しているAI技術と独自の重要度評価アルゴリズムによる、要約文の自動作成が行える。
また、「②共起ネットワーク&ワードクラウド作成」では、入力したテキストデータの可視化が可能。テキストから抽出した重要語句の関連性を共起関係のネットワーク図とワードクラウドで確認できる。
※Knowledge Explorer:株式会社図研プリサイトが現在販売しているAI実装フルオート型ナレッジ活用ソリューション
※ナレッジラボでは「③重要語句の抽出&キーワード分布グラフ作成」機能も会員限定で公開中(サイトから会員登録可能)
≫ ナレッジラボ
IBM Watson – Personality Insights
IBM Watsonサービスの一つで、テキストから筆者の性格を診断してくれるAIツール。言語学的分析とパーソナリティ理論を応用し、テキストデータからその筆者の特徴を推測する。診断はTwitter連携かテキストを入力するだけで可能で、結果はテキストベースとサンバーストチャートで提供される。なかなか当たっていると評判だ。
≫ IBM Watson – Personality Insights
帯3 – 日本語テキストの難易度を測る
入力した日本語テキストの難易度―「文章の読みやすさ」のレベル―を確認できるツール。難易度スケールは、B9、T13という2つの異なる指標をサポートしている。操作は、測定したいテキストを入力し、難易度スケールを選択して「難易度を測定」ボタンをクリックするだけでOK。文章を書く際の一つの指標として参考にするとよさそうだ。
【難易度スケール(使用する規準コーパスの違いのみで推定方法は同一)】
- B9<均衡コーパスに基づく9段階相対評価>一般用: テキストを「とてもやさしい、やさしい、かなりやさしめ、やややさしめ、ふつう、ややむずかしめ、かなりむずかしめ、むずかしい、とてもむずかしい」の9段階で評価し、当てはまるレベルを表示する。
- T13<13段階の学年区分>教育用途用: テキストを「小学1年~高校3年、大学・一般」までの13段階で評価し、当てはまるレベルを表示する。
これらのツールは気軽に利用できて便利だが、無料で提供されていることもあり、あくまでも補助ツール、支援ツールとしての位置付けでうまく使っていくといいだろう。
また、ここで紹介したツールに限ったことではないが、このような無料ツールを利用する際は、必ず利用規約を確認した上で利用してほしい。特に個人情報や機密情報が含まれる文書での利用には注意したいところだ。