一覧 最終更新 HOME ログイン

freedomcat.com

テキストマイニング

テキストマイニングとは

テキストマイニングとは何か. テキストマイニングとは、「文章の中に埋もれ. ている共通性や相関関係を発掘し、有用な知見を. 獲得する分析手法」のことを言う。

tool

sary は Suffix Array のライブラリとツールです。Suffix Array と呼ばれるデータ構造を用いることにより、 10MB, 100MB といっ た巨大なテキストファイルに対する高速な全文検索を実現します。特定の個所だけにインデックスポイントを割り当てることにより、 特定のフィールドのみを検索対象にすることもできます。

KH Coderとは、内容分析(計量テキスト分析)もしくはテキストマイニングのためのフリーソフトウェアです。新聞記事、質問紙調査における自由回答項目、インタビュー記録など、社会調査によって得られる様々な日本語テキスト型データを計量的に分析するために製作されました。