なんだかテキストマイニングが流行ってるのかな
来月上旬締め切りの原稿を書くため資料をあさっているのですが、最近の情報教育関係の論文や学会発表のタイトルを見ていると、ここ数年「テキストマイニング」の言葉をよく見かけます。気のせいかもしれませんが。
ただ、某四国の会社のシステムとか便利なツールが増えてきたようで、テキストマイニングの技術を使ったアンケートなどのテキスト分析がやりやすい環境が整備されつつあるようですね。
- 出版社/メーカー: ジャストシステム
- 発売日: 2007/02/16
- メディア: CD-ROM
- この商品を含むブログ (1件) を見る
まぁ、あまり凝ったことをしなければ、形態素解析ツールもフリーでありますし、分析ツールもPerlやRubyなどのスクリプト言語を使ったり、Rみたいなフリーな統計ツールを使ってもできるでしょう。Excelでもいいし。そういう意味ではいい時代なのかもしれませんが、それらのツールを使いこなすだけの基礎的な知識はもちろん、ツールを使いこなせるだけの統計や分析に関する知識がある程度必要となるんじゃないかと思っています。
- 作者: 林俊克
- 出版社/メーカー: オーム社
- 発売日: 2002/10/01
- メディア: 単行本
- 購入: 3人 クリック: 42回
- この商品を含むブログ (10件) を見る
- 作者: 石田基広
- 出版社/メーカー: 森北出版
- 発売日: 2008/12/16
- メディア: 単行本(ソフトカバー)
- 購入: 26人 クリック: 342回
- この商品を含むブログ (34件) を見る
フリーといえば、有名なソフトがあったのを思い出しました。「KH Coder」です。科研費(科学研究費補助金)による成果の一部です。科研費の成果をこういう形で還元をしてくださるのは、大変すばらしいです。
KH Coderとは、内容分析(計量テキスト分析)もしくはテキストマイニングのためのフリーソフトウェアです。新聞記事、質問紙調査における自由回答項目、インタビュー記録など、社会調査によって得られる様々な日本語テキスト型データを計量的に分析するために製作されました。
KH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェア
一応、下のような本も持っていたりして、勉強したりしていますがなかなか時間がとれなくって読み進められていません(汗)この本でもフリーの形態素解析ツールの「茶筅」が紹介されています。「WordMiner」というソフトを使った分析の事例も紹介されています。結構いい本だと思います。
- 作者: 藤井美和,李政元,小杉考司
- 出版社/メーカー: 中央法規出版
- 発売日: 2005/07
- メディア: 単行本
- 購入: 1人 クリック: 19回
- この商品を含むブログ (12件) を見る