なんだかテキストマイニングが流行ってるのかな

来月上旬締め切りの原稿を書くため資料をあさっているのですが、最近の情報教育関係の論文や学会発表のタイトルを見ていると、ここ数年「テキストマイニング」の言葉をよく見かけます。気のせいかもしれませんが。
ただ、某四国の会社のシステムとか便利なツールが増えてきたようで、テキストマイニングの技術を使ったアンケートなどのテキスト分析がやりやすい環境が整備されつつあるようですね。

まぁ、あまり凝ったことをしなければ、形態素解析ツールもフリーでありますし、分析ツールもPerlRubyなどのスクリプト言語を使ったり、Rみたいなフリーな統計ツールを使ってもできるでしょう。Excelでもいいし。そういう意味ではいい時代なのかもしれませんが、それらのツールを使いこなすだけの基礎的な知識はもちろん、ツールを使いこなせるだけの統計や分析に関する知識がある程度必要となるんじゃないかと思っています。

Excelで学ぶテキストマイニング入門

Excelで学ぶテキストマイニング入門

Rによるテキストマイニング入門

Rによるテキストマイニング入門

フリーといえば、有名なソフトがあったのを思い出しました。「KH Coder」です。科研費(科学研究費補助金)による成果の一部です。科研費の成果をこういう形で還元をしてくださるのは、大変すばらしいです。

KH Coderとは、内容分析(計量テキスト分析)もしくはテキストマイニングのためのフリーソフトウェアです。新聞記事、質問紙調査における自由回答項目、インタビュー記録など、社会調査によって得られる様々な日本語テキスト型データを計量的に分析するために製作されました。

KH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェア

一応、下のような本も持っていたりして、勉強したりしていますがなかなか時間がとれなくって読み進められていません(汗)この本でもフリーの形態素解析ツールの「茶筅」が紹介されています。「WordMiner」というソフトを使った分析の事例も紹介されています。結構いい本だと思います。

福祉・心理・看護のテキストマイニング入門

福祉・心理・看護のテキストマイニング入門