現代日本語書き言葉均衡コーパスに採録?

taquai2009-08-20

東京がめっきり勝ってくれなくなっちゃったので、2007年11月以来の現代生活様式学会ニウスです(´Д`)
先日、こんなメールがきましたよ。

突然のメールで失礼いたします。私どもは独立行政法人国立国語研究所と申します。
現代生活様式学会様に著作物使用許諾に関して御相談したい件があり,御連絡さ
せていただいております。

なんでも、現代の書き言葉を分析するためのデータベースを構築するプロジェクトを国語研究所さんがやっていて、そのデータベースに生活学会の本の一部を使いたいとのことで。そのプロジェクトとはこちら
よくわかりませんが、現代日本語書き言葉均衡コーパス「KOTONOHA」というデータベースを作っていて、そこに生活学会のセカンド作である『新・生活様式学入門』の文章を採録させてね、ということでした。別に優れた作品と認められたわけではなく、無作為にサンプルを抽出したらひっかかった模様(´Д`) もちろん大歓迎の意を表明しました。
で、デモ画面というのがあって、それがこちら
ためしに、2005年に刊行された書籍で「ペニス」を検索してみたところ、

1 オルで身体を拭く。ベッドに腰掛け、自分の ペニス を眺める。包皮がむけあがったばかりの、ま 村上 春樹 1940 男 書籍/9 文学 海辺のカフカ 上巻 村上春樹|著 新潮社 2005

という結果が表示されました。つい「ペニス」を検索しちゃうところに自分の限界を見てしまった気もしますが、まあいいですわ。なんかよくわかりませんが、もしかしたらなにかの仕事に使えそうな気もしないでもないですよ〜。
しかし、このぐらいの利用でもいちいち一件ずつアドレスを調べてメール送ってしかも承諾書を郵送して判を押して返送してもらわないといけないなんて、大変な労力と金を要するよ。現在のデモ画面だけでも、一般の書籍から抽出したサンプル8821件について著作権者に承諾をとったものだという。。。このぐらいだったら、別に確認とらずにやったって誰も文句言わないと思うんだけど、少なくともおれは文句言いっこないんだけど、売れっ子のコピーライツホルダーさんの場合はまったく事情が違うんでしょうな。。。