ブックリスト演算 続・類書の探し方まとめ


このまえの類書の探し方の件で,masui氏からコメントをいただく*1。で,ご紹介いただいた本棚演算をみる。


要するに,本のリストをISBNの配列に変換して足したり引いたりするという考え方ですね。和をとれば関連する本のリストやその中の人気度をとれるし,差分をとれば「持ってるべきなのに持ってない」(=推薦されるべき)リストが取得できると。
非常に面白い。Ruby未導入で試せないのが残念。


で,このプログラム自体は本棚.orgの中身(のdumpかな?)を使って本棚間の演算を対象にしているけれど,原理的にはISBNのリストを扱ってるだけなので,記述としては非常にニュートラル。たとえばその対象がブクログであるとか,はてブのコレクションであるとか,Amazonリストマニアであるとか,一定量のISBNのリストさえ得られれば何でもかまわない。
さらにいえば,差分をとる対象は,同著者の本のリストでも,あるタイトルの分冊(上下巻・シリーズ等)でも,XISBNで得られる翻訳版でも,あるいは Webcat Plus の連想検索結果やAmazonのおすすめでもかまわない。だから,たとえば

みたいなクラスタリングも同じ原理でできるはず*3
まぁ,毎回該当のWebページ等からリストを拾ってくるとけっこうめんどいが,ある程度キャッシュする機構にすればどうにかなりそう。和についてはそれこそまとめてMySQLあたりのデータベースにつっこんで,group by で count とるとかすればいけるかも。


いまのところアイディアだけ。ただ実装のイメージというか流れは思いついたので,4月中にはテスト版が作れるかも。


ところで,本棚.orgのISBNから表示・検索等できない仕様はどうにかならんのでしょうかorz 絶対中身ではISBN(またはASIN)で管理してるはずで,/{持ってるユーザー名}/{isbn}.html とやれば共通の内容が出るのに,持ってるユーザーが特定できないと探せない罠。
まあ,(ごく最近の登録は別として)Googleあたりでsite:かけて検索すれば引っ掛かるから問題ないのかな? もしくは登録本すべてをもってるスーパーユーザーとかがいれば……ってそっちのがめんどいか。

*1:最初,通りすがりさんのたれこみだと思って油断してました; 本棚.orgPOBoxの増井氏ですね

*2:以下,数は適当。

*3:分冊のISBNリストはnatu_nさんの例のように Webcat plus から,同著者のリストはAmazonからそれぞれとれる