ブックリスト演算　続・類書の探し方まとめ - Myrmecoleon in Paradoxical Library. はてな新館

このまえの類書の探し方の件で，masui氏からコメントをいただく*1。で，ご紹介いただいた本棚演算をみる。

要するに，本のリストをISBNの配列に変換して足したり引いたりするという考え方ですね。和をとれば関連する本のリストやその中の人気度をとれるし，差分をとれば「持ってるべきなのに持ってない」（＝推薦されるべき）リストが取得できると。
非常に面白い。Ruby未導入で試せないのが残念。

で，このプログラム自体は本棚.orgの中身（のdumpかな？）を使って本棚間の演算を対象にしているけれど，原理的にはISBNのリストを扱ってるだけなので，記述としては非常にニュートラル。たとえばその対象がブクログであるとか，はてブのコレクションであるとか，Amazonのリストマニアであるとか，一定量のISBNのリストさえ得られれば何でもかまわない。
さらにいえば，差分をとる対象は，同著者の本のリストでも，あるタイトルの分冊（上下巻・シリーズ等）でも，XISBNで得られる翻訳版でも，あるいは Webcat Plus の連想検索結果やAmazonのおすすめでもかまわない。だから，たとえば

分冊(2)*2

別版(1)

同じ著者の本(15)

その他の関連タイトル(20)

Amazon のみの推薦(2)

Webcat Plus のみの推薦(25)

本棚.org のみの推薦(30)

ブクログのみの推薦(20)

はてブのみの推薦(10)

みたいなクラスタリングも同じ原理でできるはず*3。
まぁ，毎回該当のWebページ等からリストを拾ってくるとけっこうめんどいが，ある程度キャッシュする機構にすればどうにかなりそう。和についてはそれこそまとめてMySQLあたりのデータベースにつっこんで，group by で count とるとかすればいけるかも。

いまのところアイディアだけ。ただ実装のイメージというか流れは思いついたので，4月中にはテスト版が作れるかも。

ところで，本棚.orgのISBNから表示・検索等できない仕様はどうにかならんのでしょうかorz　絶対中身ではISBN（またはASIN）で管理してるはずで，/{持ってるユーザー名}/{isbn}.html とやれば共通の内容が出るのに，持ってるユーザーが特定できないと探せない罠。
まあ，（ごく最近の登録は別として）Googleあたりでsite:かけて検索すれば引っ掛かるから問題ないのかな？　もしくは登録本すべてをもってるスーパーユーザーとかがいれば……ってそっちのがめんどいか。

*1:最初，通りすがりさんのたれこみだと思って油断してました；　本棚.orgやPOBoxの増井氏ですね

*2:以下，数は適当。

*3:分冊のISBNリストはnatu_nさんの例のように Webcat plus から，同著者のリストはAmazonからそれぞれとれる