おまけ:P2Pによる学術論文流通について


2005年の年末頃に書いた文章。ちょっと関係ありそうなので再掲してみる。初出は秘密。
関連した本館の記事はこちら。日付をみるに,アイディア自体はそっちの方が古いみたい。
どうでもいいけど,このネタも土屋先生の講演聞いたあとに考えたんだっけ。内容とあんまり関係ないけど。

図書館総合展で考えたこと。


WINNY 的なP2Pネットワークを使って,学術論文を流通させる,
とかってイケてないかな,ということをちょっと考え中。


要するに「何々関係の論文を集めたい」と思ったら,
キーワードを登録しておくことで,自動的に論文が収集されるような仕組み。
論文書く人は本文と最小限のメタデータを専用ソフトで変換して公開フォルダにおけば,
自動的にデータが世界中に送付される。ホームページやリポジトリすら不要。


なお,あくまで論文単位であって,雑誌単位ではない。
むしろ「雑誌」の名は,査読によって品質を保証するための一種のメタデータになる。
ある学会で査読を経たことを示すような,特殊なメタデータを付与するなどで対応可能。
また,FreeNetと違い,あえて匿名性を排除することで,著作権違反などを探索可能にして,
また本文を暗号化することで,商業的な利用も可能にする(復号キーのみ,有償で配布すればよい)。

これなら,従来の学会の研究プロセスをほとんど崩さず,
学術情報発表のためのコストをかなり削減でき,
また,電子的な学術情報の保存の問題(電子情報はパっと消える)も分散共有でクリア。
興味のある論文がバリバリ検索できるわ(もう文献データベースなんて不要),
持ってない論文もキーワード登録ですぐ集まるわ(SDIやRSSなんて目じゃないゼ),
似たような研究をしている人同士が簡単にクラスタ化するわ(WINNYなんかにある機能)
けっこういい感じ。


言うなれば,すべての研究者の端末(特別なサーバは不要)が,
同時に出版社であり,書店であり,図書館であり,というようなモデル。


たぶん,技術的な最大のネックは,データの同一性保持と不正操作の探索可能性のあたり。
勝手に論文の中身を改変されちゃ話になりませんから。
ただ,この点さえ解決できるようなフォーマットが実現できれば,あとは
(技術・運用的には)ほとんど問題がないように思える。


まぁ,頭の固い先生方と,P2P技術に対して不信をもつ人々が抵抗しそうではありますが,
わりとイケてそうな。


当時イメージしてたのとしては,WINNYでハッシュデータをやりとりするように論文単位のメタデータP2Pで流通させ,またメタデータ自体は改変・再放流可能なフォーマット(たぶんXML)にする。論文そのものはメタデータ上のリンクからダウンロードするとか,Bittorrentみたいな感じで落とすとか。
キーワードや関連文献を指定してプログラムを起動させておくと,自動的によさげな論文が集まってくる。論文を読んだら新しいタグ(件名)なり感想なり関連ありそうな論文の紹介なりをメタデータに加えて再放流させていくと,ソーシャルな力で論文の評価や関連づけができ,また人気のある論文ほど詳しい情報が集まってくる,というモデル。有力な研究者のチェックを経た論文なら査読と同等の価値が認められるということで,従来の査読システムに変わる役割ができんものか,とか考えてた。


まあ当時ははてなブックマークをやっていなかったので,いま考えるとP2Pであることについての弊害(なんだかんだいって,反映が遅いので)もあるかもな,とか思わなくもなかったり。
プログラム勉強して実装するところまで考えてたけれど,ろくに作り出さないまんま完全に忘れてました(ぁ 『WINNYの技術』も読み終わってないしなあ。


そういえば「貸し本棚」のブクマで読み終えた本の交換を「P2Pでスキャン画像を流す」のと似てると言ってくれた方がいましたが,それを言ったら図書館間の相互協力*1なんてP2Pのファイル共有と大差ないんですよ。要望に応じて自分のところでもってる本をコピーして希望者に郵送する,と。
システムの効率性,利用される本の種類,著作権を遵守する仲介者(司書)の存在,といった要素を除くと,WinMXあたりでやってる作業*2と図書館の相互協力業務(特に文献複写)はよく似ています。
なら,それを推し進めて,著作権的に問題のないシステムに出来るなら,P2Pで学術論文のやり取りをするのがいいんじゃね? ってのが上記のアイディアの発端。


これも実装する気がなくなってきたので,どっちかというとアイディアの放り投げで「disるもパクるもどうぞ」って感じなんですが,多分先行研究とかあるんだろうなあ。

*1:id:myrmecoleon:20070104:1167922683

*2:MXは希望出して拾う方式なのに対し,NYはほっとくと集まる方式なのでMX寄り。さらにいうなら,Napsterのような第一世代型P2Pが一番似てる。文献の検索はNIIのサーバ上のデータでやりますので