グリモン初挑戦。


宮崎大学附属図書館の試みが図書館界隈でちょっと話題になっている。
宮崎大学附属図書館、OPACにJuNii+をマッシュアップしてリポジトリコンテンツをリコメンドする試み | カレントアウェアネス・ポータル


何をやってるかというのを業界外の人にもわかるように説明すると,

  • ある図書館でもってる本を探す検索エンジンみたいのがある(OPACという)
  • 大学の先生方の論文とか全然論文でないものとかのデータをとりあえずうpして,そのリストを簡単に引っこ抜いて検索したりできるようにした機関リポジトリというなんかよくわからないものがある*1
  • こういう国内の機関リポジトリでもってる論文とかのリストを集めてまとめて検索できるようにしたJuNii+というサービスが試験公開されてる。*2
  • 宮崎大のOPACで,検索した本のタイトルからJuNii+を検索して論文等を表示させるマッシュアップを公開した。


って感じ。まあAmazonの本のデータの下にGoogleの検索結果が一緒に表示されるようなもんだと思えばOK。
技術的な話をすると,JuNii+は関連語句検索*3が使えるのでかなり大雑把なキーワードでも探せるってことと,検索結果をXML*4で返してるので簡単にサービスに組み込める,ってのを上手く使ったらしい。
着眼点と発想がすごいなーと思う。



ということでパクった(マテ



wikipediajunii.user.js


Wikipedia上に宮崎大のと同様の検索結果を表示させるGreasemonkeyスクリプトGreasemonkeyは作るのも使うのも初めて(あとJavascriptもまだ苦手)なのでいろいろ不出来なところもありそうですが,とりあえず動きます。
宮崎大の場合はOPAC文字コードShift_JISな関係でか(JuNii+のクエリはUTF-8)一回あいだにCGIかませてるようでしたが,WikipediaUTF-8なので直接JuNii+叩いてます。なので完全にJavascriptのみ。
検索キーは項目名と説明文の一行目を使用。いろいろ調整してみたんですが一長一短(あまり変わらないともいう)なのでとりあえず。
で,Wikipediaの項目いろいろ見てみたんですが……




微妙,ですねえ……w




10件出てくる文献で2,3個かすってれば良い方,ってレベルみたい。むしろミスマッチに笑います。Webcat Plusの連想検索(GETA)ともアルゴリズムが違うのでしょうか。字数が増えてもあまり適合率に変わりがない。あるいはまだ母数が小さいことが響いてるのか。
でもとりあえずネタにはなるな,ということで公開してみました。実用性はまだ薄いと思いますが,ちょっと面白いです。
ちなみに,これの応用で他の大学のOPACで似たようなのをくっつけるグリモンもさらっとかけます(カスタマイズは必要)。あとこれ作る前にいじってた一般用のjsがこんな感じ*5。わかる人ならちょっといじればカスタマイズできるはず。もっとも各社のOPACパッケージがどの程度対応できるかはわかりませんが。


しかしあれだな。これならむしろWebcat PlusあたりにWikipediaの結果出す方が面白いかも。APIとか出さないのかなー。新書マップなんかもブログパーツに出来たら面白いのになー。

*1:中の人でも本当によくわからない。というか大学によってやってることが全然違う。しかもここ1年で一気に増えたのでまだはじまったばかりのとこが多い。

*2:ちなみにJuNii+はGoogle八分……じゃなくてクロール禁止かなんかしてるのか,ググっても紹介記事しか出てきません。site:http://juniiplus.csc.nii.ac.jpで検索しても出ないのでガチ。

*3:RS検索。連想検索とどう違うのかはよく知らない

*4:独自仕様。XMLにXSLかぶせて表示させてる

*5:ほとんど宮崎大のと変わりませんが