Fri, May 14

  • 00:00  紙がめくれる人はiPadが使える ってのは相当雑な理解だと思うんだが・・・・・・ 目がみえなくても使える? 点字だせる? #hikari_road
  • 00:02  なんか佐々木さんねむたくなってない?w #hikari_road
  • 00:14  あたまそるwwww #hikari_road
  • 00:17  佐々木さんがだいぶ孫さんに洗脳されてきたな。
  • 00:21  ああ。佐々木さんが反対したのが今回の放送のきっかけだったのか。
  • 00:35  お。SIMロックの話をついに孫さんが語るのか #hikari_road
  • 00:38  やはりあくまで社益なのね。>SIMロック そこはごまかさないのか。 #hikari_road
  • 00:40  あれ。孫さんのうしろで流れてるTLのディスプレイのアプリ, n2witterか? #hikari_road
  • 00:40  ニコ動っぽくtwitterのコメント流せるサービスあったからあれかな?
  • 00:42  孫「過去のことを思っちゃダメ!」一瞬,孫さんの後ろに修造が見えた。 #hikari_road
  • 01:13  ねるー
  • 07:39  おはようございます。
  • 10:07  しゅしゃてた。
  • 10:07  . @m_kinugasa @nominz @hijouguchi @phen1x @Wyvern_10 おはようでしたー。
  • 10:18  ウィルス親父は飽きたのでありらいおん子に帰ってきてもらうなどした。おはようございまーす!
  • 10:19  . @turu_crane @nopjapanisch @vocamas ありがとでーす♪ アイコンさんどっかいきました。
  • 13:01  これから東京いく。駅までのバス待ちなう。
  • 13:04  ニコ生、高画質ユーザー生放送開始と聞いて。
  • 13:10  #maoyu 名前がない というのは構成上重要であっても物語上はそうでもないし タイトルにまで冠するのは何か違う気がする。
  • 13:11  #maoyu 名前がない というのは構成上重要であっても物語上はそうでもないし タイトルにまで冠するのは何か違う気がするよ。
  • 13:15  ドラクエ3攻略サイト確認したら、アレフガルドついたら最初は港から船で移動するのね。覚えてないもんだな。
  • 13:17  そうか。 #maoyu の地下世界には海がない。それは盲点。川はあるらしいが。
  • 13:19  #maoyu の序盤で海の魔族みたいのが出てくる戦争があったが あの子たちは魔界ではどこに住んでたんだろう……
  • 13:38  . @miyamo_7 @izumino 巨大な塩湖みたいのがある設定でもいいと思うんですけどね。あそこの流氷アタックはわりと好きなんだけど。  [in reply to miyamo_7]
  • 13:41  今日の自由席は座れるだろうか。
  • 13:44  なんとか座れたのでお弁当たべる。やっとごはんだ。
  • 13:58  #maoyu の海魔族の問題: 実はあの作中で開けられたような地下との穴は海底のあちこちに存在するが、地下側には大きな出口がないため認識されていない。その代わりにまた両方の地面の間に地底海が存在しており、海魔族や魔物たちは本来そこに棲息している、という後付け設定はどうか。
  • 14:06  #maoyu このため海の魔物たちはゲートの開閉と関係なく地上世界に出没することができる。あの島を任せられたのもそのため。またあの世界で別の大陸との交流が皆無だったのは、大陸から遠い海では魔物たちがよく出没するため遠距離の航海ができないから。という勝手な設定も考えた。
  • 14:11  #maoyu つまり海魔族たちは「魔界に棲息しない魔族」という特別な存在であった。多分彼らの棲息域は広大だが、あの将軍のように知性のある魔族がほとんどいないため有力な氏族にはならなかった。もしあの将軍が生きていたら、海底を経由した貿易ルートも作れたのかもしれない、という妄想。
  • 14:25  魔界と海と塩を考えると序盤で消えてしまった海魔族が重要だったことがわかってくるという。面白い。 #maoyu
  • 14:30  魔界にはむかしは海があったが、地盤の引力と斥力のバランスとかが崩れて全部地上側に引いていってしまった、とかありそう。その残りが塩の湖みたく残ってて貴重な塩の供給源に。 #maoyu
  • 14:31  とすると昔の魔界の海に棲んでいた海魔族に塩づくりの技術があったりしても何も不思議じゃないな。 #maoyu
  • 14:38  また自分のお気に入り動画のうp主さんがtwitterに。素晴らしいなあ
  • 14:49  まおゆう2では、新大陸で三国志状態の魔王たちの前に、海魔族と手を結んで地上と魔界の航路を開拓して、今度は外海にのりだした青年商人がでてきたりするんだせ。一緒にきた海魔族の王子が女騎士を仇だとか言って狙ったりな! #maoyu
  • 15:55  PCもってきたのに電源もってくるのを忘れてたことに気づいたので上野で降りて秋葉原に向かうなど。
  • 16:00  ねむい。
  • 16:08  あきばなう。
  • 16:13  アキヨドなう。ルイーダの酒場なあつまりまだあるのか……
  • 16:32  うちのに対応してるACアダプタたくさんあるけど各社ありすぎてどれがいいのかわからんな。。。
  • 16:49  もうちょっとぶらついたらこのまえ気になった開田先生の展示みにいこうかな。
  • 17:02  カッティングマシンてもう2万台で買えるんだのう。
  • 17:25  UDXなう。東京アニメセンターとかいうのを見てた。文学少女の映画の設定資料とか展示してた。
  • 17:34  開田先生の展示の横で3Dプリンタの実演(どっかの有料研修会の途中らしい)とかやってて面白い空間だった。というか先生いたような気がしたがチキンなので特に話しかけず離脱。
  • 17:39  あんまり秋葉原いられないけど @y_arim さんいるらしいのでCLUB SEGA というのにいってみよう。
  • 17:44  無意識のうちにとらで漫画かってたなど。
  • 17:45  てぴてぴてっぴー♪
  • 17:48  ミクロケテ見てる。
  • 17:55  ロケテのミクかわいかった。プレイしてみたいけど結構並んでるから断念
  • 17:56  水着レンでラブリスト更新中とかばかぷれいみてる。
  • 17:59  ちょっとリナカフェいってこよう。
  • 18:39  有村さんにこのまえのスパコミの戦利品見せてもらうなどした。ありがとでしたー
  • 18:41  秋葉からおちゃのみず、丸の内線へ乗り替えて某イベントに向かう。
  • 18:50  珍しくリアルリナカフェにいたのに リナカフェなう って言わなかったことに気がついた。
  • 18:55  東大なう。
  • 19:01  #mitan はじまた。
  • 19:05  #mitan はじまたけど @arg さんたちがUstの準備中。
  • 19:08  #mitan 岡本さんからおはなしはじまり。次回の連絡など。次回は6/25。まいたんは動くものを作ってもらうことが目標。
  • 19:10  #mitan いままではリッテルによりかかりだったけれど今後はほかのメンバーで係分け分担して開催しませうとのこと。
  • 19:12  #mitan 今回の告知。11月の図書館総合展で「L-1 グランプリ」というイベントを開催。25日まるまるつかったワークショップで若手ライブラリアン5人一組(過半数はU40)の8チームが競い合う。面白そう。
  • 19:13  #mitan 賞金100万円!>L-1 グランプリ
  • 19:15  #mitan L-1 グランプリの告知終わり。つぎ東大・前田さんから自作のCiNiiからtwitterにつぶやくツールの紹介。 #mitan
  • 19:17  #mitan 名前は「つぶやけ! CiNii」。Firefoxのグリモン,IE8のとらいしてぃー?で実装。ちょろめでの動作は上手くいってないらしい。
  • 19:19  #mitan CiNiiのHTMLからタイトル情報を探してTwitterにとばす仕組み。(DOMかな。APIは利用してないっぽい /ほかにCiNiiにYahooの関連語検索を組み込むグリモンなどもつくってる。
  • 19:20  #mitan 問題。Webサイトのスクレイピングなので変更があるとメンテが必要。各種のDBの検索画面のXHTMLガイドラインがほしい。おわり。
  • 19:21  #mitan 質疑。NIIの関戸さんから。なんでRDFの使わないのん?(意訳
  • 19:24  #mitan CiNiiのRDF表示を紹介。どうですか→回答 使えるかも。/関戸:NIIのオープンハウスでまたCiNii API コンテストの告知やるよ!!
  • 19:25  #mitan 前回のAPIコンテスト作品の紹介。論文ったー面白いよ という話も
  • 19:27  #mitan 岡本:こういうAPIコンテスト等でいろいろ図書館関連のウェブサービスが増えてきてる。まとめたブログ記事書いたら1000ブクマは硬いね,て @i2k さんが言ってたよ!
  • 19:28  #mitan さて本編。清田先生から。今回はサーチエンジンの裏側,検索システムに技術について。
  • 19:31  #mitan 検索システムのモデル。情報要求→検索質問→[ 内部表現→\マッチング!/←内部表現 ]←テキスト集合←情報集合 情報要求と情報集合を内部表現に変換してマッチングしてフィードバック。
  • 19:32  UstのURL確認。 #mitan http://ustre.am/fDHD
  • 19:33  検索システムのモデル,テキスト検索・QAシステム・ヘルプ,みんな基本は同じ仕組み。 #mitan
  • 19:35  #mitan 検索技術の歴史。1950年,キーワード抽出やKWICインデックス。1957年のスプートニクショックで米国,科学情報検索システムへの支援強化→1960年代に文献検索システム実用化。MEDLARS(1964年〜。のちのMEDLINE)など。
  • 19:38  1970-80 全文検索システムの実用化と性能向上。SaltonらのSMARTシステム(ベクトル空間法・TFIDF・適合性フィードバック),テストコレクションによる客観的精度評価の試みなど。 1990年代,いくつかの評価型ワークショップが開催。 #mitan
  • 19:39  #mitan 評価型ワークショップというのは新聞記事などのデータを提供して参加者がそれをもとに技術を開発する感じかな。TREC・MUC・NTCIR@NII を紹介
  • 19:41  1990年代後半。Webテキスト集合を検索対象として利用。ハイパーリンク構造によるランキングアルゴリズムなどが研究→HITSアルゴリズムGooglePageRankなど 2000年代にこれらが活用されてWebサーチエンジンが飛躍的に発展。 #mitan
  • 19:42  #mitan 以降はWebの規模に対応するためのスケールアウトに重点。あるいは「スパゲッティ」と「スパゲッティー」の違いの吸収など。
  • 19:43  #mitan 検索システムのキーワード。逐次検索と索引検索。ベクトル空間法,n-gram,適合率と再現率などいろいろ。これから紹介
  • 19:45  #mitan 逐次検索(しーけんしゃるさーち)。検索質問が入力されるたびに全文書をスキャン。インデキシング不要,更新は即時反映。検索速度はドキュメント数に比例 ⇔ 索引検索(いんでっくすさーち) 事前にインデックスを作成しておいて利用。文書が増えてもそんなに速度は落ちない。
  • 19:47  #mitan ベクトル空間法の説明。文書×キーワードのマッチングの行列をつくる→一行を取り出すとベクトルになる→ベクトル間の類似度を計れる 例. 内積距離で類似度を評価
  • 19:49  #mitan (このへんはたぶん古典的な技術なんだと思うけど,内容が前回と比べてだいぶレベルが上がった感じがする。つかベクトル空間法知りませんでしたorz
  • 19:52  #mitan TF・IDFの説明。キーワードの重要度の経験則〜1つの文書でたくさん出るキーワードは重要(TF),文書集合中で偏って現れるキーワードほど重要(DF。どこでも引っ掛かる言葉がヒットしても嬉しくないよ,という話)→両者を掛け合わせてキーワードの重要度を計算。
  • 19:53  #mitan TF・IDF= {あるキーワードの出現頻度}×log({文書の総数}/{そのキーワードの出現する文書の数}) ふむふむ。
  • 19:55  #mitan 転置インデックス: 文書→キーワード1,キーワード2,キーワード3 のデータを引っくり返して キーワード→文書1,文書2,文書3 のインデックスを先に作っておく →高速で文書検索
  • 19:58  #mitan n-gramモデルと形態素解析モデル。日本語のような分かち書きのない文書からキーワードのインデックスを作るための仕組み。n-gram: n文字ずつに全部ばらしてキーワードとする。ばいぐらむ,とらいぐらむ。 ⇔ 形態素解析:ちゃんと解析して単語をキーワードとする。
  • 20:01  #mitan 形態素解析の技術。自然語文を形態素(意味のある最小単位)に分割。単語の境界判別が大きな問題。日本語用形態素解析ツールの紹介→ JUMAN, ChaSen, MeCab, Yahoo!日本語形態素解析
  • 20:03  #mitan n-gram形態素解析の長所短所 辞書要らずで検索漏れが少ないがノイズ・インデックス大のn-gramとちょうど逆の形態素解析
  • 20:04  #mitan @dietrich_avatar さんがつぶやいてたきがするが 内容は学部の教養とかのレベルなんだけど普通半年かけてやることを10分そこらでやってる気がするwww ついてけてるのだろうか。
  • 20:07  #mitan 再現率と適合率の話。 再現率=ヒットした適合文書/全適合文書 適合率=ヒットした適合文書/ヒットした文書全体 トレードオフの関係。測定にはテストコレクションが必要。日本語だとNTCIR・BMIRなど。利用目的にあったコレクションを使う必要がある。
  • 20:08  #mitan Web検索では再現率の測定は極めて困難。(うんうん。昔ニコ動のタグの再現率とかなんとかやって怒られたのを思い出す。
  • 20:09  #mitan 主な検索ソフトウェアの紹介。Namazu HyperEstraier Lucene SoIr Senna GETA/GETAssoc
  • 20:14  #mitan GETAssocの紹介。GETAの後継。ベクトル空間法に基づく関連キーワード・文書の検索,クラスタリング。WebAPIを実装。データをITBファイルに変換→stpでデータベース作成,stmdと形態素解析と連携 (つかってみないとわからんなー
  • 20:15  #mitan Web検索APIの紹介。Google・Yahoo。あとTSUBAKI。/参考文献: 北「情報検索アルゴリズム」,2002 ほか
  • 20:17  #mitan 岡本:これ東大の学部3年生向けにやってる講義5回分くらいだよ(wwwwwwwww
  • 20:19  #mitan 清田:工学的なシステムはインプット・アウトプット。だが検索は人間が関わるからインタラクティブな部分があり,学際的な領域。
  • 20:20  #mitan 岡本:GoogleのUI変更が大不評ってそういう話。エンジニアリング一本。情報工学的な部分以外の観点が大事。そういう発言が清田さんから出てくることが面白い
  • 20:22  #mitan 質問がでないのでJUMANを紹介しながら形態素解析の実例。辞書が小さいから図書と館がわかれる とか
  • 20:25  #mitan 形態素解析でキーワード抽出してOPAC投げたら,分かち書きの仕組みが違ったので検索できませんでした という話から 東大・前田さんの専門用語抽出スクリプトの紹介。
  • 20:27  #mitan (図書館員によるわかち書き,ってのも一種のインデキシングの仕組み,というか古典的なインデキシングそのものだよなー。形態素解析の結果とn-gramを直接マッチングしても合わない と同じレベル
  • 20:28  #mitan 前田さんの「言選Web」がべたぼめされ中。企業とかで使われてるんだー あとでいじろう
  • 20:30  #mitan 岡本:NACSIS-CATは集合知だったはず。
  • 20:32  #mitan (そういやうちのOPACからのNACSIS-CAT検索と Webcat Plus で検索インデックスが違うらしく,同じキーワードで検索しても引っ掛かる図書が違う とかよくあったなあ。
  • 20:34  #mitan 質問。インプット側の話。自然言語で検索することについては現在どんな技術が進んでるのか等→清田:TSUBAKIの紹介。文中にある「障害」を「妨げ」と変換してたりもする。
  • 20:37  #mitan TSUBAKIはクエリを構造化したりとかして頭のよい検索をしてるらしい。ただ普通の全文検索やベクトル空間とかと比べて遅い。ふむふむ
  • 20:38  #mitan 田辺: Enju は「検索漏れをなくしてほしい」というニーズからN-gram
  • 20:40  #mitan 岡本: Webは全体の適合文書が決してわからないので再現率に意味がない そこがOPACとWeb検索は大きく違う。
  • 20:43  #mitan 農林水産研究情報総合センターのJASIでの事例。「わい化」という語が「わい」と「化」に分かれてしまう。そこで索引語に人力で追加した。最後は人手のチェックが大事
  • 20:44  #mitan Amazonのリコメンデーションの話が。そもそもレコメンドも一種の「検索」だよね。
  • 20:46  #mitan 利用者はタイトルをしっかり覚えてないので曖昧な言葉で検索できたら という話から 福井県立の覚え違いタイトル集の話
  • 20:48  #mitan 岡本:今後はドメイン指定検索でデータ取得とかやってみていろいろ作ってみて(昔,新聞社の書評検索ブックマークレットとかつくったなあ。
  • 20:50  #mitan 岡本:おしごとの役割分担しましょ
  • 20:51  #mitan 岡本:みんなブログとかで記録つくりましょう。(tsudaりじゃだめですか。。。。
  • 20:52  #mitan 記録係,会場設営手伝い,UST中継,懇親会。あと何かあるか(分担
  • 20:58  #mitan 予習・復習向けのまとめとかあると面白いかもなあ
  • 21:00  #mitan 岡本:岡本さんと清田さんの飛行機が落ちてもまいたんは続けないと(wwwwww
  • 21:18  #mitan 懇親会会場なう。
  • 23:41  #mitan 懇親会の帰りなう。電車待ち中。
  • 23:57  CA祭ニコ生みたい……

Powered by twtr2src