前回の記事がわりとつっこまれてたので色々反省して,本来書きたかった趣旨と,駄目なところをあげてみる。
書きたかったこと。
そもそも言いたかったことは以下につきる。
「ニコニコ動画のタグが使いにくいのは(精度でなく)再現率が極度に低いタグが多いから」
改めて考えると,この場合に「再現率」という語句を使うのも微妙かもなー,と思ったりもするんだけど*1,要するに,dankogaiの「精度」の語句に違和感を覚えたのをきっかけに,どうしてニコニコのタグが使いづらいのかを自分なりに適合率とか再現率とかで表現してみたくなっただけなんですな。
本当,言いたかったのはここだけ。それに余計なことを付け足したのが間違い。
駄目なところ
で駄目だよなあと反省した箇所が以下。
なお,語句としては精度より適合率のが自分は好きです(dankogaiのがあったから先の記事では揃えただけ)。たぶんこっちの方が分かりやすいと思うので,以下では適合率の方を使用してます。
今回学んだ教訓
- ネタは小刻みに出して詰め込みすぎない。
- 思いつきは思いつきで出して,変に理論武装しない。詳細な分析は後からでもOK。
- 前例主義最高!
- つか正直,こういう反省記事も痛いよねー。
*1:孤立しているタグが多いという話
*2:一種のタグである図書館の件名は前回やったノリで,適当な本を見つけてから似たような本を探すときによく使用します。
*3:似たようなところでは,タグを自動的に付与するシステムの研究で適切なタグが付与できたかを適合率・再現率を用いて評価する例はあったけど,これは「タグの付与の評価」であって「タグによる検索の評価」ではないので別物。というかこれを見てやっと検索式の評価として用いる用法だけじゃないことに気づいたアホな自分