終わったのは個人ニュースサイトではなく全人力と言うスタンス

より.私は,「個人ニュースサイト」と呼ばれる Web サイトとは非常に関わりが薄いので的外れかもしれませんが.

私は,以前に Ragnarok ONLINE と言う MMORPG のゲーム内に存在するアイテムの市場相場を調査して公開していたことがありました.もうバックアップしか残ってませんが,これ.この市場相場の調査&公開は,何も考えずに軽い気持ちで始めたこともあり,当初は全て人力で調べていました.ゲーム内で開かれている露天を1軒1軒歩いて回り,露天で売られているアイテムの値段をメモし,異常な値だなと感じたものを除外し,html にまとめて公開,と.それでも,調査当初はゲーム内に存在するアイテムの種類が少なかったこともあり,1日1時間程度で更新可能な作業量でした.

しかし,MMORPG と言うゲームの性質上,ゲーム内には新しいアイテムがどんどん追加されていきます.それにともなって,調査しなければならない量も線形的に増加し,より多くの時間を更新作業に割かれるようになります.ここで所謂「消化不良」が発生し,今までのスタンス(全てを人力で済ませる)では続けていくことができなくなりました.そこで,自然と「部分的に自動化する」と言う選択肢が浮かび上がります.上記の例では,「露天で売られているアイテムの値段をメモする作業」と「データから html(正確には xml でしたが)を生成する作業」を自動化しました.

このように,処理しなければならない量が増えるにつれて,「部分的に自動化する」作業は不可避となってきます.ここで重要なのは,あくまで「部分的に」と言う点です.

「量より質」で対抗するために

私の思考が比較的アナログなせいもありますが,個人的には,最終的な出力に「部分的に人の(恣意的な)判断を含める」方が全自動で生成する出力よりも質が高いと言う事はしばしば起こり得る,と思っています.これは,全体的な質の向上と言うよりはある部分に特化させる,と言った方が良いかもしれません.

例えば,はてなブックマークのホットエントリよりもお気に入りのブックマーカーのブックマークエントリの方が(お気に入りに登録している人にとっては)質が高いと感じるようなものでしょうか.全自動で生成されるものは,そこに関わっている全ての人の最大公約数的なものになるのでどうしても「無難な」ものになってしまいます.この「無難な」ものに対して,各人が何かしらの「色付け」をしたもの(埋もれた特色のある記事の選出,カテゴライズ,示唆に富んだコメントなど)は,その「色」にマッチした人にとっては,先の「無難な」もにに比べて非常に魅力的なものに感じるようになります.

ソーシャルブックマークの場合もある一定数のブクマを集めたものが注目されやすいようになりますが、必ずしもブクマの数と他の誰かにとっての読む価値とは比例しません。たとえばあまりに限定的、専門的なジャンルの話題で、1000人中10人くらいにしか注目をされないけど、その10人のほとんどが「これはすごい」とタグをつけたくなるような情報だって埋もれている可能性はあります。大勢には評価されないけど、とある個人にとってはとてつもなく価値のある情報だって多く埋もれています。

個人ニュースサイトは何故RSSやSBMが伸びても利用され続けるのか - 空気を読まない中杜カズサ

しかし,全てを人力で行おうとした場合,処理できる量はたかが知れています.そのため,「全人力」で「全自動なシステム」に対抗しようとすると,よほど嗅覚が鋭いかコメントセンスの良い人以外は,「色付け」などで差別化を行う以前に「絶対的な処理量」で押し切られてしまいます*1.システムは,「質より量」で攻めるのは得意です.

http://d.hatena.ne.jp/DCasakura/20090716/p1 によると,個人ニュースサイトの管理人が1日に処理できる記事量(巡回できる Web サイト数)は 100 〜 200 件だそうです.そうであるならば,個人ニュースサイトは既に終わったジャンル で挙げられていた SBM(例えば,はてなブックマークのホットエントリ)や pixiv (のランキング)などの「自動的に生成される」コンテンツに対抗するには,巡回する前に「1,000 件(あるいは 10,000 件かもしれませんが)の中から人力で巡回すべき 100 件を選ぶ作業を自動化すること」なのだろうと思います.この自動化の方法自体もかなり検討の余地がありますが*2,この部分自動化をうまく実現することができれば,きっと「全自動なシステム」に対抗し得る素晴らしい個人ニュースサイトを作ることができるのではないかな,と期待しています.

*1:例えば,「全自動なシステム」が生成するコンテンツは確かに偏ることはあるが,「絶対的な処理量の不足した人力」で生成されたコンテンツはそれ以上に偏っている,のような感じで.

*2:例えば,単純に「はてなブックマークの今日のホットエントリの被ブクマ数上位 100 件,とかにするとあまり良い結果(巡回すべき Web サイトリスト)は得られない,など