amori's blog

よろず技術系と趣味関係の雑記です。アニメの比重が高くなってます・・

SmartNewsの記事収集


先日書いたダンケルクの記事
amori.hatenablog.com
SmartNewsにピックアップされて、2日間で通常の約1ヶ月分相当のアクセスがありました。
(といっても元々が微々たるアクセスなので実数はたいしたことありませんが・・)

ピックアップされたこと自体もそうなのですが、驚いたのはそのタイミングです。
まず9/11月曜日の夜9時ごろに記事を公開。アクセスは朝までほとんどありません。まあいつものことです。
9/12の朝に読み返して「あー、ポピーアピールの話が多くなり過ぎてバランス悪くなっちゃったなあ。後で構成ちょっと変えよう。」と、誤字脱字ぐらいをちょこっと直してブクマしました。

で、昼になってアクセスが急増(当社比)していることに気がつきまして、どうやらブクマ直後からピックアップされたことがわかりました。しかも「はてな」ではなく「映画」カテゴリです。
そりゃアクセス増えるわけです。
しかし、いくらダンケルクという旬なトピックだったとしても、公開直後で色々と感想の記事が増えてた中で、こんな弱小ブログの記事がピックアップされたというのは、まあちょっとして切り口の違いがあったからなんだろう、だからきっとピックアップ候補は自動だったとしても、掲載の最終判断は人間による「切り口の違い」の判断も入ってたのだろうと思いました。

で、そのあたりの情報がないかな、と検索して見つけた記事がこちら。
web-tan.forum.impressrd.jp
ちょっと古い記事ですが、まあ基本的なシステムは変わっていないでしょう。
ここにはこうありました。

Q. 情報の正しさはどのように判断しているのでしょうか。
それもやはり、先ほどお伝えしたアルゴリズムでコンピュータが判断しています。より多くの人が反応したもの、ソーシャルでシェアされたものといったさまざまな要素を総合的に判断して、その集合知を配信しています。
ですので、人が情報の良しあしを判断するということは基本的にありません。そもそも対象とする情報量が多く、人が判断しきれる情報量ではありません。また、人が判断してしまうと、その人のバックグラウンドに影響されてしまう部分がありますので、コンピュータのほうがより中立的な情報をお届けできるのではないかと考えています。

これはびっくり。人の判断入ってないんですか。
このブログは本当にアクセス数は微々たるものなので、仮に、このブログ自体の既存の記事の読まれ方の情報を事前に収集していたとしても、それだけで記事をピックアップする判断材料になるはずはありません。ということは、記事内容が他のダンケルク記事がある程度差異があることを、自動的に判断していたのではないかと思われます。おそらく記事中のキーワードやトピックを抽出して記事の特徴を評価できるようになっているのでしょう。そして一定基準を満たしているならば、もしくは類似カテゴリの記事の中で特徴を持つものを掲載し、その後は記事の読まれ方を計測することで、掲載の場所や掲載継続の判断をしているのではないかと思います。

以上の推測から今回の記事がかなり早い時点でピックアップアップされた理由を考察すると、

  • ダンケルク」公開直後で、このトピックの評価値が非常に高かった
  • そのタイミングでブックマークで「ダンケルク」のタグをつけたことが直接のピックアップ要因となった
  • 記事内容の他の感想記事との差異が自動的に判定できる情報量を持っていた
  • ちょっと長くなったので、読者の滞留時間がちょっと長くなり、それが関心と判定された
  • このブログとしては珍しく画像をつけて、しかも真っ赤な色が掲載時にかなり目立ってクリック誘導に貢献した

となるのではないかと思います。

そう考えると、これまでにSmartNewsの「映画」「はてな」カテゴリにピックアップされたいくつかの記事も上記の条件をそれなりに満たしていたことに思いあたりました。
今回の記事が特にいち早くピックアップアップされ多くのアクセス(当社比)を集めたのは、ひとえに

映画公開直後でトピックが旬であり、それが読者の強いニーズにマッチしていたことが記事収集アルゴリズムにヒットした

のだと思います。

ちなみに、これまでにSmartNews に掲載された記事はこちら。映画の感想やそれに関する情報がピックアップされやすいですね。これは映画自体のパブリシティの関係もあるかもしれませんが、それ以上に読者が求める情報として旬かどうかがポイントでしょうか。
(ご覧のように全てブクマは告知用セルクマだけですσ(^_^;))



amori.hatenablog.com

amori.hatenablog.com

↓これは「はてな」カテゴリ
amori.hatenablog.com

amori.hatenablog.com

amori.hatenablog.com