スポンサードリンク

ちょっと前の話ですが、中国四川省の地震に絡んだデマ投稿について書いた記事が一部で話題にしていただきました。

四川省の地震で飼育員にしがみついたパンダの写真はデマ
http://irumashinjuku.net/?p=3565

最近話題のGunosyでもピックアップされまして、結構なアクセスをいただきました。自分の書いた記事が話題の記事として送られてくるとちょっと赤面しますね。

gunosy

さて、上の記事で言及した先の記事の掲載時期についてご指摘をいただきまして一部訂正をしています。

はてなブックマークでご指摘頂きました。

terazzo
トルコ語のやつ、記事の投稿日時は”02 15th, 2012″ですな。→http://www.sonsuzsifa.com/blog/2012/02/page/10/中国のサイトの検証によると初出は2006年に台湾にパンダを寄贈する際の記事らしい→ http://news.cnfol.com/130422/101,1281,14921940,00.shtml2013/04/24

Googleの検索結果を見て2004年12月26日の記事かと思い込んでしまいました。確かに記事内容からして地震の当日に上がってるのはなんか変だなとは思ったんですが。。すいません。

google search
(四川省の地震で飼育員にしがみついたパンダの写真はデマより引用)

このときは、Googleの検索結果の中から指定した期間の記事に絞り込むことができる期間指定検索を利用しました。最初に画像検索から問題の画像を検索して検索結果から少しづつ指定期間を前に切り上げて行って一番古い記事を探しました。

Googleの期間指定検索は2009年8月にリリースされた機能です。

参考:Google Japan Blog: Google 検索で日付の指定が可能になりました

期間指定検索では、各記事の日時が何を基準としているのか、明らかとなっていません。かつては詳細検索のオプションに「ページの最終更新日 (クロールされた日)」と明記されていたという情報はありました。

また、Googleプロダクトフォーラムで同様の質問に対して、Google社員が「ページの作成日に基づく」と回答していることが確認できています。

ご報告ありがとうございます!

ご指摘のとおり、「特定の期間」では、ページの作成日に基づく絞込み検索が行えるようになっていますが、
ページによっては正しく情報が反映されない場合があるようです。これからも機能改善の努力をすすめてまいりますので、
ご理解のほどよろしくお願いします!

(検索ツールの期間指定で使用される日付について – Google グループより引用)

しかし、「ページの作成日」とは何を意味するのか、これだけでは正確なところがわかりません。「元サイトで該当ページが公開された日」なのか、「クローラによってGoogle内でインデックスが作成された日」なのか、前者だったらその日付をどうやって検出するのか、謎は尽きません。

仕方ないので、ちょっと実験してみることにしました。

実験結果

WikipediaによるとGoogleの創立日は1998年9月7日だそうです。クロールされた日なのであれば、この日付より前ということはあり得ません。適当に検索して検索結果を1998年9月7日以前に絞り込んでみました。

検索語は何となく「パンダ」です。

googlesearch1

googlesearch1

1件目は1977年3月3日のアメーバブログの記事。そんなバカな。藤田晋社長もまだ幼稚園児ですよ。

よく見てみると、1件目はURLが「http://ameblo.jp/19770303121805271129/」でした。ちなみにキャッシュを確認すると「2013年3月31日 06:51:30 GMT」でした。

2件目もアメブロで、日付は1996年9月4日。ページを開いてみるとブログ主のプロフィールページで、誕生日が1996年9月4日になっていました。こちらはキャッシュの日付は「2013年4月22日 03:00:35 GMT」でした。

3件目は早川書房のページで、日付は1996年8月29日。『パンダの親指』という書籍の紹介ページでした。この本の刊行日が1996/08/29になっています。なおキャッシュの日付は「2013年3月15日 07:59:41 GMT」でした。

とりあえず上位の3件だけ挙げておきますが、これ以降も似たような感じでした。検索語を変えても同じです。

考察

今回実験してみた限りでは記事に記載された日付を拾い出して、それを記事の基準日としているとしか考えられません。

さらに具体的に言うならば、ページのソースの中で一番最初に出てくる日付と認識できる書式の文字列を、そのページの日付として認識しているっぽいです。

確かに、元の記事で取り上げたトルコ語のページも、本文の最初にトルコ語で「26 Aralık, 2004」(2004年12月26日を意味するようです)と書いてありました。

googlesearch3

確実に言えるのは、Googleの期間指定は思ったよりもいい加減な機能だということです。これを盲信するのはよろしくないということだけは確実に言えます。あくまでも目安程度にしてしっかりと中身を確認するようにしましょう。

こう言っちゃなんですが、もっとスゴイことしてると思ってたんですよね。Googleってすごいんだかすごくないんだか不思議な会社だな、と改めて思いました。

LINEで送る
Pocket