ソーシャルブックマークの分析

http://www.gnuplot.info/ をシードとした場合,

  • このページをブックマークしているユーザ数は 20名.
  • これらのユーザがブックマークしている Web ページ数は最少 30件,最大 2940件,合計 16063件(平均 803件).

ひとつのシードから派生した Web ページが約 16,000であるから,この処理をもう一段階,繰り返すと 16,000^2 = 256,000,0000 = 2億5600万件となる.
さて,ひとつのシードから 16,000件の URL を得るために要した時間が約 10分。ここからさらに1階層を調べにいくと,10分×16,000 = 2666時間 = 111日。
ということで,この調べ方では駄目だ