2008-09-09 谷村さん アクティブなブックマーク・ユーザ(e.g.最近の1週間以内にブックマークしたユーザ)を見つける機構が完成。次は,Web 文書の類似性を求めるのが仕事。類似性については,形態素解析の結果として得られる形態素のうち,語の出現頻度を特徴ベクトルとするベクトルモデルを説明した。 その前の準備として,HTML文書からタグを除去するプログラムを書いてもらう。