谷村さん

アクティブなブックマーク・ユーザ(e.g.最近の1週間以内にブックマークしたユーザ)を見つける機構が完成。次は,Web 文書の類似性を求めるのが仕事。類似性については,形態素解析の結果として得られる形態素のうち,語の出現頻度を特徴ベクトルとするベクトルモデルを説明した。
その前の準備として,HTML文書からタグを除去するプログラムを書いてもらう。