岡崎さん

Webページの分類を行なうことを目標として,文書からテーマ(主題)を抽出することを試みる.具体的には「頻出語を主題とする」「H1 タグや meta タグを利用する」が考えられる.
とりあえず,文書内での語の頻度を求めるため,divide_writing.c と chasen の使い方を説明した.