2008-09-02 岡崎さん Webページの分類を行なうことを目標として,文書からテーマ(主題)を抽出することを試みる.具体的には「頻出語を主題とする」「H1 タグや meta タグを利用する」が考えられる. とりあえず,文書内での語の頻度を求めるため,divide_writing.c と chasen の使い方を説明した.