2010-01-30から1日間の記事一覧

(メモ)毎日新聞の記事から共起を抽出した結果

毎日新聞'95データの経済面のみに絞って,共起を抽出した.総共起数は 747,799個,(重複を除いた)種類数は 412,971個.思ったほど多くない.さて,これがメモリに載るか? ということで,次のプログラムを試すと, java -Xmx1024m tmp ならば大丈夫(512m …

(メモ) 大規模過ぎるデータと LSA

上記は Yamamoto さんの実験に用いるデータについて述べている. このデータを R にてロジスティック回帰を試みたが,「エラー: サイズ 1.4 Gb のベクトルを割り当てることができません」と言われて頓挫した.S-PLUS on Windows でも同様の結果である. 以…