2009-11-01から1ヶ月間の記事一覧

スルーできません

ドライブスルーと書かれているものの,普通の車ではスルーできず,投函後はバックすることになりそうです.

EmacsとUTF-8

上記のプログラムにより UTF-8 に変換できたはずのファイルを emacs で開くと文字化けする.しかし,プログラムに自信がないから,どっちが正しいか分からん.vi, gedit, Mozilla のすべてが「UTF-8だ」と判定しているのにも関わらず,emacs は意固地である…

Webページを文字コードを変えずに取得して,コード判定 & コード変換

コード判定には juniversalchardet : Java port of universalchardet を用いる.ここから juniversalchardet-1.0.3.jar を落としてきて,適当なディレクトリに保存.文字コード(encoding)を判定できたら,byte[] 型に入れたデータと合わせて,String へ変換…

濃霧

そう言えば今朝は濃霧でしたね.

コレクションクラスに関する有用リンク

以下は自分のためのメモ アプリケーションに最適なJavaコレクションクラスを選ぼう(2/3):CodeZine(ある程度,コレクションクラスを理解できたらよむべき.「最適なコレクションクラスの選択」と題して,各クラスの特徴を説明している)

コレクションクラス

学生が set や map などのコレクションクラスの勉強を始めたから,入門として学び易そうなページをリストアップ. はじめてのJava入門[コレクションフレームワーク(コレクションフレームワークとは)](generics に対応していないが,シンプルな内容) (詳細…

Sen の IllegalArgumentException の原因 on Yamamoto's machine

VMのメモリ不足が原因の場合がある。 実行時のオプションで-Xms(初期ヒープサイズ)、-Xmx(最大ヒープサイズ)を指定(例:最大ヒープサイズを256MBにするには、-Xmx256mを指定) $ java -Xmx256m Mai95Co以上、http://d.hatena.ne.jp/Kappuccino/mobile?of=1…

(メモ)共起ペア数を削減しないと・・・

毎日新聞データ(経済面)の1月分の記事本文からウィンドウ共起(windows size = 2)をとると,約 44,000個のペアが得られた. 事前に行った処理は以下のとおり: ・多少の辞書登録 ・品詞の絞り込みルール: if((品詞 == 名詞 && !(細分類 == 数 || 細分類…

新聞記事における共起の事前調査

毎日新聞'95 経済面について,1995年1月1日の記事本文から以下の条件で語の共起を抽出した. 段落をひとつの文章とみなす. 取り出す形態素の品詞を名詞,形容詞,動詞とする. ウィンドウ共起を用い,そのウィンドウサイズを 10とする. 抽出された共起ペア…

共起の定義

文共起:同じ文に含まれている語を共起語として抽出する. ウィンドウ共起:一定の語を収容するウィンドウをテキストに沿って移動させながら,ウィンドウ内に同時に含まれている語を共起語として抽出する. 語彙統合パターン:次の論文をチェック!田淵ら,…

HashMap のキーに自作クラスを使うには

以下のように自作のクラスを定義して,HashMap という形で使いたいとする. class CoPair { String s1; String s2; .... }この場合,CoPair クラス内で equals(CoPair cp) と hashCode() の2つのメソッドを オーバーライドしなければならない.詳細は エン…

TeXで subfigure を使う.

Ubuntu では以下のとおりパッケージを入れれば OK.(余分なものもたくさん入るけど) sudo apt-get install texlive-latex-extra