2011-01-01から1ヶ月間の記事一覧

java.net.HttpURLConnection を用いた実装にあたっての注意点

HttpURLConnectionクラスは,以下のように利用されるのが一般的である. URL url = new URL("http://foo.com/hoge.html"); HttpURLConnection conn = (HttpURLConnection)url.openConnection(); int responseCode conn.getResponseCode(); InputStream is = …

多次元正規分布に従うサンプルの生成

Jahmm - An implementation of HMM in Javaを利用して,多次元正規分布に従うサンプルを生成する. (目標に対して道具が大き過ぎる点が問題だ) import java.io.*; import be.ac.ulg.montefiore.run.distributions.MultiGaussianDistribution; public class…

上記のデータを Weka に食わせた結果

Tom's Research Ground: [FAILED] Weka SimpleKMeans using CosineDistanceにて公開されていた CosineDistance (に少し手を入れたプログラム)を距離関数として Weka に与え,上記のデータをクラスタリングした結果を以下に示す. クラスタ数は4個だが,満…

X-means とコサイン距離によるクラスタリング

X-means にコサイン距離を組み込みたくて,D.Pelleg and A.Moore の論文 "X-means: Extending K-means with Efficient Estimation of the Number of Cluster" と Weka のソースを参考にプログラムを書いた(チェックは不十分だし,エラーハンドリングもいい…

データの特性と X-means on Weka の振る舞い

2次元,2個/クラスのサンプルを与えた場合 4クラスのデータを想定. x-means のオプション設定は kMin=2, kMax=5.データ: 1.0,1.0,label1 1.1,1.0,label1 4.0,1.0,label2 4.1,1.0,label2 1.0,4.0,label3 1.0,4.1,label3 4.0,4.0,label4 4.1,4.0,label4…

分かりやすいデータに X-means を適用した結果

下記のプログラムに示すように,4クラスから成るデータに対して,クラスタ数の下限を2,上限を5として X-means 法によるクラスタリングを行った. (参考:下限・上限を指定しない場合のデフォルト値は「下限 2,上限 4」である) // 配列データを Weka …

配列データをWekaのinstanceに変換する方法

以前,2010-08-31 - 仕事関連のメモにて Weka を用いた k-means 法の実装を述べた.しかし,次元が大きくなると ARFF ファイルを準備するのが大変だし,そもそも既存のプログラムにより生成されたデータを(わざわざ)ファイルを介して Weka に渡すのもおか…