形態素解析システム sen

sen は,C++ により記述されている MeCabJava に移植した形態素解析ソフトウェアである.当然,ユーザの Java プログラムとの親和性は確保されている.

以下では,最初にユーザディレクトリへインストールして動作確認を行う.
その後,システム領域へ展開して,誰でも使えるようにする.

senをユーザのディレクトリへインストール

https://sen.dev.java.net/files/documents/1373/31864/sen-1.2.2.1.zip をダウンロード

Ubuntu に ant が入っていなかったから

$ sudo apt-get install ant

ant を使うことで ipadic-2.6.0.tar.gz を落としてきて,展開してくれる.

$ unzip sen-1.2.2.1.zip
$ cd sen-1.2.2.1/dic
$ ant

以上で必要なファイルはすべて揃う.

環境設定は,とりあえず展開したディレクトリを指定.

$ export SEN_HOME=/home/muto/Software/sen-1.2.2.1
$ export CLASSPATH=$SEN_HOME/lib/sen.jar:$SEN_HOME/lib/commons-logging.jar
$
$ cd /home/muto/Software/sen-1.2.2.1/bin ・・・動作チェック
$ sh sen.sh

プログラムから呼び出すサンプルプログラムの実行

$ cd /home/muto/Software/sen-1.2.2.1/src/java
$ javac StringTaggerDemo.java
$ java -Dsen.home=${SEN_HOME} StringTaggerDemo

sen をシステム領域へインストール

cd /usr/local
sudo unzip /home/muto/Software/sen-1.2.2.1.zip
sudo mv sen-1.2.2.1 sen
cd sen/dic/
sudo ant

環境設定

/etc/profile.d/sen.sh を作り,パーミッションを変更

sudo chmod +rx /etc/profile.d/sen.sh

sen.sh の中身

export SEN_HOME=/usr/local/sen
export CLASSPATH=$CLASSPATH:$SEN_HOME/lib/sen.jar:$SEN_HOME/lib/commons-logging.jar

動作チェック

以下のコマンドを実行して,文字列を形態素解析してくれれば OK.

$ sh /usr/local/sen/bin/sen.sh

また,/usr/local/sen/src/java/StringTaggerDemo.java を適当なところへ持ってきて,うまく動作すればOK.

$ javac StringTaggerDemo.java
$ java -Dsen.home=${SEN_HOME} StringTaggerDemo