2011-05-01から1ヶ月間の記事一覧

ツイートの極性判定 その2

ツイートの極性判定 - 仕事関連のメモ で取り上げた「ツイートの極性判定」の続き. 前回の実験では,ネガティブ側に傾いていたため,今度は形容詞のみ拾い上げることにした. 実験結果を以下に示す.ポジティブと判定されたツイートはそれっぽい(もちろん…

ツイートの極性判定

今朝,通勤中にニュースをチェックしていたら,こんなニュースを見つけた. 山口・上関原発建設計画:山口知事、反対に転換へ 埋め立て免許、延長認めない方向 このニュースに対する Twitter 上の反応は歓迎ムードだろうと推測して,出勤直後に Twitter sear…

Twitterメッセージに含まれる "wwww" のクリーニング

Twitter のメッセージ中には笑いを表現する "wwww" が含まれるケースがある.最悪の場合,140文字の大部分を "wwww" が占める場合もある. (その結果,形態素に分割できないため,KH Coder の127文字制限に引っかかる)というわけで,"www..." や "www..…

MALLET を用いた topic modeling

topic modeling というか,LDA に興味があったので使ってみた. MALLETとは MAchine Learning for LanguagE Toolkit の略であり,MALLETのホームページ http://mallet.cs.umass.edu/index.php の冒頭に以下のように書いてある.かなり高機能っぽい. MALLET …

Ubuntu上でのAndroid開発環境の構築

(注意)日本語化した Eclipse ではうまく動かなかったため,予め日本語版をアンインストールし,改めて Ubuntu ソフトウェアセンターから Eclipse をインストールした。なお,Synaptic パッケージマネージャ等を用いて Eclipse を削除しても,/usr/local/ec…

GWの中日につき来訪者多数

本日,5月2日は GW の中日にあたり,(企業によっては 10日間の長期休暇もあるそうで)多くの卒業生が来研してくれた. 午前に Kさん(約5年前の卒業生;土産はプリン)と T君(今年3月の卒業生;土産はうなぎパイ). 午後に Uさん(今年3月の卒業生;土…

SetとMapを行ったり来たり

下記のプログラムを書いて,オブジェクト set と set2 の中身を iterator で順次出力した結果,同じ順番で文字列が表示されたけれど,この結果はあらゆる Java の実装系で同一と保証されているのだろうか? import java.io.*; import java.util.Set; import …