2011-08-01から1ヶ月間の記事一覧

OpinionFinder に関する調査

OpinionFinder is a publicly available software package for sentiment analysis that can be applied to determine sentence-level subjectivity.http://www.cs.pitt.edu/mpqa/opinionfinderrelease/README によると, 結果の出力形式は SGML. 主観的表現…

マップ (java.util.Map)の使い方

卒研の学生さんに参照してもらうためのプログラム. import java.util.HashMap; import java.util.Map; import java.util.Set; import java.util.Iterator; //マップ(Map)の使い方 // //2つの文書ベクトルの類似度として余弦を用いる. // //(注) 本プログ…

集合(java.util.Set)の使い方

卒研の学生さんに参照してもらうためのプログラム. import java.util.HashSet; import java.util.Set; import java.util.Iterator; //集合(Set)の使い方 // //2つの語集合間の類似度として Jaccard 係数を用いる例. //Jaccard 係数については,例えば htt…

詳細な株価時系列データを取得できるサイト

株価データ ダウンロードサイト ・・・日経平均に加えて個別銘柄の時系列データが提供されている。30分足という詳細な時系列データも含まれる。 404 - Not Found ・・・5分足、1分足という高精度のデータが提供されている。ただし、遡れるのは5分足ならば…

Web スクレイピングを用いたリアルタイム日経平均株価の取得

Tidy による整形式化および DOM に対して XPath を用いることで日経平均や為替の値を得る. // Yahoo!ファイナンスのページをスクレイピングして,日経平均株価等を抽出する. import java.io.*; import java.net.URL; import org.w3c.tidy.Tidy; import org…