2009-01-01から1年間の記事一覧

重要段落の抽出

ひとつの文書の中から重要と思われる段落を抽出する作業を学生に任せている.段落を文書をとみなして tf.idf値を出してもらうと,その値がゼロとなるケースが生じた.ひとつの文書はあるテーマにそって述べつつ完結するから,特定の単語が全ての段落に出現す…

今日の成果

EDR電子辞書(日本語単語辞書,概念辞書)を用いて,与えられた単語の概念を得て,さらにその上位概念を再帰的に取得するプログラムを作った.(ディレクトリは EDRDictionary ・・・忘れないようにメモ)結果を眺めていると TRF → TRFという音楽グループ名 …

意味の多重性

EDR電子辞書:日本語単語辞書と概念辞書を利用してある単語の意味(概念)を引っ張ってくるわけだが,日本語単語辞書に問い合わせると複数の意味が結びついていることが分かった.当然のことだが,意味は一意に決まらない. 以下は単語「陰り」に対する概念…

PageRank に関する Google の公式見解

http://jp.blogherald.com/2009/10/16/google-pagerank-finally-demoted-but-remains-on-toolbar/

テクノラティジャパン サービス終了

下記のメールが届きました. 栄枯盛衰というやつでしょうか. 研究データとして利用できなくなりました. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ テクノラティジャパン サービス終了のお知らせ ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 日頃はテクノラ…

オブジェクトをソートする方法

以下のページに ArrayList に格納したオブジェクトをソートする方法が書かれている。 予想通り Comparator を実装するわけね。http://www.kadoppe.net/2008/02/javaarraylist.htmlしかし、ソート対象のクラスの中に「大小比較を行うメソッド」があると理想的…

Ubuntu から Fedora の LVM へアクセスする方法

以下のページに全てのコマンド列が書かれている. (Fedora の LVM が特殊なため,面倒なステップを踏まないとならないみたい) Accessing a Fedora Logical Volume from Ubuntu

Ubuntu でのホスト名の変更

/etc/hostname の中身を書き換える.

Ubuntu でのユーザ登録

$ sudo adduser username

以前,作った web_collection.c を動かすための環境整備. ubuntuへのインストール:libxml2 と tidy $ sudo apt-get install libxml2-dev $ sudo apt-get install libtidy-dev

はてなブックマークを利用する際に出てくる「おすすめタグ」について

SBM

既にブックマークしたユーザが付与したタグが「おすすめタグ」として提示されるのが基本で,2009-09-28以降は閲覧している(これからブックマークしようとしている)ページの本文情報に基づいて「おすすめタグ」を提示するようだ. http://hatena.g.hatena.n…

PageRank

SBM

Googl PageRank を取得する API として Google PageRank Java API というものを見つけたのだが,2つほど疑問が発生. toolbarqueries.google.com へ問い合わせるようだが,この使い方を Google は認めているか? document によると PageRankService queries…

Yahoo! JAPAN ブックマークからブックマーク数を取得する

SBM

Yahoo! JAPAN は Yahoo!ブックマークに関する明確な API を公開していない. 一方,以下のサイトにヒントが示されていたから,これを実装した. http://blog.katsuma.tv/2008/03/yahoo_bookmark_api.html // Yahoo! JAPAN は明確な API を公開していない. /…

のAPIを使う

APIの説明は以下のページに掲載されている: http://wiki.livedoor.jp/staff_clip/d/FrontPage Apache XML-RPC Java で XMLRPC を扱うため,Aapach XML-RPC をとってきた. http://ftp.riken.jp/net/apache/ws/xmlrpc/ から apache-xmlrpc-3.1.2-bin.tar.gz …

Yahoo! Search Monkey って何?

Yahoo! の説明を読んでもよく分からないなぁと思っていたところ,以下の記述を見つけた. SearchMonkeyはウェブから集めたRDFやマイクロフォーマットなどのセマンティックマークアップ・データを収集して、検索結果ページに表示する情報を自由にカスタマイズ…

Yahoo! Site Explorer の inlinks 数は当てにならない?

SBM

http://e-club3.hyperposition.com/seoblog/yahoo/tools/20071015120005.html における 2007年の記事に次の記述がある. まず確実なことは、Yahoo! Site Explorerでinlinks(バックリンク)を調べる場合に、サインイン・アウトの状態で数値に格差があることだ…

Yahoo! Developer Network

SBM

先日の Yahoo! JAPAN デベロッパーネットワークと異なり,yahoo.com が提供するサービス. また,以前の Yahoo! Search API から随分と進化しているみたい.http://developer.yahoo.com/ から辿って,Yahoo! Search Web Services,そして Yahoo! Search Boss…

Yahoo! JAPAN デベロッパーネットワーク

SBM

http://developer.yahoo.co.jp/ 利用するには Yahoo! JAPAN ID でログインしたのち,アプリケーションID を登録する必要がある. 登録の際の必須項目は以下のとおり: Yahoo! JAPAN ID 連絡先メールアドレス(Yahoo! JAPAN ID の登録元(例:プロバイダ)か …

Google APIとディベロッパーツール

Google AJAX API Google AJAX API では,外部からアクセス可能な URL を予め登録する必要がある.Google の戦略上の理由でしょう.しかし,インタフェースを限定されるのも困り者.Google Data APIGoogle SOAP Search API が提供されなくなって困っている.…

Google による統計データ検索サービス

Google Internet Stats 紹介記事を以下に示す: http://www.itmedia.co.jp/enterprise/articles/0909/11/news064.html

英語

礼状 = thank you notes 優秀な成績 = strong performance

senを用いて形態素の出現頻度を数える

// 読み込んだ文章を sen を用いて形態素解析した上,それぞれの形態素の出現頻度を HashMap に // 記録する. // // 9-Sep-2009 // // (メモ) sen に付属していた StringTaggerDemo.java をベースにした. // // [コンパイルと実行] // javac senTest.java …

ゾロ目

2009年9月9日は,(日本では見かけないが)09/09/09 と表記される場合がある.このゾロ目を記念して(?),99.99$で結婚式をサービスした所もあるようだ.そこで,自分なりに努力した結果を以下に示す.

仕事用メモ

文字列が既にURLエンコードされているかを判定し,必要に応じてエンコードするメソッドが欲しい. javax.servlet.http.HttpServletResponseWrapper の encodeURL() はうまくやってくれるよう. http://sdc.sun.co.jp/java/docs/j2ee/sdk_1.3/ja/techdocs/api…

HashMap の使い方

import java.util.HashMap; import java.util.Set; import java.util.Iterator; public class hashMap { public static void main(String[] args) { String key = "宇部市"; // キー Integer value = new Integer(32000); // 値 // HashMap の生成 HashMap<String,Integer> m</string,integer>…

Calendarクラスを用いたサンプルプログラム

import java.util.GregorianCalendar; import java.util.Calendar; public class CalendarSample { static void printCalendar(GregorianCalendar cal){ int year = cal.get(Calendar.YEAR); int month = cal.get(Calendar.MONTH); int date = cal.get(Calen…

ディレクトリ下のファイル一覧を取得する

// あるディレクトリ下のファイル一覧を得る import java.io.File; public class DirectoryList { public static void main(String[] args) { // ディレクトリ TEST に対応するファイルオブジェクトの生成 File dir = new File("TEST"); // ディレクトリ TES…

prism

このアプリケーションはよい感じですね.

503

はてなブックマーク API を用いてブックマーク情報を取得しているが,時々 java.io.IOException: Server returned HTTP response code: 503 for URL: http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd が発生する.503 (Service Unavailable) は「…

cake

売り物にできそうな位,美味かった.