2010-09-01から1ヶ月間の記事一覧

SBMで利用されているタグの使用頻度に関する基礎調査

1215個のURL(ブックマーク)に付与されたタグを,その出現頻度の降順に並べた場合の top 30 を以下に示す. あとで読む:753 Web:733 *あとで読む:605 JavaScript:401 webデザイン:399 web制作:395 webサービス:363 まとめ:361 これはすごい:357 ネタ:351 de…

「あとで読む」との共起

はてなブックマークにて各URLに付与されたタグの分析. 同一のURLに付与されたタグの対を「共起する」と定義し,その頻度を調べた結果が以下のとおり. 各タグの出現頻度を分母に持ってくる自己相互情報量などを使わないと,特性を見出せないだろう. あとで…

取得したWebページをディスクへ保存

archive という名前が恥ずかしいけれど,他に思いつかず,つい・・ import java.io.*; import web.WebPage; public class WebArchive { // 指定された URL のコンテンツを取得し,ファイルに保存する // prefix : 保存する際のディレクトリの前置文字列 // …

Content-Type の取得

import java.io.*; import java.net.*; public class tmp { public static void main(String[] args){ try { //String url = "http://d.hatena.ne.jp/hmwr_k/20090110/1231563213"; String url = "http://www.nara-tokusan.com/flash/top.swf"; URI uri = ne…