2010-08-12から1日間の記事一覧

URLのパス名から導出されたハッシュ値の分布

パスの先頭文字では駄目だと分かったから,次はハッシュ値を使ってみた. と言っても,ハッシュ関数は「パスを構成する文字の文字コードの和 % 10」という単純なもの.上記と同じく,約30万件のデータを分析した結果を以下に示す. フォーマットは「ハッシュ…

URLのパス名における先頭文字の分布

URL のパス部分,例えば "http://www.host.com/foo/bar.html" のうち "foo/bar" の部分について,その先頭文字(ここでは 'f')の分布を調べた. (注)厳密なパス名には先頭のスラッシュが含まれており,"/foo/bar.html" が正しいが,話を簡単にするため「…

はてなブックマークの時刻形式を MySQL の DATETIME 形式へ変換

// はてなブックマークの時刻形式 "2010-02-01T15:20:57+09:00" を // MySQL の DATETIME 形式 "2010-02-01 15:20:57" に変換 static String hatenaDate2mysqlDate(String hatenaDate){ int pLoc = hatenaDate.indexOf('+'); // '+'位置の検出 String s1 = h…