2011-09-21から1日間の記事一覧

OCR Engine Tesseract 3.00

Tesseract のホームページ: http://code.google.com/p/tesseract-ocr/バージョンには 2.04 と 3.00 が存在するが,とりあえず今回は 3.00 を導入してみる. 必要なファイルのダウンロード http://code.google.com/p/tesseract-ocr/ から以下の3種類のファ…

Web検索API の比較

以下の2つの Web検索API を比較した. Yahoo! JAPAN の提供するアップグレード版ウェブ検索API http://developer.yahoo.co.jp/webapi/search/premium.html Google の提供する JSON/Atom Custom Search API http://code.google.com/intl/ja/apis/customsearc…

Google JSON/Atom Custom Search API の仕様

http://code.google.com/intl/ja/apis/customsearch/v1/overview.html 備忘録としてのメモ. 予備知識 Google Web Search API http://code.google.com/intl/ja/apis/websearch/docs/ は 2010年11月1日をもって廃止され(現在でもかろうじて動いているが,実…

Ubuntu への MeCab のインストール

Ubuntu のパッケージにも MeCab が含まれている.しかし,mecab にチェックを入れると,標準辞書にも自動的にチェックが入る.自分が入れたいのは UTF-8 対応の辞書である(これもパッケージに含まれている).結局,標準辞書が必要かどうか分からず,調べる…

Yahoo! JAPAN の「アップグレード版ウェブ検索API」

2011年3月31日付けで Yahoo!検索 Web API のサービスが変更されていた. http://developer.yahoo.co.jp/webapi/search/premium.html (ずっと Google の AJAX を利用していたため,気付かなかったのだ)平たく言えば,従来型の API を叩いても "Service unav…