2009-11-16から1日間の記事一覧

WEBrickの動作を調べてみる。

webrickのソースは、gentooでは/usr/lib/ruby19/1.9.1にあるwebrick.rb。 これは、/usr/lib/ruby19/1.9.1/webrick/下の他のファイルを読み込むの使われている。 webrick/server.rb WEBrick::GenericServer HTTPProxyServer webrick/httpserver.rb WEBrick::H…

Nokogiriに渡す前の文字コード判別

Nokogiriが確実に処理できるように、htmlを先に決め打ちでutf-8に変換する方法を模索してみた。 方針としては、 httpヘッダのcharsetは中身と一致しているとは限らないため参照しない。 metaタグのcharsetは信用する。 metaタグが無かったら自動判定。 文字…