2008-05-22から1日間の記事一覧

UTF-8のbomに悩まされる

何故かvimがutf-8で保存したときにbomを付加するようになってしまい、 そのせいで正規表現がうまくマッチしないのに悩まされた。 とりあえずutf-8のBOMを削除するコード。 text=open('utf8.txt').read() import re re_bom=re.compile('^\xEF\xBB\xBF') text=…