三次元日誌
三次元日誌
読者になる

三次元日誌

この広告は、90日以上更新していないブログに表示しています。

2008-05-22

UTF-8のbomに悩まされる

python

何故かvimがutf-8で保存したときにbomを付加するようになってしまい、
そのせいで正規表現がうまくマッチしないのに悩まされた。
とりあえずutf-8のBOMを削除するコード。

text=open('utf8.txt').read()

import re
re_bom=re.compile('^\xEF\xBB\xBF')
text=re.sub('', utf8)

ousttrue 2008-05-22 19:37 読者になる

この記事をはてなブックマークに追加
広告を非表示にする
  • もっと読む
コメントを書く
« boost::spiritに手を出してみる 文字コード変換 »
プロフィール
id:ousttrue id:ousttrue
読者です 読者をやめる 読者になる 読者になる
このブログについて
検索
リンク
  • はてなブログ
  • ブログをはじめる
  • 週刊はてなブログ
  • はてなブログPro
最新記事
  • heroku上のtDiaryに引っ越して…
  • リンクエラー
  • rails-3.1.0をcygwinでやるメモ
  • JSONと相互変換できるXMLの記述
  • ファイラーその4
月別アーカイブ
  • ▼ ▶
    2012
    • 2012 / 11
    • 2012 / 10
    • 2012 / 9
    • 2012 / 8
    • 2012 / 7
    • 2012 / 6
    • 2012 / 5
    • 2012 / 4
    • 2012 / 2
    • 2012 / 1
  • ▼ ▶
    2011
    • 2011 / 12
    • 2011 / 11
    • 2011 / 10
    • 2011 / 9
    • 2011 / 8
    • 2011 / 7
    • 2011 / 6
    • 2011 / 5
    • 2011 / 4
    • 2011 / 3
    • 2011 / 2
    • 2011 / 1
  • ▼ ▶
    2010
    • 2010 / 12
    • 2010 / 11
    • 2010 / 10
    • 2010 / 9
    • 2010 / 8
    • 2010 / 7
    • 2010 / 6
    • 2010 / 5
    • 2010 / 4
    • 2010 / 3
    • 2010 / 2
    • 2010 / 1
  • ▼ ▶
    2009
    • 2009 / 12
    • 2009 / 11
    • 2009 / 10
    • 2009 / 9
    • 2009 / 8
    • 2009 / 7
    • 2009 / 6
    • 2009 / 5
    • 2009 / 4
    • 2009 / 3
    • 2009 / 2
    • 2009 / 1
  • ▼ ▶
    2008
    • 2008 / 12
    • 2008 / 11
    • 2008 / 10
    • 2008 / 9
    • 2008 / 7
    • 2008 / 6
    • 2008 / 5
    • 2008 / 4
    • 2008 / 3
    • 2008 / 2
    • 2008 / 1
  • ▼ ▶
    2007
    • 2007 / 12
    • 2007 / 11
    • 2007 / 10
    • 2007 / 9
    • 2007 / 8
    • 2007 / 7
    • 2007 / 6
    • 2007 / 5
    • 2007 / 4

はてなブログをはじめよう!

ousttrueさんは、はてなブログを使っています。あなたもはてなブログをはじめてみませんか?

はてなブログをはじめる(無料)
はてなブログとは
三次元日誌 三次元日誌

Powered by Hatena Blog | ブログを報告する

引用をストックしました

引用するにはまずログインしてください

引用をストックできませんでした。再度お試しください

限定公開記事のため引用できません。

読者です 読者をやめる 読者になる 読者になる