utf-8の\と￥(半角) - 三次元日誌

ASCIIの時のくせで同じコードポイント(0x5c)でフォントによって文字が違うのだと思っていたが、よく考えるとUNICODEなので別のコードが当たっているのであった。
UTF-8では
\は0x5Cで
￥(半角)は0xC2A5
となる。
日本語ではUTF-8だとasciiの１バイト領域とマルチバイトの3バイト領域(今調べたら、半角カタカナもこっちだった)しか使わないと思っていたが、￥(半角)は2バイト領域になるのね。
utf-8のLinux上でとあるeucのlzh書庫を展開するスクリプトを書いていてはまったのだが、EUC-JPは\と￥(半角)が別コードになっているな。
そしてはてなでは記事中の￥(半角)は、ポストすると\に変換されちゃう。
￥(半角)はいらない子扱いです。