utf-8の\と¥(半角)

ASCIIの時のくせで同じコードポイント(0x5c)でフォントによって文字が違うのだと思っていたが、よく考えるとUNICODEなので別のコードが当たっているのであった。
UTF-8では
\は0x5Cで
¥(半角)は0xC2A5
となる。
日本語ではUTF-8だとasciiの1バイト領域とマルチバイトの3バイト領域(今調べたら、半角カタカナもこっちだった)しか使わないと思っていたが、¥(半角)は2バイト領域になるのね。
utf-8Linux上でとあるeuclzh書庫を展開するスクリプトを書いていてはまったのだが、EUC-JPは\と¥(半角)が別コードになっているな。
そしてはてなでは記事中の¥(半角)は、ポストすると\に変換されちゃう。
¥(半角)はいらない子扱いです。