文字コード

漢字つづき

「怒涛の漢字」 (某あやしげな予備校風)で調べついでにメモ。 Unicode 種別 JIS X 0212-1990 JIS X 0213:2004 a U+2460 ① NEC特殊 × ○ b U+5F45 彅 IBM拡張 ○ ○ c U+FA11 﨑 IBM拡張 × ○ d U+9751 靑 IBM拡張 × × e U+00E9 é ISO 8859-1 ○ ○ どれもJIS X 020…

EUC-JPなJava Webアプリの文字化けまとめ

問題1 PostgreSQLのデータベースをJDBC経由でEUC_JPとして運用しているとき、古いバージョン(8.1系:〜8.1.3, 7.4: 〜7.4.12)から、それ以降のバージョンにバージョンアップしたら、character 0xXXXXXX of encoding "UNICODE" has no equivalent in "EUC_JP"…

JavaでWindowsなEUC-JPの文字化けを防ぐ

文字コードについて - ooharakの日記 の続き。結論が出ていないが、考察過程。 Javaでサポートされているエンコーディングと、x-eucJP-msとの差 実際にJavaで変換を掛けた場合に、文字化けが起こるかどうかというのは、理屈の上では、区点やISO 2022などをベ…

文字コードについて

あの変態チックな文字化けでおなじみの、日本語の文字コードについて、少し調べる機会があったので書いておく。参考にしたサイト http://euc.jp/i18n/charcode.ja.html JIS X 0208 EUCであるとか、シフトJISなどを考えるときに、この規格が後々参照されるの…