Biotronique

Login

 

Article

UTF-8エンコードのテキストに対する文字化けテスト

Author
tomo
Authorised Time
2008-03-15 10:09:02+09:00
Category
Exhibit

UTF-8エンコードのテキストに対する文字化けテスト。

円記号にまつわるテスト

Shift_JISとASCIIとでは同じコードポイント005Cに対する文字割当が異なるので、Shift_JISに於ける同ポイントはUnicodeの円記号00A5に変換するのが本来正しい。 しかし、005Cは単なる字形としてのみならず、ソースコード上で制御文字としても用いられてきたため、正しく変換するとコンパイラーを通らなくなる不具合がある。

そのため、例えばMicrosoft社ではShift_JISの005CをUnicodeの005Cに変換した上で、日本語用フォントの、本来バックスラッシュがあるべき同位置に円記号を置くことで表示に対応している。 日本語圏だけでの互換性を考えるとこれで一見事足るが、実際にはUnicodeを介した国際文字セット変換プロセスで「円記号がバックスラッシュに誤変換される」という不具合が生じる。

名称Unicode コードポイントテキスト
全角円記号0xFFE5
半角円記号0x00A5¥
バックスラッシュ0x005C\

Unicode多言語と拡張文字

Unicodeは当初より、既存の諸国文字セットを統合した大文字セットとして策定されているので、この文字セット上では例えば日本語とアラビア語と韓国語の混在文章などを記述することが出来る。 しかし、実際にUnicode環境が必ずしも各国の文字字形データを搭載しているとは限らず、また搭載していてもウェブ閲覧環境などが正しく文字を表示できるかはけっこう疑わしい。

また、日本のJIS X0213:2004での例示字体変更や追加漢字についても、必ずしも対応していない。

テキスト逢葛飴巷錆諺餌辻蝕逗鴎鷗𠀋𧘕𠮟𠂉あか゚ツ゚ᄀᄹ갪객¿¥\/AbcIl1O092ĀęĬƓêæ̀ƈɣɷئبعกตษ
表示例表示例

文字合成と合成済文字

合成済文字文字合成
U+304CがU+304B; U+3099
U+304EぎU+304D; U+3099
U+3050ぐU+304F; U+3099
U+3052げU+3051; U+3099
U+3054ごU+3053; U+3099
--か゚U+304B; U+309A
--き゚U+304D; U+309A
--く゚U+304F; U+309A
--け゚U+3051; U+309A
--こ゚U+3053; U+309A
U+3056ざU+3055; U+3099
U+3058じU+3057; U+3099
U+305AずU+3059; U+3099
U+305CぜU+305B; U+3099
U+305EぞU+305D; U+3099
U+3060だU+305F; U+3099
U+3062ぢU+3061; U+3099
U+3064づU+3063; U+3099
U+3066でU+3065; U+3099
U+3068どU+3067; U+3099
U+3070ばU+306F; U+3099
U+3073びU+3072; U+3099
U+3076ぶU+3075; U+3099
U+3079べU+3078; U+3099
U+307CぼU+307B; U+3099
U+3071ぱU+306F; U+309A
U+3074ぴU+3072; U+309A
U+3077ぷU+3075; U+309A
U+307AぺU+3078; U+309A
U+307DぽU+307B; U+309A
--ま゙U+307E; U+3099
--わ゙U+308F; U+3099
--ゐ゙U+3090; U+3099
U+3094ゔU+3046; U+3099
--ゑ゙U+3091; U+3099
--を゙U+3092; U+3099
U+30ACガU+30AB; U+3099
U+30AEギU+30AD; U+3099
U+30B0グU+30AF; U+3099
U+30B2ゲU+30B1; U+3099
U+30B4ゴU+30B3; U+3099
--カ゚U+30AB; U+309A
--キ゚U+30AD; U+309A
--ク゚U+30AF; U+309A
--ケ゚U+30B1; U+309A
--コ゚U+30B3; U+309A
U+30B6ザU+30B5; U+3099
U+30B8ジU+30B7; U+3099
U+30BAズU+30B9; U+3099
U+30BCゼU+30BB; U+3099
U+30BEゾU+30BD; U+3099
U+30C0ダU+30BF; U+3099
U+30C2ヂU+30C1; U+3099
U+30C5ヅU+30C4; U+3099
U+30C7デU+30C6; U+3099
U+30C9ドU+30C8; U+3099
U+30D0バU+30CF; U+3099
U+30D3ビU+30D2; U+3099
U+30D6ブU+30D5; U+3099
U+30D9ベU+30D8; U+3099
U+30DCボU+30DB; U+3099
U+30D1パU+30CF; U+309A
U+30D4ピU+30D2; U+309A
U+30D7プU+30D5; U+309A
U+30DAペU+30D8; U+309A
U+30DDポU+30DB; U+309A
U+30F4ヴU+30A6; U+3099
ÀU+00C0U+0041; U+0300
ÁU+00C1U+0041; U+0301
ÂU+00C2U+0041; U+0302
U+1EA6ẦU+0041; U+0302; U+0300
ẦU+00C2; U+0300
U+1EA4ẤU+0041; U+0302; U+0301
ẤU+00C2; U+0301
ÃU+00C3U+0041; U+0303
ĀU+0100U+0041; U+0304
ĂU+0102U+0041; U+0306
ȦU+0226U+0041; U+0307
ǠU+01E0ǠU+0041; U+0307; U+0304
ǠU+0226; U+0304
ÄU+00C4U+0041; U+0308
ǞU+01DEǞU+0041; U+0308; U+0304
ǞU+00C4; U+0304
U+1EA2U+0041; U+0309
ÅU+00C5U+0041; U+030A
ǺU+01FAǺU+0041; U+030A; U+0301
ǺU+00C5; U+0301
ǍU+01CDU+0041; U+030C
ȀU+0200U+0041; U+030F
ȂU+0202U+0041; U+0311
U+1EA0U+0041; U+0323
U+1E00U+0041; U+0325
ĄU+0104U+0041; U+0328
U+1E02U+0042; U+0307
U+1E04U+0042; U+0323
U+1E06U+0042; U+0331
ĆU+0106U+0043; U+0301
ĈU+0108U+0043; U+0302
ĊU+010AU+0043; U+0307
ČU+010CU+0043; U+030C
ÇU+00C7U+0043; U+0327
U+1E08ḈU+0043; U+0327; U+0301
ḈU+00C7; U+0301
U+1E0AU+0044; U+0307
ĎU+010EU+0044; U+030C
U+1E0CU+0044; U+0323
U+1E10U+0044; U+0327
U+1E12U+0044; U+032D
U+1E0EU+0044; U+0331
ÈU+00C8U+0045; U+0300
ÉU+00C9U+0045; U+0301
ÊU+00CAU+0045; U+0302
ĒU+0112U+0045; U+0304
U+1E14ḔU+0045; U+0304; U+0300
ḔU+0112; U+0300
U+1E16ḖU+0045; U+0304; U+0301
ḖU+0112; U+0301
ĔU+0114U+0045; U+0306
ĖU+0116U+0045; U+0307
ËU+00CBU+0045; U+0308
ȄU+0204U+0045; U+030F
ȆU+0206U+0045; U+0311
ȨU+0228U+0045; U+0327
U+1E1CḜU+0045; U+0327; U+0306
ḜU+0228; U+0306
ĘU+0118U+0045; U+0328
U+1E18U+0045; U+032D
U+1E1AU+0045; U+0330
U+1E1EU+0046; U+0307
ǴU+01F4U+0047; U+0301
ĜU+011CU+0047; U+0302
U+1E20U+0047; U+0304
ĞU+011EU+0047; U+0306
ĠU+0120U+0047; U+0307
ǦU+01E6U+0047; U+030C
ĢU+0122U+0047; U+0327
ĤU+0124U+0048; U+0302
U+1E22U+0048; U+0307
U+1E26U+0047; U+0308
ȞU+021EU+0048; U+030C
U+1E24U+0048; U+0323
U+1E28U+0048; U+0327
U+1E2AU+0048; U+032E
ÌU+00CCU+0049; U+0300
ÍU+00CDU+0049; U+0301
ÎU+00CEU+0049; U+0302
ÎU+0128U+0049; U+0303
ĪU+012AU+0049; U+0304
ĬU+012CU+0049; U+0306
İU+0130U+0049; U+0307
ÏU+00CFU+0049; U+0308
U+1E2EḮU+0049; U+0308; U+0301
ḮU+00CF; U+0301
ǏU+01CFU+0049; U+030C
ȈU+0208U+0049; U+030F
ȊU+020AU+0049; U+0311
ĮU+012EU+0049; U+0328
U+1E2CU+0049; U+0330
ĴU+0134U+004A; U+0302
U+1E30U+004B; U+0301
ǨU+01E8U+004B; U+030C
U+1E32U+004B; U+0323
ĶU+0136U+004B; U+0327
U+1E34U+004B; U+0331
ĹU+0139U+004C; U+0301
ĽU+013DU+004C; U+030C
U+1E36U+004C; U+0323
U+1E38ḸU+004C; U+0323; U+0304
ḸU+1E36; U+0304
ĻU+013BU+004C; U+0327
U+1E3CU+004C; U+032D
U+1E3AU+004C; U+0331
U+1E3EU+004D; U+0301
U+1E40U+004D; U+0307
U+1E42U+004D; U+0323
ǸU+01F8U+004E; U+0300
ŃU+0143U+004E; U+0301
ÑU+00D1U+004E; U+0303
U+1E44U+004E; U+0307
ŇU+0147U+004E; U+030C
U+1E46U+004E; U+0323
ŅU+0145U+004E; U+0327
U+1E4AU+004E; U+032D
U+1E48U+004E; U+0331
ÒU+00D2U+004F; U+0300
ÓU+00D3U+004F; U+0301
ÔU+00D4U+004F; U+0302
ÕU+00D5U+004F; U+0303
U+1E4CṌU+004F; U+0303; U+0301
ṌU+00D5; U+0301
ȬU+022CȬU+004F; U+0303; U+0304
ȬU+00D5; U+0304
U+1E4EṎU+004F; U+0303; U+0308
ṎU+00D5; U+0308
ŌU+014CU+004F; U+0304
U+1E50ṐU+004F; U+0304; U+0300
ṐU+014C; U+0300
U+1E52ṒU+004F; U+0304; U+0301
ṒU+014C; U+0301
ÖU+014EU+004F; U+0306
ȮU+022EU+004F; U+0307
ȰU+0230ȰU+004F; U+0307; U+0304
ȰU+022E; U+0304
ÖU+00D6U+004F; U+0308
ȪU+022AȪU+004F; U+0308; U+0304
ȪU+00D6; U+0304
ŐU+0150U+004F; U+030B
ǑU+01D1U+004F; U+030C
ȌU+020CU+004F; U+030F
ȎU+020EU+004F; U+0311
ƠU+01A0U+004F; U+031B
ǪU+01EAU+004F; U+0328
ǬU+01ECǬU+004F; U+0328; U+0304
ǬU+01EA; U+0304
U+1E54U+0050; U+0301
U+1E56U+0050; U+0307
ŔU+0154U+0052; U+0301
U+1E58U+0052; U+0307
ŘU+0158U+0052; U+030C
ȐU+0210U+0052; U+030F
ȒU+0212U+0052; U+0311
U+1E5AU+0052; U+0323
U+1E5CṜU+0052; U+0323; U+0304
ṜU+1E5A; U+0304
ŖU+0156U+0052; U+0327
U+1E5EU+0052; U+0331
ŚU+015AU+0053; U+0301
U+1E64ṤU+0053; U+0301; U+0307
ṤU+015A; U+0307
ŜU+015CU+0053; U+0302
U+1E60U+0053; U+0307
ŠU+0160U+0053; U+030C
U+1E66ṦU+0053; U+030C; U+0307
ṦU+0160; U+0307
U+1E62U+0053; U+0323
ȘU+0218U+0053; U+0326
ŞU+015EU+0053; U+0327
U+1E6AU+0054; U+0307
ŤU+0164U+0054; U+030C
U+1E6CU+0054; U+0323
ȚU+021AU+0054; U+0326
ŢU+0162U+0054; U+0327
U+1E70U+0054; U+032D
U+1E6EU+0054; U+0331
ÙU+00D9U+0055; U+0300
ÚU+00DAU+0055; U+0301
ÛU+00DBU+0055; U+0302
ŨU+0168U+0055; U+0303
U+1E78ṸU+0055; U+0303; U+0301
ṸU+1E78; U+0301
ŪU+016AU+0055; U+0304
U+1E7AṺU+0055; U+0304; U+0308
ṺU+1E7A; U+0308
ŬU+016CU+0055; U+0306
ÜU+00DCU+0055; U+0308
ǛU+01DBǛU+0055; U+0308; U+0300
ǛU+00DC; U+0300
ǗU+01D7ǗU+0055; U+0308; U+0301
ǗU+00DC; U+0301
ǕU+01D5ǕU+0055; U+0308; U+0304
ǕU+00DC; U+0304
ǙU+01D9ǙU+0055; U+0308; U+030C
ǙU+00DC; U+030C
ŮU+016EU+0055; U+030A
ŰU+0170U+0055; U+030B
ǓU+01D3U+0055; U+030C
ȖU+0216U+0055; U+0311
ƯU+01AFU+0055; U+031B
U+1E72U+0055; U+0324
ŲU+0172U+0055; U+0328
U+1E76U+0055; U+032D
U+1E74U+0055; U+0330
U+1E7CU+0056; U+0303
U+1E7EU+0056; U+0323
U+1E80U+0057; U+0300
U+1E82U+0057; U+0301
ŴU+0174U+0057; U+0302
U+1E86U+0057; U+0307
U+1E84U+0057; U+0308
U+1E88U+0057; U+0323
U+1E8AU+0058; U+0307
U+1E8CU+0058; U+0308
ÝU+00DDU+0059; U+0301
ŶU+0176U+0059; U+0302
ȲU+0232U+0059; U+0304
U+1E8EU+0079; U+0307
ŸU+0178U+0059; U+0308
ŹU+0179U+005A; U+0301
U+1E90U+005A; U+0302
ŻU+017BU+005A; U+0307
ŽU+017DU+005A; U+030C
U+1E92U+005A; U+0323
U+1E94U+005A; U+0331
ǼU+01FCǼU+00C6; U+0301
ǢU+01E2ǢU+00C6; U+0304
ǾU+01FEǾU+00D8; U+0301
ǮU+01EEǮU+01B7; U+030C
ΆU+0386ΆU+0391; U+0301
àU+00E0U+0061; U+0300
áU+00E1U+0061; U+0301
âU+00E2U+0061; U+0302
U+1EA5ấU+0061; U+0302; U+0301
ấU+00E2; U+0301
ãU+00E3U+0061; U+0303
āU+0101U+0061; U+0304
ăU+0103U+0061; U+0306
ȧU+0227U+0061; U+0307
ǡU+01E1ǡU+0061; U+0307; U+0304
ȧU+0227; U+0304
äU+00E4U+0061; U+0308
ǟU+01DFǟU+0061; U+0308; U+0304
ǟU+00E4; U+0304
U+1EA3U+0061; U+0309
åU+00E5U+0061; U+030A
ǻU+01FBǻU+0061; U+030A; U+0301
ǻU+00C5; U+0301
ǎU+01CEU+0061; U+030C
ȁU+0201U+0061; U+030F
ȃU+0203U+0061; U+0311
U+1EA1U+0061; U+0323
U+1E01U+0061; U+0325
ąU+0105U+0061; U+0328
U+1E03U+0062; U+0307
U+1E05U+0062; U+0323
U+1E07U+0062; U+0331
ćU+0107U+0063; U+0301
ĉU+0109U+0063; U+0302
ċU+010BU+0063; U+0307
čU+010DU+0063; U+030C
çU+00E7U+0063; U+0327
U+1E09ḉU+0063; U+0327; U+0301
ḉU+00E7; U+0301
U+1E0BU+0064; U+0307
ďU+010FU+0064; U+030C
U+1E0DU+0064; U+0323
U+1E11U+0064; U+0327
U+1E13U+0064; U+032D
U+1E0FU+0064; U+0331
èU+00E8U+0065; U+0300
éU+00E9U+0065; U+0301
êU+00EAU+0065; U+0302
ēU+0113U+0065; U+0304
U+1E15ḕU+0065; U+0304; U+0300
ḕU+0113; U+0300
U+1E17ḗU+0065; U+0304; U+0301
ḗU+0113; U+0301
ĕU+0115U+0065; U+0306
ėU+0117U+0065; U+0307
ëU+00EBU+0065; U+0308
ȅU+0205U+0065; U+030F
ȇU+0207U+0065; U+0311
ȩU+0229U+0065; U+0327
U+1E1DḝU+0065; U+0327; U+0306
ḝU+0229; U+0306
ęU+0119U+0065; U+0328
U+1E19U+0065; U+032D
U+1E1BU+0065; U+0330
U+1E1FU+0066; U+0307
ǵU+01F5U+0067; U+0301
ĝU+011DU+0067; U+0302
U+1E21U+0067; U+0304
ğU+011FU+0067; U+0306
ġU+0121U+0067; U+0307
ǧU+01E7U+0067; U+030C
ģU+0123U+0067; U+0327
ĥU+0125U+0068; U+0302
U+1E23U+0068; U+0307
U+1E27U+0068; U+0308
ȟU+021FU+0068; U+030C
U+1E25U+0068; U+0323
U+1E29U+0068; U+0327
U+1E2BU+0068; U+032E
U+1E96U+0068; U+0331
ìU+00ECU+0069; U+0300
íU+00EDU+0069; U+0301
îU+00EEU+0069; U+0302
ĩU+0129U+0069; U+0303
īU+012BU+0069; U+0304
ĭU+012DU+0069; U+0306
ıU+0131U+0069; U+0307
ïU+00EFU+0069; U+0308
U+1E2FḯU+0069; U+0308; U+0301
ḯU+00EF; U+0301
ǐU+01D0U+0069; U+030C
ȉU+0209U+0069; U+030F
ȋU+020BU+0069; U+0311
įU+012FU+0069; U+0328
U+1E2DU+0069; U+0330
ĵU+0135U+006A; U+0302
ǰU+01F0U+006A; U+030C
U+1E31U+006B; U+0301
ǩU+01E9U+006B; U+030C
U+1E33U+006B; U+0323
ķU+0137U+006B; U+0327
U+1E35U+006B; U+0331
ĺU+013AU+006C; U+0301
ľU+013EU+006C; U+030C
U+1E37U+006C; U+0323
U+1E39ḹU+006C; U+0323; U+0304
ḹU+1E37; U+0304
U+1E3DU+006C; U+032D
ļU+013CU+006C; U+0327
U+1E3BU+006C; U+0331
ḿU+1E3FU+006D; U+0301
U+1E41U+006D; U+0307
U+1E43U+006D; U+0323
ǹU+01F9U+006E; U+0300
ńU+0144U+006E; U+0301
ñU+00F1U+006E; U+0303
U+1E45U+006E; U+0307
ňU+0148U+006E; U+030C
U+1E47U+006E; U+0323
ņU+0146U+006E; U+0327
U+1E4BU+006E; U+032D
U+1E49U+006E; U+0331
òU+00F2U+006F; U+0300
óU+00F3U+006F; U+0301
ôU+00F4U+006F; U+0302
õU+00F5U+006F; U+0303
U+1E4DṍU+006F; U+0303; U+0301
ṍU+00F5; U+0301
ȭU+022DȭU+006F; U+0303; U+0304
ȭU+00F5; U+0304
U+1E4FṏU+006F; U+0303; U+0308
ṏU+00F5; U+0308
ōU+014DU+006F; U+0304
U+1E51ṑU+006F; U+0304; U+0300
ṑU+014D; U+0300
U+1E53ṓU+006F; U+0304; U+0301
ṓU+014D; U+0301
ŏU+014FU+006F; U+0306
ȯU+022FU+006F; U+0307
ȱU+0231ȱU+006F; U+0307; U+0304
ȱU+022F; U+0304
öU+00F6U+006F; U+0308
ȫU+022BȫU+006F; U+0308; U+0304
ȫU+00F6; U+0304
őU+0151U+006F; U+030B
ǒU+01D2U+006F; U+030C
ȍU+020DU+006F; U+030F
ȏU+020FU+006F; U+0311
ơU+01A1U+006F; U+031B
ǫU+01EBU+006F; U+0328
ǭU+01EDǭU+006F; U+0328; U+0304
ǭU+01EB; U+0304
U+1E55U+0070; U+0301
U+1E57U+0070; U+0307
ŕU+0155U+0072; U+0301
U+1E59U+0072; U+0307
řU+0159U+0072; U+030C
ȑU+0211U+0072; U+030F
ȓU+0213U+0072; U+0311
U+1E5BU+0072; U+0323
U+1E5DṝU+0072; U+0323; U+0304
ṝU+1E5B; U+0304
ŗU+0157U+0072; U+0327
U+1E5FU+0072; U+0331
śU+015BU+0073; U+0301
U+1E65ṥU+0073; U+0301; U+0307
ṥU+015B; U+0307
ŝU+015DU+0073; U+0302
U+1E61U+0073; U+0307
šU+0161U+0073; U+030C
U+1E67ṧU+0073; U+030C; U+0307
ṧU+0161; U+0307
U+1E63U+0073; U+0323
șU+0219U+0073; U+0326
şU+015FU+0073; U+0327
U+1E6BU+0074; U+0307
U+1E97U+0074; U+0308
ťU+0165U+0074; U+030C
U+1E6DU+0074; U+0323
țU+021BU+0074; U+0326
ţU+0163U+0074; U+0327
U+1E71U+0074; U+032D
U+1E6FU+0074; U+0331
ùU+00F9U+0075; U+0300
úU+00FAU+0075; U+0301
ûU+00FBU+0075; U+0302
ũU+0169U+0075; U+0303
U+1E79ṹU+0075; U+0303; U+0301
ṹ́U+1E79; U+0301
ūU+016BU+0075; U+0304
U+1E7BṻU+0075; U+0304; U+0308
ṻU+016B; U+0308
ŭU+016DU+0075; U+0306
üU+00FCU+0075; U+0308
ǜU+01DCǜU+0075; U+0308; U+0300
ǜU+00FC; U+0300
ǘU+01D8ǘU+0075; U+0308; U+0301
ǘU+00FC; U+0301
ǖU+01D6ǖU+0075; U+0308; U+0304
ǖU+00FC; U+0304
ǚU+01DAǚU+0075; U+0308; U+030C
ǚU+00FC; U+030C
ůU+016FU+0075; U+030A
űU+0171U+0075; U+030B
ǔU+01D4U+0075; U+030C
ȗU+0217U+0075; U+0311
ưU+01B0U+0075; U+031B
U+1E73U+0075; U+0324
ųU+0173U+0075; U+0328
U+1E77U+0075; U+032D
U+1E75U+0075; U+0330
U+1E7DU+0076; U+0303
ṿU+1E7FU+0076; U+0323
U+1E81U+0077; U+0300
U+1E83U+0077; U+0301
ŵU+0175U+0077; U+0302
U+1E87U+0077; U+0307
U+1E85U+0077; U+0308
U+1E98U+0077; U+030A
U+1E89U+0077; U+0323
U+1E8BU+0078; U+0307
U+1E8DU+0078; U+0308
ýU+00FDU+0079; U+0301
ŷU+0177U+0079; U+0302
ȳU+0233U+0079; U+0304
U+1E8FU+0079; U+0307
ÿU+00FFU+0079; U+0308
źU+017AU+007A; U+0301
U+1E91U+007A; U+0302
żU+017CU+007A; U+0307
žU+017EU+007A; U+030C
U+1E93U+007A; U+0323
U+1E95U+007A; U+0331
ǽU+01FDǽU+00E6; U+0301
ǣU+01E3ǣU+00E6; U+0304
ǿU+01FFǿU+00F8; U+0301
U+1E9BẛU+017F; U+0307
ǯU+01EFǯU+01B7; U+030C
ΆU+0386ΆU+0391; U+0301

合字

合字済文字合字前文字列
ĿU+013FU+004C; U+00B7
U+1E9AʾaU+02BE; U+0061
U+FB00ffU+0066; U+0066
U+FB01fiU+0066; U+0069
U+FB02flU+0066; U+006C
U+FB03ffiU+0066; U+0066; U+0069
ŀU+0140U+006C; U+00B7
ʼnU+0149ʼnU+02BC; U+006E
--˩˥U+02E9; U+02E5
--˥˩U+02E5; U+02E9

異体字

正字と略字, 誤字, 異体字

正字と対応する簡易慣用字体等の略字とが個別のコードポイントに割り振られているケース。
正字略字, 異体字, 誤字備考
UnicodeJIS X 0213UnicodeJIS X 0213
U+4E9EU+4E9C
U+555E1-15-8U+55161-16-2
U+9F9DU+7A50
U+60E1U+60AA
U+71301-87-49U+71141-17-75
U+98F4U+98F4
U+570DU+56F2
U+7232U+70BA
U+91ABU+533B
U+533B
U+58F9U+58F1
U+FA67U+9038
U+7A3BU+7A32
U+98EE1-61-27U+98F21-16-91
U+53401-50-31U+533A1-22-72
U+96B1U+96A0
U+FA1EU+7FBD
U+56531-84-7U+56181-17-19簡易慣用字体として国語審議会により認められている。
U+9B31U+6B1D
U+7E6AU+7D75
U+71DFU+55B6
U+66F5U+66F3
U+69AEU+6804
U+885EU+885B
U+92B3U+92ED
U+9A5BU+99C5
U+6085U+60A6
U+FA621-92-15U+8B011-17-58
U+95B1U+95B2
U+7DE31-90-13U+7E011-17-79
U+9E7DU+5869
U+6A6B1-86-16U+6A2A1-18-3
U+9EC31-94-81U+9EC41-18-11
U+9DD71-94-69U+9D0E1-18-10
U+6EAB1-86-92U+6E291-18-25
𠮟U+20B9F1-47-52U+53F11-28-24「叱」は「か」の意味で、「しかる」の意は全く無いが、 「𠮟」の簡易慣用字体として国語審議会により認められている。
U+FA521-89-31U+798D1-18-50
U+652AU+64B9
U+6E341-86-88U+6E071-19-73
U+FA361-15-12U+559D1-19-69
U+7AC8U+7AC3
U+56991-15-26U+565B1-19-90
U+9B3BU+7CA5
U+52F8U+52E7
U+5377U+5DFB
U+5BECU+5BDB
U+6B61U+6B53
U+9592-U+95931-20-54「閒」は日本の文字セットでは採用されていないが、実は「間」の正字。
U+FA47U+6F22
U+7F50U+7F36
U+704CU+6F45
U+984FU+9854
U+559C1-20-78U+34021-14-3「㐂」は屋号などに古くから使われているが、元は「喜」の別書体を作る過程で生じた単なる間違いであり、誤字。
U+4FE01-14-26U+4FA01-22-2
U+8EC01-92-42U+8EAF1-22-77
U+FA4EU+7948
U+64E7U+6319
U+633EU+631F
U+9A45U+99C6
U+FA631-92-16U+8B391-22-64
U+FA341-14-72U+52E41-22-48
U+8346U+834A
U+52B5U+5238
U+9E7C1-94-74U+9E781-24-20
U+9EB41-94-79U+9EB91-25-77
U+529F1-24-89U+34DB1-14-59「㓛」のつくりが「力」の代わりに「刀」となっているのは単なる書き損じ由来であり、何の歴史的正当性もない単なる誤字。
U+5C621-47-64U+5C611-28-40
U+7E611-90-22U+7E4D1-29-11
U+85231-91-22U+848B1-30-53
U+91AC1-92-89U+91A41-30-63
U+87EC1-91-66U+87491-32-70
U+64141-84-86U+63BB1-33-63
U+9A521-94-20U+9A281-34-45
U+7C1E1-89-73U+7BAA1-35-29
U+64511-84-89U+63B41-36-47
U+58611-15-56U+586B1-37-22
U+985A1-94-3U+985B1-37-31
U+79B11-89-35U+79771-37-88
U+70061-87-29U+6D9C1-38-34
U+56CA1-15-32U+56A21-39-25
U+6F511-87-9U+6E8C1-40-14
U+91B11-92-90U+91971-40-16
U+98301-93-90U+982C1-43-43
U+9EB51-94-80U+9EBA1-44-45
U+840A1-91-6U+83B11-45-73
U+881F1-91-71U+874B1-47-25
U+65221-85-6U+65051-58-25
U+FA301-14-24U+4FAE1-41-78
U+50021-14-28U+4F751-42-27
U+FA311-14-41U+50E71-33-46
U+FA321-14-48U+514D1-44-40
U+FA331-14-67U+52C91-42-57
U+FA351-14-78U+53511-40-60
U+537D1-14-81U+53731-34-8
U+FA371-15-15U+56061-35-18
U+FA381-15-22U+56681-20-79
U+FA101-15-55U+585A1-36-45
U+FA391-15-58U+58401-42-29
U+589E1-15-61U+58971-33-93
U+FA3A1-15-62U+58A81-43-47
U+5BEC1-47-58U+5BDB1-20-18
U+FA3B1-47-65U+5C641-33-56
U+5DE21-84-8U+5DE31-33-67
U+F9281-84-14U+5ECA1-47-13
U+5FB51-84-36U+5FB41-36-7
U+5FB71-84-37U+5FB31-38-33
U+FA3D1-84-48U+60941-18-89
U+FA3E1-84-60U+61681-19-20
憎U+FA3F1-84-62U+618E1-33-94
U+FA401-84-65U+61F21-36-8
U+623E1-84-67U+623B1-44-65
U+63ED1-84-83U+63B21-23-39
U+64CA1-85-2U+64831-23-66
U+FA411-85-8U+654F1-41-50
U+FA421-85-11U+65E21-20-91
U+665A1-85-28U+66691-40-53
U+FA431-85-35U+66911-29-75
U+66C61-85-39U+66A61-46-81
U+F9291-85-46U+67171-47-15
U+FA441-85-69U+68851-39-63
U+69EA1-86-4U+69821-19-21
U+F91D1-86-27U+6B041-45-83
U+6B651-86-35U+6B691-42-66
U+6B771-86-37U+6B741-46-82
U+F9701-86-41U+6BBA1-27-6
U+6BCF1-86-42U+6BCE1-43-72
U+FA451-86-73U+6D771-19-4
U+6D891-86-76U+6E091-30-36
U+6DDA1-86-83U+6D991-46-62
U+FA461-86-87U+6E1A1-29-77
U+70281-87-30U+702C1-32-5
U+FA481-87-53U+716E1-28-49
U+72C01-87-74U+72B61-30-85
U+FA161-87-79U+732A1-35-86
U+FA4A1-88-5U+74221-34-86
U+75011-88-39U+74F61-41-51
U+784F1-89-3U+78141-24-6
U+FA4B1-89-7U+78911-40-74
U+FA4C1-89-19U+793E1-28-50
U+FA4D1-89-20U+79491-27-67
U+FA4E1-89-23U+79481-21-7
U+FA4F1-89-24U+79501-45-20
U+FA501-89-25U+79561-33-36
U+FA511-89-27U+795D1-29-43
U+FA191-89-28U+795E1-31-32
U+FA1A1-89-29U+79651-30-45
U+FA531-89-32U+798E1-36-87
U+FA1B1-89-33U+798F1-42-1
U+FA541-89-45U+7A401-25-82
U+FA551-89-49U+7A811-38-45
U+FA561-89-68U+7BC01-32-65
U+7DA01-90-8U+7DD11-46-48
U+7DD61-90-12U+7DD21-29-79
U+FA571-90-14U+7DF41-46-93
U+FA591-90-19U+7E411-40-43
U+FA5A1-90-26U+7F721-29-80
U+FA5B1-90-36U+80051-28-52
U+FA5C1-90-56U+81ED1-29-13
U+FA5F1-91-7U+84571-35-88
U+85B01-91-32U+85AB1-23-16
U+865B1-91-46U+865A1-21-85
U+F9361-91-47U+865C1-46-26
U+FA601-91-71U+89101-19-76
U+FA611-91-89U+89961-27-75
U+FA221-92-14U+8AF81-29-84
U+FA641-92-24U+8CD31-41-48
U+8CF41-92-26U+983C1-45-74
U+FA651-92-29U+8D081-34-3
U+FA671-92-57U+90381-16-79
U+90DE1-92-71U+90CE1-47-26
U+FA261-92-74U+90FD1-37-52
U+91151-92-76U+90F71-22-31
U+93041-93-21U+93321-47-31
U+934A1-93-27U+932C1-47-3
U+F9DC1-93-61U+96861-46-20
U+FA681-93-67U+96E31-38-81
U+FA691-93-86U+97FF1-22-33
U+FA6A1-93-91U+983B1-41-49
U+F9D01-94-4U+985E1-46-64
U+9ED11-94-82U+9ED21-25-85
U+4FF11-14-1U+50361-22-70簡易慣用字体として認められている。
U+541E1-47-94U+54511-38-61簡易慣用字体として国語審議会により認められている。
U+59F81-94-90U+598D1-53-11簡易慣用字体として国語審議会により認められている。
U+5C5B1-94-91U+5C4F1-54-2簡易慣用字体として国語審議会により認められている。
U+5E771-94-92U+5E761-54-85簡易慣用字体として国語審議会により認められている。
U+76261-94-93U+75E91-33-73簡易慣用字体として国語審議会により認められている。
U+7E6B1-94-94U+7E4B1-23-50簡易慣用字体として国語審議会により認められている。
U+525D1-15-94U+52651-39-77「剥」は国語審議会からも略字としてすら認められていない、単なる嘘字。

Unicode上に別ポイントのある漢字異体字

常用漢字異体字備考
UnicodeJIS X 0213UnicodeJIS X 0213
U+4E081-30-70𠀋U+2000B1-14-2
U+54091-21-40𠮷U+20BB7-
U+4E8C1-38-83𠄞U+2011E-
U+7B2C1-34-72U+3427-
U+9AD81-25-66U+9AD9-
U+5D0E1-26-74U+FA111-47-82
寿U+5BFF1-28-87U+58FD1-52-72
U+52A62-3-35
U+52BB2-3-38
U+52CA2-3-39
U+351F2-3-40
U+52CC1-14-68
U+52D12-3-41

言語属性と異体字セレクタ

例示画像のような按配になるかどうか。 異体字セレクタに関しては正式に各字体が登録完了もしておらず、アプリケーションの対応もこれからだろうけど。

UCSja-JPzh-TWzh-CNkoE0100E0101E0102E0103
U+8FB6辶󠄀辶󠄁辶󠄂辶󠄃
U+9038逸󠄀逸󠄁逸󠄂逸󠄃
U+8279艹󠄀艹󠄁艹󠄂艹󠄃
U+FA5D
U+FA5E
U+84EE蓮󠄀蓮󠄁蓮󠄂
U+722B爫󠄀爫󠄁爫󠄂爫󠄃
U+4E73乳󠄀乳󠄁乳󠄂乳󠄃
U+5224判󠄀判󠄁判󠄂判󠄃
U+9AA8骨󠄀骨󠄁骨󠄂骨󠄃
U+533B医󠄀医󠄁医󠄂医󠄃
U+6B21次󠄀次󠄁次󠄂次󠄃
U+5668器󠄀器󠄁器󠄂器󠄃
U+9EBB麻󠄀麻󠄁麻󠄂麻󠄃
U+89D2角󠄀角󠄁角󠄂角󠄃
U+5C6E屮󠄀屮󠄁屮󠄂屮󠄃
U+4E08丈󠄀丈󠄁丈󠄂丈󠄃
U+4E0E与󠄀与󠄁与󠄂与󠄃

Face Book Comments

Notes