Article
UTF-8エンコードのテキストに対する文字化けテスト。
円記号にまつわるテスト
Shift_JISとASCIIとでは同じコードポイント005Cに対する文字割当が異なるので、Shift_JISに於ける同ポイントはUnicodeの円記号00A5に変換するのが本来正しい。 しかし、005Cは単なる字形としてのみならず、ソースコード上で制御文字としても用いられてきたため、正しく変換するとコンパイラーを通らなくなる不具合があります。
そのため、例えばMicrosoft社ではShift_JISの005CをUnicodeの005Cに変換した上で、日本語用フォントの、本来バックスラッシュがあるべき同位置に円記号を置くことで表示に対応しています。 日本語圏だけでの互換性を考えるとこれで一見事足りますが、実際にはUnicodeを介した国際文字セット変換プロセスで「円記号がバックスラッシュに誤変換される」という不具合が生じます。
| 名称 | Unicode コードポイント | テキスト |
| 全角円記号 | 0xFFE5 | ¥ |
| 半角円記号 | 0x00A5 | ¥ |
| バックスラッシュ | 0x005C | \ |
Unicode多言語と拡張文字
Unicodeは当初より、既存の諸国文字セットを統合した大文字セットとして策定されているので、この文字セット上では例えば日本語とアラビア語と韓国語の混在文章などを記述することが出来ます。 しかし、実際にUnicode環境が必ずしも各国の文字字形データを搭載しているとは限らず、また搭載していてもウェブ閲覧環境などが正しく文字を表示できるかはけっこう疑わしい。
また、日本のJIS X0213:2004での例示字体変更や追加漢字についても、必ずしも対応していません。
| テキスト | 逢葛飴巷錆諺餌辻蝕逗鴎鷗𠀋𧘕𠮟𠂉あか゚ツ゚ᄀᄹ갪객¿¥\/AbcIl1O092ĀęĬƓêæ̀ƈɣɷئبعกตษ |
| 表示例 |  |
文字合成と合成済文字
| 合成済文字 | 文字合成 |
| が | U+304C | が | U+304B; U+3099 |
| ぎ | U+304E | ぎ | U+304D; U+3099 |
| ぐ | U+3050 | ぐ | U+304F; U+3099 |
| げ | U+3052 | げ | U+3051; U+3099 |
| ご | U+3054 | ご | U+3053; U+3099 |
| - | - | か゚ | U+304B; U+309A |
| - | - | き゚ | U+304D; U+309A |
| - | - | く゚ | U+304F; U+309A |
| - | - | け゚ | U+3051; U+309A |
| - | - | こ゚ | U+3053; U+309A |
| ざ | U+3056 | ざ | U+3055; U+3099 |
| じ | U+3058 | じ | U+3057; U+3099 |
| ず | U+305A | ず | U+3059; U+3099 |
| ぜ | U+305C | ぜ | U+305B; U+3099 |
| ぞ | U+305E | ぞ | U+305D; U+3099 |
| だ | U+3060 | だ | U+305F; U+3099 |
| ぢ | U+3062 | ぢ | U+3061; U+3099 |
| づ | U+3064 | づ | U+3063; U+3099 |
| で | U+3066 | で | U+3065; U+3099 |
| ど | U+3068 | ど | U+3067; U+3099 |
| ば | U+3070 | ば | U+306F; U+3099 |
| び | U+3073 | び | U+3072; U+3099 |
| ぶ | U+3076 | ぶ | U+3075; U+3099 |
| べ | U+3079 | べ | U+3078; U+3099 |
| ぼ | U+307C | ぼ | U+307B; U+3099 |
| ぱ | U+3071 | ぱ | U+306F; U+309A |
| ぴ | U+3074 | ぴ | U+3072; U+309A |
| ぷ | U+3077 | ぷ | U+3075; U+309A |
| ぺ | U+307A | ぺ | U+3078; U+309A |
| ぽ | U+307D | ぽ | U+307B; U+309A |
| - | - | ま゙ | U+307E; U+3099 |
| - | - | わ゙ | U+308F; U+3099 |
| - | - | ゐ゙ | U+3090; U+3099 |
| ヴ | U+3094 | ゔ | U+3046; U+3099 |
| - | - | ゑ゙ | U+3091; U+3099 |
| - | - | を゙ | U+3092; U+3099 |
| ガ | U+30AC | ガ | U+30AB; U+3099 |
| ギ | U+30AE | ギ | U+30AD; U+3099 |
| グ | U+30B0 | グ | U+30AF; U+3099 |
| ゲ | U+30B2 | ゲ | U+30B1; U+3099 |
| ゴ | U+30B4 | ゴ | U+30B3; U+3099 |
| - | - | カ゚ | U+30AB; U+309A |
| - | - | キ゚ | U+30AD; U+309A |
| - | - | ク゚ | U+30AF; U+309A |
| - | - | ケ゚ | U+30B1; U+309A |
| - | - | コ゚ | U+30B3; U+309A |
| ザ | U+30B6 | ザ | U+30B5; U+3099 |
| ジ | U+30B8 | ジ | U+30B7; U+3099 |
| ズ | U+30BA | ズ | U+30B9; U+3099 |
| ゼ | U+30BC | ゼ | U+30BB; U+3099 |
| ゾ | U+30BE | ゾ | U+30BD; U+3099 |
| ダ | U+30C0 | ダ | U+30BF; U+3099 |
| ヂ | U+30C2 | チ | U+30C1; U+3099 |
| ヅ | U+30C5 | ツ | U+30C4; U+3099 |
| デ | U+30C7 | テ | U+30C6; U+3099 |
| ド | U+30C9 | ド | U+30C8; U+3099 |
| バ | U+30D0 | バ | U+30CF; U+3099 |
| ビ | U+30D3 | ビ | U+30D2; U+3099 |
| ブ | U+30D6 | ブ | U+30D5; U+3099 |
| ベ | U+30D9 | ベ | U+30D8; U+3099 |
| ボ | U+30DC | ボ | U+30DB; U+3099 |
| パ | U+30D1 | パ | U+30CF; U+309A |
| ピ | U+30D4 | ピ | U+30D2; U+309A |
| プ | U+30D7 | プ | U+30D5; U+309A |
| ペ | U+30DA | ペ | U+30D8; U+309A |
| ポ | U+30DD | ポ | U+30DB; U+309A |
| ヴ | U+30F4 | ヴ | U+30A6; U+3099 |
| À | U+00C0 | À | U+0041; U+0300 |
| Á | U+00C1 | Á | U+0041; U+0301 |
| Â | U+00C2 | Â | U+0041; U+0302 |
| Ầ | U+1EA6 | Ầ | U+0041; U+0302; U+0300 |
| Ầ | U+00C2; U+0300 |
| Ấ | U+1EA4 | Ấ | U+0041; U+0302; U+0301 |
| Ấ | U+00C2; U+0301 |
| Ã | U+00C3 | Ã | U+0041; U+0303 |
| Ā | U+0100 | Ā | U+0041; U+0304 |
| Ă | U+0102 | Ă | U+0041; U+0306 |
| Ȧ | U+0226 | Ȧ | U+0041; U+0307 |
| Ǡ | U+01E0 | Ǡ | U+0041; U+0307; U+0304 |
| Ǡ | U+0226; U+0304 |
| Ä | U+00C4 | Ä | U+0041; U+0308 |
| Ǟ | U+01DE | Ǟ | U+0041; U+0308; U+0304 |
| Ǟ | U+00C4; U+0304 |
| Ả | U+1EA2 | Ả | U+0041; U+0309 |
| Å | U+00C5 | Å | U+0041; U+030A |
| Ǻ | U+01FA | Ǻ | U+0041; U+030A; U+0301 |
| Ǻ | U+00C5; U+0301 |
| Ǎ | U+01CD | Ǎ | U+0041; U+030C |
| Ȁ | U+0200 | Ȁ | U+0041; U+030F |
| Ȃ | U+0202 | Ȃ | U+0041; U+0311 |
| Ạ | U+1EA0 | Ạ | U+0041; U+0323 |
| Ḁ | U+1E00 | Ḁ | U+0041; U+0325 |
| Ą | U+0104 | Ą | U+0041; U+0328 |
| Ḃ | U+1E02 | Ḃ | U+0042; U+0307 |
| Ḅ | U+1E04 | Ḅ | U+0042; U+0323 |
| Ḇ | U+1E06 | Ḇ | U+0042; U+0331 |
| Ć | U+0106 | Ć | U+0043; U+0301 |
| Ĉ | U+0108 | Ĉ | U+0043; U+0302 |
| Ċ | U+010A | Ċ | U+0043; U+0307 |
| Č | U+010C | Č | U+0043; U+030C |
| Ç | U+00C7 | Ç | U+0043; U+0327 |
| Ḉ | U+1E08 | Ḉ | U+0043; U+0327; U+0301 |
| Ḉ | U+00C7; U+0301 |
| Ḋ | U+1E0A | Ḋ | U+0044; U+0307 |
| Ď | U+010E | Ď | U+0044; U+030C |
| Ḍ | U+1E0C | Ḍ | U+0044; U+0323 |
| Ḑ | U+1E10 | Ḑ | U+0044; U+0327 |
| Ḓ | U+1E12 | Ḓ | U+0044; U+032D |
| Ḏ | U+1E0E | Ḏ | U+0044; U+0331 |
| È | U+00C8 | È | U+0045; U+0300 |
| É | U+00C9 | É | U+0045; U+0301 |
| Ê | U+00CA | Ê | U+0045; U+0302 |
| Ē | U+0112 | Ē | U+0045; U+0304 |
| Ḕ | U+1E14 | Ḕ | U+0045; U+0304; U+0300 |
| Ḕ | U+0112; U+0300 |
| Ḗ | U+1E16 | Ḗ | U+0045; U+0304; U+0301 |
| Ḗ | U+0112; U+0301 |
| Ĕ | U+0114 | Ĕ | U+0045; U+0306 |
| Ė | U+0116 | Ė | U+0045; U+0307 |
| Ë | U+00CB | Ë | U+0045; U+0308 |
| Ȅ | U+0204 | Ȅ | U+0045; U+030F |
| Ȇ | U+0206 | Ȇ | U+0045; U+0311 |
| Ȩ | U+0228 | Ȩ | U+0045; U+0327 |
| Ḝ | U+1E1C | Ḝ | U+0045; U+0327; U+0306 |
| Ḝ | U+0228; U+0306 |
| Ę | U+0118 | Ę | U+0045; U+0328 |
| Ḙ | U+1E18 | Ḙ | U+0045; U+032D |
| Ḛ | U+1E1A | Ḛ | U+0045; U+0330 |
| Ḟ | U+1E1E | Ḟ | U+0046; U+0307 |
| Ǵ | U+01F4 | Ǵ | U+0047; U+0301 |
| Ĝ | U+011C | Ĝ | U+0047; U+0302 |
| Ḡ | U+1E20 | Ḡ | U+0047; U+0304 |
| Ğ | U+011E | Ğ | U+0047; U+0306 |
| Ġ | U+0120 | Ġ | U+0047; U+0307 |
| Ǧ | U+01E6 | Ǧ | U+0047; U+030C |
| Ģ | U+0122 | Ģ | U+0047; U+0327 |
| Ĥ | U+0124 | Ĥ | U+0048; U+0302 |
| Ḣ | U+1E22 | Ḣ | U+0048; U+0307 |
| Ḧ | U+1E26 | Ḧ | U+0047; U+0308 |
| Ȟ | U+021E | Ȟ | U+0048; U+030C |
| Ḥ | U+1E24 | Ḥ | U+0048; U+0323 |
| Ḩ | U+1E28 | Ḩ | U+0048; U+0327 |
| Ḫ | U+1E2A | Ḫ | U+0048; U+032E |
| Ì | U+00CC | Ì | U+0049; U+0300 |
| Í | U+00CD | Í | U+0049; U+0301 |
| Î | U+00CE | Î | U+0049; U+0302 |
| Î | U+0128 | Ĩ | U+0049; U+0303 |
| Ī | U+012A | Ī | U+0049; U+0304 |
| Ĭ | U+012C | Ĭ | U+0049; U+0306 |
| İ | U+0130 | İ | U+0049; U+0307 |
| Ï | U+00CF | Ï | U+0049; U+0308 |
| Ḯ | U+1E2E | Ḯ | U+0049; U+0308; U+0301 |
| Ḯ | U+00CF; U+0301 |
| Ǐ | U+01CF | Ǐ | U+0049; U+030C |
| Ȉ | U+0208 | Ȉ | U+0049; U+030F |
| Ȋ | U+020A | Ȋ | U+0049; U+0311 |
| Į | U+012E | Į | U+0049; U+0328 |
| Ḭ | U+1E2C | Ḭ | U+0049; U+0330 |
| Ĵ | U+0134 | Ĵ | U+004A; U+0302 |
| Ḱ | U+1E30 | Ḱ | U+004B; U+0301 |
| Ǩ | U+01E8 | Ǩ | U+004B; U+030C |
| Ḳ | U+1E32 | Ḳ | U+004B; U+0323 |
| Ķ | U+0136 | Ķ | U+004B; U+0327 |
| Ḵ | U+1E34 | Ḵ | U+004B; U+0331 |
| Ĺ | U+0139 | Ĺ | U+004C; U+0301 |
| Ľ | U+013D | Ľ | U+004C; U+030C |
| Ḷ | U+1E36 | Ḷ | U+004C; U+0323 |
| Ḹ | U+1E38 | Ḹ | U+004C; U+0323; U+0304 |
| Ḹ | U+1E36; U+0304 |
| Ļ | U+013B | Ļ | U+004C; U+0327 |
| Ḽ | U+1E3C | Ḽ | U+004C; U+032D |
| Ḻ | U+1E3A | Ḻ | U+004C; U+0331 |
| Ḿ | U+1E3E | Ḿ | U+004D; U+0301 |
| Ṁ | U+1E40 | Ṁ | U+004D; U+0307 |
| Ṃ | U+1E42 | Ṃ | U+004D; U+0323 |
| Ǹ | U+01F8 | Ǹ | U+004E; U+0300 |
| Ń | U+0143 | Ń | U+004E; U+0301 |
| Ñ | U+00D1 | Ñ | U+004E; U+0303 |
| Ṅ | U+1E44 | Ṅ | U+004E; U+0307 |
| Ň | U+0147 | Ň | U+004E; U+030C |
| Ṇ | U+1E46 | Ṇ | U+004E; U+0323 |
| Ņ | U+0145 | Ņ | U+004E; U+0327 |
| Ṋ | U+1E4A | Ṋ | U+004E; U+032D |
| Ṉ | U+1E48 | Ṉ | U+004E; U+0331 |
| Ò | U+00D2 | Ò | U+004F; U+0300 |
| Ó | U+00D3 | Ó | U+004F; U+0301 |
| Ô | U+00D4 | Ô | U+004F; U+0302 |
| Õ | U+00D5 | Õ | U+004F; U+0303 |
| Ṍ | U+1E4C | Ṍ | U+004F; U+0303; U+0301 |
| Ṍ | U+00D5; U+0301 |
| Ȭ | U+022C | Ȭ | U+004F; U+0303; U+0304 |
| Ȭ | U+00D5; U+0304 |
| Ṏ | U+1E4E | Ṏ | U+004F; U+0303; U+0308 |
| Ṏ | U+00D5; U+0308 |
| Ō | U+014C | Ō | U+004F; U+0304 |
| Ṑ | U+1E50 | Ṑ | U+004F; U+0304; U+0300 |
| Ṑ | U+014C; U+0300 |
| Ṓ | U+1E52 | Ṓ | U+004F; U+0304; U+0301 |
| Ṓ | U+014C; U+0301 |
| Ö | U+014E | Ŏ | U+004F; U+0306 |
| Ȯ | U+022E | Ȯ | U+004F; U+0307 |
| Ȱ | U+0230 | Ȱ | U+004F; U+0307; U+0304 |
| Ȱ | U+022E; U+0304 |
| Ö | U+00D6 | Ö | U+004F; U+0308 |
| Ȫ | U+022A | Ȫ | U+004F; U+0308; U+0304 |
| Ȫ | U+00D6; U+0304 |
| Ő | U+0150 | Ő | U+004F; U+030B |
| Ǒ | U+01D1 | Ǒ | U+004F; U+030C |
| Ȍ | U+020C | Ȍ | U+004F; U+030F |
| Ȏ | U+020E | Ȏ | U+004F; U+0311 |
| Ơ | U+01A0 | Ơ | U+004F; U+031B |
| Ǫ | U+01EA | Ǫ | U+004F; U+0328 |
| Ǭ | U+01EC | Ǭ | U+004F; U+0328; U+0304 |
| Ǭ | U+01EA; U+0304 |
| Ṕ | U+1E54 | Ṕ | U+0050; U+0301 |
| Ṗ | U+1E56 | Ṗ | U+0050; U+0307 |
| Ŕ | U+0154 | Ŕ | U+0052; U+0301 |
| Ṙ | U+1E58 | Ṙ | U+0052; U+0307 |
| Ř | U+0158 | Ř | U+0052; U+030C |
| Ȑ | U+0210 | Ȑ | U+0052; U+030F |
| Ȓ | U+0212 | Ȓ | U+0052; U+0311 |
| Ṛ | U+1E5A | Ṛ | U+0052; U+0323 |
| Ṝ | U+1E5C | Ṝ | U+0052; U+0323; U+0304 |
| Ṝ | U+1E5A; U+0304 |
| Ŗ | U+0156 | Ŗ | U+0052; U+0327 |
| Ṟ | U+1E5E | Ṟ | U+0052; U+0331 |
| Ś | U+015A | Ś | U+0053; U+0301 |
| Ṥ | U+1E64 | Ṥ | U+0053; U+0301; U+0307 |
| Ṥ | U+015A; U+0307 |
| Ŝ | U+015C | Ŝ | U+0053; U+0302 |
| Ṡ | U+1E60 | Ṡ | U+0053; U+0307 |
| Š | U+0160 | Š | U+0053; U+030C |
| Ṧ | U+1E66 | Ṧ | U+0053; U+030C; U+0307 |
| Ṧ | U+0160; U+0307 |
| Ṣ | U+1E62 | Ṣ | U+0053; U+0323 |
| Ș | U+0218 | Ș | U+0053; U+0326 |
| Ş | U+015E | Ş | U+0053; U+0327 |
| Ṫ | U+1E6A | Ṫ | U+0054; U+0307 |
| Ť | U+0164 | Ť | U+0054; U+030C |
| Ṭ | U+1E6C | Ṭ | U+0054; U+0323 |
| Ț | U+021A | Ț | U+0054; U+0326 |
| Ţ | U+0162 | Ţ | U+0054; U+0327 |
| Ṱ | U+1E70 | Ṱ | U+0054; U+032D |
| Ṯ | U+1E6E | Ṯ | U+0054; U+0331 |
| Ù | U+00D9 | Ù | U+0055; U+0300 |
| Ú | U+00DA | Ú | U+0055; U+0301 |
| Û | U+00DB | Û | U+0055; U+0302 |
| Ũ | U+0168 | Ũ | U+0055; U+0303 |
| Ṹ | U+1E78 | Ṹ | U+0055; U+0303; U+0301 |
| Ṹ | U+1E78; U+0301 |
| Ū | U+016A | Ū | U+0055; U+0304 |
| Ṻ | U+1E7A | Ṻ | U+0055; U+0304; U+0308 |
| Ṻ | U+1E7A; U+0308 |
| Ŭ | U+016C | Ŭ | U+0055; U+0306 |
| Ü | U+00DC | Ü | U+0055; U+0308 |
| Ǜ | U+01DB | Ǜ | U+0055; U+0308; U+0300 |
| Ǜ | U+00DC; U+0300 |
| Ǘ | U+01D7 | Ǘ | U+0055; U+0308; U+0301 |
| Ǘ | U+00DC; U+0301 |
| Ǖ | U+01D5 | Ǖ | U+0055; U+0308; U+0304 |
| Ǖ | U+00DC; U+0304 |
| Ǚ | U+01D9 | Ǚ | U+0055; U+0308; U+030C |
| Ǚ | U+00DC; U+030C |
| Ů | U+016E | Ů | U+0055; U+030A |
| Ű | U+0170 | Ű | U+0055; U+030B |
| Ǔ | U+01D3 | Ǔ | U+0055; U+030C |
| Ȗ | U+0216 | Ȗ | U+0055; U+0311 |
| Ư | U+01AF | Ư | U+0055; U+031B |
| Ṳ | U+1E72 | Ṳ | U+0055; U+0324 |
| Ų | U+0172 | Ų | U+0055; U+0328 |
| Ṷ | U+1E76 | Ṷ | U+0055; U+032D |
| Ṵ | U+1E74 | Ṵ | U+0055; U+0330 |
| Ṽ | U+1E7C | Ṽ | U+0056; U+0303 |
| Ṿ | U+1E7E | Ṿ | U+0056; U+0323 |
| Ẁ | U+1E80 | Ẁ | U+0057; U+0300 |
| Ẃ | U+1E82 | Ẃ | U+0057; U+0301 |
| Ŵ | U+0174 | Ŵ | U+0057; U+0302 |
| Ẇ | U+1E86 | Ẇ | U+0057; U+0307 |
| Ẅ | U+1E84 | Ẅ | U+0057; U+0308 |
| Ẉ | U+1E88 | Ẉ | U+0057; U+0323 |
| Ẋ | U+1E8A | Ẋ | U+0058; U+0307 |
| Ẍ | U+1E8C | Ẍ | U+0058; U+0308 |
| Ý | U+00DD | Ý | U+0059; U+0301 |
| Ŷ | U+0176 | Ŷ | U+0059; U+0302 |
| Ȳ | U+0232 | Ȳ | U+0059; U+0304 |
| Ẏ | U+1E8E | Ẏ | U+0079; U+0307 |
| Ÿ | U+0178 | Ÿ | U+0059; U+0308 |
| Ź | U+0179 | Ź | U+005A; U+0301 |
| Ẑ | U+1E90 | Ẑ | U+005A; U+0302 |
| Ż | U+017B | Ż | U+005A; U+0307 |
| Ž | U+017D | Ž | U+005A; U+030C |
| Ẓ | U+1E92 | Ẓ | U+005A; U+0323 |
| Ẕ | U+1E94 | Ẕ | U+005A; U+0331 |
| Ǽ | U+01FC | Ǽ | U+00C6; U+0301 |
| Ǣ | U+01E2 | Ǣ | U+00C6; U+0304 |
| Ǿ | U+01FE | Ǿ | U+00D8; U+0301 |
| Ǯ | U+01EE | Ǯ | U+01B7; U+030C |
| Ά | U+0386 | Ά | U+0391; U+0301 |
| à | U+00E0 | à | U+0061; U+0300 |
| á | U+00E1 | ȧ | U+0061; U+0301 |
| â | U+00E2 | â | U+0061; U+0302 |
| ấ | U+1EA5 | ấ | U+0061; U+0302; U+0301 |
| ấ | U+00E2; U+0301 |
| ã | U+00E3 | ã | U+0061; U+0303 |
| ā | U+0101 | ā | U+0061; U+0304 |
| ă | U+0103 | ă | U+0061; U+0306 |
| ȧ | U+0227 | ȧ | U+0061; U+0307 |
| ǡ | U+01E1 | ǡ | U+0061; U+0307; U+0304 |
| ȧ | U+0227; U+0304 |
| ä | U+00E4 | ä | U+0061; U+0308 |
| ǟ | U+01DF | ǟ | U+0061; U+0308; U+0304 |
| ǟ | U+00E4; U+0304 |
| ả | U+1EA3 | ả | U+0061; U+0309 |
| å | U+00E5 | å | U+0061; U+030A |
| ǻ | U+01FB | ǻ | U+0061; U+030A; U+0301 |
| ǻ | U+00C5; U+0301 |
| ǎ | U+01CE | ǎ | U+0061; U+030C |
| ȁ | U+0201 | ȁ | U+0061; U+030F |
| ȃ | U+0203 | ȃ | U+0061; U+0311 |
| ạ | U+1EA1 | ạ | U+0061; U+0323 |
| ḁ | U+1E01 | ḁ | U+0061; U+0325 |
| ą | U+0105 | ą | U+0061; U+0328 |
| ḃ | U+1E03 | ḃ | U+0062; U+0307 |
| ḅ | U+1E05 | ḅ | U+0062; U+0323 |
| ḇ | U+1E07 | ḇ | U+0062; U+0331 |
| ć | U+0107 | ć | U+0063; U+0301 |
| ĉ | U+0109 | ĉ | U+0063; U+0302 |
| ċ | U+010B | ċ | U+0063; U+0307 |
| č | U+010D | č | U+0063; U+030C |
| ç | U+00E7 | ç | U+0063; U+0327 |
| ḉ | U+1E09 | ḉ | U+0063; U+0327; U+0301 |
| ḉ | U+00E7; U+0301 |
| ḋ | U+1E0B | ḋ | U+0064; U+0307 |
| ď | U+010F | ď | U+0064; U+030C |
| ḍ | U+1E0D | ḍ | U+0064; U+0323 |
| ḑ | U+1E11 | ḑ | U+0064; U+0327 |
| ḓ | U+1E13 | ḓ | U+0064; U+032D |
| ḏ | U+1E0F | ḏ | U+0064; U+0331 |
| è | U+00E8 | è | U+0065; U+0300 |
| é | U+00E9 | é | U+0065; U+0301 |
| ê | U+00EA | ê | U+0065; U+0302 |
| ē | U+0113 | ē | U+0065; U+0304 |
| ḕ | U+1E15 | ḕ | U+0065; U+0304; U+0300 |
| ḕ | U+0113; U+0300 |
| ḗ | U+1E17 | ḗ | U+0065; U+0304; U+0301 |
| ḗ | U+0113; U+0301 |
| ĕ | U+0115 | ĕ | U+0065; U+0306 |
| ė | U+0117 | ė | U+0065; U+0307 |
| ë | U+00EB | ë | U+0065; U+0308 |
| ȅ | U+0205 | ȅ | U+0065; U+030F |
| ȇ | U+0207 | ȇ | U+0065; U+0311 |
| ȩ | U+0229 | ȩ | U+0065; U+0327 |
| ḝ | U+1E1D | ḝ | U+0065; U+0327; U+0306 |
| ḝ | U+0229; U+0306 |
| ę | U+0119 | ę | U+0065; U+0328 |
| ḙ | U+1E19 | ḙ | U+0065; U+032D |
| ḛ | U+1E1B | ḛ | U+0065; U+0330 |
| ḟ | U+1E1F | ḟ | U+0066; U+0307 |
| ǵ | U+01F5 | ǵ | U+0067; U+0301 |
| ĝ | U+011D | ĝ | U+0067; U+0302 |
| ḡ | U+1E21 | ḡ | U+0067; U+0304 |
| ğ | U+011F | ğ | U+0067; U+0306 |
| ġ | U+0121 | ġ | U+0067; U+0307 |
| ǧ | U+01E7 | ǧ | U+0067; U+030C |
| ģ | U+0123 | ģ | U+0067; U+0327 |
| ĥ | U+0125 | ĥ | U+0068; U+0302 |
| ḣ | U+1E23 | ḣ | U+0068; U+0307 |
| ḧ | U+1E27 | ḧ | U+0068; U+0308 |
| ȟ | U+021F | ȟ | U+0068; U+030C |
| ḥ | U+1E25 | ḥ | U+0068; U+0323 |
| ḩ | U+1E29 | ḩ | U+0068; U+0327 |
| ḫ | U+1E2B | ḫ | U+0068; U+032E |
| ẖ | U+1E96 | ẖ | U+0068; U+0331 |
| ì | U+00EC | ì | U+0069; U+0300 |
| í | U+00ED | í | U+0069; U+0301 |
| î | U+00EE | î | U+0069; U+0302 |
| ĩ | U+0129 | ĩ | U+0069; U+0303 |
| ī | U+012B | ī | U+0069; U+0304 |
| ĭ | U+012D | ĭ | U+0069; U+0306 |
| ı | U+0131 | i̇ | U+0069; U+0307 |
| ï | U+00EF | ï | U+0069; U+0308 |
| ḯ | U+1E2F | ḯ | U+0069; U+0308; U+0301 |
| ḯ | U+00EF; U+0301 |
| ǐ | U+01D0 | ǐ | U+0069; U+030C |
| ȉ | U+0209 | ȉ | U+0069; U+030F |
| ȋ | U+020B | ȋ | U+0069; U+0311 |
| į | U+012F | į | U+0069; U+0328 |
| ḭ | U+1E2D | ḭ | U+0069; U+0330 |
| ĵ | U+0135 | ĵ | U+006A; U+0302 |
| ǰ | U+01F0 | ǰ | U+006A; U+030C |
| ḱ | U+1E31 | ḱ | U+006B; U+0301 |
| ǩ | U+01E9 | ǩ | U+006B; U+030C |
| ḳ | U+1E33 | ḳ | U+006B; U+0323 |
| ķ | U+0137 | ķ | U+006B; U+0327 |
| ḵ | U+1E35 | ḵ | U+006B; U+0331 |
| ĺ | U+013A | ĺ | U+006C; U+0301 |
| ľ | U+013E | ľ | U+006C; U+030C |
| ḷ | U+1E37 | ḷ | U+006C; U+0323 |
| ḹ | U+1E39 | ḹ | U+006C; U+0323; U+0304 |
| ḹ | U+1E37; U+0304 |
| ḽ | U+1E3D | ḽ | U+006C; U+032D |
| ļ | U+013C | ļ | U+006C; U+0327 |
| ḻ | U+1E3B | ḻ | U+006C; U+0331 |
| ḿ | U+1E3F | ḿ | U+006D; U+0301 |
| ṁ | U+1E41 | ṁ | U+006D; U+0307 |
| ṃ | U+1E43 | ṃ | U+006D; U+0323 |
| ǹ | U+01F9 | ǹ | U+006E; U+0300 |
| ń | U+0144 | ń | U+006E; U+0301 |
| ñ | U+00F1 | ñ | U+006E; U+0303 |
| ṅ | U+1E45 | ṅ | U+006E; U+0307 |
| ň | U+0148 | ň | U+006E; U+030C |
| ṇ | U+1E47 | ṇ | U+006E; U+0323 |
| ņ | U+0146 | ņ | U+006E; U+0327 |
| ṋ | U+1E4B | ṋ | U+006E; U+032D |
| ṉ | U+1E49 | ṉ | U+006E; U+0331 |
| ò | U+00F2 | ò | U+006F; U+0300 |
| ó | U+00F3 | ó | U+006F; U+0301 |
| ô | U+00F4 | ô | U+006F; U+0302 |
| õ | U+00F5 | õ | U+006F; U+0303 |
| ṍ | U+1E4D | ṍ | U+006F; U+0303; U+0301 |
| ṍ | U+00F5; U+0301 |
| ȭ | U+022D | ȭ | U+006F; U+0303; U+0304 |
| ȭ | U+00F5; U+0304 |
| ṏ | U+1E4F | ṏ | U+006F; U+0303; U+0308 |
| ṏ | U+00F5; U+0308 |
| ō | U+014D | ō | U+006F; U+0304 |
| ṑ | U+1E51 | ṑ | U+006F; U+0304; U+0300 |
| ṑ | U+014D; U+0300 |
| ṓ | U+1E53 | ṓ | U+006F; U+0304; U+0301 |
| ṓ | U+014D; U+0301 |
| ŏ | U+014F | ŏ | U+006F; U+0306 |
| ȯ | U+022F | ȯ | U+006F; U+0307 |
| ȱ | U+0231 | ȱ | U+006F; U+0307; U+0304 |
| ȱ | U+022F; U+0304 |
| ö | U+00F6 | ö | U+006F; U+0308 |
| ȫ | U+022B | ȫ | U+006F; U+0308; U+0304 |
| ȫ | U+00F6; U+0304 |
| ő | U+0151 | ő | U+006F; U+030B |
| ǒ | U+01D2 | ǒ | U+006F; U+030C |
| ȍ | U+020D | ȍ | U+006F; U+030F |
| ȏ | U+020F | ȏ | U+006F; U+0311 |
| ơ | U+01A1 | ơ | U+006F; U+031B |
| ǫ | U+01EB | ǫ | U+006F; U+0328 |
| ǭ | U+01ED | ǭ | U+006F; U+0328; U+0304 |
| ǭ | U+01EB; U+0304 |
| ṕ | U+1E55 | ṕ | U+0070; U+0301 |
| ṗ | U+1E57 | ṗ | U+0070; U+0307 |
| ŕ | U+0155 | ŕ | U+0072; U+0301 |
| ṙ | U+1E59 | ṙ | U+0072; U+0307 |
| ř | U+0159 | ř | U+0072; U+030C |
| ȑ | U+0211 | ȑ | U+0072; U+030F |
| ȓ | U+0213 | ȓ | U+0072; U+0311 |
| ṛ | U+1E5B | ṛ | U+0072; U+0323 |
| ṝ | U+1E5D | ṝ | U+0072; U+0323; U+0304 |
| ṝ | U+1E5B; U+0304 |
| ŗ | U+0157 | ŗ | U+0072; U+0327 |
| ṟ | U+1E5F | ṟ | U+0072; U+0331 |
| ś | U+015B | ś | U+0073; U+0301 |
| ṥ | U+1E65 | ṥ | U+0073; U+0301; U+0307 |
| ṥ | U+015B; U+0307 |
| ŝ | U+015D | ŝ | U+0073; U+0302 |
| ṡ | U+1E61 | ṡ | U+0073; U+0307 |
| š | U+0161 | š | U+0073; U+030C |
| ṧ | U+1E67 | ṧ | U+0073; U+030C; U+0307 |
| ṧ | U+0161; U+0307 |
| ṣ | U+1E63 | ṣ | U+0073; U+0323 |
| ș | U+0219 | ș | U+0073; U+0326 |
| ş | U+015F | ş | U+0073; U+0327 |
| ṫ | U+1E6B | ṫ | U+0074; U+0307 |
| ẗ | U+1E97 | ẗ | U+0074; U+0308 |
| ť | U+0165 | ť | U+0074; U+030C |
| ṭ | U+1E6D | ṭ | U+0074; U+0323 |
| ț | U+021B | ț | U+0074; U+0326 |
| ţ | U+0163 | ţ | U+0074; U+0327 |
| ṱ | U+1E71 | ṱ | U+0074; U+032D |
| ṯ | U+1E6F | ṯ | U+0074; U+0331 |
| ù | U+00F9 | ù | U+0075; U+0300 |
| ú | U+00FA | ú | U+0075; U+0301 |
| û | U+00FB | û | U+0075; U+0302 |
| ũ | U+0169 | ũ | U+0075; U+0303 |
| ṹ | U+1E79 | ṹ | U+0075; U+0303; U+0301 |
| ṹ́ | U+1E79; U+0301 |
| ū | U+016B | ū | U+0075; U+0304 |
| ṻ | U+1E7B | ṻ | U+0075; U+0304; U+0308 |
| ṻ | U+016B; U+0308 |
| ŭ | U+016D | ŭ | U+0075; U+0306 |
| ü | U+00FC | ü | U+0075; U+0308 |
| ǜ | U+01DC | ǜ | U+0075; U+0308; U+0300 |
| ǜ | U+00FC; U+0300 |
| ǘ | U+01D8 | ǘ | U+0075; U+0308; U+0301 |
| ǘ | U+00FC; U+0301 |
| ǖ | U+01D6 | ǖ | U+0075; U+0308; U+0304 |
| ǖ | U+00FC; U+0304 |
| ǚ | U+01DA | ǚ | U+0075; U+0308; U+030C |
| ǚ | U+00FC; U+030C |
| ů | U+016F | ů | U+0075; U+030A |
| ű | U+0171 | ű | U+0075; U+030B |
| ǔ | U+01D4 | ǔ | U+0075; U+030C |
| ȗ | U+0217 | ȗ | U+0075; U+0311 |
| ư | U+01B0 | ư | U+0075; U+031B |
| ṳ | U+1E73 | ṳ | U+0075; U+0324 |
| ų | U+0173 | ų | U+0075; U+0328 |
| ṷ | U+1E77 | ṷ | U+0075; U+032D |
| ṵ | U+1E75 | ṵ | U+0075; U+0330 |
| ṽ | U+1E7D | ṽ | U+0076; U+0303 |
| ṿ | U+1E7F | ṿ | U+0076; U+0323 |
| ẁ | U+1E81 | ẁ | U+0077; U+0300 |
| ẃ | U+1E83 | ẃ | U+0077; U+0301 |
| ŵ | U+0175 | ŵ | U+0077; U+0302 |
| ẇ | U+1E87 | ẇ | U+0077; U+0307 |
| ẅ | U+1E85 | ẅ | U+0077; U+0308 |
| ẘ | U+1E98 | ẘ | U+0077; U+030A |
| ẉ | U+1E89 | ẉ | U+0077; U+0323 |
| ẋ | U+1E8B | ẋ | U+0078; U+0307 |
| ẍ | U+1E8D | ẍ | U+0078; U+0308 |
| ý | U+00FD | ý | U+0079; U+0301 |
| ŷ | U+0177 | ŷ | U+0079; U+0302 |
| ȳ | U+0233 | ȳ | U+0079; U+0304 |
| ẏ | U+1E8F | ẏ | U+0079; U+0307 |
| ÿ | U+00FF | ÿ | U+0079; U+0308 |
| ź | U+017A | ź | U+007A; U+0301 |
| ẑ | U+1E91 | ẑ | U+007A; U+0302 |
| ż | U+017C | ż | U+007A; U+0307 |
| ž | U+017E | ž | U+007A; U+030C |
| ẓ | U+1E93 | ẓ | U+007A; U+0323 |
| ẕ | U+1E95 | ẕ | U+007A; U+0331 |
| ǽ | U+01FD | ǽ | U+00E6; U+0301 |
| ǣ | U+01E3 | ǣ | U+00E6; U+0304 |
| ǿ | U+01FF | ǿ | U+00F8; U+0301 |
| ẛ | U+1E9B | ẛ | U+017F; U+0307 |
| ǯ | U+01EF | ǯ | U+01B7; U+030C |
| Ά | U+0386 | Ά | U+0391; U+0301 |
合字
| 合字済文字 | 合字前文字列 |
| Ŀ | U+013F | L· | U+004C; U+00B7 |
| ẚ | U+1E9A | ʾa | U+02BE; U+0061 |
| ff | U+FB00 | ff | U+0066; U+0066 |
| fi | U+FB01 | fi | U+0066; U+0069 |
| fl | U+FB02 | fl | U+0066; U+006C |
| ffi | U+FB03 | ffi | U+0066; U+0066; U+0069 |
| ŀ | U+0140 | l· | U+006C; U+00B7 |
| ʼn | U+0149 | ʼn | U+02BC; U+006E |
| - | - | ˩˥ | U+02E9; U+02E5 |
| - | - | ˥˩ | U+02E5; U+02E9 |
異体字
正字と略字, 誤字, 異体字
正字と対応する簡易慣用字体等の略字とが個別のコードポイントに割り振られているケース。
| 正字 | 略字, 異体字, 誤字 | 備考 |
| 字 | Unicode | JIS X 0213 | 字 | Unicode | JIS X 0213 |
| 亞 | U+4E9E | | 亜 | U+4E9C | | |
| 啞 | U+555E | 1-15-8 | 唖 | U+5516 | 1-16-2 | |
| 龝 | U+9F9D | | 穐 | U+7A50 | | |
| 惡 | U+60E1 | | 悪 | U+60AA | | |
| 焰 | U+7130 | 1-87-49 | 焔 | U+7114 | 1-17-75 | |
| 飴 | U+98F4 | | 飴 | U+98F4 | | |
| 圍 | U+570D | | 囲 | U+56F2 | | |
| 爲 | U+7232 | | 為 | U+70BA | | |
| 醫 | U+91AB | | 医 | U+533B | | |
| 医 | U+533B | | |
| 壹 | U+58F9 | | 壱 | U+58F1 | | |
| 逸 | U+FA67 | | 逸 | U+9038 | | |
| 稻 | U+7A3B | | 稲 | U+7A32 | | |
| 飮 | U+98EE | 1-61-27 | 飲 | U+98F2 | 1-16-91 | |
| 區 | U+5340 | 1-50-31 | 区 | U+533A | 1-22-72 | |
| 隱 | U+96B1 | | 隠 | U+96A0 | | |
| 羽 | U+FA1E | | 羽 | U+7FBD | | |
| 噓 | U+5653 | 1-84-7 | 嘘 | U+5618 | 1-17-19 | 簡易慣用字体として国語審議会により認められています。 |
| 鬱 | U+9B31 | | 欝 | U+6B1D | | |
| 繪 | U+7E6A | | 絵 | U+7D75 | | |
| 營 | U+71DF | | 営 | U+55B6 | | |
| 曵 | U+66F5 | | 曳 | U+66F3 | | |
| 榮 | U+69AE | | 栄 | U+6804 | | |
| 衞 | U+885E | | 衛 | U+885B | | |
| 銳 | U+92B3 | | 鋭 | U+92ED | | |
| 驛 | U+9A5B | | 駅 | U+99C5 | | |
| 悅 | U+6085 | | 悦 | U+60A6 | | |
| 謁 | U+FA62 | 1-92-15 | 謁 | U+8B01 | 1-17-58 | |
| 閱 | U+95B1 | | 閲 | U+95B2 | | |
| 緣 | U+7DE3 | 1-90-13 | 縁 | U+7E01 | 1-17-79 | |
| 鹽 | U+9E7D | | 塩 | U+5869 | | |
| 橫 | U+6A6B | 1-86-16 | 横 | U+6A2A | 1-18-3 | |
| 黃 | U+9EC3 | 1-94-81 | 黄 | U+9EC4 | 1-18-11 | |
| 鷗 | U+9DD7 | 1-94-69 | 鴎 | U+9D0E | 1-18-10 | |
| 溫 | U+6EAB | 1-86-92 | 温 | U+6E29 | 1-18-25 | |
| 𠮟 | U+20B9F | 1-47-52 | 叱 | U+53F1 | 1-28-24 | 「叱」は「か」の意味で、「しかる」の意は全くありませんが、 「𠮟」の簡易慣用字体として国語審議会により認められています。 |
| 禍 | U+FA52 | 1-89-31 | 禍 | U+798D | 1-18-50 | |
| 攪 | U+652A | | 撹 | U+64B9 | | |
| 渴 | U+6E34 | 1-86-88 | 渇 | U+6E07 | 1-19-73 | |
| 喝 | U+FA36 | 1-15-12 | 喝 | U+559D | 1-19-69 | |
| 竈 | U+7AC8 | | 竃 | U+7AC3 | | |
| 嚙 | U+5699 | 1-15-26 | 噛 | U+565B | 1-19-90 | |
| 鬻 | U+9B3B | | 粥 | U+7CA5 | | |
| 勸 | U+52F8 | | 勧 | U+52E7 | | |
| 卷 | U+5377 | | 巻 | U+5DFB | | |
| 寬 | U+5BEC | | 寛 | U+5BDB | | |
| 歡 | U+6B61 | | 歓 | U+6B53 | | |
| 閒 | U+9592 | - | 間 | U+9593 | 1-20-54 | 「閒」は日本の文字セットでは採用されていませんが、実は「間」の正字。 |
| 漢 | U+FA47 | | 漢 | U+6F22 | | |
| 罐 | U+7F50 | | 缶 | U+7F36 | | |
| 灌 | U+704C | | 潅 | U+6F45 | | |
| 顏 | U+984F | | 顔 | U+9854 | | |
| 喜 | U+559C | 1-20-78 | 㐂 | U+3402 | 1-14-3 | 「㐂」は屋号などに古くから使われていますが、元は「喜」の別書体を作る過程で生じた単なる間違いであり、誤字。 |
| 俠 | U+4FE0 | 1-14-26 | 侠 | U+4FA0 | 1-22-2 | |
| 軀 | U+8EC0 | 1-92-42 | 躯 | U+8EAF | 1-22-77 | |
| 祈 | U+FA4E | | 祈 | U+7948 | | |
| 擧 | U+64E7 | | 挙 | U+6319 | | |
| 挾 | U+633E | | 挟 | U+631F | | |
| 驅 | U+9A45 | | 駆 | U+99C6 | | |
| 謹 | U+FA63 | 1-92-16 | 謹 | U+8B39 | 1-22-64 | |
| 勤 | U+FA34 | 1-14-72 | 勤 | U+52E4 | 1-22-48 | |
| 荆 | U+8346 | | 荊 | U+834A | | |
| 劵 | U+52B5 | | 券 | U+5238 | | |
| 鹼 | U+9E7C | 1-94-74 | 鹸 | U+9E78 | 1-24-20 | |
| 麴 | U+9EB4 | 1-94-79 | 麹 | U+9EB9 | 1-25-77 | |
| 功 | U+529F | 1-24-89 | 㓛 | U+34DB | 1-14-59 | 「㓛」のつくりが「力」の代わりに「刀」となっているのは単なる書き損じ由来であり、何の歴史的正当性もない単なる誤字。 |
| 屢 | U+5C62 | 1-47-64 | 屡 | U+5C61 | 1-28-40 | |
| 繡 | U+7E61 | 1-90-22 | 繍 | U+7E4D | 1-29-11 | |
| 蔣 | U+8523 | 1-91-22 | 蒋 | U+848B | 1-30-53 | |
| 醬 | U+91AC | 1-92-89 | 醤 | U+91A4 | 1-30-63 | |
| 蟬 | U+87EC | 1-91-66 | 蝉 | U+8749 | 1-32-70 | |
| 搔 | U+6414 | 1-84-86 | 掻 | U+63BB | 1-33-63 | |
| 驒 | U+9A52 | 1-94-20 | 騨 | U+9A28 | 1-34-45 | |
| 簞 | U+7C1E | 1-89-73 | 箪 | U+7BAA | 1-35-29 | |
| 摑 | U+6451 | 1-84-89 | 掴 | U+63B4 | 1-36-47 | |
| 塡 | U+5861 | 1-15-56 | 填 | U+586B | 1-37-22 | |
| 顚 | U+985A | 1-94-3 | 顛 | U+985B | 1-37-31 | |
| 禱 | U+79B1 | 1-89-35 | 祷 | U+7977 | 1-37-88 | |
| 瀆 | U+7006 | 1-87-29 | 涜 | U+6D9C | 1-38-34 | |
| 囊 | U+56CA | 1-15-32 | 嚢 | U+56A2 | 1-39-25 | |
| 潑 | U+6F51 | 1-87-9 | 溌 | U+6E8C | 1-40-14 | |
| 醱 | U+91B1 | 1-92-90 | 醗 | U+9197 | 1-40-16 | |
| 頰 | U+9830 | 1-93-90 | 頬 | U+982C | 1-43-43 | |
| 麵 | U+9EB5 | 1-94-80 | 麺 | U+9EBA | 1-44-45 | |
| 萊 | U+840A | 1-91-6 | 莱 | U+83B1 | 1-45-73 | |
| 蠟 | U+881F | 1-91-71 | 蝋 | U+874B | 1-47-25 | |
| 攢 | U+6522 | 1-85-6 | 攅 | U+6505 | 1-58-25 | |
| 侮 | U+FA30 | 1-14-24 | 侮 | U+4FAE | 1-41-78 | |
| 倂 | U+5002 | 1-14-28 | 併 | U+4F75 | 1-42-27 | |
| 僧 | U+FA31 | 1-14-41 | 僧 | U+50E7 | 1-33-46 | |
| 免 | U+FA32 | 1-14-48 | 免 | U+514D | 1-44-40 | |
| 勉 | U+FA33 | 1-14-67 | 勉 | U+52C9 | 1-42-57 | |
| 卑 | U+FA35 | 1-14-78 | 卑 | U+5351 | 1-40-60 | |
| 卽 | U+537D | 1-14-81 | 即 | U+5373 | 1-34-8 | |
| 嘆 | U+FA37 | 1-15-15 | 嘆 | U+5606 | 1-35-18 | |
| 器 | U+FA38 | 1-15-22 | 器 | U+5668 | 1-20-79 | |
| 塚 | U+FA10 | 1-15-55 | 塚 | U+585A | 1-36-45 | |
| 塀 | U+FA39 | 1-15-58 | 塀 | U+5840 | 1-42-29 | |
| 增 | U+589E | 1-15-61 | 増 | U+5897 | 1-33-93 | |
| 墨 | U+FA3A | 1-15-62 | 墨 | U+58A8 | 1-43-47 | |
| 寬 | U+5BEC | 1-47-58 | 寛 | U+5BDB | 1-20-18 | |
| 層 | U+FA3B | 1-47-65 | 層 | U+5C64 | 1-33-56 | |
| 巢 | U+5DE2 | 1-84-8 | 巣 | U+5DE3 | 1-33-67 | |
| 廊 | U+F928 | 1-84-14 | 廊 | U+5ECA | 1-47-13 | |
| 徵 | U+5FB5 | 1-84-36 | 徴 | U+5FB4 | 1-36-7 | |
| 德 | U+5FB7 | 1-84-37 | 徳 | U+5FB3 | 1-38-33 | |
| 悔 | U+FA3D | 1-84-48 | 悔 | U+6094 | 1-18-89 | |
| 慨 | U+FA3E | 1-84-60 | 慨 | U+6168 | 1-19-20 | |
| 憎 | U+FA3F | 1-84-62 | 憎 | U+618E | 1-33-94 | |
| 懲 | U+FA40 | 1-84-65 | 懲 | U+61F2 | 1-36-8 | |
| 戾 | U+623E | 1-84-67 | 戻 | U+623B | 1-44-65 | |
| 揭 | U+63ED | 1-84-83 | 掲 | U+63B2 | 1-23-39 | |
| 擊 | U+64CA | 1-85-2 | 撃 | U+6483 | 1-23-66 | |
| 敏 | U+FA41 | 1-85-8 | 敏 | U+654F | 1-41-50 | |
| 既 | U+FA42 | 1-85-11 | 既 | U+65E2 | 1-20-91 | |
| 晚 | U+665A | 1-85-28 | 晩 | U+6669 | 1-40-53 | |
| 暑 | U+FA43 | 1-85-35 | 暑 | U+6691 | 1-29-75 | |
| 曆 | U+66C6 | 1-85-39 | 暦 | U+66A6 | 1-46-81 | |
| 朗 | U+F929 | 1-85-46 | 朗 | U+6717 | 1-47-15 | |
| 梅 | U+FA44 | 1-85-69 | 梅 | U+6885 | 1-39-63 | |
| 槪 | U+69EA | 1-86-4 | 概 | U+6982 | 1-19-21 | |
| 欄 | U+F91D | 1-86-27 | 欄 | U+6B04 | 1-45-83 | |
| 步 | U+6B65 | 1-86-35 | 歩 | U+6B69 | 1-42-66 | |
| 歷 | U+6B77 | 1-86-37 | 歴 | U+6B74 | 1-46-82 | |
| 殺 | U+F970 | 1-86-41 | 殺 | U+6BBA | 1-27-6 | |
| 每 | U+6BCF | 1-86-42 | 毎 | U+6BCE | 1-43-72 | |
| 海 | U+FA45 | 1-86-73 | 海 | U+6D77 | 1-19-4 | |
| 涉 | U+6D89 | 1-86-76 | 渉 | U+6E09 | 1-30-36 | |
| 淚 | U+6DDA | 1-86-83 | 涙 | U+6D99 | 1-46-62 | |
| 渚 | U+FA46 | 1-86-87 | 渚 | U+6E1A | 1-29-77 | |
| 瀨 | U+7028 | 1-87-30 | 瀬 | U+702C | 1-32-5 | |
| 煮 | U+FA48 | 1-87-53 | 煮 | U+716E | 1-28-49 | |
| 狀 | U+72C0 | 1-87-74 | 状 | U+72B6 | 1-30-85 | |
| 猪 | U+FA16 | 1-87-79 | 猪 | U+732A | 1-35-86 | |
| 琢 | U+FA4A | 1-88-5 | 琢 | U+7422 | 1-34-86 | |
| 甁 | U+7501 | 1-88-39 | 瓶 | U+74F6 | 1-41-51 | |
| 硏 | U+784F | 1-89-3 | 研 | U+7814 | 1-24-6 | |
| 碑 | U+FA4B | 1-89-7 | 碑 | U+7891 | 1-40-74 | |
| 社 | U+FA4C | 1-89-19 | 社 | U+793E | 1-28-50 | |
| 祉 | U+FA4D | 1-89-20 | 祉 | U+7949 | 1-27-67 | |
| 祈 | U+FA4E | 1-89-23 | 祈 | U+7948 | 1-21-7 | |
| 祐 | U+FA4F | 1-89-24 | 祐 | U+7950 | 1-45-20 | |
| 祖 | U+FA50 | 1-89-25 | 祖 | U+7956 | 1-33-36 | |
| 祝 | U+FA51 | 1-89-27 | 祝 | U+795D | 1-29-43 | |
| 神 | U+FA19 | 1-89-28 | 神 | U+795E | 1-31-32 | |
| 祥 | U+FA1A | 1-89-29 | 祥 | U+7965 | 1-30-45 | |
| 禎 | U+FA53 | 1-89-32 | 禎 | U+798E | 1-36-87 | |
| 福 | U+FA1B | 1-89-33 | 福 | U+798F | 1-42-1 | |
| 穀 | U+FA54 | 1-89-45 | 穀 | U+7A40 | 1-25-82 | |
| 突 | U+FA55 | 1-89-49 | 突 | U+7A81 | 1-38-45 | |
| 節 | U+FA56 | 1-89-68 | 節 | U+7BC0 | 1-32-65 | |
| 綠 | U+7DA0 | 1-90-8 | 緑 | U+7DD1 | 1-46-48 | |
| 緖 | U+7DD6 | 1-90-12 | 緒 | U+7DD2 | 1-29-79 | |
| 練 | U+FA57 | 1-90-14 | 練 | U+7DF4 | 1-46-93 | |
| 繁 | U+FA59 | 1-90-19 | 繁 | U+7E41 | 1-40-43 | |
| 署 | U+FA5A | 1-90-26 | 署 | U+7F72 | 1-29-80 | |
| 者 | U+FA5B | 1-90-36 | 者 | U+8005 | 1-28-52 | |
| 臭 | U+FA5C | 1-90-56 | 臭 | U+81ED | 1-29-13 | |
| 著 | U+FA5F | 1-91-7 | 著 | U+8457 | 1-35-88 | |
| 薰 | U+85B0 | 1-91-32 | 薫 | U+85AB | 1-23-16 | |
| 虛 | U+865B | 1-91-46 | 虚 | U+865A | 1-21-85 | |
| 虜 | U+F936 | 1-91-47 | 虜 | U+865C | 1-46-26 | |
| 褐 | U+FA60 | 1-91-71 | 褐 | U+8910 | 1-19-76 | |
| 視 | U+FA61 | 1-91-89 | 視 | U+8996 | 1-27-75 | |
| 諸 | U+FA22 | 1-92-14 | 諸 | U+8AF8 | 1-29-84 | |
| 賓 | U+FA64 | 1-92-24 | 賓 | U+8CD3 | 1-41-48 | |
| 賴 | U+8CF4 | 1-92-26 | 頼 | U+983C | 1-45-74 | |
| 贈 | U+FA65 | 1-92-29 | 贈 | U+8D08 | 1-34-3 | |
| 逸 | U+FA67 | 1-92-57 | 逸 | U+9038 | 1-16-79 | |
| 郞 | U+90DE | 1-92-71 | 郎 | U+90CE | 1-47-26 | |
| 都 | U+FA26 | 1-92-74 | 都 | U+90FD | 1-37-52 | |
| 鄕 | U+9115 | 1-92-76 | 郷 | U+90F7 | 1-22-31 | |
| 錄 | U+9304 | 1-93-21 | 録 | U+9332 | 1-47-31 | |
| 鍊 | U+934A | 1-93-27 | 錬 | U+932C | 1-47-3 | |
| 隆 | U+F9DC | 1-93-61 | 隆 | U+9686 | 1-46-20 | |
| 難 | U+FA68 | 1-93-67 | 難 | U+96E3 | 1-38-81 | |
| 響 | U+FA69 | 1-93-86 | 響 | U+97FF | 1-22-33 | |
| 頻 | U+FA6A | 1-93-91 | 頻 | U+983B | 1-41-49 | |
| 類 | U+F9D0 | 1-94-4 | 類 | U+985E | 1-46-64 | |
| 黑 | U+9ED1 | 1-94-82 | 黒 | U+9ED2 | 1-25-85 | |
| 俱 | U+4FF1 | 1-14-1 | 倶 | U+5036 | 1-22-70 | 簡易慣用字体として認められています。 |
| 吞 | U+541E | 1-47-94 | 呑 | U+5451 | 1-38-61 | 簡易慣用字体として国語審議会により認められています。 |
| 姸 | U+59F8 | 1-94-90 | 妍 | U+598D | 1-53-11 | 簡易慣用字体として国語審議会により認められています。 |
| 屛 | U+5C5B | 1-94-91 | 屏 | U+5C4F | 1-54-2 | 簡易慣用字体として国語審議会により認められています。 |
| 幷 | U+5E77 | 1-94-92 | 并 | U+5E76 | 1-54-85 | 簡易慣用字体として国語審議会により認められています。 |
| 瘦 | U+7626 | 1-94-93 | 痩 | U+75E9 | 1-33-73 | 簡易慣用字体として国語審議会により認められています。 |
| 繫 | U+7E6B | 1-94-94 | 繋 | U+7E4B | 1-23-50 | 簡易慣用字体として国語審議会により認められています。 |
| 剝 | U+525D | 1-15-94 | 剥 | U+5265 | 1-39-77 | 「剥」は国語審議会からも略字としてすら認められていない、単なる嘘字。 |
Unicode上に別ポイントのある漢字異体字
| 常用漢字 | 異体字 | 備考 |
| 字 | Unicode | JIS X 0213 | 字 | Unicode | JIS X 0213 |
| 丈 | U+4E08 | 1-30-70 | 𠀋 | U+2000B | 1-14-2 | |
| 吉 | U+5409 | 1-21-40 | 𠮷 | U+20BB7 | - | |
| 二 | U+4E8C | 1-38-83 | 𠄞 | U+2011E | - | |
| 第 | U+7B2C | 1-34-72 | 㐧 | U+3427 | - | |
| 高 | U+9AD8 | 1-25-66 | 髙 | U+9AD9 | - | |
| 崎 | U+5D0E | 1-26-74 | 﨑 | U+FA11 | 1-47-82 | |
| 寿 | U+5BFF | 1-28-87 | 壽 | U+58FD | 1-52-72 | |
| | | 劦 | U+52A6 | 2-3-35 | |
| | | 劻 | U+52BB | 2-3-38 | |
| | | 勊 | U+52CA | 2-3-39 | |
| | | 㔟 | U+351F | 2-3-40 | |
| | | 勌 | U+52CC | 1-14-68 | |
| | | 勑 | U+52D1 | 2-3-41 | |
言語属性と異体字セレクタ
例示画像のような按配になるかどうか。 異体字セレクタに関しては正式に各字体が登録完了もしておらず、アプリケーションの対応もこれからでしょうけど。
| UCS | ja-JP | zh-TW | zh-CN | ko | E0100 | E0101 | E0102 | E0103 |
| U+8FB6 | 辶 | 辶 | 辶 | 辶 | 辶󠄀 | 辶󠄁 | 辶󠄂 | 辶󠄃 |
| U+9038 | 逸 | 逸 | 逸 | 逸 | 逸󠄀 | 逸󠄁 | 逸󠄂 | 逸󠄃 |
| U+8279 | 艹 | 艹 | 艹 | 艹 | 艹󠄀 | 艹󠄁 | 艹󠄂 | 艹󠄃 |
| U+FA5D | 艹 | 艹 | 艹 | 艹 | | | | |
| U+FA5E | 艹 | 艹 | 艹 | 艹 | | | | |
| U+84EE | 蓮 | 蓮 | 蓮 | 蓮 | 蓮󠄀 | 蓮󠄁 | 蓮󠄂 | |
| U+722B | 爫 | 爫 | 爫 | 爫 | 爫󠄀 | 爫󠄁 | 爫󠄂 | 爫󠄃 |
| U+4E73 | 乳 | 乳 | 乳 | 乳 | 乳󠄀 | 乳󠄁 | 乳󠄂 | 乳󠄃 |
| U+5224 | 判 | 判 | 判 | 判 | 判󠄀 | 判󠄁 | 判󠄂 | 判󠄃 |
| U+9AA8 | 骨 | 骨 | 骨 | 骨 | 骨󠄀 | 骨󠄁 | 骨󠄂 | 骨󠄃 |
| U+533B | 医 | 医 | 医 | 医 | 医󠄀 | 医󠄁 | 医󠄂 | 医󠄃 |
| U+6B21 | 次 | 次 | 次 | 次 | 次󠄀 | 次󠄁 | 次󠄂 | 次󠄃 |
| U+5668 | 器 | 器 | 器 | 器 | 器󠄀 | 器󠄁 | 器󠄂 | 器󠄃 |
| U+9EBB | 麻 | 麻 | 麻 | 麻 | 麻󠄀 | 麻󠄁 | 麻󠄂 | 麻󠄃 |
| U+89D2 | 角 | 角 | 角 | 角 | 角󠄀 | 角󠄁 | 角󠄂 | 角󠄃 |
| U+5C6E | 屮 | 屮 | 屮 | 屮 | 屮󠄀 | 屮󠄁 | 屮󠄂 | 屮󠄃 |
| U+4E08 | 丈 | 丈 | 丈 | 丈 | 丈󠄀 | 丈󠄁 | 丈󠄂 | 丈󠄃 |
| U+4E0E | 与 | 与 | 与 | 与 | 与󠄀 | 与󠄁 | 与󠄂 | 与󠄃 |