Windows-1252
Windows-1252 或 CP-1252 是拉丁字母的字元編碼,主要用於英文、 爱尔兰语、意大利语、挪威语、葡萄牙语、西班牙语、瑞典语以及德语、芬兰语、冰岛语、法语、荷兰语(除了IJ字符)、斯洛文尼亚语(除了č字符)等西方文字版本 Microsoft Windows 的預設編碼,為Windows代碼頁之一。LaTeX軟件稱之為「ansinew」。
詳情
此編碼是 ISO 8859-1 的超集,但和 IANA 的 ISO-8859-1 分別在於在 80 至 9F (hex) 範圍使用可顯示字元而非控制字元。在 Windows 稱為代碼頁1252,還有個 IANA 登記名稱「Windows‑1252」。此代頁碼包含所有 ISO 8859-15 中的可顯示字(但部份碼位不同)。
常見錯誤是將 Windows-1252 文本誤標為 ISO-8859-1 字元集。常見的結果是所有引號和撇號(由 Microsoft 軟件的「smart quotes」功能產生)在非 Windows 操作系統都變成問號或方格。為了解決此問題,現在大部份網頁瀏覽器和電郵用戶端都懂得將 MIME 字元集 ISO-8859-1 視作 Windows-1252 處理。這也是 HTML5 草稿規格要求的處理方式,要求將自稱是 ISO-8859-1 的文件視作 Windows-1252 編碼。[1]
在 Windows,「ANSI代碼頁」 (ACP) 是用來指稱多個不同的代碼頁,其中一個就是真的是 ANSI(美國國家標準協會)標準,例如 ISO-8859-1。雖然 Windows-1252 是首個,也是最流行的 Windows 代碼頁,但其從來不是正式 ANSI 標準。
代碼頁配置
下表顯示 Windows-1252 代碼頁。每個字元同時顯示其 Unicode 碼位和十進位值。Unicode 的參考值使用「最適」原則。[2]
圖例:黃格是控制字元、藍格是標點、紫格是數字、綠格是 ASCII 字母、橙格是國際字母。和 ISO-8859-1 有分別的地方以粗綠框表示。
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 0 | SOH 0001 1 | STX 0002 2 | ETX 0003 3 | EOT 0004 4 | ENQ 0005 5 | ACK 0006 6 | BEL 0007 7 | BS 0008 8 | HT 0009 9 | LF 000A 10 | VT 000B 11 | FF 000C 12 | CR 000D 13 | SO 000E 14 | SI 000F 15 |
1_ | DLE 0010 16 | DC1 0011 17 | DC2 0012 18 | DC3 0013 19 | DC4 0014 20 | NAK 0015 21 | SYN 0016 22 | ETB 0017 23 | CAN 0018 24 | EM 0019 25 | SUB 001A 26 | ESC 001B 27 | FS 001C 28 | GS 001D 29 | RS 001E 30 | US 001F 31 |
2_ | SP 0020 32 | ! 0021 33 | " 0022 34 | # 0023 35 | $ 0024 36 | % 0025 37 | & 0026 38 | ' 0027 39 | ( 0028 40 | ) 0029 41 | * 002A 42 | + 002B 43 | , 002C 44 | - 002D 45 | . 002E 46 | / 002F 47 |
3_ | 0 0030 48 | 1 0031 49 | 2 0032 50 | 3 0033 51 | 4 0034 52 | 5 0035 53 | 6 0036 54 | 7 0037 55 | 8 0038 56 | 9 0039 57 | : 003A 58 | ; 003B 59 | < 003C 60 | = 003D 61 | > 003E 62 | ? 003F 63 |
4_ | @ 0040 64 | A 0041 65 | B 0042 66 | C 0043 67 | D 0044 68 | E 0045 69 | F 0046 70 | G 0047 71 | H 0048 72 | I 0049 73 | J 004A 74 | K 004B 75 | L 004C 76 | M 004D 77 | N 004E 78 | O 004F 79 |
5_ | P 0050 80 | Q 0051 81 | R 0052 82 | S 0053 83 | T 0054 84 | U 0055 85 | V 0056 86 | W 0057 87 | X 0058 88 | Y 0059 89 | Z 005A 90 | [ 005B 91 | \ 005C 92 | ] 005D 93 | ^ 005E 94 | _ 005F 95 |
6_ | ` 0060 96 | a 0061 97 | b 0062 98 | c 0063 99 | d 0064 100 | e 0065 101 | f 0066 102 | g 0067 103 | h 0068 104 | i 0069 105 | j 006A 106 | k 006B 107 | l 006C 108 | m 006D 109 | n 006E 110 | o 006F 111 |
7_ | p 0070 112 | q 0071 113 | r 0072 114 | s 0073 115 | t 0074 116 | u 0075 117 | v 0076 118 | w 0077 119 | x 0078 120 | y 0079 121 | z 007A 122 | { 007B 123 | | 007C 124 | } 007D 125 | ~ 007E 126 | DEL 007F 127 |
8_ | € 20AC 128 | ‚ 201A 130 | ƒ 0192 131 | „ 201E 132 | … 2026 133 | † 2020 134 | ‡ 2021 135 | ˆ 02C6 136 | ‰ 2030 137 | Š 0160 138 | ‹ 2039 139 | Œ 0152 140 | Ž 017D 142 | |||
9_ | ‘ 2018 145 | ’ 2019 146 | “ 201C 147 | ” 201D 148 | • 2022 149 | – 2013 150 | — 2014 151 | ˜ 02DC 152 | ™ 2122 153 | š 0161 154 | › 203A 155 | œ 0153 156 | ž 017E 158 | Ÿ 0178 159 | ||
A_ | NBSP 00A0 160 | ¡ 00A1 161 | ¢ 00A2 162 | £ 00A3 163 | ¤ 00A4 164 | ¥ 00A5 165 | ¦ 00A6 166 | § 00A7 167 | ¨ 00A8 168 | © 00A9 169 | ª 00AA 170 | « 00AB 171 | ¬ 00AC 172 | SHY(英语:soft hyphen) 00AD 173 | ® 00AE 174 | ¯ 00AF 175 |
B_ | ° 00B0 176 | ± 00B1 177 | ² 00B2 178 | ³ 00B3 179 | ´ 00B4 180 | µ 00B5 181 | ¶ 00B6 182 | · 00B7 183 | ¸ 00B8 184 | ¹ 00B9 185 | º 00BA 186 | » 00BB 187 | ¼ 00BC 188 | ½ 00BD 189 | ¾ 00BE 190 | ¿ 00BF 191 |
C_ | À 00C0 192 | Á 00C1 193 | Â 00C2 194 | Ã 00C3 195 | Ä 00C4 196 | Å 00C5 197 | Æ 00C6 198 | Ç 00C7 199 | È 00C8 200 | É 00C9 201 | Ê 00CA 202 | Ë 00CB 203 | Ì 00CC 204 | Í 00CD 205 | Î 00CE 206 | Ï 00CF 207 |
D_ | Ð 00D0 208 | Ñ 00D1 209 | Ò 00D2 210 | Ó 00D3 211 | Ô 00D4 212 | Õ 00D5 213 | Ö 00D6 214 | × 00D7 215 | Ø 00D8 216 | Ù 00D9 217 | Ú 00DA 218 | Û 00DB 219 | Ü 00DC 220 | Ý 00DD 221 | Þ 00DE 222 | ß 00DF 223 |
E_ | à 00E0 224 | á 00E1 225 | â 00E2 226 | ã 00E3 227 | ä 00E4 228 | å 00E5 229 | æ 00E6 230 | ç 00E7 231 | è 00E8 232 | é 00E9 233 | ê 00EA 234 | ë 00EB 235 | ì 00EC 236 | í 00ED 237 | î 00EE 238 | ï 00EF 239 |
F_ | ð 00F0 240 | ñ 00F1 241 | ò 00F2 242 | ó 00F3 243 | ô 00F4 244 | õ 00F5 245 | ö 00F6 246 | ÷ 00F7 247 | ø 00F8 248 | ù 00F9 249 | ú 00FA 250 | û 00FB 251 | ü 00FC 252 | ý 00FD 253 | þ 00FE 254 | ÿ 00FF 255 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
根據 Microsoft 和 Unicode 協會的網站,81、8D、8F、90 和 9D 都未有使用;但 Windows API MultiByteToWideChar
會將此等碼位對映至 C1控制字元。
另見
- 西方拉丁字元集
- Windows-1250
注釋
外部連結
- Windows 1252 reference chart
- IANA Charset Name Registration (页面存档备份,存于互联网档案馆)
- Unicode mapping table for Windows 1252 (页面存档备份,存于互联网档案馆)
- Unicode mappings of windows 1252 with "best fit" (页面存档备份,存于互联网档案馆)
- 查
- 论
- 编
- 現行
- 廢止
- 提議
- KOI-8西里爾字母(英语:ISO-IR-111)
- 薩米文(英语:ISO-IR-197)
- 改編
- 威爾斯文(英语:ISO-IR-182)
- 巴倫支西里爾字母(英语:ISO-IR-200)
- 愛沙尼亞文(英语:Code page 922)
- 烏克蘭西里爾字母(英语:Code page 1124)
- ArmSCII
- BraSCII(英语:BraSCII)
- 中文標準交換碼
- DIN 66003(英语:DIN 66003)
- ELOT 927(英语:ELOT 927)
- GOST 10859(英语:GOST 10859)
- GB 2312
- GB 12052
- GB 18030
- HKSCS
- ISCII
- JIS X 0201
- JIS X 0208
- JIS X 0212(英语:JIS X 0212)
- JIS X 0213(英语:JIS X 0213)
- KOI-7(英语:KOI-7)
- KPS 9566
- KS X 1001
- KS X 1002(英语:KS X 1002)
- LST 1564(英语:LST 1564)
- LST 1590-4(英语:LST 1590-4)
- PASCII
- Shift JIS
- SI 960(英语:SI 960)
- TIS-620(英语:Thai Industrial Standard 620-2533)
- TSCII
- VISCII(英语:VISCII)
- VSCII
- YUSCII(英语:YUSCII)
- ISO/IEC 8859
- ISO/IEC 10367(英语:ISO/IEC 10367)
- EUC
- ISO-IR-165
- 亞美尼亞文(英语:Mac OS Armenian)
- 阿拉伯文
- 巴倫支西里爾字母(英语:Mac OS Barents Cyrillic)
- 凱爾特語族(英语:Mac OS Celtic)
- 中歐語言
- 克羅埃西亞文(英语:Mac OS Croatian encoding)
- 西里爾字母(英语:Mac OS Cyrillic encoding)
- 梵文
- 波斯文(英语:MacFarsi encoding)
- 字體X(英语:Macintosh Font X encoding)
- 蓋爾文(英语:Mac OS Gaelic)
- 喬治亞文(英语:Mac OS Georgian)
- 希臘文(英语:MacGreek encoding)
- 古吉拉特文(英语:Mac OS Gujarati)
- 古木基文(英语:Mac OS Gurmukhi)
- 希伯來文(英语:Mac OS Hebrew)
- 冰島文(英语:Mac OS Icelandic encoding)
- 因紐特文(英语:Mac OS Inuit)
- 鍵盤(英语:Mac OS Keyboard encoding)
- 拉丁文(英语:Macintosh Latin encoding)
- 馬爾他文/世界文(英语:Mac OS Maltese/Esperanto encoding)
- 歐甘字母(英语:Mac OS Ogham)
- 羅曼語族
- 羅馬尼亞文(英语:Mac OS Romanian encoding)
- 薩米文(英语:Mac OS Sámi)
- 土耳其文(英语:Mac OS Turkish encoding)
- 土耳其西里爾字母(英语:Mac OS Turkic Cyrillic)
- 烏克蘭文(英语:Mac OS Ukrainian encoding)
- VT100(英语:VT100 encoding)
- 437
- 668(英语:Code page 668)
- 708(英语:Code page 708)
- 720(英语:Code page 720)
- 737(英语:Code page 737)
- 770(英语:Code page 770)
- 773(英语:Code page 773)
- 775(英语:Code page 775)
- 776(英语:Code page 776)
- 777(英语:Code page 777)
- 778(英语:Code page 778)
- 850(英语:Code page 850)
- 851(英语:Code page 851)
- 852(英语:Code page 852)
- 853(英语:Code page 853)
- 855(英语:Code page 855)
- 856(英语:Code page 856)
- 857(英语:Code page 857)
- 858(英语:Code page 858)
- 859(英语:Code page 859)
- 860(英语:Code page 860)
- 861(英语:Code page 861)
- 862(英语:Code page 862)
- 863(英语:Code page 863)
- 864(英语:Code page 864)
- 865(英语:Code page 865)
- 866(英语:Code page 866)
- 867(英语:Code page 867)
- 868(英语:Code page 868)
- 869(英语:Code page 869)
- 897(英语:Code page 897)
- 899(英语:Code page 899)
- 903(英语:Code page 903)
- 904(英语:Code page 904)
- 932(英语:Code page 932 (IBM))
- 936(英语:Code page 936 (IBM))
- 942(英语:Code page 942)
- 949(英语:Code page 949 (IBM))
- 950
- 951(英语:Code page 951)
- 1040(英语:Code page 1040)
- 1042(英语:Code page 1042)
- 1043(英语:Code page 1043)
- 1046(英语:Code page 1046)
- 1098(英语:Code page 1098)
- 1115(英语:Code page 1115)
- 1116(英语:Code page 1116)
- 1117(英语:Code page 1117)
- 1118(英语:Code page 1118)
- 1127(英语:Code page 1127)
- 3846(英语:Code page 3846)
- ABICOMP(英语:ABICOMP character set)
- CS Indic(英语:CS Indic character set)
- CSX Indic(英语:CSX Indic character set)
- CSX+ Indic(英语:CSX+ Indic character set)
- CWI-2(英语:CWI-2)
- 伊朗系統(英语:Iran System encoding)
- 卡梅尼茨(英语:Kamenický encoding)
- 馬索維亞(英语:Mazovia encoding)
- MIK(英语:MIK (character set))
- 895(英语:Code page 895)
- 896(英语:Code page 896)
- 912(英语:Code page 912)
- 915(英语:Code page 915)
- 921(英语:Code page 921)
- 922(英语:Code page 922)
- 1006(英语:Code page 1006)
- 1008(英语:Code page 1008)
- 1009(英语:Code page 1009)
- 1010(英语:Code page 1010)
- 1012(英语:Code page 1012)
- 1013(英语:Code page 1013)
- 1014(英语:Code page 1014)
- 1015(英语:Code page 1015)
- 1016(英语:Code page 1016)
- 1017(英语:Code page 1017)
- 1018(英语:Code page 1018)
- 1019(英语:Code page 1019)
- 1124(英语:Code page 1124)
- 1133(英语:Code page 1133)
- CER-GS(英语:CER-GS)
- 932(英语:Code page 932 (Microsoft Windows))
- 936
- 950
- 1169(英语:Code page 1169)
- Extended Latin-8(英语:Extended Latin-8)
- 1250(英语:Windows-1250)
- 1251(英语:Windows-1251)
- 1252
- 1253(英语:Windows-1253)
- 1254(英语:Windows-1254)
- 1255(英语:Windows-1255)
- 1256(英语:Windows-1256)
- 1257(英语:Windows-1257)
- 1258(英语:Windows-1258)
- 1270(英语:Windows-1270)
- 西里爾字母+芬蘭文(英语:Windows Cyrillic + Finnish)
- 西里爾字母+法文(英语:Windows Cyrillic + French)
- 西里爾字母+德文(英语:Windows Cyrillic + German)
- 希臘語變音符號(英语:Windows Polytonic Greek)
- 37(英语:Code page 37)
- EBCDIC中的日文(英语:Japanese language in EBCDIC)
- DKOI(英语:DKOI)
- MCS(英语:Multinational Character Set)
- NRCS(英语:National Replacement Character Set)
- 加拿大法文(英语:Code page 1020)
- 瑞士文(英语:Code page 1021)
- 西班牙文(英语:Code page 1023)
- 英國英文(英语:Code page 1101)
- 荷蘭文(英语:Code page 1102)
- 芬蘭文(英语:Code page 1103)
- 法文(英语:Code page 1104)
- 挪威文/丹麥文(英语:Code page 1105)
- 瑞典文(英语:Code page 1106)
- 挪威文/丹麥文(替代)(英语:Code page 1107)
- 8位元希臘文(英语:Code page 1287)
- 8位元土耳其文(英语:Code page 1288)
- SI 960(英语:SI 960)
- 希伯來文(英语:DEC Hebrew)
- 特殊圖形(英语:DEC Special Graphics)
- 技術(英语:DEC Technical Character Set)
- 1057(英语:Code page 1057)
- Acorn(英语:RISC OS character set)
- Adobe標準(英语:PostScript Standard Encoding)
- Adobe Latin 1(英语:PostScript Latin 1 Encoding)
- Amstrad CPC(英语:Amstrad CPC character set)
- Apple II(英语:Apple II character set)
- 雅達利資訊交換標準碼(英语:ATASCII)
- 雅達利ST(英语:Atari ST character set)
- BICS(英语:Bitstream International Character Set)
- 卡西歐計算機(英语:Casio calculator character sets)
- CDC(英语:CDC display code)
- Compucolor II(英语:Compucolor II character set)
- CP/M+(英语:Amstrad CP/M Plus character set)
- DEC RADIX 50(英语:DEC RADIX 50)
- DEC MCS(英语:Multinational Character Set)/NRCS(英语:National Replacement Character Set)
- DG國際(英语:DG International)
- Fieldata(英语:Fieldata)
- GEM(英语:GEM character set)
- GSM 03.38(英语:GSM 03.38)
- HP Roman(英语:HP Roman)
- HP FOCAL(英语:FOCAL character set)
- HP RPL(英语:RPL character set)
- SQUOZE(英语:SQUOZE)
- LICS(英语:Lotus International Character Set)
- LMBCS(英语:Lotus Multi-Byte Character Set)
- MSX(英语:MSX character set)
- NEC APC(英语:NEC APC character set)
- NeXT(英语:NeXT character set)
- PETSCII(英语:PETSCII)
- SEGA SC-3000(英语:Sega SC-3000 character set)
- 夏普計算機(英语:Sharp pocket computer character sets)
- 夏普MZ(英语:Sharp MZ character set)
- 辛克萊QL(英语:Sinclair QL character set)
- 符號
- 電傳文訊(英语:Teletext character set)
- 德州儀器計算機(英语:TI calculator character sets)
- TRS-80(英语:TRS-80 character set)
- 文圖拉國際(英语:Ventura International)
- WISCII(英语:Wang International Standard Code for Information Interchange)
- XCCS(英语:Xerox Character Code Standard)
- ZX80(英语:ZX80 character set)
- ZX81(英语:ZX81 character set)
- ZX Spectrum(英语:ZX Spectrum character set)
- 科克(英语:Cork encoding)
- LY1(英语:LY1 encoding)
- OML(英语:OML encoding)
- OMS(英语:OMS encoding)
- OT1(英语:OT1 encoding)
- ABICOMP(英语:ABICOMP character set)
- ASMO 449(英语:ASMO 449)
- 大五碼
- APL符號數位編碼(英语:Digital encoding of APL symbols)
- ISO-IR-68(英语:ISO-IR-68)
- ARIB STD-B24
- HZ(英语:HZ (character encoding))
- IEC-P27-1(英语:IEC-P27-1)
- INIS
- 7位元(英语:INIS character set)
- INIS-8(英语:8位元)
- ISO-IR-169(英语:ISO-IR-169)
- ISO 2033(英语:ISO 2033)
- KOI
- 今昔文字鏡
- SEASCII(英语:Stanford Extended ASCII)
- Stanford/ITS(英语:Stanford/ITS character set)
- TRON(英语:TRON (encoding))
- 統合韓文代碼(英语:Unified Hangul Code)
- 摩斯電碼專用代碼(英语:Prosigns for Morse code)
- C0与C1控制字符
- ISO/IEC 6429
- JIS X 0211(英语:JIS X 0211)
- Unicode控制字符
- 空白字元