]> www.wagner.pp.ru Git - oss/catdoc.git/blob - charsets/mac-roman.txt
Recreated CVS repository from working copy
[oss/catdoc.git] / charsets / mac-roman.txt
1 #=======================================================================
2 #   File name:  ROMAN.TXT
3 #
4 #   Contents:   Map (external version) from Mac OS Roman
5 #               character set to Unicode 2.1 and later.
6 #
7 #   Copyright:  (c) 1994-2002, 2005 by Apple Computer, Inc., all rights
8 #               reserved.
9 #
10 #   Contact:    charsets@apple.com
11 #
12 #   Changes:
13 #
14 #       c02  2005-Apr-05    Update header comments. Matches internal xml
15 #                           <c1.1> and Text Encoding Converter 2.0.
16 #      b4,c1 2002-Dec-19    Update URLs, notes. Matches internal
17 #                           utom<b5>.
18 #       b03  1999-Sep-22    Update contact e-mail address. Matches
19 #                           internal utom<b4>, ufrm<b3>, and Text
20 #                           Encoding Converter version 1.5.
21 #       b02  1998-Aug-18    Encoding changed for Mac OS 8.5; change
22 #                           mapping of 0xDB from CURRENCY SIGN to
23 #                           EURO SIGN. Matches internal utom<b3>,
24 #                           ufrm<b3>.
25 #       n08  1998-Feb-05    Minor update to header comments
26 #       n06  1997-Dec-14    Add warning about future changes to 0xDB
27 #                           from CURRENCY SIGN to EURO SIGN. Clarify
28 #                           some header information
29 #       n04  1997-Dec-01    Update to match internal utom<n3>, ufrm<n22>:
30 #                           Change standard mapping for 0xBD from U+2126
31 #                           to its canonical decomposition, U+03A9.
32 #       n03  1995-Apr-15    First version (after fixing some typos).
33 #                           Matches internal ufrm<n9>.
34 #
35 # Standard header:
36 # ----------------
37 #
38 #   Apple, the Apple logo, and Macintosh are trademarks of Apple
39 #   Computer, Inc., registered in the United States and other countries.
40 #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
41 #   throughout this document, "Macintosh" can be used to refer to
42 #   Macintosh computers and "Unicode" can be used to refer to the
43 #   Unicode standard.
44 #
45 #   Apple Computer, Inc. ("Apple") makes no warranty or representation,
46 #   either express or implied, with respect to this document and the
47 #   included data, its quality, accuracy, or fitness for a particular
48 #   purpose. In no event will Apple be liable for direct, indirect,
49 #   special, incidental, or consequential damages resulting from any
50 #   defect or inaccuracy in this document or the included data.
51 #
52 #   These mapping tables and character lists are subject to change.
53 #   The latest tables should be available from the following:
54 #
55 #   <http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
56 #
57 #   For general information about Mac OS encodings and these mapping
58 #   tables, see the file "README.TXT".
59 #
60 # Format:
61 # -------
62 #
63 #   Three tab-separated columns;
64 #   '#' begins a comment which continues to the end of the line.
65 #     Column #1 is the Mac OS Roman code (in hex as 0xNN)
66 #     Column #2 is the corresponding Unicode (in hex as 0xNNNN)
67 #     Column #3 is a comment containing the Unicode name
68 #
69 #   The entries are in Mac OS Roman code order.
70 #
71 #   One of these mappings requires the use of a corporate character.
72 #   See the file "CORPCHAR.TXT" and notes below.
73 #
74 #   Control character mappings are not shown in this table, following
75 #   the conventions of the standard UTC mapping tables. However, the
76 #   Mac OS Roman character set uses the standard control characters at
77 #   0x00-0x1F and 0x7F.
78 #
79 # Notes on Mac OS Roman:
80 # ----------------------
81 #
82 #   This is a legacy Mac OS encoding; in the Mac OS X Carbon and Cocoa
83 #   environments, it is only supported directly in programming
84 #   interfaces for QuickDraw Text, the Script Manager, and related
85 #   Text Utilities. For other purposes it is supported via transcoding
86 #   to and from Unicode.
87 #
88 #   This character set is used for at least the following Mac OS
89 #   localizations: U.S., British, Canadian French, French, Swiss
90 #   French, German, Swiss German, Italian, Swiss Italian, Dutch,
91 #   Swedish, Norwegian, Danish, Finnish, Spanish, Catalan,
92 #   Portuguese, Brazilian, and the default International system.
93 #
94 #   Variants of Mac OS Roman are used for Croatian, Icelandic,
95 #   Turkish, Romanian, and other encodings. Separate mapping tables
96 #   are available for these encodings.
97 #
98 #   Before Mac OS 8.5, code point 0xDB was CURRENCY SIGN, and was
99 #   mapped to U+00A4. In Mac OS 8.5 and later versions, code point
100 #   0xDB is changed to EURO SIGN and maps to U+20AC; the standard
101 #   Apple fonts are updated for Mac OS 8.5 to reflect this. There is
102 #   a "currency sign" variant of the Mac OS Roman encoding that still
103 #   maps 0xDB to U+00A4; this can be used for older fonts.
104 #
105 #   Before Mac OS 8.5, the ROM bitmap versions of the fonts Chicago,
106 #   New York, Geneva, and Monaco did not implement the full Mac OS
107 #   Roman character set; they only supported character codes up to
108 #   0xD8. The TrueType versions of these fonts have always implemented
109 #   the full character set, as with the bitmap and TrueType versions
110 #   of the other standard Roman fonts.
111 #
112 #   In all Mac OS encodings, fonts such as Chicago which are used
113 #   as "system" fonts (for menus, dialogs, etc.) have four glyphs
114 #   at code points 0x11-0x14 for transient use by the Menu Manager.
115 #   These glyphs are not intended as characters for use in normal
116 #   text, and the associated code points are not generally
117 #   interpreted as associated with these glyphs; they are usually
118 #   interpreted (if at all) as the control codes DC1-DC4.
119 #
120 # Unicode mapping issues and notes:
121 # ---------------------------------
122 #
123 #   The following corporate zone Unicode character is used in this
124 #   mapping:
125 #
126 #     0xF8FF  Apple logo
127 #
128 #   NOTE: The graphic image associated with the Apple logo character
129 #   is not authorized for use without permission of Apple, and
130 #   unauthorized use might constitute trademark infringement.
131 #
132 # Details of mapping changes in each version:
133 # -------------------------------------------
134 #
135 #   Changes from version n08 to version b02:
136 #
137 #   - Encoding changed for Mac OS 8.5; change mapping of 0xDB from
138 #   CURRENCY SIGN (U+00A4) to EURO SIGN (U+20AC).
139 #
140 #   Changes from version n03 to version n04:
141 #
142 #   - Change mapping of 0xBD from U+2126 to its canonical
143 #     decomposition, U+03A9.
144 #
145 ##################
146
147 0x20    0x0020  # SPACE
148 0x21    0x0021  # EXCLAMATION MARK
149 0x22    0x0022  # QUOTATION MARK
150 0x23    0x0023  # NUMBER SIGN
151 0x24    0x0024  # DOLLAR SIGN
152 0x25    0x0025  # PERCENT SIGN
153 0x26    0x0026  # AMPERSAND
154 0x27    0x0027  # APOSTROPHE
155 0x28    0x0028  # LEFT PARENTHESIS
156 0x29    0x0029  # RIGHT PARENTHESIS
157 0x2A    0x002A  # ASTERISK
158 0x2B    0x002B  # PLUS SIGN
159 0x2C    0x002C  # COMMA
160 0x2D    0x002D  # HYPHEN-MINUS
161 0x2E    0x002E  # FULL STOP
162 0x2F    0x002F  # SOLIDUS
163 0x30    0x0030  # DIGIT ZERO
164 0x31    0x0031  # DIGIT ONE
165 0x32    0x0032  # DIGIT TWO
166 0x33    0x0033  # DIGIT THREE
167 0x34    0x0034  # DIGIT FOUR
168 0x35    0x0035  # DIGIT FIVE
169 0x36    0x0036  # DIGIT SIX
170 0x37    0x0037  # DIGIT SEVEN
171 0x38    0x0038  # DIGIT EIGHT
172 0x39    0x0039  # DIGIT NINE
173 0x3A    0x003A  # COLON
174 0x3B    0x003B  # SEMICOLON
175 0x3C    0x003C  # LESS-THAN SIGN
176 0x3D    0x003D  # EQUALS SIGN
177 0x3E    0x003E  # GREATER-THAN SIGN
178 0x3F    0x003F  # QUESTION MARK
179 0x40    0x0040  # COMMERCIAL AT
180 0x41    0x0041  # LATIN CAPITAL LETTER A
181 0x42    0x0042  # LATIN CAPITAL LETTER B
182 0x43    0x0043  # LATIN CAPITAL LETTER C
183 0x44    0x0044  # LATIN CAPITAL LETTER D
184 0x45    0x0045  # LATIN CAPITAL LETTER E
185 0x46    0x0046  # LATIN CAPITAL LETTER F
186 0x47    0x0047  # LATIN CAPITAL LETTER G
187 0x48    0x0048  # LATIN CAPITAL LETTER H
188 0x49    0x0049  # LATIN CAPITAL LETTER I
189 0x4A    0x004A  # LATIN CAPITAL LETTER J
190 0x4B    0x004B  # LATIN CAPITAL LETTER K
191 0x4C    0x004C  # LATIN CAPITAL LETTER L
192 0x4D    0x004D  # LATIN CAPITAL LETTER M
193 0x4E    0x004E  # LATIN CAPITAL LETTER N
194 0x4F    0x004F  # LATIN CAPITAL LETTER O
195 0x50    0x0050  # LATIN CAPITAL LETTER P
196 0x51    0x0051  # LATIN CAPITAL LETTER Q
197 0x52    0x0052  # LATIN CAPITAL LETTER R
198 0x53    0x0053  # LATIN CAPITAL LETTER S
199 0x54    0x0054  # LATIN CAPITAL LETTER T
200 0x55    0x0055  # LATIN CAPITAL LETTER U
201 0x56    0x0056  # LATIN CAPITAL LETTER V
202 0x57    0x0057  # LATIN CAPITAL LETTER W
203 0x58    0x0058  # LATIN CAPITAL LETTER X
204 0x59    0x0059  # LATIN CAPITAL LETTER Y
205 0x5A    0x005A  # LATIN CAPITAL LETTER Z
206 0x5B    0x005B  # LEFT SQUARE BRACKET
207 0x5C    0x005C  # REVERSE SOLIDUS
208 0x5D    0x005D  # RIGHT SQUARE BRACKET
209 0x5E    0x005E  # CIRCUMFLEX ACCENT
210 0x5F    0x005F  # LOW LINE
211 0x60    0x0060  # GRAVE ACCENT
212 0x61    0x0061  # LATIN SMALL LETTER A
213 0x62    0x0062  # LATIN SMALL LETTER B
214 0x63    0x0063  # LATIN SMALL LETTER C
215 0x64    0x0064  # LATIN SMALL LETTER D
216 0x65    0x0065  # LATIN SMALL LETTER E
217 0x66    0x0066  # LATIN SMALL LETTER F
218 0x67    0x0067  # LATIN SMALL LETTER G
219 0x68    0x0068  # LATIN SMALL LETTER H
220 0x69    0x0069  # LATIN SMALL LETTER I
221 0x6A    0x006A  # LATIN SMALL LETTER J
222 0x6B    0x006B  # LATIN SMALL LETTER K
223 0x6C    0x006C  # LATIN SMALL LETTER L
224 0x6D    0x006D  # LATIN SMALL LETTER M
225 0x6E    0x006E  # LATIN SMALL LETTER N
226 0x6F    0x006F  # LATIN SMALL LETTER O
227 0x70    0x0070  # LATIN SMALL LETTER P
228 0x71    0x0071  # LATIN SMALL LETTER Q
229 0x72    0x0072  # LATIN SMALL LETTER R
230 0x73    0x0073  # LATIN SMALL LETTER S
231 0x74    0x0074  # LATIN SMALL LETTER T
232 0x75    0x0075  # LATIN SMALL LETTER U
233 0x76    0x0076  # LATIN SMALL LETTER V
234 0x77    0x0077  # LATIN SMALL LETTER W
235 0x78    0x0078  # LATIN SMALL LETTER X
236 0x79    0x0079  # LATIN SMALL LETTER Y
237 0x7A    0x007A  # LATIN SMALL LETTER Z
238 0x7B    0x007B  # LEFT CURLY BRACKET
239 0x7C    0x007C  # VERTICAL LINE
240 0x7D    0x007D  # RIGHT CURLY BRACKET
241 0x7E    0x007E  # TILDE
242 #
243 0x80    0x00C4  # LATIN CAPITAL LETTER A WITH DIAERESIS
244 0x81    0x00C5  # LATIN CAPITAL LETTER A WITH RING ABOVE
245 0x82    0x00C7  # LATIN CAPITAL LETTER C WITH CEDILLA
246 0x83    0x00C9  # LATIN CAPITAL LETTER E WITH ACUTE
247 0x84    0x00D1  # LATIN CAPITAL LETTER N WITH TILDE
248 0x85    0x00D6  # LATIN CAPITAL LETTER O WITH DIAERESIS
249 0x86    0x00DC  # LATIN CAPITAL LETTER U WITH DIAERESIS
250 0x87    0x00E1  # LATIN SMALL LETTER A WITH ACUTE
251 0x88    0x00E0  # LATIN SMALL LETTER A WITH GRAVE
252 0x89    0x00E2  # LATIN SMALL LETTER A WITH CIRCUMFLEX
253 0x8A    0x00E4  # LATIN SMALL LETTER A WITH DIAERESIS
254 0x8B    0x00E3  # LATIN SMALL LETTER A WITH TILDE
255 0x8C    0x00E5  # LATIN SMALL LETTER A WITH RING ABOVE
256 0x8D    0x00E7  # LATIN SMALL LETTER C WITH CEDILLA
257 0x8E    0x00E9  # LATIN SMALL LETTER E WITH ACUTE
258 0x8F    0x00E8  # LATIN SMALL LETTER E WITH GRAVE
259 0x90    0x00EA  # LATIN SMALL LETTER E WITH CIRCUMFLEX
260 0x91    0x00EB  # LATIN SMALL LETTER E WITH DIAERESIS
261 0x92    0x00ED  # LATIN SMALL LETTER I WITH ACUTE
262 0x93    0x00EC  # LATIN SMALL LETTER I WITH GRAVE
263 0x94    0x00EE  # LATIN SMALL LETTER I WITH CIRCUMFLEX
264 0x95    0x00EF  # LATIN SMALL LETTER I WITH DIAERESIS
265 0x96    0x00F1  # LATIN SMALL LETTER N WITH TILDE
266 0x97    0x00F3  # LATIN SMALL LETTER O WITH ACUTE
267 0x98    0x00F2  # LATIN SMALL LETTER O WITH GRAVE
268 0x99    0x00F4  # LATIN SMALL LETTER O WITH CIRCUMFLEX
269 0x9A    0x00F6  # LATIN SMALL LETTER O WITH DIAERESIS
270 0x9B    0x00F5  # LATIN SMALL LETTER O WITH TILDE
271 0x9C    0x00FA  # LATIN SMALL LETTER U WITH ACUTE
272 0x9D    0x00F9  # LATIN SMALL LETTER U WITH GRAVE
273 0x9E    0x00FB  # LATIN SMALL LETTER U WITH CIRCUMFLEX
274 0x9F    0x00FC  # LATIN SMALL LETTER U WITH DIAERESIS
275 0xA0    0x2020  # DAGGER
276 0xA1    0x00B0  # DEGREE SIGN
277 0xA2    0x00A2  # CENT SIGN
278 0xA3    0x00A3  # POUND SIGN
279 0xA4    0x00A7  # SECTION SIGN
280 0xA5    0x2022  # BULLET
281 0xA6    0x00B6  # PILCROW SIGN
282 0xA7    0x00DF  # LATIN SMALL LETTER SHARP S
283 0xA8    0x00AE  # REGISTERED SIGN
284 0xA9    0x00A9  # COPYRIGHT SIGN
285 0xAA    0x2122  # TRADE MARK SIGN
286 0xAB    0x00B4  # ACUTE ACCENT
287 0xAC    0x00A8  # DIAERESIS
288 0xAD    0x2260  # NOT EQUAL TO
289 0xAE    0x00C6  # LATIN CAPITAL LETTER AE
290 0xAF    0x00D8  # LATIN CAPITAL LETTER O WITH STROKE
291 0xB0    0x221E  # INFINITY
292 0xB1    0x00B1  # PLUS-MINUS SIGN
293 0xB2    0x2264  # LESS-THAN OR EQUAL TO
294 0xB3    0x2265  # GREATER-THAN OR EQUAL TO
295 0xB4    0x00A5  # YEN SIGN
296 0xB5    0x00B5  # MICRO SIGN
297 0xB6    0x2202  # PARTIAL DIFFERENTIAL
298 0xB7    0x2211  # N-ARY SUMMATION
299 0xB8    0x220F  # N-ARY PRODUCT
300 0xB9    0x03C0  # GREEK SMALL LETTER PI
301 0xBA    0x222B  # INTEGRAL
302 0xBB    0x00AA  # FEMININE ORDINAL INDICATOR
303 0xBC    0x00BA  # MASCULINE ORDINAL INDICATOR
304 0xBD    0x03A9  # GREEK CAPITAL LETTER OMEGA
305 0xBE    0x00E6  # LATIN SMALL LETTER AE
306 0xBF    0x00F8  # LATIN SMALL LETTER O WITH STROKE
307 0xC0    0x00BF  # INVERTED QUESTION MARK
308 0xC1    0x00A1  # INVERTED EXCLAMATION MARK
309 0xC2    0x00AC  # NOT SIGN
310 0xC3    0x221A  # SQUARE ROOT
311 0xC4    0x0192  # LATIN SMALL LETTER F WITH HOOK
312 0xC5    0x2248  # ALMOST EQUAL TO
313 0xC6    0x2206  # INCREMENT
314 0xC7    0x00AB  # LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
315 0xC8    0x00BB  # RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
316 0xC9    0x2026  # HORIZONTAL ELLIPSIS
317 0xCA    0x00A0  # NO-BREAK SPACE
318 0xCB    0x00C0  # LATIN CAPITAL LETTER A WITH GRAVE
319 0xCC    0x00C3  # LATIN CAPITAL LETTER A WITH TILDE
320 0xCD    0x00D5  # LATIN CAPITAL LETTER O WITH TILDE
321 0xCE    0x0152  # LATIN CAPITAL LIGATURE OE
322 0xCF    0x0153  # LATIN SMALL LIGATURE OE
323 0xD0    0x2013  # EN DASH
324 0xD1    0x2014  # EM DASH
325 0xD2    0x201C  # LEFT DOUBLE QUOTATION MARK
326 0xD3    0x201D  # RIGHT DOUBLE QUOTATION MARK
327 0xD4    0x2018  # LEFT SINGLE QUOTATION MARK
328 0xD5    0x2019  # RIGHT SINGLE QUOTATION MARK
329 0xD6    0x00F7  # DIVISION SIGN
330 0xD7    0x25CA  # LOZENGE
331 0xD8    0x00FF  # LATIN SMALL LETTER Y WITH DIAERESIS
332 0xD9    0x0178  # LATIN CAPITAL LETTER Y WITH DIAERESIS
333 0xDA    0x2044  # FRACTION SLASH
334 0xDB    0x20AC  # EURO SIGN
335 0xDC    0x2039  # SINGLE LEFT-POINTING ANGLE QUOTATION MARK
336 0xDD    0x203A  # SINGLE RIGHT-POINTING ANGLE QUOTATION MARK
337 0xDE    0xFB01  # LATIN SMALL LIGATURE FI
338 0xDF    0xFB02  # LATIN SMALL LIGATURE FL
339 0xE0    0x2021  # DOUBLE DAGGER
340 0xE1    0x00B7  # MIDDLE DOT
341 0xE2    0x201A  # SINGLE LOW-9 QUOTATION MARK
342 0xE3    0x201E  # DOUBLE LOW-9 QUOTATION MARK
343 0xE4    0x2030  # PER MILLE SIGN
344 0xE5    0x00C2  # LATIN CAPITAL LETTER A WITH CIRCUMFLEX
345 0xE6    0x00CA  # LATIN CAPITAL LETTER E WITH CIRCUMFLEX
346 0xE7    0x00C1  # LATIN CAPITAL LETTER A WITH ACUTE
347 0xE8    0x00CB  # LATIN CAPITAL LETTER E WITH DIAERESIS
348 0xE9    0x00C8  # LATIN CAPITAL LETTER E WITH GRAVE
349 0xEA    0x00CD  # LATIN CAPITAL LETTER I WITH ACUTE
350 0xEB    0x00CE  # LATIN CAPITAL LETTER I WITH CIRCUMFLEX
351 0xEC    0x00CF  # LATIN CAPITAL LETTER I WITH DIAERESIS
352 0xED    0x00CC  # LATIN CAPITAL LETTER I WITH GRAVE
353 0xEE    0x00D3  # LATIN CAPITAL LETTER O WITH ACUTE
354 0xEF    0x00D4  # LATIN CAPITAL LETTER O WITH CIRCUMFLEX
355 0xF0    0xF8FF  # Apple logo
356 0xF1    0x00D2  # LATIN CAPITAL LETTER O WITH GRAVE
357 0xF2    0x00DA  # LATIN CAPITAL LETTER U WITH ACUTE
358 0xF3    0x00DB  # LATIN CAPITAL LETTER U WITH CIRCUMFLEX
359 0xF4    0x00D9  # LATIN CAPITAL LETTER U WITH GRAVE
360 0xF5    0x0131  # LATIN SMALL LETTER DOTLESS I
361 0xF6    0x02C6  # MODIFIER LETTER CIRCUMFLEX ACCENT
362 0xF7    0x02DC  # SMALL TILDE
363 0xF8    0x00AF  # MACRON
364 0xF9    0x02D8  # BREVE
365 0xFA    0x02D9  # DOT ABOVE
366 0xFB    0x02DA  # RING ABOVE
367 0xFC    0x00B8  # CEDILLA
368 0xFD    0x02DD  # DOUBLE ACUTE ACCENT
369 0xFE    0x02DB  # OGONEK
370 0xFF    0x02C7  # CARON