Upgrade to Encode 2.00.
[p5sagit/p5-mst-13.2.git] / ext / Encode / ucm / 8859-2.ucm
index eeb8ee3..fe61819 100644 (file)
@@ -1,45 +1,46 @@
 #
-# $Id: 8859-2.ucm,v 1.0 2002/03/28 23:26:24 dankogai Exp $
+# $Id: 8859-2.ucm,v 2.0 2004/05/16 20:55:19 dankogai Exp $
+#
+# Original table can be obtained at
+# http://www.unicode.org/Public/MAPPINGS/ISO8859/8859-2.TXT
 #
-# ./compile -n iso-8859-2 -o Encode/iso8859-2.ucm Encode/iso8859-2.enc
 <code_set_name> "iso-8859-2"
 <mb_cur_min> 1
 <mb_cur_max> 1
 <subchar> \x3F
-#
 CHARMAP
-<U0000> \x00 |0 # <control>
-<U0001> \x01 |0 # <control>
-<U0002> \x02 |0 # <control>
-<U0003> \x03 |0 # <control>
-<U0004> \x04 |0 # <control>
-<U0005> \x05 |0 # <control>
-<U0006> \x06 |0 # <control>
-<U0007> \x07 |0 # <control>
-<U0008> \x08 |0 # <control>
-<U0009> \x09 |0 # <control>
-<U000A> \x0A |0 # <control>
-<U000B> \x0B |0 # <control>
-<U000C> \x0C |0 # <control>
-<U000D> \x0D |0 # <control>
-<U000E> \x0E |0 # <control>
-<U000F> \x0F |0 # <control>
-<U0010> \x10 |0 # <control>
-<U0011> \x11 |0 # <control>
-<U0012> \x12 |0 # <control>
-<U0013> \x13 |0 # <control>
-<U0014> \x14 |0 # <control>
-<U0015> \x15 |0 # <control>
-<U0016> \x16 |0 # <control>
-<U0017> \x17 |0 # <control>
-<U0018> \x18 |0 # <control>
-<U0019> \x19 |0 # <control>
-<U001A> \x1A |0 # <control>
-<U001B> \x1B |0 # <control>
-<U001C> \x1C |0 # <control>
-<U001D> \x1D |0 # <control>
-<U001E> \x1E |0 # <control>
-<U001F> \x1F |0 # <control>
+<U0000> \x00 |0 # NULL
+<U0001> \x01 |0 # START OF HEADING
+<U0002> \x02 |0 # START OF TEXT
+<U0003> \x03 |0 # END OF TEXT
+<U0004> \x04 |0 # END OF TRANSMISSION
+<U0005> \x05 |0 # ENQUIRY
+<U0006> \x06 |0 # ACKNOWLEDGE
+<U0007> \x07 |0 # BELL
+<U0008> \x08 |0 # BACKSPACE
+<U0009> \x09 |0 # CHARACTER TABULATION
+<U000A> \x0A |0 # LINE FEED (LF)
+<U000B> \x0B |0 # LINE TABULATION
+<U000C> \x0C |0 # FORM FEED (FF)
+<U000D> \x0D |0 # CARRIAGE RETURN (CR)
+<U000E> \x0E |0 # SHIFT OUT
+<U000F> \x0F |0 # SHIFT IN
+<U0010> \x10 |0 # DATA LINK ESCAPE
+<U0011> \x11 |0 # DEVICE CONTROL ONE
+<U0012> \x12 |0 # DEVICE CONTROL TWO
+<U0013> \x13 |0 # DEVICE CONTROL THREE
+<U0014> \x14 |0 # DEVICE CONTROL FOUR
+<U0015> \x15 |0 # NEGATIVE ACKNOWLEDGE
+<U0016> \x16 |0 # SYNCHRONOUS IDLE
+<U0017> \x17 |0 # END OF TRANSMISSION BLOCK
+<U0018> \x18 |0 # CANCEL
+<U0019> \x19 |0 # END OF MEDIUM
+<U001A> \x1A |0 # SUBSTITUTE
+<U001B> \x1B |0 # ESCAPE
+<U001C> \x1C |0 # INFORMATION SEPARATOR FOUR
+<U001D> \x1D |0 # INFORMATION SEPARATOR THREE
+<U001E> \x1E |0 # INFORMATION SEPARATOR TWO
+<U001F> \x1F |0 # INFORMATION SEPARATOR ONE
 <U0020> \x20 |0 # SPACE
 <U0021> \x21 |0 # EXCLAMATION MARK
 <U0022> \x22 |0 # QUOTATION MARK
@@ -135,133 +136,133 @@ CHARMAP
 <U007C> \x7C |0 # VERTICAL LINE
 <U007D> \x7D |0 # RIGHT CURLY BRACKET
 <U007E> \x7E |0 # TILDE
-<U007F> \x7F |0 # <control>
+<U007F> \x7F |0 # DELETE
 <U0080> \x80 |0 # <control>
 <U0081> \x81 |0 # <control>
-<U0082> \x82 |0 # <control>
-<U0083> \x83 |0 # <control>
+<U0082> \x82 |0 # BREAK PERMITTED HERE
+<U0083> \x83 |0 # NO BREAK HERE
 <U0084> \x84 |0 # <control>
-<U0085> \x85 |0 # <control>
-<U0086> \x86 |0 # <control>
-<U0087> \x87 |0 # <control>
-<U0088> \x88 |0 # <control>
-<U0089> \x89 |0 # <control>
-<U008A> \x8A |0 # <control>
-<U008B> \x8B |0 # <control>
-<U008C> \x8C |0 # <control>
-<U008D> \x8D |0 # <control>
-<U008E> \x8E |0 # <control>
-<U008F> \x8F |0 # <control>
-<U0090> \x90 |0 # <control>
-<U0091> \x91 |0 # <control>
-<U0092> \x92 |0 # <control>
-<U0093> \x93 |0 # <control>
-<U0094> \x94 |0 # <control>
-<U0095> \x95 |0 # <control>
-<U0096> \x96 |0 # <control>
-<U0097> \x97 |0 # <control>
-<U0098> \x98 |0 # <control>
+<U0085> \x85 |0 # NEXT LINE (NEL)
+<U0086> \x86 |0 # START OF SELECTED AREA
+<U0087> \x87 |0 # END OF SELECTED AREA
+<U0088> \x88 |0 # CHARACTER TABULATION SET
+<U0089> \x89 |0 # CHARACTER TABULATION WITH JUSTIFICATION
+<U008A> \x8A |0 # LINE TABULATION SET
+<U008B> \x8B |0 # PARTIAL LINE FORWARD
+<U008C> \x8C |0 # PARTIAL LINE BACKWARD
+<U008D> \x8D |0 # REVERSE LINE FEED
+<U008E> \x8E |0 # SINGLE SHIFT TWO
+<U008F> \x8F |0 # SINGLE SHIFT THREE
+<U0090> \x90 |0 # DEVICE CONTROL STRING
+<U0091> \x91 |0 # PRIVATE USE ONE
+<U0092> \x92 |0 # PRIVATE USE TWO
+<U0093> \x93 |0 # SET TRANSMIT STATE
+<U0094> \x94 |0 # CANCEL CHARACTER
+<U0095> \x95 |0 # MESSAGE WAITING
+<U0096> \x96 |0 # START OF GUARDED AREA
+<U0097> \x97 |0 # END OF GUARDED AREA
+<U0098> \x98 |0 # START OF STRING
 <U0099> \x99 |0 # <control>
-<U009A> \x9A |0 # <control>
-<U009B> \x9B |0 # <control>
-<U009C> \x9C |0 # <control>
-<U009D> \x9D |0 # <control>
-<U009E> \x9E |0 # <control>
-<U009F> \x9F |0 # <control>
+<U009A> \x9A |0 # SINGLE CHARACTER INTRODUCER
+<U009B> \x9B |0 # CONTROL SEQUENCE INTRODUCER
+<U009C> \x9C |0 # STRING TERMINATOR
+<U009D> \x9D |0 # OPERATING SYSTEM COMMAND
+<U009E> \x9E |0 # PRIVACY MESSAGE
+<U009F> \x9F |0 # APPLICATION PROGRAM COMMAND
 <U00A0> \xA0 |0 # NO-BREAK SPACE
-<U0104> \xA1 |0 # LATIN CAPITAL LETTER A WITH OGONEK
-<U02D8> \xA2 |0 # BREVE
-<U0141> \xA3 |0 # LATIN CAPITAL LETTER L WITH STROKE
 <U00A4> \xA4 |0 # CURRENCY SIGN
-<U013D> \xA5 |0 # LATIN CAPITAL LETTER L WITH CARON
-<U015A> \xA6 |0 # LATIN CAPITAL LETTER S WITH ACUTE
 <U00A7> \xA7 |0 # SECTION SIGN
 <U00A8> \xA8 |0 # DIAERESIS
-<U0160> \xA9 |0 # LATIN CAPITAL LETTER S WITH CARON
-<U015E> \xAA |0 # LATIN CAPITAL LETTER S WITH CEDILLA
-<U0164> \xAB |0 # LATIN CAPITAL LETTER T WITH CARON
-<U0179> \xAC |0 # LATIN CAPITAL LETTER Z WITH ACUTE
 <U00AD> \xAD |0 # SOFT HYPHEN
-<U017D> \xAE |0 # LATIN CAPITAL LETTER Z WITH CARON
-<U017B> \xAF |0 # LATIN CAPITAL LETTER Z WITH DOT ABOVE
 <U00B0> \xB0 |0 # DEGREE SIGN
-<U0105> \xB1 |0 # LATIN SMALL LETTER A WITH OGONEK
-<U02DB> \xB2 |0 # OGONEK
-<U0142> \xB3 |0 # LATIN SMALL LETTER L WITH STROKE
 <U00B4> \xB4 |0 # ACUTE ACCENT
-<U013E> \xB5 |0 # LATIN SMALL LETTER L WITH CARON
-<U015B> \xB6 |0 # LATIN SMALL LETTER S WITH ACUTE
-<U02C7> \xB7 |0 # CARON
 <U00B8> \xB8 |0 # CEDILLA
-<U0161> \xB9 |0 # LATIN SMALL LETTER S WITH CARON
-<U015F> \xBA |0 # LATIN SMALL LETTER S WITH CEDILLA
-<U0165> \xBB |0 # LATIN SMALL LETTER T WITH CARON
-<U017A> \xBC |0 # LATIN SMALL LETTER Z WITH ACUTE
-<U02DD> \xBD |0 # DOUBLE ACUTE ACCENT
-<U017E> \xBE |0 # LATIN SMALL LETTER Z WITH CARON
-<U017C> \xBF |0 # LATIN SMALL LETTER Z WITH DOT ABOVE
-<U0154> \xC0 |0 # LATIN CAPITAL LETTER R WITH ACUTE
 <U00C1> \xC1 |0 # LATIN CAPITAL LETTER A WITH ACUTE
 <U00C2> \xC2 |0 # LATIN CAPITAL LETTER A WITH CIRCUMFLEX
-<U0102> \xC3 |0 # LATIN CAPITAL LETTER A WITH BREVE
 <U00C4> \xC4 |0 # LATIN CAPITAL LETTER A WITH DIAERESIS
-<U0139> \xC5 |0 # LATIN CAPITAL LETTER L WITH ACUTE
-<U0106> \xC6 |0 # LATIN CAPITAL LETTER C WITH ACUTE
 <U00C7> \xC7 |0 # LATIN CAPITAL LETTER C WITH CEDILLA
-<U010C> \xC8 |0 # LATIN CAPITAL LETTER C WITH CARON
 <U00C9> \xC9 |0 # LATIN CAPITAL LETTER E WITH ACUTE
-<U0118> \xCA |0 # LATIN CAPITAL LETTER E WITH OGONEK
 <U00CB> \xCB |0 # LATIN CAPITAL LETTER E WITH DIAERESIS
-<U011A> \xCC |0 # LATIN CAPITAL LETTER E WITH CARON
 <U00CD> \xCD |0 # LATIN CAPITAL LETTER I WITH ACUTE
 <U00CE> \xCE |0 # LATIN CAPITAL LETTER I WITH CIRCUMFLEX
-<U010E> \xCF |0 # LATIN CAPITAL LETTER D WITH CARON
-<U0110> \xD0 |0 # LATIN CAPITAL LETTER D WITH STROKE
-<U0143> \xD1 |0 # LATIN CAPITAL LETTER N WITH ACUTE
-<U0147> \xD2 |0 # LATIN CAPITAL LETTER N WITH CARON
 <U00D3> \xD3 |0 # LATIN CAPITAL LETTER O WITH ACUTE
 <U00D4> \xD4 |0 # LATIN CAPITAL LETTER O WITH CIRCUMFLEX
-<U0150> \xD5 |0 # LATIN CAPITAL LETTER O WITH DOUBLE ACUTE
 <U00D6> \xD6 |0 # LATIN CAPITAL LETTER O WITH DIAERESIS
 <U00D7> \xD7 |0 # MULTIPLICATION SIGN
-<U0158> \xD8 |0 # LATIN CAPITAL LETTER R WITH CARON
-<U016E> \xD9 |0 # LATIN CAPITAL LETTER U WITH RING ABOVE
 <U00DA> \xDA |0 # LATIN CAPITAL LETTER U WITH ACUTE
-<U0170> \xDB |0 # LATIN CAPITAL LETTER U WITH DOUBLE ACUTE
 <U00DC> \xDC |0 # LATIN CAPITAL LETTER U WITH DIAERESIS
 <U00DD> \xDD |0 # LATIN CAPITAL LETTER Y WITH ACUTE
-<U0162> \xDE |0 # LATIN CAPITAL LETTER T WITH CEDILLA
 <U00DF> \xDF |0 # LATIN SMALL LETTER SHARP S
-<U0155> \xE0 |0 # LATIN SMALL LETTER R WITH ACUTE
 <U00E1> \xE1 |0 # LATIN SMALL LETTER A WITH ACUTE
 <U00E2> \xE2 |0 # LATIN SMALL LETTER A WITH CIRCUMFLEX
-<U0103> \xE3 |0 # LATIN SMALL LETTER A WITH BREVE
 <U00E4> \xE4 |0 # LATIN SMALL LETTER A WITH DIAERESIS
-<U013A> \xE5 |0 # LATIN SMALL LETTER L WITH ACUTE
-<U0107> \xE6 |0 # LATIN SMALL LETTER C WITH ACUTE
 <U00E7> \xE7 |0 # LATIN SMALL LETTER C WITH CEDILLA
-<U010D> \xE8 |0 # LATIN SMALL LETTER C WITH CARON
 <U00E9> \xE9 |0 # LATIN SMALL LETTER E WITH ACUTE
-<U0119> \xEA |0 # LATIN SMALL LETTER E WITH OGONEK
 <U00EB> \xEB |0 # LATIN SMALL LETTER E WITH DIAERESIS
-<U011B> \xEC |0 # LATIN SMALL LETTER E WITH CARON
 <U00ED> \xED |0 # LATIN SMALL LETTER I WITH ACUTE
 <U00EE> \xEE |0 # LATIN SMALL LETTER I WITH CIRCUMFLEX
-<U010F> \xEF |0 # LATIN SMALL LETTER D WITH CARON
-<U0111> \xF0 |0 # LATIN SMALL LETTER D WITH STROKE
-<U0144> \xF1 |0 # LATIN SMALL LETTER N WITH ACUTE
-<U0148> \xF2 |0 # LATIN SMALL LETTER N WITH CARON
 <U00F3> \xF3 |0 # LATIN SMALL LETTER O WITH ACUTE
 <U00F4> \xF4 |0 # LATIN SMALL LETTER O WITH CIRCUMFLEX
-<U0151> \xF5 |0 # LATIN SMALL LETTER O WITH DOUBLE ACUTE
 <U00F6> \xF6 |0 # LATIN SMALL LETTER O WITH DIAERESIS
 <U00F7> \xF7 |0 # DIVISION SIGN
-<U0159> \xF8 |0 # LATIN SMALL LETTER R WITH CARON
-<U016F> \xF9 |0 # LATIN SMALL LETTER U WITH RING ABOVE
 <U00FA> \xFA |0 # LATIN SMALL LETTER U WITH ACUTE
-<U0171> \xFB |0 # LATIN SMALL LETTER U WITH DOUBLE ACUTE
 <U00FC> \xFC |0 # LATIN SMALL LETTER U WITH DIAERESIS
 <U00FD> \xFD |0 # LATIN SMALL LETTER Y WITH ACUTE
+<U0102> \xC3 |0 # LATIN CAPITAL LETTER A WITH BREVE
+<U0103> \xE3 |0 # LATIN SMALL LETTER A WITH BREVE
+<U0104> \xA1 |0 # LATIN CAPITAL LETTER A WITH OGONEK
+<U0105> \xB1 |0 # LATIN SMALL LETTER A WITH OGONEK
+<U0106> \xC6 |0 # LATIN CAPITAL LETTER C WITH ACUTE
+<U0107> \xE6 |0 # LATIN SMALL LETTER C WITH ACUTE
+<U010C> \xC8 |0 # LATIN CAPITAL LETTER C WITH CARON
+<U010D> \xE8 |0 # LATIN SMALL LETTER C WITH CARON
+<U010E> \xCF |0 # LATIN CAPITAL LETTER D WITH CARON
+<U010F> \xEF |0 # LATIN SMALL LETTER D WITH CARON
+<U0110> \xD0 |0 # LATIN CAPITAL LETTER D WITH STROKE
+<U0111> \xF0 |0 # LATIN SMALL LETTER D WITH STROKE
+<U0118> \xCA |0 # LATIN CAPITAL LETTER E WITH OGONEK
+<U0119> \xEA |0 # LATIN SMALL LETTER E WITH OGONEK
+<U011A> \xCC |0 # LATIN CAPITAL LETTER E WITH CARON
+<U011B> \xEC |0 # LATIN SMALL LETTER E WITH CARON
+<U0139> \xC5 |0 # LATIN CAPITAL LETTER L WITH ACUTE
+<U013A> \xE5 |0 # LATIN SMALL LETTER L WITH ACUTE
+<U013D> \xA5 |0 # LATIN CAPITAL LETTER L WITH CARON
+<U013E> \xB5 |0 # LATIN SMALL LETTER L WITH CARON
+<U0141> \xA3 |0 # LATIN CAPITAL LETTER L WITH STROKE
+<U0142> \xB3 |0 # LATIN SMALL LETTER L WITH STROKE
+<U0143> \xD1 |0 # LATIN CAPITAL LETTER N WITH ACUTE
+<U0144> \xF1 |0 # LATIN SMALL LETTER N WITH ACUTE
+<U0147> \xD2 |0 # LATIN CAPITAL LETTER N WITH CARON
+<U0148> \xF2 |0 # LATIN SMALL LETTER N WITH CARON
+<U0150> \xD5 |0 # LATIN CAPITAL LETTER O WITH DOUBLE ACUTE
+<U0151> \xF5 |0 # LATIN SMALL LETTER O WITH DOUBLE ACUTE
+<U0154> \xC0 |0 # LATIN CAPITAL LETTER R WITH ACUTE
+<U0155> \xE0 |0 # LATIN SMALL LETTER R WITH ACUTE
+<U0158> \xD8 |0 # LATIN CAPITAL LETTER R WITH CARON
+<U0159> \xF8 |0 # LATIN SMALL LETTER R WITH CARON
+<U015A> \xA6 |0 # LATIN CAPITAL LETTER S WITH ACUTE
+<U015B> \xB6 |0 # LATIN SMALL LETTER S WITH ACUTE
+<U015E> \xAA |0 # LATIN CAPITAL LETTER S WITH CEDILLA
+<U015F> \xBA |0 # LATIN SMALL LETTER S WITH CEDILLA
+<U0160> \xA9 |0 # LATIN CAPITAL LETTER S WITH CARON
+<U0161> \xB9 |0 # LATIN SMALL LETTER S WITH CARON
+<U0162> \xDE |0 # LATIN CAPITAL LETTER T WITH CEDILLA
 <U0163> \xFE |0 # LATIN SMALL LETTER T WITH CEDILLA
+<U0164> \xAB |0 # LATIN CAPITAL LETTER T WITH CARON
+<U0165> \xBB |0 # LATIN SMALL LETTER T WITH CARON
+<U016E> \xD9 |0 # LATIN CAPITAL LETTER U WITH RING ABOVE
+<U016F> \xF9 |0 # LATIN SMALL LETTER U WITH RING ABOVE
+<U0170> \xDB |0 # LATIN CAPITAL LETTER U WITH DOUBLE ACUTE
+<U0171> \xFB |0 # LATIN SMALL LETTER U WITH DOUBLE ACUTE
+<U0179> \xAC |0 # LATIN CAPITAL LETTER Z WITH ACUTE
+<U017A> \xBC |0 # LATIN SMALL LETTER Z WITH ACUTE
+<U017B> \xAF |0 # LATIN CAPITAL LETTER Z WITH DOT ABOVE
+<U017C> \xBF |0 # LATIN SMALL LETTER Z WITH DOT ABOVE
+<U017D> \xAE |0 # LATIN CAPITAL LETTER Z WITH CARON
+<U017E> \xBE |0 # LATIN SMALL LETTER Z WITH CARON
+<U02C7> \xB7 |0 # CARON
+<U02D8> \xA2 |0 # BREVE
 <U02D9> \xFF |0 # DOT ABOVE
+<U02DB> \xB2 |0 # OGONEK
+<U02DD> \xBD |0 # DOUBLE ACUTE ACCENT
 END CHARMAP