Upgrade to Encode 1.26, from Dan Kogai.
[p5sagit/p5-mst-13.2.git] / ext / Encode / ucm / koi8-r.ucm
index b9f413e..21f1da3 100644 (file)
@@ -1,45 +1,46 @@
 #
-# $Id: koi8-r.ucm,v 1.0 2002/03/31 21:09:59 dankogai Exp $
+# $Id: koi8-r.ucm,v 1.20 2002/04/04 19:50:54 dankogai Exp $
+#
+# Original table can be obtained at
+# http://www.unicode.org/Public/MAPPINGS/VENDORS/MISC/KOI8-R.TXT
 #
-# ./compile -n koi8-r -o Encode/koi8-r.ucm Encode/koi8-r.enc
 <code_set_name> "koi8-r"
 <mb_cur_min> 1
 <mb_cur_max> 1
 <subchar> \x3F
-#
 CHARMAP
-<U0000> \x00 |0 # <control>
-<U0001> \x01 |0 # <control>
-<U0002> \x02 |0 # <control>
-<U0003> \x03 |0 # <control>
-<U0004> \x04 |0 # <control>
-<U0005> \x05 |0 # <control>
-<U0006> \x06 |0 # <control>
-<U0007> \x07 |0 # <control>
-<U0008> \x08 |0 # <control>
-<U0009> \x09 |0 # <control>
-<U000A> \x0A |0 # <control>
-<U000B> \x0B |0 # <control>
-<U000C> \x0C |0 # <control>
-<U000D> \x0D |0 # <control>
-<U000E> \x0E |0 # <control>
-<U000F> \x0F |0 # <control>
-<U0010> \x10 |0 # <control>
-<U0011> \x11 |0 # <control>
-<U0012> \x12 |0 # <control>
-<U0013> \x13 |0 # <control>
-<U0014> \x14 |0 # <control>
-<U0015> \x15 |0 # <control>
-<U0016> \x16 |0 # <control>
-<U0017> \x17 |0 # <control>
-<U0018> \x18 |0 # <control>
-<U0019> \x19 |0 # <control>
-<U001A> \x1A |0 # <control>
-<U001B> \x1B |0 # <control>
-<U001C> \x1C |0 # <control>
-<U001D> \x1D |0 # <control>
-<U001E> \x1E |0 # <control>
-<U001F> \x1F |0 # <control>
+<U0000> \x00 |0 # NULL
+<U0001> \x01 |0 # START OF HEADING
+<U0002> \x02 |0 # START OF TEXT
+<U0003> \x03 |0 # END OF TEXT
+<U0004> \x04 |0 # END OF TRANSMISSION
+<U0005> \x05 |0 # ENQUIRY
+<U0006> \x06 |0 # ACKNOWLEDGE
+<U0007> \x07 |0 # BELL
+<U0008> \x08 |0 # BACKSPACE
+<U0009> \x09 |0 # HORIZONTAL TABULATION
+<U000A> \x0A |0 # LINE FEED
+<U000B> \x0B |0 # VERTICAL TABULATION
+<U000C> \x0C |0 # FORM FEED
+<U000D> \x0D |0 # CARRIAGE RETURN
+<U000E> \x0E |0 # SHIFT OUT
+<U000F> \x0F |0 # SHIFT IN
+<U0010> \x10 |0 # DATA LINK ESCAPE
+<U0011> \x11 |0 # DEVICE CONTROL ONE
+<U0012> \x12 |0 # DEVICE CONTROL TWO
+<U0013> \x13 |0 # DEVICE CONTROL THREE
+<U0014> \x14 |0 # DEVICE CONTROL FOUR
+<U0015> \x15 |0 # NEGATIVE ACKNOWLEDGE
+<U0016> \x16 |0 # SYNCHRONOUS IDLE
+<U0017> \x17 |0 # END OF TRANSMISSION BLOCK
+<U0018> \x18 |0 # CANCEL
+<U0019> \x19 |0 # END OF MEDIUM
+<U001A> \x1A |0 # SUBSTITUTE
+<U001B> \x1B |0 # ESCAPE
+<U001C> \x1C |0 # FILE SEPARATOR
+<U001D> \x1D |0 # GROUP SEPARATOR
+<U001E> \x1E |0 # RECORD SEPARATOR
+<U001F> \x1F |0 # UNIT SEPARATOR
 <U0020> \x20 |0 # SPACE
 <U0021> \x21 |0 # EXCLAMATION MARK
 <U0022> \x22 |0 # QUOTATION MARK
@@ -135,7 +136,86 @@ CHARMAP
 <U007C> \x7C |0 # VERTICAL LINE
 <U007D> \x7D |0 # RIGHT CURLY BRACKET
 <U007E> \x7E |0 # TILDE
-<U007F> \x7F |0 # <control>
+<U007F> \x7F |0 # DELETE
+<U00A0> \x9A |0 # NO-BREAK SPACE
+<U00A9> \xBF |0 # COPYRIGHT SIGN
+<U00B0> \x9C |0 # DEGREE SIGN
+<U00B2> \x9D |0 # SUPERSCRIPT TWO
+<U00B7> \x9E |0 # MIDDLE DOT
+<U00F7> \x9F |0 # DIVISION SIGN
+<U0401> \xB3 |0 # CYRILLIC CAPITAL LETTER IO
+<U0410> \xE1 |0 # CYRILLIC CAPITAL LETTER A
+<U0411> \xE2 |0 # CYRILLIC CAPITAL LETTER BE
+<U0412> \xF7 |0 # CYRILLIC CAPITAL LETTER VE
+<U0413> \xE7 |0 # CYRILLIC CAPITAL LETTER GHE
+<U0414> \xE4 |0 # CYRILLIC CAPITAL LETTER DE
+<U0415> \xE5 |0 # CYRILLIC CAPITAL LETTER IE
+<U0416> \xF6 |0 # CYRILLIC CAPITAL LETTER ZHE
+<U0417> \xFA |0 # CYRILLIC CAPITAL LETTER ZE
+<U0418> \xE9 |0 # CYRILLIC CAPITAL LETTER I
+<U0419> \xEA |0 # CYRILLIC CAPITAL LETTER SHORT I
+<U041A> \xEB |0 # CYRILLIC CAPITAL LETTER KA
+<U041B> \xEC |0 # CYRILLIC CAPITAL LETTER EL
+<U041C> \xED |0 # CYRILLIC CAPITAL LETTER EM
+<U041D> \xEE |0 # CYRILLIC CAPITAL LETTER EN
+<U041E> \xEF |0 # CYRILLIC CAPITAL LETTER O
+<U041F> \xF0 |0 # CYRILLIC CAPITAL LETTER PE
+<U0420> \xF2 |0 # CYRILLIC CAPITAL LETTER ER
+<U0421> \xF3 |0 # CYRILLIC CAPITAL LETTER ES
+<U0422> \xF4 |0 # CYRILLIC CAPITAL LETTER TE
+<U0423> \xF5 |0 # CYRILLIC CAPITAL LETTER U
+<U0424> \xE6 |0 # CYRILLIC CAPITAL LETTER EF
+<U0425> \xE8 |0 # CYRILLIC CAPITAL LETTER HA
+<U0426> \xE3 |0 # CYRILLIC CAPITAL LETTER TSE
+<U0427> \xFE |0 # CYRILLIC CAPITAL LETTER CHE
+<U0428> \xFB |0 # CYRILLIC CAPITAL LETTER SHA
+<U0429> \xFD |0 # CYRILLIC CAPITAL LETTER SHCHA
+<U042A> \xFF |0 # CYRILLIC CAPITAL LETTER HARD SIGN
+<U042B> \xF9 |0 # CYRILLIC CAPITAL LETTER YERU
+<U042C> \xF8 |0 # CYRILLIC CAPITAL LETTER SOFT SIGN
+<U042D> \xFC |0 # CYRILLIC CAPITAL LETTER E
+<U042E> \xE0 |0 # CYRILLIC CAPITAL LETTER YU
+<U042F> \xF1 |0 # CYRILLIC CAPITAL LETTER YA
+<U0430> \xC1 |0 # CYRILLIC SMALL LETTER A
+<U0431> \xC2 |0 # CYRILLIC SMALL LETTER BE
+<U0432> \xD7 |0 # CYRILLIC SMALL LETTER VE
+<U0433> \xC7 |0 # CYRILLIC SMALL LETTER GHE
+<U0434> \xC4 |0 # CYRILLIC SMALL LETTER DE
+<U0435> \xC5 |0 # CYRILLIC SMALL LETTER IE
+<U0436> \xD6 |0 # CYRILLIC SMALL LETTER ZHE
+<U0437> \xDA |0 # CYRILLIC SMALL LETTER ZE
+<U0438> \xC9 |0 # CYRILLIC SMALL LETTER I
+<U0439> \xCA |0 # CYRILLIC SMALL LETTER SHORT I
+<U043A> \xCB |0 # CYRILLIC SMALL LETTER KA
+<U043B> \xCC |0 # CYRILLIC SMALL LETTER EL
+<U043C> \xCD |0 # CYRILLIC SMALL LETTER EM
+<U043D> \xCE |0 # CYRILLIC SMALL LETTER EN
+<U043E> \xCF |0 # CYRILLIC SMALL LETTER O
+<U043F> \xD0 |0 # CYRILLIC SMALL LETTER PE
+<U0440> \xD2 |0 # CYRILLIC SMALL LETTER ER
+<U0441> \xD3 |0 # CYRILLIC SMALL LETTER ES
+<U0442> \xD4 |0 # CYRILLIC SMALL LETTER TE
+<U0443> \xD5 |0 # CYRILLIC SMALL LETTER U
+<U0444> \xC6 |0 # CYRILLIC SMALL LETTER EF
+<U0445> \xC8 |0 # CYRILLIC SMALL LETTER HA
+<U0446> \xC3 |0 # CYRILLIC SMALL LETTER TSE
+<U0447> \xDE |0 # CYRILLIC SMALL LETTER CHE
+<U0448> \xDB |0 # CYRILLIC SMALL LETTER SHA
+<U0449> \xDD |0 # CYRILLIC SMALL LETTER SHCHA
+<U044A> \xDF |0 # CYRILLIC SMALL LETTER HARD SIGN
+<U044B> \xD9 |0 # CYRILLIC SMALL LETTER YERU
+<U044C> \xD8 |0 # CYRILLIC SMALL LETTER SOFT SIGN
+<U044D> \xDC |0 # CYRILLIC SMALL LETTER E
+<U044E> \xC0 |0 # CYRILLIC SMALL LETTER YU
+<U044F> \xD1 |0 # CYRILLIC SMALL LETTER YA
+<U0451> \xA3 |0 # CYRILLIC SMALL LETTER IO
+<U2219> \x95 |0 # BULLET OPERATOR
+<U221A> \x96 |0 # SQUARE ROOT
+<U2248> \x97 |0 # ALMOST EQUAL TO
+<U2264> \x98 |0 # LESS-THAN OR EQUAL TO
+<U2265> \x99 |0 # GREATER-THAN OR EQUAL TO
+<U2320> \x93 |0 # TOP HALF INTEGRAL
+<U2321> \x9B |0 # BOTTOM HALF INTEGRAL
 <U2500> \x80 |0 # BOX DRAWINGS LIGHT HORIZONTAL
 <U2502> \x81 |0 # BOX DRAWINGS LIGHT VERTICAL
 <U250C> \x82 |0 # BOX DRAWINGS LIGHT DOWN AND RIGHT
@@ -147,31 +227,9 @@ CHARMAP
 <U252C> \x88 |0 # BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
 <U2534> \x89 |0 # BOX DRAWINGS LIGHT UP AND HORIZONTAL
 <U253C> \x8A |0 # BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
-<U2580> \x8B |0 # UPPER HALF BLOCK
-<U2584> \x8C |0 # LOWER HALF BLOCK
-<U2588> \x8D |0 # FULL BLOCK
-<U258C> \x8E |0 # LEFT HALF BLOCK
-<U2590> \x8F |0 # RIGHT HALF BLOCK
-<U2591> \x90 |0 # LIGHT SHADE
-<U2592> \x91 |0 # MEDIUM SHADE
-<U2593> \x92 |0 # DARK SHADE
-<U2320> \x93 |0 # TOP HALF INTEGRAL
-<U25A0> \x94 |0 # BLACK SQUARE
-<U2219> \x95 |0 # BULLET OPERATOR
-<U221A> \x96 |0 # SQUARE ROOT
-<U2248> \x97 |0 # ALMOST EQUAL TO
-<U2264> \x98 |0 # LESS-THAN OR EQUAL TO
-<U2265> \x99 |0 # GREATER-THAN OR EQUAL TO
-<U00A0> \x9A |0 # NO-BREAK SPACE
-<U2321> \x9B |0 # BOTTOM HALF INTEGRAL
-<U00B0> \x9C |0 # DEGREE SIGN
-<U00B2> \x9D |0 # SUPERSCRIPT TWO
-<U00B7> \x9E |0 # MIDDLE DOT
-<U00F7> \x9F |0 # DIVISION SIGN
 <U2550> \xA0 |0 # BOX DRAWINGS DOUBLE HORIZONTAL
 <U2551> \xA1 |0 # BOX DRAWINGS DOUBLE VERTICAL
 <U2552> \xA2 |0 # BOX DRAWINGS DOWN SINGLE AND RIGHT DOUBLE
-<U0451> \xA3 |0 # CYRILLIC SMALL LETTER IO
 <U2553> \xA4 |0 # BOX DRAWINGS DOWN DOUBLE AND RIGHT SINGLE
 <U2554> \xA5 |0 # BOX DRAWINGS DOUBLE DOWN AND RIGHT
 <U2555> \xA6 |0 # BOX DRAWINGS DOWN SINGLE AND LEFT DOUBLE
@@ -187,7 +245,6 @@ CHARMAP
 <U255F> \xB0 |0 # BOX DRAWINGS VERTICAL DOUBLE AND RIGHT SINGLE
 <U2560> \xB1 |0 # BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
 <U2561> \xB2 |0 # BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
-<U0401> \xB3 |0 # CYRILLIC CAPITAL LETTER IO
 <U2562> \xB4 |0 # BOX DRAWINGS VERTICAL DOUBLE AND LEFT SINGLE
 <U2563> \xB5 |0 # BOX DRAWINGS DOUBLE VERTICAL AND LEFT
 <U2564> \xB6 |0 # BOX DRAWINGS DOWN SINGLE AND HORIZONTAL DOUBLE
@@ -199,69 +256,13 @@ CHARMAP
 <U256A> \xBC |0 # BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
 <U256B> \xBD |0 # BOX DRAWINGS VERTICAL DOUBLE AND HORIZONTAL SINGLE
 <U256C> \xBE |0 # BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
-<U00A9> \xBF |0 # COPYRIGHT SIGN
-<U044E> \xC0 |0 # CYRILLIC SMALL LETTER YU
-<U0430> \xC1 |0 # CYRILLIC SMALL LETTER A
-<U0431> \xC2 |0 # CYRILLIC SMALL LETTER BE
-<U0446> \xC3 |0 # CYRILLIC SMALL LETTER TSE
-<U0434> \xC4 |0 # CYRILLIC SMALL LETTER DE
-<U0435> \xC5 |0 # CYRILLIC SMALL LETTER IE
-<U0444> \xC6 |0 # CYRILLIC SMALL LETTER EF
-<U0433> \xC7 |0 # CYRILLIC SMALL LETTER GHE
-<U0445> \xC8 |0 # CYRILLIC SMALL LETTER HA
-<U0438> \xC9 |0 # CYRILLIC SMALL LETTER I
-<U0439> \xCA |0 # CYRILLIC SMALL LETTER SHORT I
-<U043A> \xCB |0 # CYRILLIC SMALL LETTER KA
-<U043B> \xCC |0 # CYRILLIC SMALL LETTER EL
-<U043C> \xCD |0 # CYRILLIC SMALL LETTER EM
-<U043D> \xCE |0 # CYRILLIC SMALL LETTER EN
-<U043E> \xCF |0 # CYRILLIC SMALL LETTER O
-<U043F> \xD0 |0 # CYRILLIC SMALL LETTER PE
-<U044F> \xD1 |0 # CYRILLIC SMALL LETTER YA
-<U0440> \xD2 |0 # CYRILLIC SMALL LETTER ER
-<U0441> \xD3 |0 # CYRILLIC SMALL LETTER ES
-<U0442> \xD4 |0 # CYRILLIC SMALL LETTER TE
-<U0443> \xD5 |0 # CYRILLIC SMALL LETTER U
-<U0436> \xD6 |0 # CYRILLIC SMALL LETTER ZHE
-<U0432> \xD7 |0 # CYRILLIC SMALL LETTER VE
-<U044C> \xD8 |0 # CYRILLIC SMALL LETTER SOFT SIGN
-<U044B> \xD9 |0 # CYRILLIC SMALL LETTER YERU
-<U0437> \xDA |0 # CYRILLIC SMALL LETTER ZE
-<U0448> \xDB |0 # CYRILLIC SMALL LETTER SHA
-<U044D> \xDC |0 # CYRILLIC SMALL LETTER E
-<U0449> \xDD |0 # CYRILLIC SMALL LETTER SHCHA
-<U0447> \xDE |0 # CYRILLIC SMALL LETTER CHE
-<U044A> \xDF |0 # CYRILLIC SMALL LETTER HARD SIGN
-<U042E> \xE0 |0 # CYRILLIC CAPITAL LETTER YU
-<U0410> \xE1 |0 # CYRILLIC CAPITAL LETTER A
-<U0411> \xE2 |0 # CYRILLIC CAPITAL LETTER BE
-<U0426> \xE3 |0 # CYRILLIC CAPITAL LETTER TSE
-<U0414> \xE4 |0 # CYRILLIC CAPITAL LETTER DE
-<U0415> \xE5 |0 # CYRILLIC CAPITAL LETTER IE
-<U0424> \xE6 |0 # CYRILLIC CAPITAL LETTER EF
-<U0413> \xE7 |0 # CYRILLIC CAPITAL LETTER GHE
-<U0425> \xE8 |0 # CYRILLIC CAPITAL LETTER HA
-<U0418> \xE9 |0 # CYRILLIC CAPITAL LETTER I
-<U0419> \xEA |0 # CYRILLIC CAPITAL LETTER SHORT I
-<U041A> \xEB |0 # CYRILLIC CAPITAL LETTER KA
-<U041B> \xEC |0 # CYRILLIC CAPITAL LETTER EL
-<U041C> \xED |0 # CYRILLIC CAPITAL LETTER EM
-<U041D> \xEE |0 # CYRILLIC CAPITAL LETTER EN
-<U041E> \xEF |0 # CYRILLIC CAPITAL LETTER O
-<U041F> \xF0 |0 # CYRILLIC CAPITAL LETTER PE
-<U042F> \xF1 |0 # CYRILLIC CAPITAL LETTER YA
-<U0420> \xF2 |0 # CYRILLIC CAPITAL LETTER ER
-<U0421> \xF3 |0 # CYRILLIC CAPITAL LETTER ES
-<U0422> \xF4 |0 # CYRILLIC CAPITAL LETTER TE
-<U0423> \xF5 |0 # CYRILLIC CAPITAL LETTER U
-<U0416> \xF6 |0 # CYRILLIC CAPITAL LETTER ZHE
-<U0412> \xF7 |0 # CYRILLIC CAPITAL LETTER VE
-<U042C> \xF8 |0 # CYRILLIC CAPITAL LETTER SOFT SIGN
-<U042B> \xF9 |0 # CYRILLIC CAPITAL LETTER YERU
-<U0417> \xFA |0 # CYRILLIC CAPITAL LETTER ZE
-<U0428> \xFB |0 # CYRILLIC CAPITAL LETTER SHA
-<U042D> \xFC |0 # CYRILLIC CAPITAL LETTER E
-<U0429> \xFD |0 # CYRILLIC CAPITAL LETTER SHCHA
-<U0427> \xFE |0 # CYRILLIC CAPITAL LETTER CHE
-<U042A> \xFF |0 # CYRILLIC CAPITAL LETTER HARD SIGN
+<U2580> \x8B |0 # UPPER HALF BLOCK
+<U2584> \x8C |0 # LOWER HALF BLOCK
+<U2588> \x8D |0 # FULL BLOCK
+<U258C> \x8E |0 # LEFT HALF BLOCK
+<U2590> \x8F |0 # RIGHT HALF BLOCK
+<U2591> \x90 |0 # LIGHT SHADE
+<U2592> \x91 |0 # MEDIUM SHADE
+<U2593> \x92 |0 # DARK SHADE
+<U25A0> \x94 |0 # BLACK SQUARE
 END CHARMAP