s/SvPV/SvPVbyte/g, as suggested by Gisle Aas.
[p5sagit/p5-mst-13.2.git] / lib / unicore / Is.pl
1 # !!!!!!!   DO NOT EDIT THIS FILE   !!!!!!! 
2 # This file is built by ./mktables from e.g. Unicode.txt.
3 # Any changes made here will be lost!
4
5 ##
6 ## Data in this file used by ../utf8_heavy.pl
7 ##
8
9 ## Mapping from name to filename in ./Is
10 %utf8::Is = (
11   'ASCII'                                   => 'ASCII',
12   'Alnum'                                   => 'Alnum',
13   'Alpha'                                   => 'Alpha',
14   'BidiAL'                                  => 'BidiAL',
15   'BidiAN'                                  => 'BidiAN',
16   'BidiB'                                   => 'BidiB',
17   'BidiBN'                                  => 'BidiBN',
18   'BidiCS'                                  => 'BidiCS',
19   'BidiEN'                                  => 'BidiEN',
20   'BidiES'                                  => 'BidiES',
21   'BidiET'                                  => 'BidiET',
22   'BidiL'                                   => 'BidiL',
23   'BidiLRE'                                 => 'BidiLRE',
24   'BidiLRO'                                 => 'BidiLRO',
25   'BidiNSM'                                 => 'BidiNSM',
26   'BidiON'                                  => 'BidiON',
27   'BidiPDF'                                 => 'BidiPDF',
28   'BidiR'                                   => 'BidiR',
29   'BidiRLE'                                 => 'BidiRLE',
30   'BidiRLO'                                 => 'BidiRLO',
31   'BidiS'                                   => 'BidiS',
32   'BidiWS'                                  => 'BidiWS',
33   'Blank'                                   => 'Blank',
34   'C'                                       => 'C',
35   'Canon'                                   => 'Canon',
36   'Cc'                                      => 'Cc',
37   'Cf'                                      => 'Cf',
38   'Cn'                                      => 'Cn',
39   'Cntrl'                                   => 'Cntrl',
40   'Co'                                      => 'Co',
41   'Compat'                                  => 'Compat',
42   'Cs'                                      => 'Cs',
43   'DCcircle'                                => 'DCcircle',
44   'DCcompat'                                => 'DCcompat',
45   'DCfinal'                                 => 'DCfinal',
46   'DCfont'                                  => 'DCfont',
47   'DCfraction'                              => 'DCfracti',
48   'DCinitial'                               => 'DCinitia',
49   'DCisolated'                              => 'DCisolat',
50   'DCmedial'                                => 'DCmedial',
51   'DCnarrow'                                => 'DCnarrow',
52   'DCnoBreak'                               => 'DCnoBrea',
53   'DCsmall'                                 => 'DCsmall',
54   'DCsquare'                                => 'DCsquare',
55   'DCsub'                                   => 'DCsub',
56   'DCsuper'                                 => 'DCsuper',
57   'DCvertical'                              => 'DCvertic',
58   'DCwide'                                  => 'DCwide',
59   'Digit'                                   => 'Digit',
60   'Graph'                                   => 'Graph',
61   'L'                                       => 'L',
62   'L&'                                      => 'L_',
63   'LbrkAI'                                  => 'LbrkAI',
64   'LbrkAL'                                  => 'LbrkAL',
65   'LbrkB2'                                  => 'LbrkB2',
66   'LbrkBA'                                  => 'LbrkBA',
67   'LbrkBB'                                  => 'LbrkBB',
68   'LbrkBK'                                  => 'LbrkBK',
69   'LbrkCB'                                  => 'LbrkCB',
70   'LbrkCL'                                  => 'LbrkCL',
71   'LbrkCM'                                  => 'LbrkCM',
72   'LbrkCR'                                  => 'LbrkCR',
73   'LbrkEX'                                  => 'LbrkEX',
74   'LbrkGL'                                  => 'LbrkGL',
75   'LbrkHY'                                  => 'LbrkHY',
76   'LbrkID'                                  => 'LbrkID',
77   'LbrkIN'                                  => 'LbrkIN',
78   'LbrkIS'                                  => 'LbrkIS',
79   'LbrkLF'                                  => 'LbrkLF',
80   'LbrkNS'                                  => 'LbrkNS',
81   'LbrkNU'                                  => 'LbrkNU',
82   'LbrkOP'                                  => 'LbrkOP',
83   'LbrkPO'                                  => 'LbrkPO',
84   'LbrkPR'                                  => 'LbrkPR',
85   'LbrkQU'                                  => 'LbrkQU',
86   'LbrkSA'                                  => 'LbrkSA',
87   'LbrkSG'                                  => 'LbrkSG',
88   'LbrkSP'                                  => 'LbrkSP',
89   'LbrkSY'                                  => 'LbrkSY',
90   'LbrkXX'                                  => 'LbrkXX',
91   'LbrkZW'                                  => 'LbrkZW',
92   'Ll'                                      => 'Ll',
93   'Lm'                                      => 'Lm',
94   'Lo'                                      => 'Lo',
95   'Lower'                                   => 'Lower',
96   'Lt'                                      => 'Lt',
97   'Lu'                                      => 'Lu',
98   'M'                                       => 'M',
99   'Mc'                                      => 'Mc',
100   'Me'                                      => 'Me',
101   'Mirrored'                                => 'Mirrored',
102   'Mn'                                      => 'Mn',
103   'N'                                       => 'N',
104   'Nd'                                      => 'Nd',
105   'Nl'                                      => 'Nl',
106   'No'                                      => 'No',
107   'P'                                       => 'P',
108   'Pc'                                      => 'Pc',
109   'Pd'                                      => 'Pd',
110   'Pe'                                      => 'Pe',
111   'Pf'                                      => 'Pf',
112   'Pi'                                      => 'Pi',
113   'Po'                                      => 'Po',
114   'Print'                                   => 'Print',
115   'Ps'                                      => 'Ps',
116   'Punct'                                   => 'Punct',
117   'S'                                       => 'S',
118   'Sc'                                      => 'Sc',
119   'Sk'                                      => 'Sk',
120   'Sm'                                      => 'Sm',
121   'So'                                      => 'So',
122   'Space'                                   => 'Space',
123   'SpacePerl'                               => 'SpacePer',
124   'Title'                                   => 'Title',
125   'Upper'                                   => 'Upper',
126   'Word'                                    => 'Word',
127   'XDigit'                                  => 'XDigit',
128   'Z'                                       => 'Z',
129   'Zl'                                      => 'Zl',
130   'Zp'                                      => 'Zp',
131   'Zs'                                      => 'Zs',
132   '_CanonDCIJ'                              => '_CanonDC',
133   '_CaseIgnorable'                          => '_CaseIgn',
134   '_CombAbove'                              => '_CombAbo',
135 );
136
137 ## Mappings from regex to filename in ./Is/
138 %utf8::IsPat = (
139  'al' => {
140         'All' => 'Any',
141         'Alphabetic' => 'Alphabet',
142  },
143  'an' => {
144         'Any' => 'Any',
145  },
146  'ar' => {
147         'Armenian' => 'Armenian',
148         'Arabic' => 'Arabic',
149  },
150  'as' => {
151         'Ascii(?:[-_]|\s+)?Hex(?:[-_]|\s+)?Digit' => 'AsciiHex',
152         'Assigned' => 'Assigned',
153  },
154  'be' => {
155         'Bengali' => 'Bengali',
156  },
157  'bi' => {
158         'Bidi(?:[-_]|\s+)?Control' => 'BidiCont',
159  },
160  'bo' => {
161         'Bopomofo' => 'Bopomofo',
162  },
163  'ca' => {
164         'Canadian(?:[-_]|\s+)?Aboriginal' => 'Canadian',
165  },
166  'ch' => {
167         'Cherokee' => 'Cherokee',
168  },
169  'cl' => {
170         'Close(?:[-_]|\s+)?Punctuation' => 'Pe',
171  },
172  'co' => {
173         'Control' => 'Cc',
174         'Common' => 'Common',
175         'Connector(?:[-_]|\s+)?Punctuation' => 'Pc',
176  },
177  'cu' => {
178         'Currency(?:[-_]|\s+)?Symbol' => 'Sc',
179  },
180  'cy' => {
181         'Cyrillic' => 'Cyrillic',
182  },
183  'da' => {
184         'Dash(?:[-_]|\s+)?Punctuation' => 'Pd',
185         'Dash' => 'Dash',
186  },
187  'de' => {
188         'Deseret' => 'Deseret',
189         'Devanagari' => 'Devanaga',
190         'Decimal(?:[-_]|\s+)?Number' => 'Nd',
191  },
192  'di' => {
193         'Diacritic' => 'Diacriti',
194  },
195  'en' => {
196         'Enclosing(?:[-_]|\s+)?Mark' => 'Me',
197  },
198  'et' => {
199         'Ethiopic' => 'Ethiopic',
200  },
201  'ex' => {
202         'Extender' => 'Extender',
203  },
204  'fi' => {
205         'Final(?:[-_]|\s+)?Punctuation' => 'Pf',
206  },
207  'fo' => {
208         'Format' => 'Cf',
209  },
210  'ge' => {
211         'Georgian' => 'Georgian',
212  },
213  'go' => {
214         'Gothic' => 'Gothic',
215  },
216  'gr' => {
217         'Greek' => 'Greek',
218  },
219  'gu' => {
220         'Gujarati' => 'Gujarati',
221         'Gurmukhi' => 'Gurmukhi',
222  },
223  'ha' => {
224         'Hangul' => 'Hangul',
225         'Han' => 'Han',
226  },
227  'he' => {
228         'Hebrew' => 'Hebrew',
229         'Hex(?:[-_]|\s+)?Digit' => 'HexDigit',
230  },
231  'hi' => {
232         'Hiragana' => 'Hiragana',
233  },
234  'hy' => {
235         'Hyphen' => 'Hyphen',
236  },
237  'id' => {
238         'Ideographic' => 'Ideograp',
239         'Id(?:[-_]|\s+)?Continue' => 'IdContin',
240         'Id(?:[-_]|\s+)?Start' => 'IdStart',
241  },
242  'in' => {
243         'Inherited' => 'Inherite',
244         'Initial(?:[-_]|\s+)?Punctuation' => 'Pi',
245  },
246  'jo' => {
247         'Join(?:[-_]|\s+)?Control' => 'JoinCont',
248  },
249  'ka' => {
250         'Kannada' => 'Kannada',
251         'Katakana' => 'Katakana',
252  },
253  'kh' => {
254         'Khmer' => 'Khmer',
255  },
256  'la' => {
257         'Lao' => 'Lao',
258         'Latin' => 'Latin',
259  },
260  'le' => {
261         'Letter(?:[-_]|\s+)?Number' => 'Nl',
262         'Letter' => 'L',
263  },
264  'li' => {
265         'Line(?:[-_]|\s+)?Separator' => 'Zl',
266  },
267  'lo' => {
268         'Lowercase' => 'Lowercas',
269         'Lowercase(?:[-_]|\s+)?Letter' => 'Ll',
270  },
271  'ma' => {
272         'Math' => 'Math',
273         'Malayalam' => 'Malayala',
274         'Mark' => 'M',
275         'Math(?:[-_]|\s+)?Symbol' => 'Sm',
276  },
277  'mo' => {
278         'Modifier(?:[-_]|\s+)?Symbol' => 'Sk',
279         'Mongolian' => 'Mongolia',
280         'Modifier(?:[-_]|\s+)?Letter' => 'Lm',
281  },
282  'my' => {
283         'Myanmar' => 'Myanmar',
284  },
285  'no' => {
286         'Noncharacter(?:[-_]|\s+)?Code(?:[-_]|\s+)?Point' => 'Nonchara',
287         'Non(?:[-_]|\s+)?Spacing(?:[-_]|\s+)?Mark' => 'Mn',
288  },
289  'nu' => {
290         'Number' => 'N',
291  },
292  'og' => {
293         'Ogham' => 'Ogham',
294  },
295  'ol' => {
296         'Old(?:[-_]|\s+)?Italic' => 'OldItali',
297  },
298  'op' => {
299         'Open(?:[-_]|\s+)?Punctuation' => 'Ps',
300  },
301  'or' => {
302         'Oriya' => 'Oriya',
303  },
304  'ot' => {
305         'Other(?:[-_]|\s+)?Punctuation' => 'Po',
306         'Other(?:[-_]|\s+)?Uppercase' => 'OtherUpp',
307         'Other(?:[-_]|\s+)?Alphabetic' => 'OtherAlp',
308         'Other(?:[-_]|\s+)?Symbol' => 'So',
309         'Other(?:[-_]|\s+)?Number' => 'No',
310         'Other' => 'C',
311         'Other(?:[-_]|\s+)?Math' => 'OtherMat',
312         'Other(?:[-_]|\s+)?Letter' => 'Lo',
313         'Other(?:[-_]|\s+)?Lowercase' => 'OtherLow',
314  },
315  'pa' => {
316         'Paragraph(?:[-_]|\s+)?Separator' => 'Zp',
317  },
318  'pr' => {
319         'Private(?:[-_]|\s+)?Use' => 'Co',
320  },
321  'pu' => {
322         'Punctuation' => 'P',
323  },
324  'qu' => {
325         'Quotation(?:[-_]|\s+)?Mark' => 'Quotatio',
326  },
327  'ru' => {
328         'Runic' => 'Runic',
329  },
330  'se' => {
331         'Separator' => 'Z',
332  },
333  'si' => {
334         'Sinhala' => 'Sinhala',
335  },
336  'sp' => {
337         'Space(?:[-_]|\s+)?Separator' => 'Zs',
338         'Spacing(?:[-_]|\s+)?Mark' => 'Mc',
339  },
340  'su' => {
341         'Surrogate' => 'Cs',
342  },
343  'sy' => {
344         'Syriac' => 'Syriac',
345         'Symbol' => 'S',
346  },
347  'ta' => {
348         'Tamil' => 'Tamil',
349  },
350  'te' => {
351         'Telugu' => 'Telugu',
352         'Terminal(?:[-_]|\s+)?Punctuation' => 'Terminal',
353  },
354  'th' => {
355         'Thaana' => 'Thaana',
356         'Thai' => 'Thai',
357  },
358  'ti' => {
359         'Tibetan' => 'Tibetan',
360         'Titlecase(?:[-_]|\s+)?Letter' => 'Lt',
361  },
362  'un' => {
363         'Unassigned' => 'Cn',
364  },
365  'up' => {
366         'Uppercase' => 'Uppercas',
367         'Uppercase(?:[-_]|\s+)?Letter' => 'Lu',
368  },
369  'wh' => {
370         'White(?:[-_]|\s+)?Space' => 'WhiteSpa',
371  },
372  'yi' => {
373         'Yi' => 'Yi',
374  },
375 );