Upgrade to Encode 1.90 (plus the one extra use lib in enc_module.t)
[p5sagit/p5-mst-13.2.git] / ext / Encode / t / Aliases.t
1 #!../perl
2
3 BEGIN {
4     if ($ENV{'PERL_CORE'}){
5         chdir 't';
6         unshift @INC, '../lib';
7     }
8     require Config; import Config;
9     if ($Config{'extensions'} !~ /\bEncode\b/) {
10         print "1..0 # Skip: Encode was not built\n";
11             exit 0;
12     }
13 }
14
15 use strict;
16 use Encode;
17 use Encode::Alias;
18 my %a2c;
19 my $ON_EBCDIC;
20
21 sub init_a2c{
22     %a2c = (
23             'US-ascii' => 'ascii',
24             'ISO-646-US' => 'ascii',
25             'UTF-8'    => 'utf8',
26             'UCS-2'    => 'UCS-2BE',
27             'UCS2'     => 'UCS-2BE',
28             'iso-10646-1' => 'UCS-2BE',
29             'ucs2-le'  => 'UCS-2LE',
30             'ucs2-be'  => 'UCS-2BE',
31             'utf16'    => 'UTF-16',
32             'utf32'    => 'UTF-32',
33             'utf16-be'  => 'UTF-16BE',
34             'utf32-be'  => 'UTF-32BE',
35             'utf16-le'  => 'UTF-16LE',
36             'utf32-le'  => 'UTF-32LE',
37             'UCS4-BE'   => 'UTF-32BE',
38             'UCS-4-LE'  => 'UTF-32LE',
39             'cyrillic' => 'iso-8859-5',
40             'arabic'   => 'iso-8859-6',
41             'greek'    => 'iso-8859-7',
42             'hebrew'   => 'iso-8859-8',
43             'thai'     => 'iso-8859-11',
44             'tis620'   => 'iso-8859-11',
45             'WinLatin1'     => 'cp1252',
46             'WinLatin2'     => 'cp1250',
47             'WinCyrillic'   => 'cp1251',
48             'WinGreek'      => 'cp1253',
49             'WinTurkish'    => 'cp1254',
50             'WinHebrew'     => 'cp1255',
51             'WinArabic'     => 'cp1256',
52             'WinBaltic'     => 'cp1257',
53             'WinVietnamese' => 'cp1258',
54             'ja_JP.euc'     => $ON_EBCDIC ? '' : 'euc-jp',
55             'x-euc-jp'      => $ON_EBCDIC ? '' : 'euc-jp',
56             'zh_CN.euc'     => $ON_EBCDIC ? '' : 'euc-cn',
57             'x-euc-cn'      => $ON_EBCDIC ? '' : 'euc-cn',
58             'ko_KR.euc'     => $ON_EBCDIC ? '' : 'euc-kr',
59             'x-euc-kr'      => $ON_EBCDIC ? '' : 'euc-kr',
60             'ujis'          => $ON_EBCDIC ? '' : 'euc-jp',
61             'Shift_JIS'     => $ON_EBCDIC ? '' : 'shiftjis',
62             'x-sjis'        => $ON_EBCDIC ? '' : 'shiftjis',
63             'jis'           => $ON_EBCDIC ? '' : '7bit-jis',
64             'big-5'         => $ON_EBCDIC ? '' : 'big5-eten',
65             'zh_TW.Big5'    => $ON_EBCDIC ? '' : 'big5-eten',
66             'tca-big5'      => $ON_EBCDIC ? '' : 'big5-eten',
67             'big5-hk'       => $ON_EBCDIC ? '' : 'big5-hkscs',
68             'hkscs-big5'    => $ON_EBCDIC ? '' : 'big5-hkscs',
69             'GB_2312-80'    => $ON_EBCDIC ? '' : 'euc-cn',
70             'KS_C_5601-1987'    => $ON_EBCDIC ? '' : 'cp949',
71             #
72             'gb12345-raw'   => $ON_EBCDIC ? '' : 'gb12345-raw',
73             'gb2312-raw'    => $ON_EBCDIC ? '' : 'gb2312-raw',
74             'jis0201-raw'   => $ON_EBCDIC ? '' : 'jis0201-raw',
75             'jis0208-raw'   => $ON_EBCDIC ? '' : 'jis0208-raw',
76             'jis0212-raw'   => $ON_EBCDIC ? '' : 'jis0212-raw',
77             'ksc5601-raw'   => $ON_EBCDIC ? '' : 'ksc5601-raw',
78            );
79
80     for my $i (1..11,13..16){
81         $a2c{"ISO 8859 $i"} = "iso-8859-$i";
82     }
83     for my $i (1..10){
84         $a2c{"ISO Latin $i"} = "iso-8859-$Encode::Alias::Latin2iso[$i]";
85     }
86     for my $k (keys %Encode::Alias::Winlatin2cp){
87         my $v = $Encode::Alias::Winlatin2cp{$k};
88         $a2c{"Win" . ucfirst($k)} = "cp" . $v;
89         $a2c{"IBM-$v"} = $a2c{"MS-$v"} = "cp" . $v;
90         $a2c{"cp-" . $v} = "cp" . $v;
91     }
92     my @a2c = keys %a2c;
93     for my $k (@a2c){
94         $a2c{uc($k)} = $a2c{$k};
95         $a2c{lc($k)} = $a2c{$k};
96         $a2c{lcfirst($k)} = $a2c{$k};
97         $a2c{ucfirst($k)} = $a2c{$k};
98     }
99 }
100
101 BEGIN{
102     $ON_EBCDIC = ord("A") == 193;
103     @ARGV and $ON_EBCDIC = $ARGV[0] eq 'EBCDIC';
104     $Encode::ON_EBCDIC = $ON_EBCDIC;
105     init_a2c();
106 }
107
108 if ($ON_EBCDIC){
109     delete @Encode::ExtModule{
110         qw(euc-cn gb2312 gb12345 gbk cp936 iso-ir-165 MacChineseSimp
111            euc-jp iso-2022-jp 7bit-jis shiftjis MacJapanese cp932
112            euc-kr ksc5601 cp949 MacKorean
113            big5 big5-hkscs cp950 MacChineseTrad
114            gb18030 big5plus euc-tw)
115         };
116 }
117
118 use Test::More tests => (scalar keys %a2c) * 4;
119
120 print "# alias test;  \$ON_EBCDIC == $ON_EBCDIC\n";
121
122 foreach my $a (keys %a2c){      
123     my $e = Encode::find_encoding($a);
124     is((defined($e) and $e->name), $a2c{$a},$a)
125         or warn "alias was $a";;
126 }
127
128 # now we override some of the aliases and see if it works fine
129
130 define_alias(
131              qr/ascii/i    => 'WinLatin1',
132              qr/cyrillic/i => 'WinCyrillic',
133              qr/arabic/i   => 'WinArabic',
134              qr/greek/i    => 'WinGreek',
135              qr/hebrew/i   => 'WinHebrew'
136             );
137
138 print "# alias test with alias overrides\n";
139
140 foreach my $a (keys %a2c){      
141     my $e = Encode::find_encoding($a);
142     is((defined($e) and $e->name), $a2c{$a}, "Override $a")
143         or warn "alias was $a";
144 }
145
146 print "# alias undef test\n";
147
148 Encode::Alias->undef_aliases;
149 foreach my $a (keys %a2c){      
150     my $e = Encode::find_encoding($a);
151     ok(!defined($e) || $e->name =~ /-raw$/o,"Undef $a")
152         or warn "alias was $a";
153 }
154
155 print "# alias reinit test\n";
156
157 Encode::Alias->init_aliases;
158 init_a2c();
159 foreach my $a (keys %a2c){      
160     my $e = Encode::find_encoding($a);
161     is((defined($e) and $e->name), $a2c{$a}, "Reinit $a")
162         or warn "alias was $a";
163 }
164 __END__
165 for my $k (keys %a2c){
166     $k =~ /[A-Z]/ and next;
167     print "$k => $a2c{$k}\n";
168 }
169
170
171