Upgrade to Encode 2.10
[p5sagit/p5-mst-13.2.git] / ext / Encode / lib / Encode / Alias.pm
index 7dbc47b..7776096 100644 (file)
@@ -1,8 +1,9 @@
 package Encode::Alias;
 use strict;
+no warnings 'redefine';
 use Encode;
-our $VERSION = do { my @r = (q$Revision: 1.35 $ =~ /\d+/g); sprintf "%d."."%02d" x $#r, @r };
-our $DEBUG = 0;
+our $VERSION = do { my @r = (q$Revision: 2.3 $ =~ /\d+/g); sprintf "%d."."%02d" x $#r, @r };
+sub DEBUG () { 0 }
 
 use base qw(Exporter);
 
@@ -17,47 +18,47 @@ our @EXPORT =
 our @Alias;  # ordered matching list
 our %Alias;  # cached known aliases
 
-sub find_alias
-{
+sub find_alias{
     my $class = shift;
     my $find = shift;
-    unless (exists $Alias{$find})
-    {
+    unless (exists $Alias{$find}) {
         $Alias{$find} = undef; # Recursion guard
-       for (my $i=0; $i < @Alias; $i += 2)
-       {
+       for (my $i=0; $i < @Alias; $i += 2){
            my $alias = $Alias[$i];
            my $val   = $Alias[$i+1];
            my $new;
-           if (ref($alias) eq 'Regexp' && $find =~ $alias)
-           {
-               $DEBUG and warn "eval $val";
+           if (ref($alias) eq 'Regexp' && $find =~ $alias){
+               DEBUG and warn "eval $val";
                $new = eval $val;
-               $DEBUG and $@ and warn "$val, $@";
-           }
-           elsif (ref($alias) eq 'CODE')
-           {
-               $DEBUG and warn "$alias", "->", "($find)";
+               DEBUG and $@ and warn "$val, $@";
+           }elsif (ref($alias) eq 'CODE'){
+               DEBUG and warn "$alias", "->", "($find)";
                $new = $alias->($find);
-           }
-           elsif (lc($find) eq lc($alias))
-           {
+           }elsif (lc($find) eq lc($alias)){
                $new = $val;
            }
-           if (defined($new))
-           {
+           if (defined($new)){
                next if $new eq $find; # avoid (direct) recursion on bugs
-               $DEBUG and warn "$alias, $new";
+               DEBUG and warn "$alias, $new";
                my $enc = (ref($new)) ? $new : Encode::find_encoding($new);
-               if ($enc)
-               {
+               if ($enc){
                    $Alias{$find} = $enc;
                    last;
                }
            }
        }
+       # case insensitive search when canonical is not in all lowercase
+       # RT ticket #7835
+       unless ($Alias{$find}){
+           my $lcfind = lc($find);
+           for my $name (keys %Encode::Encoding, keys %Encode::ExtModule){
+               $lcfind eq lc($name) or next;
+               $Alias{$find} =  Encode::find_encoding($name);
+               DEBUG and warn "$find => $name";
+           }
+       }
     }
-    if ($DEBUG){
+    if (DEBUG){
        my $name;
        if (my $e = $Alias{$find}){
            $name = $e->name;
@@ -69,36 +70,32 @@ sub find_alias
     return $Alias{$find};
 }
 
-sub define_alias
-{
-    while (@_)
-    {
+sub define_alias{
+    while (@_){
        my ($alias,$name) = splice(@_,0,2);
        unshift(@Alias, $alias => $name);   # newer one has precedence
-       # clear %Alias cache to allow overrides
        if (ref($alias)){
+           # clear %Alias cache to allow overrides
            my @a = keys %Alias;
            for my $k (@a){
-               if (ref($alias) eq 'Regexp' && $k =~ $alias)
-               {
-                   $DEBUG and warn "delete \$Alias\{$k\}";
+               if (ref($alias) eq 'Regexp' && $k =~ $alias){
+                   DEBUG and warn "delete \$Alias\{$k\}";
                    delete $Alias{$k};
                }
-               elsif (ref($alias) eq 'CODE')
-               {
-                   $DEBUG and warn "delete \$Alias\{$k\}";
+               elsif (ref($alias) eq 'CODE'){
+                   DEBUG and warn "delete \$Alias\{$k\}";
                    delete $Alias{$alias->($name)};
                }
            }
        }else{
-           $DEBUG and warn "delete \$Alias\{$alias\}";
+           DEBUG and warn "delete \$Alias\{$alias\}";
            delete $Alias{$alias};
        }
     }
 }
 
 # Allow latin-1 style names as well
-                     # 0  1  2  3  4  5   6   7   8   9  10
+# 0  1  2  3  4  5   6   7   8   9  10
 our @Latin2iso = ( 0, 1, 2, 3, 4, 9, 10, 13, 14, 15, 16 );
 # Allow winlatin1 style names as well
 our %Winlatin2cp   = (
@@ -123,18 +120,18 @@ sub undef_aliases{
 sub init_aliases
 {
     undef_aliases();
-
     # Try all-lower-case version should all else fails
     define_alias( qr/^(.*)$/ => '"\L$1"' );
 
     # UTF/UCS stuff
+    define_alias( qr/^UTF-?7$/i           => '"UTF-7"');
     define_alias( qr/^UCS-?2-?LE$/i       => '"UCS-2LE"' );
     define_alias( qr/^UCS-?2-?(BE)?$/i    => '"UCS-2BE"',
                   qr/^UCS-?4-?(BE|LE)?$/i => 'uc("UTF-32$1")',
                  qr/^iso-10646-1$/i      => '"UCS-2BE"' );
-    define_alias( qr/^UTF(16|32)-?BE$/i   => '"UTF-$1BE"',
-                 qr/^UTF(16|32)-?LE$/i   => '"UTF-$1LE"',
-                 qr/^UTF(16|32)$/i       => '"UTF-$1"',
+    define_alias( qr/^UTF-?(16|32)-?BE$/i   => '"UTF-$1BE"',
+                 qr/^UTF-?(16|32)-?LE$/i   => '"UTF-$1LE"',
+                 qr/^UTF-?(16|32)$/i       => '"UTF-$1"',
                );
     # ASCII
     define_alias(qr/^(?:US-?)ascii$/i => '"ascii"');
@@ -190,9 +187,7 @@ sub init_aliases
     # define_alias( qr/\bmacRomanian$/i => '"macRumanian"');
   
     # Standardize on the dashed versions.
-    # define_alias( qr/\butf8$/i  => 'utf-8' );
-    define_alias( qr/\bkoi8r$/i => 'koi8-r' );
-    define_alias( qr/\bkoi8u$/i => 'koi8-u' );
+    define_alias( qr/\bkoi8[\s\-_]*([ru])$/i => '"koi8-$1"' );
 
     unless ($Encode::ON_EBCDIC){
         # for Encode::CN
@@ -202,7 +197,7 @@ sub init_aliases
        # CP936 doesn't have vendor-addon for GBK, so they're identical.
        define_alias( qr/^gbk$/i => '"cp936"');
        # This fixes gb2312 vs. euc-cn confusion, practically
-       define_alias( qr/\bGB[-_ ]?2312(?:\D.*$|$)/i => '"euc-cn"' );
+       define_alias( qr/\bGB[-_ ]?2312(?!-?raw)/i => '"euc-cn"' );
        # for Encode::JP
        define_alias( qr/\bjis$/i            => '"7bit-jis"' );
        define_alias( qr/\beuc.*jp$/i        => '"euc-jp"' );
@@ -210,6 +205,7 @@ sub init_aliases
        define_alias( qr/\bujis$/i           => '"euc-jp"' );
        define_alias( qr/\bshift.*jis$/i     => '"shiftjis"' );
        define_alias( qr/\bsjis$/i           => '"shiftjis"' );
+       define_alias( qr/\bwindows-31j$/i    => '"cp932"' );
         # for Encode::KR
        define_alias( qr/\beuc.*kr$/i        => '"euc-kr"' );
        define_alias( qr/\bkr.*euc$/i        => '"euc-kr"' );
@@ -225,7 +221,7 @@ sub init_aliases
        define_alias( qr/\bhk(?:scs)?[-_]?big5$/i  => '"big5-hkscs"' );
     }
     # utf8 is blessed :)
-    define_alias( qr/^UTF-8$/i => '"utf8"',);
+    define_alias( qr/^UTF-8$/i => '"utf-8-strict"');
     # At last, Map white space and _ to '-'
     define_alias( qr/^(\S+)[\s_]+(.*)$/i => '"$1-$2"' );
 }