As we're not passing over (or copying in) a NUL, don't need that extra
[p5sagit/p5-mst-13.2.git] / ext / MIME / Base64 / QuotedPrint.pm
index 778cdab..1d6a7c1 100644 (file)
@@ -1,8 +1,25 @@
-#
-# $Id: QuotedPrint.pm,v 2.11 2003/01/05 08:01:33 gisle Exp $
-
 package MIME::QuotedPrint;
 
+# $Id: QuotedPrint.pm,v 3.7 2005/11/29 20:49:46 gisle Exp $
+
+use strict;
+use vars qw(@ISA @EXPORT $VERSION);
+
+require Exporter;
+@ISA = qw(Exporter);
+@EXPORT = qw(encode_qp decode_qp);
+
+$VERSION = "3.07";
+
+use MIME::Base64;  # will load XS version of {en,de}code_qp()
+
+*encode = \&encode_qp;
+*decode = \&decode_qp;
+
+1;
+
+__END__
+
 =head1 NAME
 
 MIME::QuotedPrint - Encoding and decoding of quoted-printable strings
@@ -16,12 +33,12 @@ MIME::QuotedPrint - Encoding and decoding of quoted-printable strings
 
 =head1 DESCRIPTION
 
-This module provides functions to encode and decode strings into the
-Quoted-Printable encoding specified in RFC 2045 - I<MIME (Multipurpose
-Internet Mail Extensions)>.  The Quoted-Printable encoding is intended
+This module provides functions to encode and decode strings into and from the
+quoted-printable encoding specified in RFC 2045 - I<MIME (Multipurpose
+Internet Mail Extensions)>.  The quoted-printable encoding is intended
 to represent data that largely consists of bytes that correspond to
-printable characters in the ASCII character set.  Non-printable
-characters (as defined by english americans) are represented by a
+printable characters in the ASCII character set.  Each non-printable
+character (as defined by English Americans) is represented by a
 triplet consisting of the character "=" followed by two hexadecimal
 digits.
 
@@ -33,144 +50,67 @@ The following functions are provided:
 
 =item encode_qp($str, $eol)
 
-This function will return an encoded version of the string given as
-argument.  The second argument is the line ending sequence to use (it
-is optional and defaults to C<"\n">).
+=item encode_qp($str, $eol, $binmode)
+
+This function returns an encoded version of the string ($str) given as
+argument.
+
+The second argument ($eol) is the line-ending sequence to use.  It is
+optional and defaults to "\n".  Every occurrence of "\n" is replaced
+with this string, and it is also used for additional "soft line
+breaks" to ensure that no line end up longer than 76 characters.  Pass
+it as "\015\012" to produce data suitable for external consumption.
+The string "\r\n" produces the same result on many platforms, but not
+all.
+
+The third argument ($binmode) will select binary mode if passed as a
+TRUE value.  In binary mode "\n" will be encoded in the same way as
+any other non-printable character.  This ensures that a decoder will
+end up with exactly the same string whatever line ending sequence it
+uses.  In general it is preferable to use the base64 encoding for
+binary data; see L<MIME::Base64>.
+
+An $eol of "" (the empty string) is special.  In this case, no "soft
+line breaks" are introduced and binary mode is effectively enabled so
+that any "\n" in the original data is encoded as well.
 
 =item decode_qp($str);
 
-This function will return the plain text version of the string given
-as argument.  Lines with be "\n" terminated.
+This function returns the plain text version of the string given
+as argument.  The lines of the result are "\n" terminated, even if
+the $str argument contains "\r\n" terminated lines.
 
 =back
 
 
-If you prefer not to import these routines into your namespace you can
+If you prefer not to import these routines into your namespace, you can
 call them as:
 
   use MIME::QuotedPrint ();
   $encoded = MIME::QuotedPrint::encode($decoded);
   $decoded = MIME::QuotedPrint::decode($encoded);
 
-=head1 COPYRIGHT
+Perl v5.8 and better allow extended Unicode characters in strings.
+Such strings cannot be encoded directly, as the quoted-printable
+encoding is only defined for single-byte characters.  The solution is
+to use the Encode module to select the byte encoding you want.  For
+example:
 
-Copyright 1995-1997,2002-2003 Gisle Aas.
+    use MIME::QuotedPrint qw(encode_qp);
+    use Encode qw(encode);
 
-This library is free software; you can redistribute it and/or
-modify it under the same terms as Perl itself.
+    $encoded = encode_qp(encode("UTF-8", "\x{FFFF}\n"));
+    print $encoded;
 
-=cut
+=head1 COPYRIGHT
 
-use strict;
-use vars qw(@ISA @EXPORT $VERSION);
-if (ord('A') == 193) { # on EBCDIC machines we need translation help
-    require Encode;
-}
+Copyright 1995-1997,2002-2004 Gisle Aas.
 
-require Exporter;
-@ISA = qw(Exporter);
-@EXPORT = qw(encode_qp decode_qp);
+This library is free software; you can redistribute it and/or
+modify it under the same terms as Perl itself.
 
-use Carp qw(croak);
-
-$VERSION = "2.16";
-
-use MIME::Base64;  # try to load XS version of encode_qp
-unless (defined &encode_qp) {
-    *encode_qp = \&old_encode_qp;
-    *decode_qp = \&old_decode_qp;
-}
-
-sub old_encode_qp ($;$)
-{
-    my $res = shift;
-    if ($] >= 5.006) {
-       require bytes;
-       if (bytes::length($res) > length($res) ||
-           ($] >= 5.008 && $res =~ /[^\0-\xFF]/)) {
-           croak("The Quoted-Printable encoding is only defined for bytes");
-       }
-    }
-
-    my $eol = shift;
-    $eol = "\n" unless defined($eol) || length($eol);
-
-    # Do not mention ranges such as $res =~ s/([^ \t\n!-<>-~])/sprintf("=%02X", ord($1))/eg;
-    # since that will not even compile on an EBCDIC machine (where ord('!') > ord('<')).
-    if (ord('A') == 193) { # EBCDIC style machine
-        if (ord('[') == 173) {
-            $res =~ s/([^ \t\n!"#\$%&'()*+,\-.\/0-9:;<>?\@A-Z[\\\]^_`a-z{|}~])/sprintf("=%02X", ord(Encode::encode('iso-8859-1',Encode::decode('cp1047',$1))))/eg;  # rule #2,#3
-            $res =~ s/([ \t]+)$/
-              join('', map { sprintf("=%02X", ord(Encode::encode('iso-8859-1',Encode::decode('cp1047',$_)))) }
-                          split('', $1)
-              )/egm;                        # rule #3 (encode whitespace at eol)
-        }
-        elsif (ord('[') == 187) {
-            $res =~ s/([^ \t\n!"#\$%&'()*+,\-.\/0-9:;<>?\@A-Z[\\\]^_`a-z{|}~])/sprintf("=%02X", ord(Encode::encode('iso-8859-1',Encode::decode('posix-bc',$1))))/eg;  # rule #2,#3
-            $res =~ s/([ \t]+)$/
-              join('', map { sprintf("=%02X", ord(Encode::encode('iso-8859-1',Encode::decode('posix-bc',$_)))) }
-                          split('', $1)
-              )/egm;                        # rule #3 (encode whitespace at eol)
-        }
-        elsif (ord('[') == 186) {
-            $res =~ s/([^ \t\n!"#\$%&'()*+,\-.\/0-9:;<>?\@A-Z[\\\]^_`a-z{|}~])/sprintf("=%02X", ord(Encode::encode('iso-8859-1',Encode::decode('cp37',$1))))/eg;  # rule #2,#3
-            $res =~ s/([ \t]+)$/
-              join('', map { sprintf("=%02X", ord(Encode::encode('iso-8859-1',Encode::decode('cp37',$_)))) }
-                          split('', $1)
-              )/egm;                        # rule #3 (encode whitespace at eol)
-        }
-    }
-    else { # ASCII style machine
-        $res =~  s/([^ \t\n!"#\$%&'()*+,\-.\/0-9:;<>?\@A-Z[\\\]^_`a-z{|}~])/sprintf("=%02X", ord($1))/eg;  # rule #2,#3
-        $res =~ s/([ \t]+)$/
-          join('', map { sprintf("=%02X", ord($_)) }
-                  split('', $1)
-          )/egm;                        # rule #3 (encode whitespace at eol)
-    }
-
-    # rule #5 (lines must be shorter than 76 chars, but we are not allowed
-    # to break =XX escapes.  This makes things complicated :-( )
-    my $brokenlines = "";
-    $brokenlines .= "$1=$eol"
-       while $res =~ s/(.*?^[^\n]{73} (?:
-                [^=\n]{2} (?! [^=\n]{0,1} $) # 75 not followed by .?\n
-               |[^=\n]    (?! [^=\n]{0,2} $) # 74 not followed by .?.?\n
-               |          (?! [^=\n]{0,3} $) # 73 not followed by .?.?.?\n
-           ))//xsm;
-
-    "$brokenlines$res";
-}
-
-
-sub old_decode_qp ($)
-{
-    my $res = shift;
-    $res =~ s/\r\n/\n/g;            # normalize newlines
-    $res =~ s/[ \t]+\n/\n/g;        # rule #3 (trailing space must be deleted)
-    $res =~ s/=\n//g;               # rule #5 (soft line breaks)
-    if (ord('A') == 193) { # EBCDIC style machine
-        if (ord('[') == 173) {
-            $res =~ s/=([\da-fA-F]{2})/Encode::encode('cp1047',Encode::decode('iso-8859-1',pack("C", hex($1))))/ge;
-        }
-        elsif (ord('[') == 187) {
-            $res =~ s/=([\da-fA-F]{2})/Encode::encode('posix-bc',Encode::decode('iso-8859-1',pack("C", hex($1))))/ge;
-        }
-        elsif (ord('[') == 186) {
-            $res =~ s/=([\da-fA-F]{2})/Encode::encode('cp37',Encode::decode('iso-8859-1',pack("C", hex($1))))/ge;
-        }
-    }
-    else { # ASCII style machine
-        $res =~ s/=([\da-fA-F]{2})/pack("C", hex($1))/ge;
-    }
-    $res;
-}
-
-# Set up aliases so that these functions also can be called as
-#
-# MIME::QuotedPrint::encode();
-# MIME::QuotedPrint::decode();
+=head1 SEE ALSO
 
-*encode = \&encode_qp;
-*decode = \&decode_qp;
+L<MIME::Base64>
 
-1;
+=cut