Make the :bytes conditional on PerlIO.
[p5sagit/p5-mst-13.2.git] / ext / PerlIO / t / encoding.t
1 #!./perl -w
2
3 BEGIN {
4     chdir 't' if -d 't';
5     @INC = '../lib';
6     no warnings; # Need global -w flag for later tests, but don't want this
7     # to warn here:
8     push @INC, "::lib:$MacPerl::Architecture:" if $^O eq 'MacOS';
9     unless (find PerlIO::Layer 'perlio') {
10         print "1..0 # Skip: not perlio\n";
11         exit 0;
12     }
13 }
14
15 print "1..14\n";
16
17 my $grk = "grk$$";
18 my $utf = "utf$$";
19 my $fail1 = "fa$$";
20 my $fail2 = "fb$$";
21 my $russki = "koi8r$$";
22 my $threebyte = "3byte$$";
23
24 if (open(GRK, ">$grk")) {
25     binmode(GRK, ":bytes");
26     # alpha beta gamma in ISO 8859-7
27     print GRK "\xe1\xe2\xe3";
28     close GRK or die "Could not close: $!";
29 }
30
31 {
32     use Encode;
33     open(my $i,'<:encoding(iso-8859-7)',$grk);
34     print "ok 1\n";
35     open(my $o,'>:utf8',$utf);
36     print "ok 2\n";
37     print $o readline($i);
38     print "ok 3\n";
39     close($o) or die "Could not close: $!";
40     close($i);
41 }
42
43 if (open(UTF, "<$utf")) {
44     binmode(UTF, ":bytes");
45     if (ord('A') == 193) { # EBCDIC
46         # alpha beta gamma in UTF-EBCDIC Unicode (0x3b1 0x3b2 0x3b3)
47         print "not " unless <UTF> eq "\xb4\x58\xb4\x59\xb4\x62";
48     } else {
49         # alpha beta gamma in UTF-8 Unicode (0x3b1 0x3b2 0x3b3)
50         print "not " unless <UTF> eq "\xce\xb1\xce\xb2\xce\xb3";
51     }
52     print "ok 4\n";
53     close UTF;
54 }
55
56 {
57     use Encode;
58     open(my $i,'<:utf8',$utf);
59     print "ok 5\n";
60     open(my $o,'>:encoding(iso-8859-7)',$grk);
61     print "ok 6\n";
62     print $o readline($i);
63     print "ok 7\n";
64     close($o) or die "Could not close: $!";
65     close($i);
66 }
67
68 if (open(GRK, "<$grk")) {
69     binmode(GRK, ":bytes");
70     print "not " unless <GRK> eq "\xe1\xe2\xe3";
71     print "ok 8\n";
72     close GRK;
73 }
74
75 $SIG{__WARN__} = sub {$warn .= $_[0]};
76
77 if (open(FAIL, ">:encoding(NoneSuch)", $fail1)) {
78     print "not ok 9 # Open should fail\n";
79 } else {
80     print "ok 9\n";
81 }
82 if (!defined $warn) {
83     print "not ok 10 # warning is undef\n";
84 } elsif ($warn =~ /^Cannot find encoding "NoneSuch" at/) {
85     print "ok 10\n";
86 } else {
87     print "not ok 10 # warning is '$warn'";
88 }
89
90 if (open(RUSSKI, ">$russki")) {
91     print RUSSKI "\x3c\x3f\x78";
92     close RUSSKI or die "Could not close: $!";
93     open(RUSSKI, "$russki");
94     binmode(RUSSKI, ":raw");
95     my $buf1;
96     read(RUSSKI, $buf1, 1);
97     # eof(RUSSKI);
98     binmode(RUSSKI, ":encoding(koi8-r)");
99     my $buf2;
100     read(RUSSKI, $buf2, 1);
101     my $offset = tell(RUSSKI);
102     if (ord($buf1) == 0x3c &&
103         ord($buf2) == (ord('A') == 193) ? 0x6f : 0x3f &&
104         $offset == 2) {
105         print "ok 11\n";
106     } else {
107         printf "not ok 11 # [%s] [%s] %d\n",
108                join(" ", unpack("H*", $buf1)),
109                join(" ", unpack("H*", $buf2)), $offset;
110     }
111     close(RUSSKI);
112 } else {
113     print "not ok 11 # open failed: $!\n";
114 }
115
116 undef $warn;
117
118 # Check there is no Use of uninitialized value in concatenation (.) warning
119 # due to the way @latin2iso_num was used to make aliases.
120 if (open(FAIL, ">:encoding(latin42)", $fail2)) {
121     print "not ok 12 # Open should fail\n";
122 } else {
123     print "ok 12\n";
124 }
125 if (!defined $warn) {
126     print "not ok 13 # warning is undef\n";
127 } elsif ($warn =~ /^Cannot find encoding "latin42" at.*line \d+\.$/) {
128     print "ok 13\n";
129 } else {
130     print "not ok 13 # warning is: \n";
131     $warn =~ s/^/# /mg;
132     print "$warn";
133 }
134
135 # Create a string of chars that are 3 bytes in UTF-8 
136 my $str = "\x{1f80}" x 2048;
137
138 # Write them to a file
139 open(F,'>:utf8',$threebyte) || die "Cannot open $threebyte:$!";
140 print F $str;
141 close(F);
142
143 # Read file back as UTF-8 
144 open(F,'<:encoding(utf-8)',$threebyte) || die "Cannot open $threebyte:$!";
145 my $dstr = <F>;
146 close(F);
147 print "not " unless ($dstr eq $str);
148 print "ok 14\n";
149
150 END {
151     unlink($grk, $utf, $fail1, $fail2, $russki, $threebyte);
152 }