(retracted by #14846)
[p5sagit/p5-mst-13.2.git] / ext / Unicode / Normalize / t / test.t
1 # Before `make install' is performed this script should be runnable with
2 # `make test'. After `make install' it should work as `perl test.pl'
3
4 #########################
5
6 use Test;
7 use strict;
8 use warnings;
9 BEGIN { plan tests => 20 };
10 use Unicode::Normalize;
11 ok(1); # If we made it this far, we're ok.
12
13 #########################
14
15 ok(NFC(""), "");
16 ok(NFD(""), "");
17
18 sub hexNFC {
19   join " ", map sprintf("%04X", $_),
20   unpack 'U*', NFC pack 'U*', map hex(), split ' ', shift;
21 }
22 sub hexNFD {
23   join " ", map sprintf("%04X", $_),
24   unpack 'U*', NFD pack 'U*', map hex(), split ' ', shift;
25 }
26
27 my $ordA   = ord("A");
28 my $ASCII  = $ordA == 0x41;
29 my $EBCDIC = $ordA == 0xc1;
30
31 if ($ASCII) {
32   ok(hexNFC("0061 0315 0300 05AE 05C4 0062"), "00E0 05AE 05C4 0315 0062");
33   ok(hexNFC("00E0 05AE 05C4 0315 0062"),      "00E0 05AE 05C4 0315 0062");
34   ok(hexNFC("0061 05AE 0300 05C4 0315 0062"), "00E0 05AE 05C4 0315 0062");
35 } elsif ($EBCDIC) {
36   # A WITH GRAVE  is 0044 in EBCDIC, not 00E0
37   # SMALL LATIN B is 0082 in EBCDIC, not 0062
38   ok(hexNFC("0061 0315 0300 05AE 05C4 0062"), "0044 05AE 05C4 0315 0082");
39   ok(hexNFC("00E0 05AE 05C4 0315 0062"),      "0044 05AE 05C4 0315 0082");
40   ok(hexNFC("0061 05AE 0300 05C4 0315 0062"), "0044 05AE 05C4 0315 0082");
41 } else {
42   skip("Neither ASCII nor EBCDIC based") for 1..3;
43 }
44
45 ok(hexNFC("0045 0304 0300 AC00 11A8"), "1E14 AC01");
46 ok(hexNFC("1100 1161 1100 1173 11AF"), "AC00 AE00");
47 ok(hexNFC("1100 0300 1161 1173 11AF"), "1100 0300 1161 1173 11AF");
48
49 ok(hexNFD("0061 0315 0300 05AE 05C4 0062"), "0061 05AE 0300 05C4 0315 0062");
50 ok(hexNFD("00E0 05AE 05C4 0315 0062"),      "0061 05AE 0300 05C4 0315 0062");
51 ok(hexNFD("0061 05AE 0300 05C4 0315 0062"), "0061 05AE 0300 05C4 0315 0062");
52
53 if ($ASCII) {
54   ok(hexNFC("0061 05C4 0315 0300 05AE 0062"), "0061 05AE 05C4 0300 0315 0062");
55   ok(hexNFC("0061 05AE 05C4 0300 0315 0062"), "0061 05AE 05C4 0300 0315 0062");
56 } elsif ($EBCDIC) {
57   # SMALL LATIN A is 0081 in EBCDIC, not 0061
58   # SMALL LATIN B is 0082 in EBCDIC, not 0062
59   ok(hexNFC("0061 05C4 0315 0300 05AE 0062"), "0081 05AE 05C4 0300 0315 0082");
60   ok(hexNFC("0061 05AE 05C4 0300 0315 0062"), "0081 05AE 05C4 0300 0315 0082");
61 } else {
62   skip("Neither ASCII nor EBCDIC based") for 1..2;
63 }
64
65 ok(hexNFD("0061 05C4 0315 0300 05AE 0062"), "0061 05AE 05C4 0300 0315 0062");
66 ok(hexNFD("0061 05AE 05C4 0300 0315 0062"), "0061 05AE 05C4 0300 0315 0062");
67
68 if ($ASCII) {
69   ok(hexNFC("0000 0041 0000 0000"), "0000 0041 0000 0000");
70 } elsif ($EBCDIC) {
71   # CAPITAL LATIN A is 00C1 in EBCDIC, not 0041
72   ok(hexNFC("0000 0041 0000 0000"), "0000 00C1 0000 0000");
73 } else {
74   skip("Neither ASCII nor EBCDIC based");
75 }
76
77 ok(hexNFD("0000 0041 0000 0000"), "0000 0041 0000 0000");
78
79 # should be unary.
80 if ($ASCII) {
81   ok(NFC "\x{41}\x{0302}\x{0301}\x62" eq "\x{1EA4}\x62");
82 } elsif ($EBCDIC) {
83   ok(NFC "\x{41}\x{0302}\x{0301}\x62" eq "\x{1EA4}\x82");
84 } else {
85   skip("Neither ASCII nor EBCDIC based");
86 }
87 ok(NFD "\x{E0}\x{AC00}" eq "\x{61}\x{0300}\x{1100}\x{1161}");