let stringify_args pass all args; add test for reading dups
[scpubgit/stemmatology.git] / base / t / text_tradition_collation.t
1 #!/usr/bin/perl -w
2
3 use strict;
4 use Test::More 'no_plan';
5 $| = 1;
6
7
8
9 # =begin testing
10 {
11 use Text::Tradition;
12
13 my $cxfile = 't/data/Collatex-16.xml';
14 my $t = Text::Tradition->new( 
15     'name'  => 'inline', 
16     'input' => 'CollateX',
17     'file'  => $cxfile,
18     );
19 my $c = $t->collation;
20
21 my $rno = scalar $c->readings;
22 # Split n21 ('unto') for testing purposes
23 my $new_r = $c->add_reading( { 'id' => 'n21p0', 'text' => 'un', 'join_next' => 1 } );
24 my $old_r = $c->reading( 'n21' );
25 $old_r->alter_text( 'to' );
26 $c->del_path( 'n20', 'n21', 'A' );
27 $c->add_path( 'n20', 'n21p0', 'A' );
28 $c->add_path( 'n21p0', 'n21', 'A' );
29 $c->add_relationship( 'n21', 'n22', { type => 'collated', scope => 'local' } );
30 $c->flatten_ranks();
31 ok( $c->reading( 'n21p0' ), "New reading exists" );
32 is( scalar $c->readings, $rno, "Reading add offset by flatten_ranks" );
33
34 # Combine n3 and n4 ( with his )
35 $c->merge_readings( 'n3', 'n4', 1 );
36 ok( !$c->reading('n4'), "Reading n4 is gone" );
37 is( $c->reading('n3')->text, 'with his', "Reading n3 has both words" );
38
39 # Collapse n9 and n10 ( rood / root )
40 $c->merge_readings( 'n9', 'n10' );
41 ok( !$c->reading('n10'), "Reading n10 is gone" );
42 is( $c->reading('n9')->text, 'rood', "Reading n9 has an unchanged word" );
43
44 # Combine n21 and n21p0
45 my $remaining = $c->reading('n21');
46 $remaining ||= $c->reading('n22');  # one of these should still exist
47 $c->merge_readings( 'n21p0', $remaining, 1 );
48 ok( !$c->reading('n21'), "Reading $remaining is gone" );
49 is( $c->reading('n21p0')->text, 'unto', "Reading n21p0 merged correctly" );
50 }
51
52
53
54 # =begin testing
55 {
56 use Text::Tradition;
57
58 my $st = Text::Tradition->new( 'input' => 'Self', 'file' => 't/data/collatecorr.xml' );
59 is( ref( $st ), 'Text::Tradition', "Got a tradition from test file" );
60 ok( $st->has_witness('Ba96'), "Tradition has the affected witness" );
61
62 my $sc = $st->collation;
63 my $numr = 17;
64 ok( $sc->reading('n131'), "Tradition has the affected reading" );
65 is( scalar( $sc->readings ), $numr, "There are $numr readings in the graph" );
66 is( $sc->end->rank, 14, "There are fourteen ranks in the graph" );
67
68 # Detach the erroneously collated reading
69 my $newr = $sc->duplicate_reading( 'n131', 'Ba96' );
70 ok( $newr, "New reading was created" );
71 ok( $sc->reading('n131_0'), "Detached the bad collation with a new reading" );
72 is( scalar( $sc->readings ), $numr + 1, "A reading was added to the graph" );
73 is( $sc->end->rank, 10, "There are now only ten ranks in the graph" );
74 my $csucc = $sc->common_successor( 'n131', 'n131_0' );
75 is( $csucc->id, 'n136', "Found correct common successor to duped reading" ); 
76
77 # Check that the bad transposition is gone
78 is( $sc->get_relationship( 'n130', 'n135' ), undef, "Bad transposition relationship is gone" );
79
80 # The collation should not be fixed
81 my @pairs = $sc->identical_readings();
82 is( scalar @pairs, 0, "Not re-collated yet" );
83 # Fix the collation
84 ok( $sc->merge_readings( 'n124', 'n131_0' ), "Collated the readings correctly" );
85 @pairs = $sc->identical_readings( start => 'n124', end => $csucc->id );
86 is( scalar @pairs, 3, "Found three more identical readings" );
87 is( $sc->end->rank, 11, "The ranks shifted appropriately" );
88 $sc->flatten_ranks();
89 is( scalar( $sc->readings ), $numr - 3, "Now we are collated correctly" );
90 }
91
92
93
94 # =begin testing
95 {
96 use Text::Tradition;
97 use TryCatch;
98
99 my $READINGS = 311;
100 my $PATHS = 361;
101
102 my $datafile = 't/data/florilegium_tei_ps.xml';
103 my $tradition = Text::Tradition->new( 'input' => 'TEI',
104                                       'name' => 'test0',
105                                       'file' => $datafile,
106                                       'linear' => 1 );
107
108 ok( $tradition, "Got a tradition object" );
109 is( scalar $tradition->witnesses, 13, "Found all witnesses" );
110 ok( $tradition->collation, "Tradition has a collation" );
111
112 my $c = $tradition->collation;
113 is( scalar $c->readings, $READINGS, "Collation has all readings" );
114 is( scalar $c->paths, $PATHS, "Collation has all paths" );
115 is( scalar $c->relationships, 0, "Collation has all relationships" );
116
117 # Add a few relationships
118 $c->add_relationship( 'w123', 'w125', { 'type' => 'collated' } );
119 $c->add_relationship( 'w193', 'w196', { 'type' => 'collated' } );
120 $c->add_relationship( 'w257', 'w262', { 'type' => 'transposition' } );
121
122 # Now write it to GraphML and parse it again.
123
124 my $graphml = $c->as_graphml;
125 my $st = Text::Tradition->new( 'input' => 'Self', 'string' => $graphml );
126 is( scalar $st->collation->readings, $READINGS, "Reparsed collation has all readings" );
127 is( scalar $st->collation->paths, $PATHS, "Reparsed collation has all paths" );
128 is( scalar $st->collation->relationships, 3, "Reparsed collation has new relationships" );
129
130 # Now add a stemma, write to GraphML, and look at the output.
131 SKIP: {
132         skip "Analysis module not present", 3 unless $tradition->can( 'add_stemma' );
133         my $stemma = $tradition->add_stemma( 'dotfile' => 't/data/florilegium.dot' );
134         is( ref( $stemma ), 'Text::Tradition::Stemma', "Parsed dotfile into stemma" );
135         is( $tradition->stemmata, 1, "Tradition now has the stemma" );
136         $graphml = $c->as_graphml;
137         like( $graphml, qr/digraph/, "Digraph declaration exists in GraphML" );
138 }
139 }
140
141
142
143 # =begin testing
144 {
145 use Text::Tradition;
146
147 my $cxfile = 't/data/Collatex-16.xml';
148 my $t = Text::Tradition->new( 
149     'name'  => 'inline', 
150     'input' => 'CollateX',
151     'file'  => $cxfile,
152     );
153 my $c = $t->collation;
154
155 # Make an svg
156 my $table = $c->alignment_table;
157 ok( $c->has_cached_table, "Alignment table was cached" );
158 is( $c->alignment_table, $table, "Cached table returned upon second call" );
159 $c->calculate_ranks;
160 is( $c->alignment_table, $table, "Cached table retained with no rank change" );
161 $c->add_relationship( 'n13', 'n23', { type => 'repetition' } );
162 is( $c->alignment_table, $table, "Alignment table unchanged after non-colo relationship add" );
163 $c->add_relationship( 'n24', 'n23', { type => 'spelling' } );
164 isnt( $c->alignment_table, $table, "Alignment table changed after colo relationship add" );
165 }
166
167
168
169 # =begin testing
170 {
171 use Text::Tradition;
172
173 my $cxfile = 't/data/Collatex-16.xml';
174 my $t = Text::Tradition->new( 
175     'name'  => 'inline', 
176     'input' => 'CollateX',
177     'file'  => $cxfile,
178     );
179 my $c = $t->collation;
180
181 my @common = $c->calculate_common_readings();
182 is( scalar @common, 8, "Found correct number of common readings" );
183 my @marked = sort $c->common_readings();
184 is( scalar @common, 8, "All common readings got marked as such" );
185 my @expected = qw/ n1 n11 n16 n19 n20 n5 n6 n7 /;
186 is_deeply( \@marked, \@expected, "Found correct list of common readings" );
187 }
188
189
190
191 # =begin testing
192 {
193 use Text::Tradition;
194
195 my $cxfile = 't/data/Collatex-16.xml';
196 my $t = Text::Tradition->new( 
197     'name'  => 'inline', 
198     'input' => 'CollateX',
199     'file'  => $cxfile,
200     );
201 my $c = $t->collation;
202
203 is( $c->common_predecessor( 'n24', 'n23' )->id, 
204     'n20', "Found correct common predecessor" );
205 is( $c->common_successor( 'n24', 'n23' )->id, 
206     '__END__', "Found correct common successor" );
207
208 is( $c->common_predecessor( 'n19', 'n17' )->id, 
209     'n16', "Found correct common predecessor for readings on same path" );
210 is( $c->common_successor( 'n21', 'n10' )->id, 
211     '__END__', "Found correct common successor for readings on same path" );
212 }
213
214
215
216
217 1;