continued doc and testing drive; rationalize GraphML a little
[scpubgit/stemmatology.git] / lib / Text / Tradition / Parser / GraphML.pm
index c29f78a..3ecd936 100644 (file)
@@ -2,9 +2,14 @@ package Text::Tradition::Parser::GraphML;
 
 use strict;
 use warnings;
+use Exporter 'import';
+use vars qw/ @EXPORT_OK $xpc /;
+
 use XML::LibXML;
 use XML::LibXML::XPathContext;
 
+@EXPORT_OK = qw/ graphml_parse populate_witness_path /;
+
 =head1 NAME
 
 Text::Tradition::Parser::GraphML
@@ -19,9 +24,7 @@ GraphML conventions of the source program.
 
 =head1 METHODS
 
-=over
-
-=item B<parse>
+=head2 B<graphml_parse>( $init_opts )
 
 parse( $init_opts );
 
@@ -31,17 +34,15 @@ and their associated data.
 
 =cut
 
-use vars qw/ $xpc $graphattr $nodedata $witnesses /;
-
 # Return graph -> nodeid -> { key1/val1, key2/val2, key3/val3 ... }
 #              -> edgeid -> { source, target, wit1/val1, wit2/val2 ...}
 
-sub parse {
+sub graphml_parse {
     my( $opts ) = @_;
 
     my $graph_hash = { 'nodes' => [],
                        'edges' => [] };
-
+                       
     my $parser = XML::LibXML->new();
     my $doc;
     if( exists $opts->{'string'} ) {
@@ -53,6 +54,7 @@ sub parse {
         return;
     }
     
+    my( $graphattr, $nodedata, $witnesses ) = ( {}, {}, {} );
     my $graphml = $doc->documentElement();
     $xpc = XML::LibXML::XPathContext->new( $graphml );
     $xpc->registerNs( 'g', 'http://graphml.graphdrawing.org/xmlns' );
@@ -127,6 +129,29 @@ sub parse {
     return $graph_hash;
 }
 
+=head2 B<populate_witness_path>( $tradition )
+
+Given a tradition, populate the 'path' and 'uncorrected_path' attributes
+of all of its witnesses.  Useful for all formats based on the graph itself.
+
+=cut
+
+sub populate_witness_path {
+    my ( $tradition, $ante_corr ) = @_;
+    my $c = $tradition->collation;
+    print STDERR "Walking paths for witnesses\n";
+    foreach my $wit ( $tradition->witnesses ) {
+       my @path = $c->reading_sequence( $c->start, $c->end, $wit->sigil );
+       $wit->path( \@path );
+       if( $ante_corr->{$wit->sigil} ) {
+               # Get the uncorrected path too
+               my @uc = $c->reading_sequence( $c->start, $c->end, 
+                       $wit->sigil . $c->ac_label, $wit->sigil );
+               $wit->uncorrected_path( \@uc );
+       }
+    }
+}
+
 sub _lookup_node_data {
     my( $xmlnode, $key ) = @_;
     my $lookup_xpath = './g:data[@key="%s"]/child::text()';