Class::C3::XS support
[gitmo/Class-C3.git] / lib / Class / C3.pm
1
2 package Class::C3;
3
4 use strict;
5 use warnings;
6
7 our $VERSION = '0.15_01';
8
9 our $C3_IN_CORE;
10 our $C3_XS;
11
12 BEGIN {
13     eval "require mro"; # XXX in the future, this should be a version check
14     if($@) {
15         die $@ if $@ !~ /locate/;
16         eval "require Class::C3::XS";
17         if($@) {
18             die $@ if $@ !~ /locate/;
19             eval "require Algorithm::C3; require Class::C3::next";
20             die $@ if $@;
21         }
22         else {
23             $C3_XS = 1;
24         }
25     }
26     else {
27         $C3_IN_CORE = 1;
28     }
29 }
30
31 # this is our global stash of both 
32 # MRO's and method dispatch tables
33 # the structure basically looks like
34 # this:
35 #
36 #   $MRO{$class} = {
37 #      MRO => [ <class precendence list> ],
38 #      methods => {
39 #          orig => <original location of method>,
40 #          code => \&<ref to original method>
41 #      },
42 #      has_overload_fallback => (1 | 0)
43 #   }
44 #
45 our %MRO;
46
47 # use these for debugging ...
48 sub _dump_MRO_table { %MRO }
49 our $TURN_OFF_C3 = 0;
50
51 # state tracking for initialize()/uninitialize()
52 our $_initialized = 0;
53
54 sub import {
55     my $class = caller();
56     # skip if the caller is main::
57     # since that is clearly not relevant
58     return if $class eq 'main';
59
60     return if $TURN_OFF_C3;
61     mro::set_mro($class, 'c3') if $C3_IN_CORE;
62
63     # make a note to calculate $class 
64     # during INIT phase
65     $MRO{$class} = undef unless exists $MRO{$class};
66 }
67
68 ## initializers
69
70 sub initialize {
71     %next::METHOD_CACHE = ();
72     # why bother if we don't have anything ...
73     return unless keys %MRO;
74     if($C3_IN_CORE) {
75         mro::set_mro($_, 'c3') for keys %MRO;
76     }
77     else {
78         if($_initialized) {
79             uninitialize();
80             $MRO{$_} = undef foreach keys %MRO;
81         }
82         _calculate_method_dispatch_tables();
83         _apply_method_dispatch_tables();
84         $_initialized = 1;
85     }
86 }
87
88 sub uninitialize {
89     # why bother if we don't have anything ...
90     %next::METHOD_CACHE = ();
91     return unless keys %MRO;    
92     if($C3_IN_CORE) {
93         mro::set_mro($_, 'dfs') for keys %MRO;
94     }
95     else {
96         _remove_method_dispatch_tables();    
97         $_initialized = 0;
98     }
99 }
100
101 sub reinitialize { goto &initialize }
102
103 ## functions for applying C3 to classes
104
105 sub _calculate_method_dispatch_tables {
106     return if $C3_IN_CORE;
107     my %merge_cache;
108     foreach my $class (keys %MRO) {
109         _calculate_method_dispatch_table($class, \%merge_cache);
110     }
111 }
112
113 sub _calculate_method_dispatch_table {
114     return if $C3_IN_CORE;
115     my ($class, $merge_cache) = @_;
116     no strict 'refs';
117     my @MRO = calculateMRO($class, $merge_cache);
118     $MRO{$class} = { MRO => \@MRO };
119     my $has_overload_fallback = 0;
120     my %methods;
121     # NOTE: 
122     # we do @MRO[1 .. $#MRO] here because it
123     # makes no sense to interogate the class
124     # which you are calculating for. 
125     foreach my $local (@MRO[1 .. $#MRO]) {
126         # if overload has tagged this module to 
127         # have use "fallback", then we want to
128         # grab that value 
129         $has_overload_fallback = ${"${local}::()"} 
130             if defined ${"${local}::()"};
131         foreach my $method (grep { defined &{"${local}::$_"} } keys %{"${local}::"}) {
132             # skip if already overriden in local class
133             next unless !defined *{"${class}::$method"}{CODE};
134             $methods{$method} = {
135                 orig => "${local}::$method",
136                 code => \&{"${local}::$method"}
137             } unless exists $methods{$method};
138         }
139     }    
140     # now stash them in our %MRO table
141     $MRO{$class}->{methods} = \%methods; 
142     $MRO{$class}->{has_overload_fallback} = $has_overload_fallback;        
143 }
144
145 sub _apply_method_dispatch_tables {
146     return if $C3_IN_CORE;
147     foreach my $class (keys %MRO) {
148         _apply_method_dispatch_table($class);
149     }     
150 }
151
152 sub _apply_method_dispatch_table {
153     return if $C3_IN_CORE;
154     my $class = shift;
155     no strict 'refs';
156     ${"${class}::()"} = $MRO{$class}->{has_overload_fallback}
157         if $MRO{$class}->{has_overload_fallback};
158     foreach my $method (keys %{$MRO{$class}->{methods}}) {
159         if ( $method =~ /^\(/ ) {
160             my $orig = $MRO{$class}->{methods}->{$method}->{orig};
161             ${"${class}::$method"} = $$orig if defined $$orig;
162         }
163         *{"${class}::$method"} = $MRO{$class}->{methods}->{$method}->{code};
164     }    
165 }
166
167 sub _remove_method_dispatch_tables {
168     return if $C3_IN_CORE;
169     foreach my $class (keys %MRO) {
170         _remove_method_dispatch_table($class);
171     }       
172 }
173
174 sub _remove_method_dispatch_table {
175     return if $C3_IN_CORE;
176     my $class = shift;
177     no strict 'refs';
178     delete ${"${class}::"}{"()"} if $MRO{$class}->{has_overload_fallback};    
179     foreach my $method (keys %{$MRO{$class}->{methods}}) {
180         delete ${"${class}::"}{$method}
181             if defined *{"${class}::${method}"}{CODE} && 
182                (*{"${class}::${method}"}{CODE} eq $MRO{$class}->{methods}->{$method}->{code});       
183     }   
184 }
185
186 sub calculateMRO {
187     my ($class, $merge_cache) = @_;
188
189     return Algorithm::C3::merge($class, sub { 
190         no strict 'refs'; 
191         @{$_[0] . '::ISA'};
192     }, $merge_cache);
193 }
194
195 sub _core_calculateMRO { @{mro::get_linear_isa($_[0])} }
196
197 if($C3_IN_CORE) {
198     no warnings 'redefine';
199     *Class::C3::calculateMRO = \&_core_calculateMRO;
200 }
201 elsif($C3_XS) {
202     no warnings 'redefine';
203     *Class::C3::calculateMRO = \&Class::C3::XS::calculateMRO;
204 }
205
206 1;
207
208 __END__
209
210 =pod
211
212 =head1 NAME
213
214 Class::C3 - A pragma to use the C3 method resolution order algortihm
215
216 =head1 SYNOPSIS
217
218     package A;
219     use Class::C3;     
220     sub hello { 'A::hello' }
221
222     package B;
223     use base 'A';
224     use Class::C3;     
225
226     package C;
227     use base 'A';
228     use Class::C3;     
229
230     sub hello { 'C::hello' }
231
232     package D;
233     use base ('B', 'C');
234     use Class::C3;    
235
236     # Classic Diamond MI pattern
237     #    <A>
238     #   /   \
239     # <B>   <C>
240     #   \   /
241     #    <D>
242
243     package main;
244     
245     # initializez the C3 module 
246     # (formerly called in INIT)
247     Class::C3::initialize();  
248
249     print join ', ' => Class::C3::calculateMRO('Diamond_D') # prints D, B, C, A
250
251     print D->hello() # prints 'C::hello' instead of the standard p5 'A::hello'
252     
253     D->can('hello')->();          # can() also works correctly
254     UNIVERSAL::can('D', 'hello'); # as does UNIVERSAL::can()
255
256 =head1 SPECIAL NOTE FOR 0.15_01
257
258 To try this with the experimental perl core c3 patch,
259 download a recent copy perl-current:
260
261 http://mirrors.develooper.com/perl/APC/perl-current-snap/perl-current@30943.tar.bz2
262
263 apply the enclosed c3.patch, and install this perl:
264
265 sh Configure -Dusedevel -Dprefix=/where/I/want/it -d -e && make && make test && make install
266
267 then try your C3-using software against this perl + Class::C3 0.15_01.
268
269 =head1 DESCRIPTION
270
271 This is pragma to change Perl 5's standard method resolution order from depth-first left-to-right 
272 (a.k.a - pre-order) to the more sophisticated C3 method resolution order. 
273
274 =head2 What is C3?
275
276 C3 is the name of an algorithm which aims to provide a sane method resolution order under multiple
277 inheritence. It was first introduced in the langauge Dylan (see links in the L<SEE ALSO> section),
278 and then later adopted as the prefered MRO (Method Resolution Order) for the new-style classes in 
279 Python 2.3. Most recently it has been adopted as the 'canonical' MRO for Perl 6 classes, and the 
280 default MRO for Parrot objects as well.
281
282 =head2 How does C3 work.
283
284 C3 works by always preserving local precendence ordering. This essentially means that no class will 
285 appear before any of it's subclasses. Take the classic diamond inheritence pattern for instance:
286
287      <A>
288     /   \
289   <B>   <C>
290     \   /
291      <D>
292
293 The standard Perl 5 MRO would be (D, B, A, C). The result being that B<A> appears before B<C>, even 
294 though B<C> is the subclass of B<A>. The C3 MRO algorithm however, produces the following MRO 
295 (D, B, C, A), which does not have this same issue.
296
297 This example is fairly trival, for more complex examples and a deeper explaination, see the links in
298 the L<SEE ALSO> section.
299
300 =head2 How does this module work?
301
302 This module uses a technique similar to Perl 5's method caching. When C<Class::C3::initialize> is 
303 called, this module calculates the MRO of all the classes which called C<use Class::C3>. It then 
304 gathers information from the symbol tables of each of those classes, and builds a set of method 
305 aliases for the correct dispatch ordering. Once all these C3-based method tables are created, it 
306 then adds the method aliases into the local classes symbol table. 
307
308 The end result is actually classes with pre-cached method dispatch. However, this caching does not
309 do well if you start changing your C<@ISA> or messing with class symbol tables, so you should consider
310 your classes to be effectively closed. See the L<CAVEATS> section for more details.
311
312 =head1 OPTIONAL LOWERCASE PRAGMA
313
314 This release also includes an optional module B<c3> in the F<opt/> folder. I did not include this in 
315 the regular install since lowercase module names are considered I<"bad"> by some people. However I
316 think that code looks much nicer like this:
317
318   package MyClass;
319   use c3;
320   
321 The the more clunky:
322
323   package MyClass;
324   use Class::C3;
325   
326 But hey, it's your choice, thats why it is optional.
327
328 =head1 FUNCTIONS
329
330 =over 4
331
332 =item B<calculateMRO ($class)>
333
334 Given a C<$class> this will return an array of class names in the proper C3 method resolution order.
335
336 =item B<initialize>
337
338 This B<must be called> to initalize the C3 method dispatch tables, this module B<will not work> if 
339 you do not do this. It is advised to do this as soon as possible B<after> loading any classes which 
340 use C3. Here is a quick code example:
341   
342   package Foo;
343   use Class::C3;
344   # ... Foo methods here
345   
346   package Bar;
347   use Class::C3;
348   use base 'Foo';
349   # ... Bar methods here
350   
351   package main;
352   
353   Class::C3::initialize(); # now it is safe to use Foo and Bar
354
355 This function used to be called automatically for you in the INIT phase of the perl compiler, but 
356 that lead to warnings if this module was required at runtime. After discussion with my user base 
357 (the L<DBIx::Class> folks), we decided that calling this in INIT was more of an annoyance than a 
358 convience. I apologize to anyone this causes problems for (although i would very suprised if I had 
359 any other users other than the L<DBIx::Class> folks). The simplest solution of course is to define 
360 your own INIT method which calls this function. 
361
362 NOTE: 
363
364 If C<initialize> detects that C<initialize> has already been executed, it will L</uninitialize> and
365 clear the MRO cache first.
366
367 =item B<uninitialize>
368
369 Calling this function results in the removal of all cached methods, and the restoration of the old Perl 5
370 style dispatch order (depth-first, left-to-right). 
371
372 =item B<reinitialize>
373
374 This is an alias for L</initialize> above.
375
376 =back
377
378 =head1 METHOD REDISPATCHING
379
380 It is always useful to be able to re-dispatch your method call to the "next most applicable method". This 
381 module provides a pseudo package along the lines of C<SUPER::> or C<NEXT::> which will re-dispatch the 
382 method along the C3 linearization. This is best show with an examples.
383
384   # a classic diamond MI pattern ...
385      <A>
386     /   \
387   <B>   <C>
388     \   /
389      <D>
390   
391   package A;
392   use c3; 
393   sub foo { 'A::foo' }       
394  
395   package B;
396   use base 'A'; 
397   use c3;     
398   sub foo { 'B::foo => ' . (shift)->next::method() }       
399  
400   package B;
401   use base 'A'; 
402   use c3;    
403   sub foo { 'C::foo => ' . (shift)->next::method() }   
404  
405   package D;
406   use base ('B', 'C'); 
407   use c3; 
408   sub foo { 'D::foo => ' . (shift)->next::method() }   
409   
410   print D->foo; # prints out "D::foo => B::foo => C::foo => A::foo"
411
412 A few things to note. First, we do not require you to add on the method name to the C<next::method> 
413 call (this is unlike C<NEXT::> and C<SUPER::> which do require that). This helps to enforce the rule 
414 that you cannot dispatch to a method of a different name (this is how C<NEXT::> behaves as well). 
415
416 The next thing to keep in mind is that you will need to pass all arguments to C<next::method> it can 
417 not automatically use the current C<@_>. 
418
419 If C<next::method> cannot find a next method to re-dispatch the call to, it will throw an exception.
420 You can use C<next::can> to see if C<next::method> will succeed before you call it like so:
421
422   $self->next::method(@_) if $self->next::can; 
423
424 Additionally, you can use C<maybe::next::method> as a shortcut to only call the next method if it exists. 
425 The previous example could be simply written as:
426
427   $self->maybe::next::method(@_);
428
429 There are some caveats about using C<next::method>, see below for those.
430
431 =head1 CAVEATS
432
433 This module used to be labeled as I<experimental>, however it has now been pretty heavily tested by 
434 the good folks over at L<DBIx::Class> and I am confident this module is perfectly usable for 
435 whatever your needs might be. 
436
437 But there are still caveats, so here goes ...
438
439 =over 4
440
441 =item Use of C<SUPER::>.
442
443 The idea of C<SUPER::> under multiple inheritence is ambigious, and generally not recomended anyway.
444 However, it's use in conjuntion with this module is very much not recommended, and in fact very 
445 discouraged. The recommended approach is to instead use the supplied C<next::method> feature, see
446 more details on it's usage above.
447
448 =item Changing C<@ISA>.
449
450 It is the author's opinion that changing C<@ISA> at runtime is pure insanity anyway. However, people
451 do it, so I must caveat. Any changes to the C<@ISA> will not be reflected in the MRO calculated by this
452 module, and therefor probably won't even show up. If you do this, you will need to call C<reinitialize> 
453 in order to recalulate B<all> method dispatch tables. See the C<reinitialize> documentation and an example
454 in F<t/20_reinitialize.t> for more information.
455
456 =item Adding/deleting methods from class symbol tables.
457
458 This module calculates the MRO for each requested class by interogatting the symbol tables of said classes. 
459 So any symbol table manipulation which takes place after our INIT phase is run will not be reflected in 
460 the calculated MRO. Just as with changing the C<@ISA>, you will need to call C<reinitialize> for any 
461 changes you make to take effect.
462
463 =item Calling C<next::method> from methods defined outside the class
464
465 There is an edge case when using C<next::method> from within a subroutine which was created in a different 
466 module than the one it is called from. It sounds complicated, but it really isn't. Here is an example which 
467 will not work correctly:
468
469   *Foo::foo = sub { (shift)->next::method(@_) };
470
471 The problem exists because the anonymous subroutine being assigned to the glob C<*Foo::foo> will show up 
472 in the call stack as being called C<__ANON__> and not C<foo> as you might expect. Since C<next::method> 
473 uses C<caller> to find the name of the method it was called in, it will fail in this case. 
474
475 But fear not, there is a simple solution. The module C<Sub::Name> will reach into the perl internals and 
476 assign a name to an anonymous subroutine for you. Simply do this:
477     
478   use Sub::Name 'subname';
479   *Foo::foo = subname 'Foo::foo' => sub { (shift)->next::method(@_) };
480
481 and things will Just Work. Of course this is not always possible to do, but to be honest, I just can't 
482 manage to find a workaround for it, so until someone gives me a working patch this will be a known 
483 limitation of this module.
484
485 =back
486
487 =head1 COMPATIBILITY
488
489 If your software requires Perl 5.9.5 or higher, you do not need L<Class::C3>, you can simple C<use mro 'c3'>, and not worry about C<initialize()>, avoid some of the above caveats, and get the best possible performance.  See L<mro> for more details.
490
491 If your software is meant to work on earlier Perls, use L<Class::C3> as documented here.  L<Class::C3> will detect Perl 5.9.5+ and take advantage of the core support when available.
492
493 =head1 Class::C3::XS
494
495 This module will load L<Class::C3::XS> if it's installed and you are running on a Perl version older than 5.9.5.  Installing this is recommended when possible, as it results in significant performance improvements (but unlike the 5.9.5+ core support, it still has all of the same caveats as L<Class::C3>).
496
497 =head1 CODE COVERAGE
498
499 I use B<Devel::Cover> to test the code coverage of my tests, below is the B<Devel::Cover> report on this 
500 module's test suite.
501
502  ---------------------------- ------ ------ ------ ------ ------ ------ ------
503  File                           stmt   bran   cond    sub    pod   time  total
504  ---------------------------- ------ ------ ------ ------ ------ ------ ------
505  Class/C3.pm                    98.3   84.4   80.0   96.2  100.0   98.4   94.4
506  ---------------------------- ------ ------ ------ ------ ------ ------ ------
507  Total                          98.3   84.4   80.0   96.2  100.0   98.4   94.4
508  ---------------------------- ------ ------ ------ ------ ------ ------ ------
509
510 =head1 SEE ALSO
511
512 =head2 The original Dylan paper
513
514 =over 4
515
516 =item L<http://www.webcom.com/haahr/dylan/linearization-oopsla96.html>
517
518 =back
519
520 =head2 The prototype Perl 6 Object Model uses C3
521
522 =over 4
523
524 =item L<http://svn.openfoundry.org/pugs/perl5/Perl6-MetaModel/>
525
526 =back
527
528 =head2 Parrot now uses C3
529
530 =over 4
531
532 =item L<http://aspn.activestate.com/ASPN/Mail/Message/perl6-internals/2746631>
533
534 =item L<http://use.perl.org/~autrijus/journal/25768>
535
536 =back
537
538 =head2 Python 2.3 MRO related links
539
540 =over 4
541
542 =item L<http://www.python.org/2.3/mro.html>
543
544 =item L<http://www.python.org/2.2.2/descrintro.html#mro>
545
546 =back
547
548 =head2 C3 for TinyCLOS
549
550 =over 4
551
552 =item L<http://www.call-with-current-continuation.org/eggs/c3.html>
553
554 =back 
555
556 =head1 ACKNOWLEGEMENTS
557
558 =over 4
559
560 =item Thanks to Matt S. Trout for using this module in his module L<DBIx::Class> 
561 and finding many bugs and providing fixes.
562
563 =item Thanks to Justin Guenther for making C<next::method> more robust by handling 
564 calls inside C<eval> and anon-subs.
565
566 =item Thanks to Robert Norris for adding support for C<next::can> and 
567 C<maybe::next::method>.
568
569 =back
570
571 =head1 AUTHOR
572
573 Stevan Little, E<lt>stevan@iinteractive.comE<gt>
574
575 Brandon L. Black, E<lt>blblack@gmail.comE<gt>
576
577 =head1 COPYRIGHT AND LICENSE
578
579 Copyright 2005, 2006 by Infinity Interactive, Inc.
580
581 L<http://www.iinteractive.com>
582
583 This library is free software; you can redistribute it and/or modify
584 it under the same terms as Perl itself. 
585
586 =cut