0.15_05, assumes 5.9.5 has patch
[gitmo/Class-C3.git] / lib / Class / C3.pm
1
2 package Class::C3;
3
4 use strict;
5 use warnings;
6
7 our $VERSION = '0.15_05';
8
9 our $C3_IN_CORE;
10 our $C3_XS;
11
12 BEGIN {
13     if($^V < 5.009005) {
14         eval "require Class::C3::XS";
15         if($@) {
16             die $@ if $@ !~ /locate/;
17             eval "require Algorithm::C3; require Class::C3::next";
18             die $@ if $@;
19         }
20         else {
21             $C3_XS = 1;
22         }
23     }
24     else {
25         $C3_IN_CORE = 1;
26     }
27 }
28
29 # this is our global stash of both 
30 # MRO's and method dispatch tables
31 # the structure basically looks like
32 # this:
33 #
34 #   $MRO{$class} = {
35 #      MRO => [ <class precendence list> ],
36 #      methods => {
37 #          orig => <original location of method>,
38 #          code => \&<ref to original method>
39 #      },
40 #      has_overload_fallback => (1 | 0)
41 #   }
42 #
43 our %MRO;
44
45 # use these for debugging ...
46 sub _dump_MRO_table { %MRO }
47 our $TURN_OFF_C3 = 0;
48
49 # state tracking for initialize()/uninitialize()
50 our $_initialized = 0;
51
52 sub import {
53     my $class = caller();
54     # skip if the caller is main::
55     # since that is clearly not relevant
56     return if $class eq 'main';
57
58     return if $TURN_OFF_C3;
59     mro::set_mro($class, 'c3') if $C3_IN_CORE;
60
61     # make a note to calculate $class 
62     # during INIT phase
63     $MRO{$class} = undef unless exists $MRO{$class};
64 }
65
66 ## initializers
67
68 sub initialize {
69     %next::METHOD_CACHE = ();
70     # why bother if we don't have anything ...
71     return unless keys %MRO;
72     if($C3_IN_CORE) {
73         mro::set_mro($_, 'c3') for keys %MRO;
74     }
75     else {
76         if($_initialized) {
77             uninitialize();
78             $MRO{$_} = undef foreach keys %MRO;
79         }
80         _calculate_method_dispatch_tables();
81         _apply_method_dispatch_tables();
82         $_initialized = 1;
83     }
84 }
85
86 sub uninitialize {
87     # why bother if we don't have anything ...
88     %next::METHOD_CACHE = ();
89     return unless keys %MRO;    
90     if($C3_IN_CORE) {
91         mro::set_mro($_, 'dfs') for keys %MRO;
92     }
93     else {
94         _remove_method_dispatch_tables();    
95         $_initialized = 0;
96     }
97 }
98
99 sub reinitialize { goto &initialize }
100
101 ## functions for applying C3 to classes
102
103 sub _calculate_method_dispatch_tables {
104     return if $C3_IN_CORE;
105     my %merge_cache;
106     foreach my $class (keys %MRO) {
107         _calculate_method_dispatch_table($class, \%merge_cache);
108     }
109 }
110
111 sub _calculate_method_dispatch_table {
112     return if $C3_IN_CORE;
113     my ($class, $merge_cache) = @_;
114     no strict 'refs';
115     my @MRO = calculateMRO($class, $merge_cache);
116     $MRO{$class} = { MRO => \@MRO };
117     my $has_overload_fallback = 0;
118     my %methods;
119     # NOTE: 
120     # we do @MRO[1 .. $#MRO] here because it
121     # makes no sense to interogate the class
122     # which you are calculating for. 
123     foreach my $local (@MRO[1 .. $#MRO]) {
124         # if overload has tagged this module to 
125         # have use "fallback", then we want to
126         # grab that value 
127         $has_overload_fallback = ${"${local}::()"} 
128             if defined ${"${local}::()"};
129         foreach my $method (grep { defined &{"${local}::$_"} } keys %{"${local}::"}) {
130             # skip if already overriden in local class
131             next unless !defined *{"${class}::$method"}{CODE};
132             $methods{$method} = {
133                 orig => "${local}::$method",
134                 code => \&{"${local}::$method"}
135             } unless exists $methods{$method};
136         }
137     }    
138     # now stash them in our %MRO table
139     $MRO{$class}->{methods} = \%methods; 
140     $MRO{$class}->{has_overload_fallback} = $has_overload_fallback;        
141 }
142
143 sub _apply_method_dispatch_tables {
144     return if $C3_IN_CORE;
145     foreach my $class (keys %MRO) {
146         _apply_method_dispatch_table($class);
147     }     
148 }
149
150 sub _apply_method_dispatch_table {
151     return if $C3_IN_CORE;
152     my $class = shift;
153     no strict 'refs';
154     ${"${class}::()"} = $MRO{$class}->{has_overload_fallback}
155         if $MRO{$class}->{has_overload_fallback};
156     foreach my $method (keys %{$MRO{$class}->{methods}}) {
157         if ( $method =~ /^\(/ ) {
158             my $orig = $MRO{$class}->{methods}->{$method}->{orig};
159             ${"${class}::$method"} = $$orig if defined $$orig;
160         }
161         *{"${class}::$method"} = $MRO{$class}->{methods}->{$method}->{code};
162     }    
163 }
164
165 sub _remove_method_dispatch_tables {
166     return if $C3_IN_CORE;
167     foreach my $class (keys %MRO) {
168         _remove_method_dispatch_table($class);
169     }       
170 }
171
172 sub _remove_method_dispatch_table {
173     return if $C3_IN_CORE;
174     my $class = shift;
175     no strict 'refs';
176     delete ${"${class}::"}{"()"} if $MRO{$class}->{has_overload_fallback};    
177     foreach my $method (keys %{$MRO{$class}->{methods}}) {
178         delete ${"${class}::"}{$method}
179             if defined *{"${class}::${method}"}{CODE} && 
180                (*{"${class}::${method}"}{CODE} eq $MRO{$class}->{methods}->{$method}->{code});       
181     }   
182 }
183
184 sub calculateMRO {
185     my ($class, $merge_cache) = @_;
186
187     return Algorithm::C3::merge($class, sub { 
188         no strict 'refs'; 
189         @{$_[0] . '::ISA'};
190     }, $merge_cache);
191 }
192
193 sub _core_calculateMRO { @{mro::get_linear_isa($_[0])} }
194
195 if($C3_IN_CORE) {
196     no warnings 'redefine';
197     *Class::C3::calculateMRO = \&_core_calculateMRO;
198 }
199 elsif($C3_XS) {
200     no warnings 'redefine';
201     *Class::C3::calculateMRO = \&Class::C3::XS::calculateMRO;
202 }
203
204 1;
205
206 __END__
207
208 =pod
209
210 =head1 NAME
211
212 Class::C3 - A pragma to use the C3 method resolution order algortihm
213
214 =head1 SYNOPSIS
215
216     package A;
217     use Class::C3;     
218     sub hello { 'A::hello' }
219
220     package B;
221     use base 'A';
222     use Class::C3;     
223
224     package C;
225     use base 'A';
226     use Class::C3;     
227
228     sub hello { 'C::hello' }
229
230     package D;
231     use base ('B', 'C');
232     use Class::C3;    
233
234     # Classic Diamond MI pattern
235     #    <A>
236     #   /   \
237     # <B>   <C>
238     #   \   /
239     #    <D>
240
241     package main;
242     
243     # initializez the C3 module 
244     # (formerly called in INIT)
245     Class::C3::initialize();  
246
247     print join ', ' => Class::C3::calculateMRO('Diamond_D') # prints D, B, C, A
248
249     print D->hello() # prints 'C::hello' instead of the standard p5 'A::hello'
250     
251     D->can('hello')->();          # can() also works correctly
252     UNIVERSAL::can('D', 'hello'); # as does UNIVERSAL::can()
253
254 =head1 SPECIAL NOTE FOR 0.15_05
255
256 To try this with the new perl core c3 support,
257 download the most recent copy perl-current:
258
259 http://mirrors.develooper.com/perl/APC/perl-current-snap/
260
261 sh Configure -Dusedevel -Dprefix=/where/I/want/it -d -e && make && make test && make install
262
263 then try your C3-using software against this perl + Class::C3 0.15_05.
264
265 =head1 DESCRIPTION
266
267 This is pragma to change Perl 5's standard method resolution order from depth-first left-to-right 
268 (a.k.a - pre-order) to the more sophisticated C3 method resolution order. 
269
270 =head2 What is C3?
271
272 C3 is the name of an algorithm which aims to provide a sane method resolution order under multiple
273 inheritence. It was first introduced in the langauge Dylan (see links in the L<SEE ALSO> section),
274 and then later adopted as the prefered MRO (Method Resolution Order) for the new-style classes in 
275 Python 2.3. Most recently it has been adopted as the 'canonical' MRO for Perl 6 classes, and the 
276 default MRO for Parrot objects as well.
277
278 =head2 How does C3 work.
279
280 C3 works by always preserving local precendence ordering. This essentially means that no class will 
281 appear before any of it's subclasses. Take the classic diamond inheritence pattern for instance:
282
283      <A>
284     /   \
285   <B>   <C>
286     \   /
287      <D>
288
289 The standard Perl 5 MRO would be (D, B, A, C). The result being that B<A> appears before B<C>, even 
290 though B<C> is the subclass of B<A>. The C3 MRO algorithm however, produces the following MRO 
291 (D, B, C, A), which does not have this same issue.
292
293 This example is fairly trival, for more complex examples and a deeper explaination, see the links in
294 the L<SEE ALSO> section.
295
296 =head2 How does this module work?
297
298 This module uses a technique similar to Perl 5's method caching. When C<Class::C3::initialize> is 
299 called, this module calculates the MRO of all the classes which called C<use Class::C3>. It then 
300 gathers information from the symbol tables of each of those classes, and builds a set of method 
301 aliases for the correct dispatch ordering. Once all these C3-based method tables are created, it 
302 then adds the method aliases into the local classes symbol table. 
303
304 The end result is actually classes with pre-cached method dispatch. However, this caching does not
305 do well if you start changing your C<@ISA> or messing with class symbol tables, so you should consider
306 your classes to be effectively closed. See the L<CAVEATS> section for more details.
307
308 =head1 OPTIONAL LOWERCASE PRAGMA
309
310 This release also includes an optional module B<c3> in the F<opt/> folder. I did not include this in 
311 the regular install since lowercase module names are considered I<"bad"> by some people. However I
312 think that code looks much nicer like this:
313
314   package MyClass;
315   use c3;
316   
317 The the more clunky:
318
319   package MyClass;
320   use Class::C3;
321   
322 But hey, it's your choice, thats why it is optional.
323
324 =head1 FUNCTIONS
325
326 =over 4
327
328 =item B<calculateMRO ($class)>
329
330 Given a C<$class> this will return an array of class names in the proper C3 method resolution order.
331
332 =item B<initialize>
333
334 This B<must be called> to initalize the C3 method dispatch tables, this module B<will not work> if 
335 you do not do this. It is advised to do this as soon as possible B<after> loading any classes which 
336 use C3. Here is a quick code example:
337   
338   package Foo;
339   use Class::C3;
340   # ... Foo methods here
341   
342   package Bar;
343   use Class::C3;
344   use base 'Foo';
345   # ... Bar methods here
346   
347   package main;
348   
349   Class::C3::initialize(); # now it is safe to use Foo and Bar
350
351 This function used to be called automatically for you in the INIT phase of the perl compiler, but 
352 that lead to warnings if this module was required at runtime. After discussion with my user base 
353 (the L<DBIx::Class> folks), we decided that calling this in INIT was more of an annoyance than a 
354 convience. I apologize to anyone this causes problems for (although i would very suprised if I had 
355 any other users other than the L<DBIx::Class> folks). The simplest solution of course is to define 
356 your own INIT method which calls this function. 
357
358 NOTE: 
359
360 If C<initialize> detects that C<initialize> has already been executed, it will L</uninitialize> and
361 clear the MRO cache first.
362
363 =item B<uninitialize>
364
365 Calling this function results in the removal of all cached methods, and the restoration of the old Perl 5
366 style dispatch order (depth-first, left-to-right). 
367
368 =item B<reinitialize>
369
370 This is an alias for L</initialize> above.
371
372 =back
373
374 =head1 METHOD REDISPATCHING
375
376 It is always useful to be able to re-dispatch your method call to the "next most applicable method". This 
377 module provides a pseudo package along the lines of C<SUPER::> or C<NEXT::> which will re-dispatch the 
378 method along the C3 linearization. This is best show with an examples.
379
380   # a classic diamond MI pattern ...
381      <A>
382     /   \
383   <B>   <C>
384     \   /
385      <D>
386   
387   package A;
388   use c3; 
389   sub foo { 'A::foo' }       
390  
391   package B;
392   use base 'A'; 
393   use c3;     
394   sub foo { 'B::foo => ' . (shift)->next::method() }       
395  
396   package B;
397   use base 'A'; 
398   use c3;    
399   sub foo { 'C::foo => ' . (shift)->next::method() }   
400  
401   package D;
402   use base ('B', 'C'); 
403   use c3; 
404   sub foo { 'D::foo => ' . (shift)->next::method() }   
405   
406   print D->foo; # prints out "D::foo => B::foo => C::foo => A::foo"
407
408 A few things to note. First, we do not require you to add on the method name to the C<next::method> 
409 call (this is unlike C<NEXT::> and C<SUPER::> which do require that). This helps to enforce the rule 
410 that you cannot dispatch to a method of a different name (this is how C<NEXT::> behaves as well). 
411
412 The next thing to keep in mind is that you will need to pass all arguments to C<next::method> it can 
413 not automatically use the current C<@_>. 
414
415 If C<next::method> cannot find a next method to re-dispatch the call to, it will throw an exception.
416 You can use C<next::can> to see if C<next::method> will succeed before you call it like so:
417
418   $self->next::method(@_) if $self->next::can; 
419
420 Additionally, you can use C<maybe::next::method> as a shortcut to only call the next method if it exists. 
421 The previous example could be simply written as:
422
423   $self->maybe::next::method(@_);
424
425 There are some caveats about using C<next::method>, see below for those.
426
427 =head1 CAVEATS
428
429 This module used to be labeled as I<experimental>, however it has now been pretty heavily tested by 
430 the good folks over at L<DBIx::Class> and I am confident this module is perfectly usable for 
431 whatever your needs might be. 
432
433 But there are still caveats, so here goes ...
434
435 =over 4
436
437 =item Use of C<SUPER::>.
438
439 The idea of C<SUPER::> under multiple inheritence is ambigious, and generally not recomended anyway.
440 However, it's use in conjuntion with this module is very much not recommended, and in fact very 
441 discouraged. The recommended approach is to instead use the supplied C<next::method> feature, see
442 more details on it's usage above.
443
444 =item Changing C<@ISA>.
445
446 It is the author's opinion that changing C<@ISA> at runtime is pure insanity anyway. However, people
447 do it, so I must caveat. Any changes to the C<@ISA> will not be reflected in the MRO calculated by this
448 module, and therefor probably won't even show up. If you do this, you will need to call C<reinitialize> 
449 in order to recalulate B<all> method dispatch tables. See the C<reinitialize> documentation and an example
450 in F<t/20_reinitialize.t> for more information.
451
452 =item Adding/deleting methods from class symbol tables.
453
454 This module calculates the MRO for each requested class by interogatting the symbol tables of said classes. 
455 So any symbol table manipulation which takes place after our INIT phase is run will not be reflected in 
456 the calculated MRO. Just as with changing the C<@ISA>, you will need to call C<reinitialize> for any 
457 changes you make to take effect.
458
459 =item Calling C<next::method> from methods defined outside the class
460
461 There is an edge case when using C<next::method> from within a subroutine which was created in a different 
462 module than the one it is called from. It sounds complicated, but it really isn't. Here is an example which 
463 will not work correctly:
464
465   *Foo::foo = sub { (shift)->next::method(@_) };
466
467 The problem exists because the anonymous subroutine being assigned to the glob C<*Foo::foo> will show up 
468 in the call stack as being called C<__ANON__> and not C<foo> as you might expect. Since C<next::method> 
469 uses C<caller> to find the name of the method it was called in, it will fail in this case. 
470
471 But fear not, there is a simple solution. The module C<Sub::Name> will reach into the perl internals and 
472 assign a name to an anonymous subroutine for you. Simply do this:
473     
474   use Sub::Name 'subname';
475   *Foo::foo = subname 'Foo::foo' => sub { (shift)->next::method(@_) };
476
477 and things will Just Work. Of course this is not always possible to do, but to be honest, I just can't 
478 manage to find a workaround for it, so until someone gives me a working patch this will be a known 
479 limitation of this module.
480
481 =back
482
483 =head1 COMPATIBILITY
484
485 If your software requires Perl 5.9.5 or higher, you do not need L<Class::C3>, you can simple C<use mro 'c3'>, and not worry about C<initialize()>, avoid some of the above caveats, and get the best possible performance.  See L<mro> for more details.
486
487 If your software is meant to work on earlier Perls, use L<Class::C3> as documented here.  L<Class::C3> will detect Perl 5.9.5+ and take advantage of the core support when available.
488
489 =head1 Class::C3::XS
490
491 This module will load L<Class::C3::XS> if it's installed and you are running on a Perl version older than 5.9.5.  Installing this is recommended when possible, as it results in significant performance improvements (but unlike the 5.9.5+ core support, it still has all of the same caveats as L<Class::C3>).
492
493 =head1 CODE COVERAGE
494
495 I use B<Devel::Cover> to test the code coverage of my tests, below is the B<Devel::Cover> report on this 
496 module's test suite.
497
498  ---------------------------- ------ ------ ------ ------ ------ ------ ------
499  File                           stmt   bran   cond    sub    pod   time  total
500  ---------------------------- ------ ------ ------ ------ ------ ------ ------
501  Class/C3.pm                    98.3   84.4   80.0   96.2  100.0   98.4   94.4
502  ---------------------------- ------ ------ ------ ------ ------ ------ ------
503  Total                          98.3   84.4   80.0   96.2  100.0   98.4   94.4
504  ---------------------------- ------ ------ ------ ------ ------ ------ ------
505
506 =head1 SEE ALSO
507
508 =head2 The original Dylan paper
509
510 =over 4
511
512 =item L<http://www.webcom.com/haahr/dylan/linearization-oopsla96.html>
513
514 =back
515
516 =head2 The prototype Perl 6 Object Model uses C3
517
518 =over 4
519
520 =item L<http://svn.openfoundry.org/pugs/perl5/Perl6-MetaModel/>
521
522 =back
523
524 =head2 Parrot now uses C3
525
526 =over 4
527
528 =item L<http://aspn.activestate.com/ASPN/Mail/Message/perl6-internals/2746631>
529
530 =item L<http://use.perl.org/~autrijus/journal/25768>
531
532 =back
533
534 =head2 Python 2.3 MRO related links
535
536 =over 4
537
538 =item L<http://www.python.org/2.3/mro.html>
539
540 =item L<http://www.python.org/2.2.2/descrintro.html#mro>
541
542 =back
543
544 =head2 C3 for TinyCLOS
545
546 =over 4
547
548 =item L<http://www.call-with-current-continuation.org/eggs/c3.html>
549
550 =back 
551
552 =head1 ACKNOWLEGEMENTS
553
554 =over 4
555
556 =item Thanks to Matt S. Trout for using this module in his module L<DBIx::Class> 
557 and finding many bugs and providing fixes.
558
559 =item Thanks to Justin Guenther for making C<next::method> more robust by handling 
560 calls inside C<eval> and anon-subs.
561
562 =item Thanks to Robert Norris for adding support for C<next::can> and 
563 C<maybe::next::method>.
564
565 =back
566
567 =head1 AUTHOR
568
569 Stevan Little, E<lt>stevan@iinteractive.comE<gt>
570
571 Brandon L. Black, E<lt>blblack@gmail.comE<gt>
572
573 =head1 COPYRIGHT AND LICENSE
574
575 Copyright 2005, 2006 by Infinity Interactive, Inc.
576
577 L<http://www.iinteractive.com>
578
579 This library is free software; you can redistribute it and/or modify
580 it under the same terms as Perl itself. 
581
582 =cut