replace patch with link
[gitmo/Class-C3.git] / lib / Class / C3.pm
1
2 package Class::C3;
3
4 use strict;
5 use warnings;
6
7 our $VERSION = '0.15_04';
8
9 our $C3_IN_CORE;
10 our $C3_XS;
11
12 BEGIN {
13     eval "require mro"; # XXX in the future, this should be a version check
14     if($@) {
15         die $@ if $@ !~ /locate/;
16         eval "require Class::C3::XS";
17         if($@) {
18             die $@ if $@ !~ /locate/;
19             eval "require Algorithm::C3; require Class::C3::next";
20             die $@ if $@;
21         }
22         else {
23             $C3_XS = 1;
24         }
25     }
26     else {
27         $C3_IN_CORE = 1;
28     }
29 }
30
31 # this is our global stash of both 
32 # MRO's and method dispatch tables
33 # the structure basically looks like
34 # this:
35 #
36 #   $MRO{$class} = {
37 #      MRO => [ <class precendence list> ],
38 #      methods => {
39 #          orig => <original location of method>,
40 #          code => \&<ref to original method>
41 #      },
42 #      has_overload_fallback => (1 | 0)
43 #   }
44 #
45 our %MRO;
46
47 # use these for debugging ...
48 sub _dump_MRO_table { %MRO }
49 our $TURN_OFF_C3 = 0;
50
51 # state tracking for initialize()/uninitialize()
52 our $_initialized = 0;
53
54 sub import {
55     my $class = caller();
56     # skip if the caller is main::
57     # since that is clearly not relevant
58     return if $class eq 'main';
59
60     return if $TURN_OFF_C3;
61     mro::set_mro($class, 'c3') if $C3_IN_CORE;
62
63     # make a note to calculate $class 
64     # during INIT phase
65     $MRO{$class} = undef unless exists $MRO{$class};
66 }
67
68 ## initializers
69
70 sub initialize {
71     %next::METHOD_CACHE = ();
72     # why bother if we don't have anything ...
73     return unless keys %MRO;
74     if($C3_IN_CORE) {
75         mro::set_mro($_, 'c3') for keys %MRO;
76     }
77     else {
78         if($_initialized) {
79             uninitialize();
80             $MRO{$_} = undef foreach keys %MRO;
81         }
82         _calculate_method_dispatch_tables();
83         _apply_method_dispatch_tables();
84         $_initialized = 1;
85     }
86 }
87
88 sub uninitialize {
89     # why bother if we don't have anything ...
90     %next::METHOD_CACHE = ();
91     return unless keys %MRO;    
92     if($C3_IN_CORE) {
93         mro::set_mro($_, 'dfs') for keys %MRO;
94     }
95     else {
96         _remove_method_dispatch_tables();    
97         $_initialized = 0;
98     }
99 }
100
101 sub reinitialize { goto &initialize }
102
103 ## functions for applying C3 to classes
104
105 sub _calculate_method_dispatch_tables {
106     return if $C3_IN_CORE;
107     my %merge_cache;
108     foreach my $class (keys %MRO) {
109         _calculate_method_dispatch_table($class, \%merge_cache);
110     }
111 }
112
113 sub _calculate_method_dispatch_table {
114     return if $C3_IN_CORE;
115     my ($class, $merge_cache) = @_;
116     no strict 'refs';
117     my @MRO = calculateMRO($class, $merge_cache);
118     $MRO{$class} = { MRO => \@MRO };
119     my $has_overload_fallback = 0;
120     my %methods;
121     # NOTE: 
122     # we do @MRO[1 .. $#MRO] here because it
123     # makes no sense to interogate the class
124     # which you are calculating for. 
125     foreach my $local (@MRO[1 .. $#MRO]) {
126         # if overload has tagged this module to 
127         # have use "fallback", then we want to
128         # grab that value 
129         $has_overload_fallback = ${"${local}::()"} 
130             if defined ${"${local}::()"};
131         foreach my $method (grep { defined &{"${local}::$_"} } keys %{"${local}::"}) {
132             # skip if already overriden in local class
133             next unless !defined *{"${class}::$method"}{CODE};
134             $methods{$method} = {
135                 orig => "${local}::$method",
136                 code => \&{"${local}::$method"}
137             } unless exists $methods{$method};
138         }
139     }    
140     # now stash them in our %MRO table
141     $MRO{$class}->{methods} = \%methods; 
142     $MRO{$class}->{has_overload_fallback} = $has_overload_fallback;        
143 }
144
145 sub _apply_method_dispatch_tables {
146     return if $C3_IN_CORE;
147     foreach my $class (keys %MRO) {
148         _apply_method_dispatch_table($class);
149     }     
150 }
151
152 sub _apply_method_dispatch_table {
153     return if $C3_IN_CORE;
154     my $class = shift;
155     no strict 'refs';
156     ${"${class}::()"} = $MRO{$class}->{has_overload_fallback}
157         if $MRO{$class}->{has_overload_fallback};
158     foreach my $method (keys %{$MRO{$class}->{methods}}) {
159         if ( $method =~ /^\(/ ) {
160             my $orig = $MRO{$class}->{methods}->{$method}->{orig};
161             ${"${class}::$method"} = $$orig if defined $$orig;
162         }
163         *{"${class}::$method"} = $MRO{$class}->{methods}->{$method}->{code};
164     }    
165 }
166
167 sub _remove_method_dispatch_tables {
168     return if $C3_IN_CORE;
169     foreach my $class (keys %MRO) {
170         _remove_method_dispatch_table($class);
171     }       
172 }
173
174 sub _remove_method_dispatch_table {
175     return if $C3_IN_CORE;
176     my $class = shift;
177     no strict 'refs';
178     delete ${"${class}::"}{"()"} if $MRO{$class}->{has_overload_fallback};    
179     foreach my $method (keys %{$MRO{$class}->{methods}}) {
180         delete ${"${class}::"}{$method}
181             if defined *{"${class}::${method}"}{CODE} && 
182                (*{"${class}::${method}"}{CODE} eq $MRO{$class}->{methods}->{$method}->{code});       
183     }   
184 }
185
186 sub calculateMRO {
187     my ($class, $merge_cache) = @_;
188
189     return Algorithm::C3::merge($class, sub { 
190         no strict 'refs'; 
191         @{$_[0] . '::ISA'};
192     }, $merge_cache);
193 }
194
195 sub _core_calculateMRO { @{mro::get_linear_isa($_[0])} }
196
197 if($C3_IN_CORE) {
198     no warnings 'redefine';
199     *Class::C3::calculateMRO = \&_core_calculateMRO;
200 }
201 elsif($C3_XS) {
202     no warnings 'redefine';
203     *Class::C3::calculateMRO = \&Class::C3::XS::calculateMRO;
204 }
205
206 1;
207
208 __END__
209
210 =pod
211
212 =head1 NAME
213
214 Class::C3 - A pragma to use the C3 method resolution order algortihm
215
216 =head1 SYNOPSIS
217
218     package A;
219     use Class::C3;     
220     sub hello { 'A::hello' }
221
222     package B;
223     use base 'A';
224     use Class::C3;     
225
226     package C;
227     use base 'A';
228     use Class::C3;     
229
230     sub hello { 'C::hello' }
231
232     package D;
233     use base ('B', 'C');
234     use Class::C3;    
235
236     # Classic Diamond MI pattern
237     #    <A>
238     #   /   \
239     # <B>   <C>
240     #   \   /
241     #    <D>
242
243     package main;
244     
245     # initializez the C3 module 
246     # (formerly called in INIT)
247     Class::C3::initialize();  
248
249     print join ', ' => Class::C3::calculateMRO('Diamond_D') # prints D, B, C, A
250
251     print D->hello() # prints 'C::hello' instead of the standard p5 'A::hello'
252     
253     D->can('hello')->();          # can() also works correctly
254     UNIVERSAL::can('D', 'hello'); # as does UNIVERSAL::can()
255
256 =head1 SPECIAL NOTE FOR 0.15_04
257
258 To try this with the experimental perl core c3 patch,
259 download the most recent copy perl-current:
260
261 http://mirrors.develooper.com/perl/APC/perl-current-snap/
262
263 Apply the latest C3 patch from:
264
265 http://www.dtmf.com/c3-subgen.patch
266
267 Then:
268
269 sh Configure -Dusedevel -Dprefix=/where/I/want/it -d -e && make && make test && make install
270
271 then try your C3-using software against this perl + Class::C3 0.15_04.
272
273 =head1 DESCRIPTION
274
275 This is pragma to change Perl 5's standard method resolution order from depth-first left-to-right 
276 (a.k.a - pre-order) to the more sophisticated C3 method resolution order. 
277
278 =head2 What is C3?
279
280 C3 is the name of an algorithm which aims to provide a sane method resolution order under multiple
281 inheritence. It was first introduced in the langauge Dylan (see links in the L<SEE ALSO> section),
282 and then later adopted as the prefered MRO (Method Resolution Order) for the new-style classes in 
283 Python 2.3. Most recently it has been adopted as the 'canonical' MRO for Perl 6 classes, and the 
284 default MRO for Parrot objects as well.
285
286 =head2 How does C3 work.
287
288 C3 works by always preserving local precendence ordering. This essentially means that no class will 
289 appear before any of it's subclasses. Take the classic diamond inheritence pattern for instance:
290
291      <A>
292     /   \
293   <B>   <C>
294     \   /
295      <D>
296
297 The standard Perl 5 MRO would be (D, B, A, C). The result being that B<A> appears before B<C>, even 
298 though B<C> is the subclass of B<A>. The C3 MRO algorithm however, produces the following MRO 
299 (D, B, C, A), which does not have this same issue.
300
301 This example is fairly trival, for more complex examples and a deeper explaination, see the links in
302 the L<SEE ALSO> section.
303
304 =head2 How does this module work?
305
306 This module uses a technique similar to Perl 5's method caching. When C<Class::C3::initialize> is 
307 called, this module calculates the MRO of all the classes which called C<use Class::C3>. It then 
308 gathers information from the symbol tables of each of those classes, and builds a set of method 
309 aliases for the correct dispatch ordering. Once all these C3-based method tables are created, it 
310 then adds the method aliases into the local classes symbol table. 
311
312 The end result is actually classes with pre-cached method dispatch. However, this caching does not
313 do well if you start changing your C<@ISA> or messing with class symbol tables, so you should consider
314 your classes to be effectively closed. See the L<CAVEATS> section for more details.
315
316 =head1 OPTIONAL LOWERCASE PRAGMA
317
318 This release also includes an optional module B<c3> in the F<opt/> folder. I did not include this in 
319 the regular install since lowercase module names are considered I<"bad"> by some people. However I
320 think that code looks much nicer like this:
321
322   package MyClass;
323   use c3;
324   
325 The the more clunky:
326
327   package MyClass;
328   use Class::C3;
329   
330 But hey, it's your choice, thats why it is optional.
331
332 =head1 FUNCTIONS
333
334 =over 4
335
336 =item B<calculateMRO ($class)>
337
338 Given a C<$class> this will return an array of class names in the proper C3 method resolution order.
339
340 =item B<initialize>
341
342 This B<must be called> to initalize the C3 method dispatch tables, this module B<will not work> if 
343 you do not do this. It is advised to do this as soon as possible B<after> loading any classes which 
344 use C3. Here is a quick code example:
345   
346   package Foo;
347   use Class::C3;
348   # ... Foo methods here
349   
350   package Bar;
351   use Class::C3;
352   use base 'Foo';
353   # ... Bar methods here
354   
355   package main;
356   
357   Class::C3::initialize(); # now it is safe to use Foo and Bar
358
359 This function used to be called automatically for you in the INIT phase of the perl compiler, but 
360 that lead to warnings if this module was required at runtime. After discussion with my user base 
361 (the L<DBIx::Class> folks), we decided that calling this in INIT was more of an annoyance than a 
362 convience. I apologize to anyone this causes problems for (although i would very suprised if I had 
363 any other users other than the L<DBIx::Class> folks). The simplest solution of course is to define 
364 your own INIT method which calls this function. 
365
366 NOTE: 
367
368 If C<initialize> detects that C<initialize> has already been executed, it will L</uninitialize> and
369 clear the MRO cache first.
370
371 =item B<uninitialize>
372
373 Calling this function results in the removal of all cached methods, and the restoration of the old Perl 5
374 style dispatch order (depth-first, left-to-right). 
375
376 =item B<reinitialize>
377
378 This is an alias for L</initialize> above.
379
380 =back
381
382 =head1 METHOD REDISPATCHING
383
384 It is always useful to be able to re-dispatch your method call to the "next most applicable method". This 
385 module provides a pseudo package along the lines of C<SUPER::> or C<NEXT::> which will re-dispatch the 
386 method along the C3 linearization. This is best show with an examples.
387
388   # a classic diamond MI pattern ...
389      <A>
390     /   \
391   <B>   <C>
392     \   /
393      <D>
394   
395   package A;
396   use c3; 
397   sub foo { 'A::foo' }       
398  
399   package B;
400   use base 'A'; 
401   use c3;     
402   sub foo { 'B::foo => ' . (shift)->next::method() }       
403  
404   package B;
405   use base 'A'; 
406   use c3;    
407   sub foo { 'C::foo => ' . (shift)->next::method() }   
408  
409   package D;
410   use base ('B', 'C'); 
411   use c3; 
412   sub foo { 'D::foo => ' . (shift)->next::method() }   
413   
414   print D->foo; # prints out "D::foo => B::foo => C::foo => A::foo"
415
416 A few things to note. First, we do not require you to add on the method name to the C<next::method> 
417 call (this is unlike C<NEXT::> and C<SUPER::> which do require that). This helps to enforce the rule 
418 that you cannot dispatch to a method of a different name (this is how C<NEXT::> behaves as well). 
419
420 The next thing to keep in mind is that you will need to pass all arguments to C<next::method> it can 
421 not automatically use the current C<@_>. 
422
423 If C<next::method> cannot find a next method to re-dispatch the call to, it will throw an exception.
424 You can use C<next::can> to see if C<next::method> will succeed before you call it like so:
425
426   $self->next::method(@_) if $self->next::can; 
427
428 Additionally, you can use C<maybe::next::method> as a shortcut to only call the next method if it exists. 
429 The previous example could be simply written as:
430
431   $self->maybe::next::method(@_);
432
433 There are some caveats about using C<next::method>, see below for those.
434
435 =head1 CAVEATS
436
437 This module used to be labeled as I<experimental>, however it has now been pretty heavily tested by 
438 the good folks over at L<DBIx::Class> and I am confident this module is perfectly usable for 
439 whatever your needs might be. 
440
441 But there are still caveats, so here goes ...
442
443 =over 4
444
445 =item Use of C<SUPER::>.
446
447 The idea of C<SUPER::> under multiple inheritence is ambigious, and generally not recomended anyway.
448 However, it's use in conjuntion with this module is very much not recommended, and in fact very 
449 discouraged. The recommended approach is to instead use the supplied C<next::method> feature, see
450 more details on it's usage above.
451
452 =item Changing C<@ISA>.
453
454 It is the author's opinion that changing C<@ISA> at runtime is pure insanity anyway. However, people
455 do it, so I must caveat. Any changes to the C<@ISA> will not be reflected in the MRO calculated by this
456 module, and therefor probably won't even show up. If you do this, you will need to call C<reinitialize> 
457 in order to recalulate B<all> method dispatch tables. See the C<reinitialize> documentation and an example
458 in F<t/20_reinitialize.t> for more information.
459
460 =item Adding/deleting methods from class symbol tables.
461
462 This module calculates the MRO for each requested class by interogatting the symbol tables of said classes. 
463 So any symbol table manipulation which takes place after our INIT phase is run will not be reflected in 
464 the calculated MRO. Just as with changing the C<@ISA>, you will need to call C<reinitialize> for any 
465 changes you make to take effect.
466
467 =item Calling C<next::method> from methods defined outside the class
468
469 There is an edge case when using C<next::method> from within a subroutine which was created in a different 
470 module than the one it is called from. It sounds complicated, but it really isn't. Here is an example which 
471 will not work correctly:
472
473   *Foo::foo = sub { (shift)->next::method(@_) };
474
475 The problem exists because the anonymous subroutine being assigned to the glob C<*Foo::foo> will show up 
476 in the call stack as being called C<__ANON__> and not C<foo> as you might expect. Since C<next::method> 
477 uses C<caller> to find the name of the method it was called in, it will fail in this case. 
478
479 But fear not, there is a simple solution. The module C<Sub::Name> will reach into the perl internals and 
480 assign a name to an anonymous subroutine for you. Simply do this:
481     
482   use Sub::Name 'subname';
483   *Foo::foo = subname 'Foo::foo' => sub { (shift)->next::method(@_) };
484
485 and things will Just Work. Of course this is not always possible to do, but to be honest, I just can't 
486 manage to find a workaround for it, so until someone gives me a working patch this will be a known 
487 limitation of this module.
488
489 =back
490
491 =head1 COMPATIBILITY
492
493 If your software requires Perl 5.9.5 or higher, you do not need L<Class::C3>, you can simple C<use mro 'c3'>, and not worry about C<initialize()>, avoid some of the above caveats, and get the best possible performance.  See L<mro> for more details.
494
495 If your software is meant to work on earlier Perls, use L<Class::C3> as documented here.  L<Class::C3> will detect Perl 5.9.5+ and take advantage of the core support when available.
496
497 =head1 Class::C3::XS
498
499 This module will load L<Class::C3::XS> if it's installed and you are running on a Perl version older than 5.9.5.  Installing this is recommended when possible, as it results in significant performance improvements (but unlike the 5.9.5+ core support, it still has all of the same caveats as L<Class::C3>).
500
501 =head1 CODE COVERAGE
502
503 I use B<Devel::Cover> to test the code coverage of my tests, below is the B<Devel::Cover> report on this 
504 module's test suite.
505
506  ---------------------------- ------ ------ ------ ------ ------ ------ ------
507  File                           stmt   bran   cond    sub    pod   time  total
508  ---------------------------- ------ ------ ------ ------ ------ ------ ------
509  Class/C3.pm                    98.3   84.4   80.0   96.2  100.0   98.4   94.4
510  ---------------------------- ------ ------ ------ ------ ------ ------ ------
511  Total                          98.3   84.4   80.0   96.2  100.0   98.4   94.4
512  ---------------------------- ------ ------ ------ ------ ------ ------ ------
513
514 =head1 SEE ALSO
515
516 =head2 The original Dylan paper
517
518 =over 4
519
520 =item L<http://www.webcom.com/haahr/dylan/linearization-oopsla96.html>
521
522 =back
523
524 =head2 The prototype Perl 6 Object Model uses C3
525
526 =over 4
527
528 =item L<http://svn.openfoundry.org/pugs/perl5/Perl6-MetaModel/>
529
530 =back
531
532 =head2 Parrot now uses C3
533
534 =over 4
535
536 =item L<http://aspn.activestate.com/ASPN/Mail/Message/perl6-internals/2746631>
537
538 =item L<http://use.perl.org/~autrijus/journal/25768>
539
540 =back
541
542 =head2 Python 2.3 MRO related links
543
544 =over 4
545
546 =item L<http://www.python.org/2.3/mro.html>
547
548 =item L<http://www.python.org/2.2.2/descrintro.html#mro>
549
550 =back
551
552 =head2 C3 for TinyCLOS
553
554 =over 4
555
556 =item L<http://www.call-with-current-continuation.org/eggs/c3.html>
557
558 =back 
559
560 =head1 ACKNOWLEGEMENTS
561
562 =over 4
563
564 =item Thanks to Matt S. Trout for using this module in his module L<DBIx::Class> 
565 and finding many bugs and providing fixes.
566
567 =item Thanks to Justin Guenther for making C<next::method> more robust by handling 
568 calls inside C<eval> and anon-subs.
569
570 =item Thanks to Robert Norris for adding support for C<next::can> and 
571 C<maybe::next::method>.
572
573 =back
574
575 =head1 AUTHOR
576
577 Stevan Little, E<lt>stevan@iinteractive.comE<gt>
578
579 Brandon L. Black, E<lt>blblack@gmail.comE<gt>
580
581 =head1 COPYRIGHT AND LICENSE
582
583 Copyright 2005, 2006 by Infinity Interactive, Inc.
584
585 L<http://www.iinteractive.com>
586
587 This library is free software; you can redistribute it and/or modify
588 it under the same terms as Perl itself. 
589
590 =cut