changes
[gitmo/Class-C3.git] / lib / Class / C3.pm
1
2 package Class::C3;
3
4 use strict;
5 use warnings;
6
7 use Scalar::Util 'blessed';
8 use Algorithm::C3;
9
10 our $VERSION = '0.12';
11
12 # this is our global stash of both 
13 # MRO's and method dispatch tables
14 # the structure basically looks like
15 # this:
16 #
17 #   $MRO{$class} = {
18 #      MRO => [ <class precendence list> ],
19 #      methods => {
20 #          orig => <original location of method>,
21 #          code => \&<ref to original method>
22 #      },
23 #      has_overload_fallback => (1 | 0)
24 #   }
25 #
26 our %MRO;
27
28 # use these for debugging ...
29 sub _dump_MRO_table { %MRO }
30 our $TURN_OFF_C3 = 0;
31
32 sub import {
33     my $class = caller();
34     # skip if the caller is main::
35     # since that is clearly not relevant
36     return if $class eq 'main';
37     return if $TURN_OFF_C3;
38     # make a note to calculate $class 
39     # during INIT phase
40     $MRO{$class} = undef unless exists $MRO{$class};
41 }
42
43 ## initializers
44
45 sub initialize {
46     # why bother if we don't have anything ...
47     return unless keys %MRO;
48     _calculate_method_dispatch_tables();
49     _apply_method_dispatch_tables();
50     %next::METHOD_CACHE = ();
51 }
52
53 sub uninitialize {
54     # why bother if we don't have anything ...
55     return unless keys %MRO;    
56     _remove_method_dispatch_tables();    
57     %next::METHOD_CACHE = ();
58 }
59
60 sub reinitialize {
61     uninitialize();
62     # clean up the %MRO before we re-initialize
63     $MRO{$_} = undef foreach keys %MRO;
64     initialize();
65 }
66
67 ## functions for applying C3 to classes
68
69 sub _calculate_method_dispatch_tables {
70     foreach my $class (keys %MRO) {
71         _calculate_method_dispatch_table($class);
72     }
73 }
74
75 sub _calculate_method_dispatch_table {
76     my $class = shift;
77     no strict 'refs';
78     my @MRO = calculateMRO($class);
79     $MRO{$class} = { MRO => \@MRO };
80     my $has_overload_fallback = 0;
81     my %methods;
82     # NOTE: 
83     # we do @MRO[1 .. $#MRO] here because it
84     # makes no sense to interogate the class
85     # which you are calculating for. 
86     foreach my $local (@MRO[1 .. $#MRO]) {
87         # if overload has tagged this module to 
88         # have use "fallback", then we want to
89         # grab that value 
90         $has_overload_fallback = ${"${local}::()"} 
91             if defined ${"${local}::()"};
92         foreach my $method (grep { defined &{"${local}::$_"} } keys %{"${local}::"}) {
93             # skip if already overriden in local class
94             next unless !defined *{"${class}::$method"}{CODE};
95             $methods{$method} = {
96                 orig => "${local}::$method",
97                 code => \&{"${local}::$method"}
98             } unless exists $methods{$method};
99         }
100     }    
101     # now stash them in our %MRO table
102     $MRO{$class}->{methods} = \%methods; 
103     $MRO{$class}->{has_overload_fallback} = $has_overload_fallback;        
104 }
105
106 sub _apply_method_dispatch_tables {
107     foreach my $class (keys %MRO) {
108         _apply_method_dispatch_table($class);
109     }     
110 }
111
112 sub _apply_method_dispatch_table {
113     my $class = shift;
114     no strict 'refs';
115     ${"${class}::()"} = $MRO{$class}->{has_overload_fallback}
116         if $MRO{$class}->{has_overload_fallback};
117     foreach my $method (keys %{$MRO{$class}->{methods}}) {
118         *{"${class}::$method"} = $MRO{$class}->{methods}->{$method}->{code};
119     }    
120 }
121
122 sub _remove_method_dispatch_tables {
123     foreach my $class (keys %MRO) {
124         _remove_method_dispatch_table($class);
125     }       
126 }
127
128 sub _remove_method_dispatch_table {
129     my $class = shift;
130     no strict 'refs';
131     delete ${"${class}::"}{"()"} if $MRO{$class}->{has_overload_fallback};    
132     foreach my $method (keys %{$MRO{$class}->{methods}}) {
133         delete ${"${class}::"}{$method}
134             if defined *{"${class}::${method}"}{CODE} && 
135                (*{"${class}::${method}"}{CODE} eq $MRO{$class}->{methods}->{$method}->{code});       
136     }   
137 }
138
139 ## functions for calculating C3 MRO
140
141 sub calculateMRO {
142     my ($class) = @_;
143     return Algorithm::C3::merge($class, sub { 
144         no strict 'refs'; 
145         @{$_[0] . '::ISA'};
146     });
147 }
148
149 package  # hide me from PAUSE
150     next; 
151
152 use strict;
153 use warnings;
154
155 use Scalar::Util 'blessed';
156
157 our $VERSION = '0.05';
158
159 our %METHOD_CACHE;
160
161 sub method {
162     my $level = 1;
163     my ($method_caller, $label, @label);
164     while ($method_caller = (caller($level++))[3]) {
165       @label = (split '::', $method_caller);
166       $label = pop @label;
167       last unless
168         $label eq '(eval)' ||
169         $label eq '__ANON__';
170     }
171     my $caller   = join '::' => @label;    
172     my $self     = $_[0];
173     my $class    = blessed($self) || $self;
174     
175     goto &{ $METHOD_CACHE{"$class|$caller|$label"} ||= do {
176
177       my @MRO = Class::C3::calculateMRO($class);
178
179       my $current;
180       while ($current = shift @MRO) {
181           last if $caller eq $current;
182       }
183
184       no strict 'refs';
185       my $found;
186       foreach my $class (@MRO) {
187           next if (defined $Class::C3::MRO{$class} && 
188                    defined $Class::C3::MRO{$class}{methods}{$label});          
189           last if (defined ($found = *{$class . '::' . $label}{CODE}));
190       }
191
192       die "No next::method '$label' found for $self" unless $found;
193
194       $found;
195     } };
196 }
197
198 1;
199
200 __END__
201
202 =pod
203
204 =head1 NAME
205
206 Class::C3 - A pragma to use the C3 method resolution order algortihm
207
208 =head1 SYNOPSIS
209
210     package A;
211     use Class::C3;     
212     sub hello { 'A::hello' }
213
214     package B;
215     use base 'A';
216     use Class::C3;     
217
218     package C;
219     use base 'A';
220     use Class::C3;     
221
222     sub hello { 'C::hello' }
223
224     package D;
225     use base ('B', 'C');
226     use Class::C3;    
227
228     # Classic Diamond MI pattern
229     #    <A>
230     #   /   \
231     # <B>   <C>
232     #   \   /
233     #    <D>
234
235     package main;
236     
237     # initializez the C3 module 
238     # (formerly called in INIT)
239     Class::C3::initialize();  
240
241     print join ', ' => Class::C3::calculateMRO('Diamond_D') # prints D, B, C, A
242
243     print D->hello() # prints 'C::hello' instead of the standard p5 'A::hello'
244     
245     D->can('hello')->();          # can() also works correctly
246     UNIVERSAL::can('D', 'hello'); # as does UNIVERSAL::can()
247
248 =head1 DESCRIPTION
249
250 This is pragma to change Perl 5's standard method resolution order from depth-first left-to-right 
251 (a.k.a - pre-order) to the more sophisticated C3 method resolution order. 
252
253 =head2 What is C3?
254
255 C3 is the name of an algorithm which aims to provide a sane method resolution order under multiple
256 inheritence. It was first introduced in the langauge Dylan (see links in the L<SEE ALSO> section),
257 and then later adopted as the prefered MRO (Method Resolution Order) for the new-style classes in 
258 Python 2.3. Most recently it has been adopted as the 'canonical' MRO for Perl 6 classes, and the 
259 default MRO for Parrot objects as well.
260
261 =head2 How does C3 work.
262
263 C3 works by always preserving local precendence ordering. This essentially means that no class will 
264 appear before any of it's subclasses. Take the classic diamond inheritence pattern for instance:
265
266      <A>
267     /   \
268   <B>   <C>
269     \   /
270      <D>
271
272 The standard Perl 5 MRO would be (D, B, A, C). The result being that B<A> appears before B<C>, even 
273 though B<C> is the subclass of B<A>. The C3 MRO algorithm however, produces the following MRO 
274 (D, B, C, A), which does not have this same issue.
275
276 This example is fairly trival, for more complex examples and a deeper explaination, see the links in
277 the L<SEE ALSO> section.
278
279 =head2 How does this module work?
280
281 This module uses a technique similar to Perl 5's method caching. When C<Class::C3::initialize> is 
282 called, this module calculates the MRO of all the classes which called C<use Class::C3>. It then 
283 gathers information from the symbol tables of each of those classes, and builds a set of method 
284 aliases for the correct dispatch ordering. Once all these C3-based method tables are created, it 
285 then adds the method aliases into the local classes symbol table. 
286
287 The end result is actually classes with pre-cached method dispatch. However, this caching does not
288 do well if you start changing your C<@ISA> or messing with class symbol tables, so you should consider
289 your classes to be effectively closed. See the L<CAVEATS> section for more details.
290
291 =head1 OPTIONAL LOWERCASE PRAGMA
292
293 This release also includes an optional module B<c3> in the F<opt/> folder. I did not include this in 
294 the regular install since lowercase module names are considered I<"bad"> by some people. However I
295 think that code looks much nicer like this:
296
297   package MyClass;
298   use c3;
299   
300 The the more clunky:
301
302   package MyClass;
303   use Class::C3;
304   
305 But hey, it's your choice, thats why it is optional.
306
307 =head1 FUNCTIONS
308
309 =over 4
310
311 =item B<calculateMRO ($class)>
312
313 Given a C<$class> this will return an array of class names in the proper C3 method resolution order.
314
315 =item B<initialize>
316
317 This B<must be called> to initalize the C3 method dispatch tables, this module B<will not work> if 
318 you do not do this. It is advised to do this as soon as possible B<after> loading any classes which 
319 use C3. Here is a quick code example:
320   
321   package Foo;
322   use Class::C3;
323   # ... Foo methods here
324   
325   package Bar;
326   use Class::C3;
327   use base 'Foo';
328   # ... Bar methods here
329   
330   package main;
331   
332   Class::C3::initialize(); # now it is safe to use Foo and Bar
333
334 This function used to be called automatically for you in the INIT phase of the perl compiler, but 
335 that lead to warnings if this module was required at runtime. After discussion with my user base 
336 (the L<DBIx::Class> folks), we decided that calling this in INIT was more of an annoyance than a 
337 convience. I apologize to anyone this causes problems for (although i would very suprised if I had 
338 any other users other than the L<DBIx::Class> folks). The simplest solution of course is to define 
339 your own INIT method which calls this function. 
340
341 NOTE: 
342 This can B<not> be used to re-load the dispatch tables for all classes. Use C<reinitialize> for that.
343
344 =item B<uninitialize>
345
346 Calling this function results in the removal of all cached methods, and the restoration of the old Perl 5
347 style dispatch order (depth-first, left-to-right). 
348
349 =item B<reinitialize>
350
351 This effectively calls C<uninitialize> followed by C<initialize> the result of which is a reloading of
352 B<all> the calculated C3 dispatch tables. 
353
354 It should be noted that if you have a large class library, this could potentially be a rather costly 
355 operation.
356
357 =back
358
359 =head1 METHOD REDISPATCHING
360
361 It is always useful to be able to re-dispatch your method call to the "next most applicable method". This 
362 module provides a pseudo package along the lines of C<SUPER::> or C<NEXT::> which will re-dispatch the 
363 method along the C3 linearization. This is best show with an examples.
364
365   # a classic diamond MI pattern ...
366      <A>
367     /   \
368   <B>   <C>
369     \   /
370      <D>
371   
372   package A;
373   use c3; 
374   sub foo { 'A::foo' }       
375  
376   package B;
377   use base 'A'; 
378   use c3;     
379   sub foo { 'B::foo => ' . (shift)->next::method() }       
380  
381   package B;
382   use base 'A'; 
383   use c3;    
384   sub foo { 'C::foo => ' . (shift)->next::method() }   
385  
386   package D;
387   use base ('B', 'C'); 
388   use c3; 
389   sub foo { 'D::foo => ' . (shift)->next::method() }   
390   
391   print D->foo; # prints out "D::foo => B::foo => C::foo => A::foo"
392
393 A few things to note. First, we do not require you to add on the method name to the C<next::method> 
394 call (this is unlike C<NEXT::> and C<SUPER::> which do require that). This helps to enforce the rule 
395 that you cannot dispatch to a method of a different name (this is how C<NEXT::> behaves as well). 
396
397 The next thing to keep in mind is that you will need to pass all arguments to C<next::method> it can 
398 not automatically use the current C<@_>. 
399
400 There are some caveats about using C<next::method>, see below for those.
401
402 =head1 CAVEATS
403
404 This module used to be labeled as I<experimental>, however it has now been pretty heavily tested by 
405 the good folks over at L<DBIx::Class> and I am confident this module is perfectly usable for 
406 whatever your needs might be. 
407
408 But there are still caveats, so here goes ...
409
410 =over 4
411
412 =item Use of C<SUPER::>.
413
414 The idea of C<SUPER::> under multiple inheritence is ambigious, and generally not recomended anyway.
415 However, it's use in conjuntion with this module is very much not recommended, and in fact very 
416 discouraged. The recommended approach is to instead use the supplied C<next::method> feature, see
417 more details on it's usage above.
418
419 =item Changing C<@ISA>.
420
421 It is the author's opinion that changing C<@ISA> at runtime is pure insanity anyway. However, people
422 do it, so I must caveat. Any changes to the C<@ISA> will not be reflected in the MRO calculated by this
423 module, and therefor probably won't even show up. If you do this, you will need to call C<reinitialize> 
424 in order to recalulate B<all> method dispatch tables. See the C<reinitialize> documentation and an example
425 in F<t/20_reinitialize.t> for more information.
426
427 =item Adding/deleting methods from class symbol tables.
428
429 This module calculates the MRO for each requested class by interogatting the symbol tables of said classes. 
430 So any symbol table manipulation which takes place after our INIT phase is run will not be reflected in 
431 the calculated MRO. Just as with changing the C<@ISA>, you will need to call C<reinitialize> for any 
432 changes you make to take effect.
433
434 =item Calling C<next::method> from methods defined outside the class
435
436 There is an edge case when using C<next::method> from within a subroutine which was created in a different 
437 module than the one it is called from. It sounds complicated, but it really isn't. Here is an example which 
438 will not work correctly:
439
440   *Foo::foo = sub { (shift)->next::method(@_) };
441
442 The problem exists because the anonymous subroutine being assigned to the glob C<*Foo::foo> will show up 
443 in the call stack as being called C<__ANON__> and not C<foo> as you might expect. Since C<next::method> 
444 uses C<caller> to find the name of the method it was called in, it will fail in this case. 
445
446 But fear not, there is a simple solution. The module C<Sub::Name> will reach into the perl internals and 
447 assign a name to an anonymous subroutine for you. Simply do this:
448     
449   use Sub::Name 'subname';
450   *Foo::foo = subname 'Foo::foo' => sub { (shift)->next::method(@_) };
451
452 and things will Just Work. Of course this is not always possible to do, but to be honest, I just can't 
453 manage to find a workaround for it, so until someone gives me a working patch this will be a known 
454 limitation of this module.
455
456 =back
457
458 =head1 CODE COVERAGE
459
460 I use B<Devel::Cover> to test the code coverage of my tests, below is the B<Devel::Cover> report on this 
461 module's test suite.
462
463  ---------------------------- ------ ------ ------ ------ ------ ------ ------
464  File                           stmt   bran   cond    sub    pod   time  total
465  ---------------------------- ------ ------ ------ ------ ------ ------ ------
466  Class/C3.pm                    98.3   84.4   80.0   96.2  100.0   98.4   94.4
467  ---------------------------- ------ ------ ------ ------ ------ ------ ------
468  Total                          98.3   84.4   80.0   96.2  100.0   98.4   94.4
469  ---------------------------- ------ ------ ------ ------ ------ ------ ------
470
471 =head1 SEE ALSO
472
473 =head2 The original Dylan paper
474
475 =over 4
476
477 =item L<http://www.webcom.com/haahr/dylan/linearization-oopsla96.html>
478
479 =back
480
481 =head2 The prototype Perl 6 Object Model uses C3
482
483 =over 4
484
485 =item L<http://svn.openfoundry.org/pugs/perl5/Perl6-MetaModel/>
486
487 =back
488
489 =head2 Parrot now uses C3
490
491 =over 4
492
493 =item L<http://aspn.activestate.com/ASPN/Mail/Message/perl6-internals/2746631>
494
495 =item L<http://use.perl.org/~autrijus/journal/25768>
496
497 =back
498
499 =head2 Python 2.3 MRO related links
500
501 =over 4
502
503 =item L<http://www.python.org/2.3/mro.html>
504
505 =item L<http://www.python.org/2.2.2/descrintro.html#mro>
506
507 =back
508
509 =head2 C3 for TinyCLOS
510
511 =over 4
512
513 =item L<http://www.call-with-current-continuation.org/eggs/c3.html>
514
515 =back 
516
517 =head1 ACKNOWLEGEMENTS
518
519 =over 4
520
521 =item Thanks to Matt S. Trout for using this module in his module L<DBIx::Class> 
522 and finding many bugs and providing fixes.
523
524 =item Thanks to Justin Guenther for making C<next::method> more robust by handling 
525 calls inside C<eval> and anon-subs.
526
527 =back
528
529 =head1 AUTHOR
530
531 Stevan Little, E<lt>stevan@iinteractive.comE<gt>
532
533 =head1 COPYRIGHT AND LICENSE
534
535 Copyright 2005, 2006 by Infinity Interactive, Inc.
536
537 L<http://www.iinteractive.com>
538
539 This library is free software; you can redistribute it and/or modify
540 it under the same terms as Perl itself. 
541
542 =cut