fixed test resultclass formatting, added a few more DBIC::Storage::DBI methods that...
[dbsrgits/DBIx-Class.git] / lib / DBIx / Class / Storage / DBI / Replicated.pm
1 package DBIx::Class::Storage::DBI::Replicated;
2
3 BEGIN {
4   use Carp::Clan qw/^DBIx::Class/;
5         
6   ## Modules required for Replication support not required for general DBIC
7   ## use, so we explicitly test for these.
8         
9   my %replication_required = (
10     'Moose' => '0.77',
11     'MooseX::AttributeHelpers' => '0.12',
12     'MooseX::Types' => '0.10',
13     'namespace::clean' => '0.11',
14     'Hash::Merge' => '0.11'
15   );
16         
17   my @didnt_load;
18   
19   for my $module (keys %replication_required) {
20         eval "use $module $replication_required{$module}";
21         push @didnt_load, "$module $replication_required{$module}"
22          if $@;
23   }
24         
25   croak("@{[ join ', ', @didnt_load ]} are missing and are required for Replication")
26     if @didnt_load;     
27 }
28
29 use Moose;
30 use DBIx::Class::Storage::DBI;
31 use DBIx::Class::Storage::DBI::Replicated::Pool;
32 use DBIx::Class::Storage::DBI::Replicated::Balancer;
33 use DBIx::Class::Storage::DBI::Replicated::Types 'BalancerClassNamePart';
34 use MooseX::Types::Moose qw/ClassName HashRef Object/;
35 use Scalar::Util 'reftype';
36 use Carp::Clan qw/^DBIx::Class/;
37 use Hash::Merge 'merge';
38
39 use namespace::clean -except => 'meta';
40
41 =head1 NAME
42
43 DBIx::Class::Storage::DBI::Replicated - BETA Replicated database support
44
45 =head1 SYNOPSIS
46
47 The Following example shows how to change an existing $schema to a replicated
48 storage type, add some replicated (readonly) databases, and perform reporting
49 tasks.
50
51   ## Change storage_type in your schema class
52   $schema->storage_type( ['::DBI::Replicated', {balancer=>'::Random'}] );
53   
54   ## Add some slaves.  Basically this is an array of arrayrefs, where each
55   ## arrayref is database connect information
56   
57   $schema->storage->connect_replicants(
58     [$dsn1, $user, $pass, \%opts],
59     [$dsn2, $user, $pass, \%opts],
60     [$dsn3, $user, $pass, \%opts],
61   );
62   
63   ## Now, just use the $schema as normal
64   $schema->resultset('Source')->search({name=>'etc'});
65   
66   ## You can force a given query to use a particular storage using the search
67   ### attribute 'force_pool'.  For example:
68   
69   my $RS = $schema->resultset('Source')->search(undef, {force_pool=>'master'});
70   
71   ## Now $RS will force everything (both reads and writes) to use whatever was
72   ## setup as the master storage.  'master' is hardcoded to always point to the
73   ## Master, but you can also use any Replicant name.  Please see:
74   ## L<DBIx::Class::Storage::Replicated::Pool> and the replicants attribute for
75   ## More. Also see transactions and L</execute_reliably> for alternative ways
76   ## to force read traffic to the master.
77   
78 =head1 DESCRIPTION
79
80 Warning: This class is marked BETA.  This has been running a production
81 website using MySQL native replication as its backend and we have some decent
82 test coverage but the code hasn't yet been stressed by a variety of databases.
83 Individual DB's may have quirks we are not aware of.  Please use this in first
84 development and pass along your experiences/bug fixes.
85
86 This class implements replicated data store for DBI. Currently you can define
87 one master and numerous slave database connections. All write-type queries
88 (INSERT, UPDATE, DELETE and even LAST_INSERT_ID) are routed to master
89 database, all read-type queries (SELECTs) go to the slave database.
90
91 Basically, any method request that L<DBIx::Class::Storage::DBI> would normally
92 handle gets delegated to one of the two attributes: L</read_handler> or to
93 L</write_handler>.  Additionally, some methods need to be distributed
94 to all existing storages.  This way our storage class is a drop in replacement
95 for L<DBIx::Class::Storage::DBI>.
96
97 Read traffic is spread across the replicants (slaves) occuring to a user
98 selected algorithm.  The default algorithm is random weighted.
99
100 =head1 NOTES
101
102 The consistancy betweeen master and replicants is database specific.  The Pool
103 gives you a method to validate it's replicants, removing and replacing them
104 when they fail/pass predefined criteria.  Please make careful use of the ways
105 to force a query to run against Master when needed.
106
107 =head1 REQUIREMENTS
108
109 Replicated Storage has additional requirements not currently part of L<DBIx::Class>
110
111   Moose => 0.77
112   MooseX::AttributeHelpers => 0.12 
113   MooseX::Types => 0.10
114   namespace::clean => 0.11
115   Hash::Merge => 0.11
116   
117 You will need to install these modules manually via CPAN or make them part of the
118 Makefile for your distribution.
119
120 =head1 ATTRIBUTES
121
122 This class defines the following attributes.
123
124 =head2 schema
125
126 The underlying L<DBIx::Class::Schema> object this storage is attaching
127
128 =cut
129
130 has 'schema' => (
131     is=>'rw',
132     isa=>'DBIx::Class::Schema',
133     weak_ref=>1,
134     required=>1,
135 );
136
137 =head2 pool_type
138
139 Contains the classname which will instantiate the L</pool> object.  Defaults 
140 to: L<DBIx::Class::Storage::DBI::Replicated::Pool>.
141
142 =cut
143
144 has 'pool_type' => (
145   is=>'rw',
146   isa=>ClassName,
147   default=>'DBIx::Class::Storage::DBI::Replicated::Pool',
148   handles=>{
149     'create_pool' => 'new',
150   },
151 );
152
153 =head2 pool_args
154
155 Contains a hashref of initialized information to pass to the Balancer object.
156 See L<DBIx::Class::Storage::Replicated::Pool> for available arguments.
157
158 =cut
159
160 has 'pool_args' => (
161   is=>'rw',
162   isa=>HashRef,
163   lazy=>1,
164   default=>sub { {} },
165 );
166
167
168 =head2 balancer_type
169
170 The replication pool requires a balance class to provider the methods for
171 choose how to spread the query load across each replicant in the pool.
172
173 =cut
174
175 has 'balancer_type' => (
176   is=>'rw',
177   isa=>BalancerClassNamePart,
178   coerce=>1,
179   required=>1,
180   default=> 'DBIx::Class::Storage::DBI::Replicated::Balancer::First',
181   handles=>{
182     'create_balancer' => 'new',
183   },
184 );
185
186 =head2 balancer_args
187
188 Contains a hashref of initialized information to pass to the Balancer object.
189 See L<DBIx::Class::Storage::Replicated::Balancer> for available arguments.
190
191 =cut
192
193 has 'balancer_args' => (
194   is=>'rw',
195   isa=>HashRef,
196   lazy=>1,
197   required=>1,
198   default=>sub { {} },
199 );
200
201 =head2 pool
202
203 Is a <DBIx::Class::Storage::DBI::Replicated::Pool> or derived class.  This is a
204 container class for one or more replicated databases.
205
206 =cut
207
208 has 'pool' => (
209   is=>'ro',
210   isa=>'DBIx::Class::Storage::DBI::Replicated::Pool',
211   lazy_build=>1,
212   handles=>[qw/
213     connect_replicants    
214     replicants
215     has_replicants
216   /],
217 );
218
219 =head2 balancer
220
221 Is a <DBIx::Class::Storage::DBI::Replicated::Balancer> or derived class.  This 
222 is a class that takes a pool (<DBIx::Class::Storage::DBI::Replicated::Pool>)
223
224 =cut
225
226 has 'balancer' => (
227   is=>'rw',
228   isa=>'DBIx::Class::Storage::DBI::Replicated::Balancer',
229   lazy_build=>1,
230   handles=>[qw/auto_validate_every/],
231 );
232
233 =head2 master
234
235 The master defines the canonical state for a pool of connected databases.  All
236 the replicants are expected to match this databases state.  Thus, in a classic
237 Master / Slaves distributed system, all the slaves are expected to replicate
238 the Master's state as quick as possible.  This is the only database in the
239 pool of databases that is allowed to handle write traffic.
240
241 =cut
242
243 has 'master' => (
244   is=> 'ro',
245   isa=>'DBIx::Class::Storage::DBI',
246   lazy_build=>1,
247 );
248
249 =head1 ATTRIBUTES IMPLEMENTING THE DBIx::Storage::DBI INTERFACE
250
251 The following methods are delegated all the methods required for the 
252 L<DBIx::Class::Storage::DBI> interface.
253
254 =head2 read_handler
255
256 Defines an object that implements the read side of L<BIx::Class::Storage::DBI>.
257
258 =cut
259
260 has 'read_handler' => (
261   is=>'rw',
262   isa=>Object,
263   lazy_build=>1,
264   handles=>[qw/
265     select
266     select_single
267     columns_info_for
268   /],    
269 );
270
271 =head2 write_handler
272
273 Defines an object that implements the write side of L<BIx::Class::Storage::DBI>.
274
275 =cut
276
277 has 'write_handler' => (
278   is=>'ro',
279   isa=>Object,
280   lazy_build=>1,
281   handles=>[qw/   
282     on_connect_do
283     on_disconnect_do       
284     connect_info
285     throw_exception
286     sql_maker
287     sqlt_type
288     create_ddl_dir
289     deployment_statements
290     datetime_parser
291     datetime_parser_type  
292     build_datetime_parser      
293     last_insert_id
294     insert
295     insert_bulk
296     update
297     delete
298     dbh
299     txn_begin
300     txn_do
301     txn_commit
302     txn_rollback
303     txn_scope_guard
304     sth
305     deploy
306     with_deferred_fk_checks
307         dbh_do
308     reload_row
309         with_deferred_fk_checks
310     _prep_for_execute
311
312         backup
313         is_datatype_numeric
314         _count_select
315         _subq_count_select
316         _subq_update_delete 
317         svp_rollback
318         svp_begin
319         svp_release
320   /],
321 );
322
323 has _master_connect_info_opts =>
324   (is => 'rw', isa => HashRef, default => sub { {} });
325
326 =head2 around: connect_info
327
328 Preserve master's C<connect_info> options (for merging with replicants.)
329 Also set any Replicated related options from connect_info, such as
330 C<pool_type>, C<pool_args>, C<balancer_type> and C<balancer_args>.
331
332 =cut
333
334 around connect_info => sub {
335   my ($next, $self, $info, @extra) = @_;
336
337   my $wantarray = wantarray;
338
339   my %opts;
340   for my $arg (@$info) {
341     next unless (reftype($arg)||'') eq 'HASH';
342     %opts = %{ merge($arg, \%opts) };
343   }
344   delete $opts{dsn};
345
346   if (@opts{qw/pool_type pool_args/}) {
347     $self->pool_type(delete $opts{pool_type})
348       if $opts{pool_type};
349
350     $self->pool_args(
351       merge((delete $opts{pool_args} || {}), $self->pool_args)
352     );
353
354     $self->pool($self->_build_pool)
355         if $self->pool;
356   }
357
358   if (@opts{qw/balancer_type balancer_args/}) {
359     $self->balancer_type(delete $opts{balancer_type})
360       if $opts{balancer_type};
361
362     $self->balancer_args(
363       merge((delete $opts{balancer_args} || {}), $self->balancer_args)
364     );
365
366     $self->balancer($self->_build_balancer)
367         if $self->balancer;
368   }
369
370   $self->_master_connect_info_opts(\%opts);
371
372   my (@res, $res);
373   if ($wantarray) {
374     @res = $self->$next($info, @extra);
375   } else {
376     $res = $self->$next($info, @extra);
377   }
378
379   # Make sure master is blessed into the correct class and apply role to it.
380   my $master = $self->master;
381   $master->_determine_driver;
382   Moose::Meta::Class->initialize(ref $master);
383   DBIx::Class::Storage::DBI::Replicated::WithDSN->meta->apply($master);
384
385   $wantarray ? @res : $res;
386 };
387
388 =head1 METHODS
389
390 This class defines the following methods.
391
392 =head2 BUILDARGS
393
394 L<DBIx::Class::Schema> when instantiating it's storage passed itself as the
395 first argument.  So we need to massage the arguments a bit so that all the
396 bits get put into the correct places.
397
398 =cut
399
400 sub BUILDARGS {
401   my ($class, $schema, $storage_type_args, @args) = @_; 
402   
403   return {
404         schema=>$schema, 
405         %$storage_type_args,
406         @args
407   }
408 }
409
410 =head2 _build_master
411
412 Lazy builder for the L</master> attribute.
413
414 =cut
415
416 sub _build_master {
417   my $self = shift @_;
418   my $master = DBIx::Class::Storage::DBI->new($self->schema);
419   $master
420 }
421
422 =head2 _build_pool
423
424 Lazy builder for the L</pool> attribute.
425
426 =cut
427
428 sub _build_pool {
429   my $self = shift @_;
430   $self->create_pool(%{$self->pool_args});
431 }
432
433 =head2 _build_balancer
434
435 Lazy builder for the L</balancer> attribute.  This takes a Pool object so that
436 the balancer knows which pool it's balancing.
437
438 =cut
439
440 sub _build_balancer {
441   my $self = shift @_;
442   $self->create_balancer(
443     pool=>$self->pool, 
444     master=>$self->master,
445     %{$self->balancer_args},
446   );
447 }
448
449 =head2 _build_write_handler
450
451 Lazy builder for the L</write_handler> attribute.  The default is to set this to
452 the L</master>.
453
454 =cut
455
456 sub _build_write_handler {
457   return shift->master;
458 }
459
460 =head2 _build_read_handler
461
462 Lazy builder for the L</read_handler> attribute.  The default is to set this to
463 the L</balancer>.
464
465 =cut
466
467 sub _build_read_handler {
468   return shift->balancer;
469 }
470
471 =head2 around: connect_replicants
472
473 All calls to connect_replicants needs to have an existing $schema tacked onto
474 top of the args, since L<DBIx::Storage::DBI> needs it, and any C<connect_info>
475 options merged with the master, with replicant opts having higher priority.
476
477 =cut
478
479 around connect_replicants => sub {
480   my ($next, $self, @args) = @_;
481
482   for my $r (@args) {
483     $r = [ $r ] unless reftype $r eq 'ARRAY';
484
485     croak "coderef replicant connect_info not supported"
486       if ref $r->[0] && reftype $r->[0] eq 'CODE';
487
488 # any connect_info options?
489     my $i = 0;
490     $i++ while $i < @$r && (reftype($r->[$i])||'') ne 'HASH';
491
492 # make one if none    
493     $r->[$i] = {} unless $r->[$i];
494
495 # merge if two hashes
496     my @hashes = @$r[$i .. $#{$r}];
497
498     croak "invalid connect_info options"
499       if (grep { reftype($_) eq 'HASH' } @hashes) != @hashes;
500
501     croak "too many hashrefs in connect_info"
502       if @hashes > 2;
503
504     my %opts = %{ merge(reverse @hashes) };
505
506 # delete them
507     splice @$r, $i+1, ($#{$r} - $i), ();
508
509 # merge with master
510     %opts = %{ merge(\%opts, $self->_master_connect_info_opts) };
511
512 # update
513     $r->[$i] = \%opts;
514   }
515
516   $self->$next($self->schema, @args);
517 };
518
519 =head2 all_storages
520
521 Returns an array of of all the connected storage backends.  The first element
522 in the returned array is the master, and the remainings are each of the
523 replicants.
524
525 =cut
526
527 sub all_storages {
528   my $self = shift @_;
529   return grep {defined $_ && blessed $_} (
530      $self->master,
531      values %{ $self->replicants },
532   );
533 }
534
535 =head2 execute_reliably ($coderef, ?@args)
536
537 Given a coderef, saves the current state of the L</read_handler>, forces it to
538 use reliable storage (ie sets it to the master), executes a coderef and then
539 restores the original state.
540
541 Example:
542
543   my $reliably = sub {
544     my $name = shift @_;
545     $schema->resultset('User')->create({name=>$name});
546     my $user_rs = $schema->resultset('User')->find({name=>$name}); 
547     return $user_rs;
548   };
549
550   my $user_rs = $schema->storage->execute_reliably($reliably, 'John');
551
552 Use this when you must be certain of your database state, such as when you just
553 inserted something and need to get a resultset including it, etc.
554
555 =cut
556
557 sub execute_reliably {
558   my ($self, $coderef, @args) = @_;
559   
560   unless( ref $coderef eq 'CODE') {
561     $self->throw_exception('Second argument must be a coderef');
562   }
563   
564   ##Get copy of master storage
565   my $master = $self->master;
566   
567   ##Get whatever the current read hander is
568   my $current = $self->read_handler;
569   
570   ##Set the read handler to master
571   $self->read_handler($master);
572   
573   ## do whatever the caller needs
574   my @result;
575   my $want_array = wantarray;
576   
577   eval {
578     if($want_array) {
579       @result = $coderef->(@args);
580     } elsif(defined $want_array) {
581       ($result[0]) = ($coderef->(@args));
582     } else {
583       $coderef->(@args);
584     }       
585   };
586   
587   ##Reset to the original state
588   $self->read_handler($current); 
589   
590   ##Exception testing has to come last, otherwise you might leave the 
591   ##read_handler set to master.
592   
593   if($@) {
594     $self->throw_exception("coderef returned an error: $@");
595   } else {
596     return $want_array ? @result : $result[0];
597   }
598 }
599
600 =head2 set_reliable_storage
601
602 Sets the current $schema to be 'reliable', that is all queries, both read and
603 write are sent to the master
604   
605 =cut
606
607 sub set_reliable_storage {
608   my $self = shift @_;
609   my $schema = $self->schema;
610   my $write_handler = $self->schema->storage->write_handler;
611   
612   $schema->storage->read_handler($write_handler);
613 }
614
615 =head2 set_balanced_storage
616
617 Sets the current $schema to be use the </balancer> for all reads, while all
618 writea are sent to the master only
619   
620 =cut
621
622 sub set_balanced_storage {
623   my $self = shift @_;
624   my $schema = $self->schema;
625   my $balanced_handler = $self->schema->storage->balancer;
626   
627   $schema->storage->read_handler($balanced_handler);
628 }
629
630 =head2 connected
631
632 Check that the master and at least one of the replicants is connected.
633
634 =cut
635
636 sub connected {
637   my $self = shift @_;
638   return
639     $self->master->connected &&
640     $self->pool->connected_replicants;
641 }
642
643 =head2 ensure_connected
644
645 Make sure all the storages are connected.
646
647 =cut
648
649 sub ensure_connected {
650   my $self = shift @_;
651   foreach my $source ($self->all_storages) {
652     $source->ensure_connected(@_);
653   }
654 }
655
656 =head2 limit_dialect
657
658 Set the limit_dialect for all existing storages
659
660 =cut
661
662 sub limit_dialect {
663   my $self = shift @_;
664   foreach my $source ($self->all_storages) {
665     $source->limit_dialect(@_);
666   }
667   return $self->master->quote_char;
668 }
669
670 =head2 quote_char
671
672 Set the quote_char for all existing storages
673
674 =cut
675
676 sub quote_char {
677   my $self = shift @_;
678   foreach my $source ($self->all_storages) {
679     $source->quote_char(@_);
680   }
681   return $self->master->quote_char;
682 }
683
684 =head2 name_sep
685
686 Set the name_sep for all existing storages
687
688 =cut
689
690 sub name_sep {
691   my $self = shift @_;
692   foreach my $source ($self->all_storages) {
693     $source->name_sep(@_);
694   }
695   return $self->master->name_sep;
696 }
697
698 =head2 set_schema
699
700 Set the schema object for all existing storages
701
702 =cut
703
704 sub set_schema {
705   my $self = shift @_;
706   foreach my $source ($self->all_storages) {
707     $source->set_schema(@_);
708   }
709 }
710
711 =head2 debug
712
713 set a debug flag across all storages
714
715 =cut
716
717 sub debug {
718   my $self = shift @_;
719   if(@_) {
720     foreach my $source ($self->all_storages) {
721       $source->debug(@_);
722     }   
723   }
724   return $self->master->debug;
725 }
726
727 =head2 debugobj
728
729 set a debug object across all storages
730
731 =cut
732
733 sub debugobj {
734   my $self = shift @_;
735   if(@_) {
736     foreach my $source ($self->all_storages) {
737       $source->debugobj(@_);
738     }   
739   }
740   return $self->master->debugobj;
741 }
742
743 =head2 debugfh
744
745 set a debugfh object across all storages
746
747 =cut
748
749 sub debugfh {
750   my $self = shift @_;
751   if(@_) {
752     foreach my $source ($self->all_storages) {
753       $source->debugfh(@_);
754     }   
755   }
756   return $self->master->debugfh;
757 }
758
759 =head2 debugcb
760
761 set a debug callback across all storages
762
763 =cut
764
765 sub debugcb {
766   my $self = shift @_;
767   if(@_) {
768     foreach my $source ($self->all_storages) {
769       $source->debugcb(@_);
770     }   
771   }
772   return $self->master->debugcb;
773 }
774
775 =head2 disconnect
776
777 disconnect everything
778
779 =cut
780
781 sub disconnect {
782   my $self = shift @_;
783   foreach my $source ($self->all_storages) {
784     $source->disconnect(@_);
785   }
786 }
787
788 =head2 cursor_class
789
790 set cursor class on all storages, or return master's
791
792 =cut
793
794 sub cursor_class {
795   my ($self, $cursor_class) = @_;
796
797   if ($cursor_class) {
798     $_->cursor_class($cursor_class) for $self->all_storages;
799   }
800   $self->master->cursor_class;
801 }
802   
803 =head1 GOTCHAS
804
805 Due to the fact that replicants can lag behind a master, you must take care to
806 make sure you use one of the methods to force read queries to a master should
807 you need realtime data integrity.  For example, if you insert a row, and then
808 immediately re-read it from the database (say, by doing $row->discard_changes)
809 or you insert a row and then immediately build a query that expects that row
810 to be an item, you should force the master to handle reads.  Otherwise, due to
811 the lag, there is no certainty your data will be in the expected state.
812
813 For data integrity, all transactions automatically use the master storage for
814 all read and write queries.  Using a transaction is the preferred and recommended
815 method to force the master to handle all read queries.
816
817 Otherwise, you can force a single query to use the master with the 'force_pool'
818 attribute:
819
820   my $row = $resultset->search(undef, {force_pool=>'master'})->find($pk);
821
822 This attribute will safely be ignore by non replicated storages, so you can use
823 the same code for both types of systems.
824
825 Lastly, you can use the L</execute_reliably> method, which works very much like
826 a transaction.
827
828 For debugging, you can turn replication on/off with the methods L</set_reliable_storage>
829 and L</set_balanced_storage>, however this operates at a global level and is not
830 suitable if you have a shared Schema object being used by multiple processes,
831 such as on a web application server.  You can get around this limitation by
832 using the Schema clone method.
833
834   my $new_schema = $schema->clone;
835   $new_schema->set_reliable_storage;
836   
837   ## $new_schema will use only the Master storage for all reads/writes while
838   ## the $schema object will use replicated storage.
839
840 =head1 AUTHOR
841
842   John Napiorkowski <john.napiorkowski@takkle.com>
843
844 Based on code originated by:
845
846   Norbert Csongrádi <bert@cpan.org>
847   Peter Siklósi <einon@einon.hu>
848
849 =head1 LICENSE
850
851 You may distribute this code under the same terms as Perl itself.
852
853 =cut
854
855 __PACKAGE__->meta->make_immutable;
856
857 1;