increased Moose version requirements due to changes in the way type constraints get...
[dbsrgits/DBIx-Class.git] / lib / DBIx / Class / Storage / DBI / Replicated.pm
1 package DBIx::Class::Storage::DBI::Replicated;
2
3 BEGIN {
4   use Carp::Clan qw/^DBIx::Class/;
5
6   ## Modules required for Replication support not required for general DBIC
7   ## use, so we explicitly test for these.
8
9   my %replication_required = (
10     'Moose' => '0.87',
11     'MooseX::AttributeHelpers' => '0.20',
12     'MooseX::Types' => '0.16',
13     'namespace::clean' => '0.11',
14     'Hash::Merge' => '0.11'
15   );
16
17   my @didnt_load;
18
19   for my $module (keys %replication_required) {
20         eval "use $module $replication_required{$module}";
21         push @didnt_load, "$module $replication_required{$module}"
22          if $@;
23   }
24
25   croak("@{[ join ', ', @didnt_load ]} are missing and are required for Replication")
26     if @didnt_load;
27 }
28
29 use Moose;
30 use DBIx::Class::Storage::DBI;
31 use DBIx::Class::Storage::DBI::Replicated::Pool;
32 use DBIx::Class::Storage::DBI::Replicated::Balancer;
33 use DBIx::Class::Storage::DBI::Replicated::Types qw/BalancerClassNamePart DBICSchema DBICStorageDBI/;
34 use MooseX::Types::Moose qw/ClassName HashRef Object/;
35 use Scalar::Util 'reftype';
36 use Carp::Clan qw/^DBIx::Class/;
37 use Hash::Merge 'merge';
38
39 use namespace::clean -except => 'meta';
40
41 =head1 NAME
42
43 DBIx::Class::Storage::DBI::Replicated - BETA Replicated database support
44
45 =head1 SYNOPSIS
46
47 The Following example shows how to change an existing $schema to a replicated
48 storage type, add some replicated (readonly) databases, and perform reporting
49 tasks.
50
51 You should set the 'storage_type attribute to a replicated type.  You should
52 also define your arguments, such as which balancer you want and any arguments
53 that the Pool object should get.
54
55   $schema->storage_type( ['::DBI::Replicated', {balancer=>'::Random'}] );
56
57 Next, you need to add in the Replicants.  Basically this is an array of 
58 arrayrefs, where each arrayref is database connect information.  Think of these
59 arguments as what you'd pass to the 'normal' $schema->connect method.
60
61   $schema->storage->connect_replicants(
62     [$dsn1, $user, $pass, \%opts],
63     [$dsn2, $user, $pass, \%opts],
64     [$dsn3, $user, $pass, \%opts],
65   );
66
67 Now, just use the $schema as you normally would.  Automatically all reads will
68 be delegated to the replicants, while writes to the master.
69
70   $schema->resultset('Source')->search({name=>'etc'});
71
72 You can force a given query to use a particular storage using the search
73 attribute 'force_pool'.  For example:
74
75   my $RS = $schema->resultset('Source')->search(undef, {force_pool=>'master'});
76
77 Now $RS will force everything (both reads and writes) to use whatever was setup
78 as the master storage.  'master' is hardcoded to always point to the Master, 
79 but you can also use any Replicant name.  Please see:
80 L<DBIx::Class::Storage::DBI::Replicated::Pool> and the replicants attribute for more.
81
82 Also see transactions and L</execute_reliably> for alternative ways to
83 force read traffic to the master.  In general, you should wrap your statements
84 in a transaction when you are reading and writing to the same tables at the
85 same time, since your replicants will often lag a bit behind the master.
86
87 See L<DBIx::Class::Storage::DBI::Replicated::Instructions> for more help and
88 walkthroughs.
89
90 =head1 DESCRIPTION
91
92 Warning: This class is marked BETA.  This has been running a production
93 website using MySQL native replication as its backend and we have some decent
94 test coverage but the code hasn't yet been stressed by a variety of databases.
95 Individual DB's may have quirks we are not aware of.  Please use this in first
96 development and pass along your experiences/bug fixes.
97
98 This class implements replicated data store for DBI. Currently you can define
99 one master and numerous slave database connections. All write-type queries
100 (INSERT, UPDATE, DELETE and even LAST_INSERT_ID) are routed to master
101 database, all read-type queries (SELECTs) go to the slave database.
102
103 Basically, any method request that L<DBIx::Class::Storage::DBI> would normally
104 handle gets delegated to one of the two attributes: L</read_handler> or to
105 L</write_handler>.  Additionally, some methods need to be distributed
106 to all existing storages.  This way our storage class is a drop in replacement
107 for L<DBIx::Class::Storage::DBI>.
108
109 Read traffic is spread across the replicants (slaves) occuring to a user
110 selected algorithm.  The default algorithm is random weighted.
111
112 =head1 NOTES
113
114 The consistancy betweeen master and replicants is database specific.  The Pool
115 gives you a method to validate it's replicants, removing and replacing them
116 when they fail/pass predefined criteria.  Please make careful use of the ways
117 to force a query to run against Master when needed.
118
119 =head1 REQUIREMENTS
120
121 Replicated Storage has additional requirements not currently part of L<DBIx::Class>
122
123   Moose => '0.87',
124   MooseX::AttributeHelpers => '0.20',
125   MooseX::Types => '0.16',
126   namespace::clean => '0.11',
127   Hash::Merge => '0.11'
128
129 You will need to install these modules manually via CPAN or make them part of the
130 Makefile for your distribution.
131
132 =head1 ATTRIBUTES
133
134 This class defines the following attributes.
135
136 =head2 schema
137
138 The underlying L<DBIx::Class::Schema> object this storage is attaching
139
140 =cut
141
142 has 'schema' => (
143     is=>'rw',
144     isa=>DBICSchema,
145     weak_ref=>1,
146     required=>1,
147 );
148
149 =head2 pool_type
150
151 Contains the classname which will instantiate the L</pool> object.  Defaults 
152 to: L<DBIx::Class::Storage::DBI::Replicated::Pool>.
153
154 =cut
155
156 has 'pool_type' => (
157   is=>'rw',
158   isa=>ClassName,
159   default=>'DBIx::Class::Storage::DBI::Replicated::Pool',
160   handles=>{
161     'create_pool' => 'new',
162   },
163 );
164
165 =head2 pool_args
166
167 Contains a hashref of initialized information to pass to the Balancer object.
168 See L<DBIx::Class::Storage::DBI::Replicated::Pool> for available arguments.
169
170 =cut
171
172 has 'pool_args' => (
173   is=>'rw',
174   isa=>HashRef,
175   lazy=>1,
176   default=>sub { {} },
177 );
178
179
180 =head2 balancer_type
181
182 The replication pool requires a balance class to provider the methods for
183 choose how to spread the query load across each replicant in the pool.
184
185 =cut
186
187 has 'balancer_type' => (
188   is=>'rw',
189   isa=>BalancerClassNamePart,
190   coerce=>1,
191   required=>1,
192   default=> 'DBIx::Class::Storage::DBI::Replicated::Balancer::First',
193   handles=>{
194     'create_balancer' => 'new',
195   },
196 );
197
198 =head2 balancer_args
199
200 Contains a hashref of initialized information to pass to the Balancer object.
201 See L<DBIx::Class::Storage::DBI::Replicated::Balancer> for available arguments.
202
203 =cut
204
205 has 'balancer_args' => (
206   is=>'rw',
207   isa=>HashRef,
208   lazy=>1,
209   required=>1,
210   default=>sub { {} },
211 );
212
213 =head2 pool
214
215 Is a <DBIx::Class::Storage::DBI::Replicated::Pool> or derived class.  This is a
216 container class for one or more replicated databases.
217
218 =cut
219
220 has 'pool' => (
221   is=>'ro',
222   isa=>'DBIx::Class::Storage::DBI::Replicated::Pool',
223   lazy_build=>1,
224   handles=>[qw/
225     connect_replicants    
226     replicants
227     has_replicants
228   /],
229 );
230
231 =head2 balancer
232
233 Is a <DBIx::Class::Storage::DBI::Replicated::Balancer> or derived class.  This 
234 is a class that takes a pool (<DBIx::Class::Storage::DBI::Replicated::Pool>)
235
236 =cut
237
238 has 'balancer' => (
239   is=>'rw',
240   isa=>'DBIx::Class::Storage::DBI::Replicated::Balancer',
241   lazy_build=>1,
242   handles=>[qw/auto_validate_every/],
243 );
244
245 =head2 master
246
247 The master defines the canonical state for a pool of connected databases.  All
248 the replicants are expected to match this databases state.  Thus, in a classic
249 Master / Slaves distributed system, all the slaves are expected to replicate
250 the Master's state as quick as possible.  This is the only database in the
251 pool of databases that is allowed to handle write traffic.
252
253 =cut
254
255 has 'master' => (
256   is=> 'ro',
257   isa=>DBICStorageDBI,
258   lazy_build=>1,
259 );
260
261 =head1 ATTRIBUTES IMPLEMENTING THE DBIx::Storage::DBI INTERFACE
262
263 The following methods are delegated all the methods required for the 
264 L<DBIx::Class::Storage::DBI> interface.
265
266 =head2 read_handler
267
268 Defines an object that implements the read side of L<BIx::Class::Storage::DBI>.
269
270 =cut
271
272 has 'read_handler' => (
273   is=>'rw',
274   isa=>Object,
275   lazy_build=>1,
276   handles=>[qw/
277     select
278     select_single
279     columns_info_for
280   /],    
281 );
282
283 =head2 write_handler
284
285 Defines an object that implements the write side of L<BIx::Class::Storage::DBI>.
286
287 =cut
288
289 has 'write_handler' => (
290   is=>'ro',
291   isa=>Object,
292   lazy_build=>1,
293   handles=>[qw/   
294     on_connect_do
295     on_disconnect_do       
296     connect_info
297     throw_exception
298     sql_maker
299     sqlt_type
300     create_ddl_dir
301     deployment_statements
302     datetime_parser
303     datetime_parser_type  
304     build_datetime_parser      
305     last_insert_id
306     insert
307     insert_bulk
308     update
309     delete
310     dbh
311     txn_begin
312     txn_do
313     txn_commit
314     txn_rollback
315     txn_scope_guard
316     sth
317     deploy
318     with_deferred_fk_checks
319         dbh_do
320     reload_row
321         with_deferred_fk_checks
322     _prep_for_execute
323
324         backup
325         is_datatype_numeric
326         _count_select
327         _subq_count_select
328         _subq_update_delete 
329         svp_rollback
330         svp_begin
331         svp_release
332   /],
333 );
334
335 has _master_connect_info_opts =>
336   (is => 'rw', isa => HashRef, default => sub { {} });
337
338 =head2 around: connect_info
339
340 Preserve master's C<connect_info> options (for merging with replicants.)
341 Also set any Replicated related options from connect_info, such as
342 C<pool_type>, C<pool_args>, C<balancer_type> and C<balancer_args>.
343
344 =cut
345
346 around connect_info => sub {
347   my ($next, $self, $info, @extra) = @_;
348
349   my $wantarray = wantarray;
350
351   my %opts;
352   for my $arg (@$info) {
353     next unless (reftype($arg)||'') eq 'HASH';
354     %opts = %{ merge($arg, \%opts) };
355   }
356   delete $opts{dsn};
357
358   if (@opts{qw/pool_type pool_args/}) {
359     $self->pool_type(delete $opts{pool_type})
360       if $opts{pool_type};
361
362     $self->pool_args(
363       merge((delete $opts{pool_args} || {}), $self->pool_args)
364     );
365
366     $self->pool($self->_build_pool)
367         if $self->pool;
368   }
369
370   if (@opts{qw/balancer_type balancer_args/}) {
371     $self->balancer_type(delete $opts{balancer_type})
372       if $opts{balancer_type};
373
374     $self->balancer_args(
375       merge((delete $opts{balancer_args} || {}), $self->balancer_args)
376     );
377
378     $self->balancer($self->_build_balancer)
379         if $self->balancer;
380   }
381
382   $self->_master_connect_info_opts(\%opts);
383
384   my (@res, $res);
385   if ($wantarray) {
386     @res = $self->$next($info, @extra);
387   } else {
388     $res = $self->$next($info, @extra);
389   }
390
391   # Make sure master is blessed into the correct class and apply role to it.
392   my $master = $self->master;
393   $master->_determine_driver;
394   Moose::Meta::Class->initialize(ref $master);
395   DBIx::Class::Storage::DBI::Replicated::WithDSN->meta->apply($master);
396
397   $wantarray ? @res : $res;
398 };
399
400 =head1 METHODS
401
402 This class defines the following methods.
403
404 =head2 BUILDARGS
405
406 L<DBIx::Class::Schema> when instantiating it's storage passed itself as the
407 first argument.  So we need to massage the arguments a bit so that all the
408 bits get put into the correct places.
409
410 =cut
411
412 sub BUILDARGS {
413   my ($class, $schema, $storage_type_args, @args) = @_; 
414
415   return {
416         schema=>$schema, 
417         %$storage_type_args,
418         @args
419   }
420 }
421
422 =head2 _build_master
423
424 Lazy builder for the L</master> attribute.
425
426 =cut
427
428 sub _build_master {
429   my $self = shift @_;
430   my $master = DBIx::Class::Storage::DBI->new($self->schema);
431   $master
432 }
433
434 =head2 _build_pool
435
436 Lazy builder for the L</pool> attribute.
437
438 =cut
439
440 sub _build_pool {
441   my $self = shift @_;
442   $self->create_pool(%{$self->pool_args});
443 }
444
445 =head2 _build_balancer
446
447 Lazy builder for the L</balancer> attribute.  This takes a Pool object so that
448 the balancer knows which pool it's balancing.
449
450 =cut
451
452 sub _build_balancer {
453   my $self = shift @_;
454   $self->create_balancer(
455     pool=>$self->pool, 
456     master=>$self->master,
457     %{$self->balancer_args},
458   );
459 }
460
461 =head2 _build_write_handler
462
463 Lazy builder for the L</write_handler> attribute.  The default is to set this to
464 the L</master>.
465
466 =cut
467
468 sub _build_write_handler {
469   return shift->master;
470 }
471
472 =head2 _build_read_handler
473
474 Lazy builder for the L</read_handler> attribute.  The default is to set this to
475 the L</balancer>.
476
477 =cut
478
479 sub _build_read_handler {
480   return shift->balancer;
481 }
482
483 =head2 around: connect_replicants
484
485 All calls to connect_replicants needs to have an existing $schema tacked onto
486 top of the args, since L<DBIx::Storage::DBI> needs it, and any C<connect_info>
487 options merged with the master, with replicant opts having higher priority.
488
489 =cut
490
491 around connect_replicants => sub {
492   my ($next, $self, @args) = @_;
493
494   for my $r (@args) {
495     $r = [ $r ] unless reftype $r eq 'ARRAY';
496
497     croak "coderef replicant connect_info not supported"
498       if ref $r->[0] && reftype $r->[0] eq 'CODE';
499
500 # any connect_info options?
501     my $i = 0;
502     $i++ while $i < @$r && (reftype($r->[$i])||'') ne 'HASH';
503
504 # make one if none    
505     $r->[$i] = {} unless $r->[$i];
506
507 # merge if two hashes
508     my @hashes = @$r[$i .. $#{$r}];
509
510     croak "invalid connect_info options"
511       if (grep { reftype($_) eq 'HASH' } @hashes) != @hashes;
512
513     croak "too many hashrefs in connect_info"
514       if @hashes > 2;
515
516     my %opts = %{ merge(reverse @hashes) };
517
518 # delete them
519     splice @$r, $i+1, ($#{$r} - $i), ();
520
521 # merge with master
522     %opts = %{ merge(\%opts, $self->_master_connect_info_opts) };
523
524 # update
525     $r->[$i] = \%opts;
526   }
527
528   $self->$next($self->schema, @args);
529 };
530
531 =head2 all_storages
532
533 Returns an array of of all the connected storage backends.  The first element
534 in the returned array is the master, and the remainings are each of the
535 replicants.
536
537 =cut
538
539 sub all_storages {
540   my $self = shift @_;
541   return grep {defined $_ && blessed $_} (
542      $self->master,
543      values %{ $self->replicants },
544   );
545 }
546
547 =head2 execute_reliably ($coderef, ?@args)
548
549 Given a coderef, saves the current state of the L</read_handler>, forces it to
550 use reliable storage (ie sets it to the master), executes a coderef and then
551 restores the original state.
552
553 Example:
554
555   my $reliably = sub {
556     my $name = shift @_;
557     $schema->resultset('User')->create({name=>$name});
558     my $user_rs = $schema->resultset('User')->find({name=>$name}); 
559     return $user_rs;
560   };
561
562   my $user_rs = $schema->storage->execute_reliably($reliably, 'John');
563
564 Use this when you must be certain of your database state, such as when you just
565 inserted something and need to get a resultset including it, etc.
566
567 =cut
568
569 sub execute_reliably {
570   my ($self, $coderef, @args) = @_;
571
572   unless( ref $coderef eq 'CODE') {
573     $self->throw_exception('Second argument must be a coderef');
574   }
575
576   ##Get copy of master storage
577   my $master = $self->master;
578
579   ##Get whatever the current read hander is
580   my $current = $self->read_handler;
581
582   ##Set the read handler to master
583   $self->read_handler($master);
584
585   ## do whatever the caller needs
586   my @result;
587   my $want_array = wantarray;
588
589   eval {
590     if($want_array) {
591       @result = $coderef->(@args);
592     } elsif(defined $want_array) {
593       ($result[0]) = ($coderef->(@args));
594     } else {
595       $coderef->(@args);
596     }       
597   };
598
599   ##Reset to the original state
600   $self->read_handler($current); 
601
602   ##Exception testing has to come last, otherwise you might leave the 
603   ##read_handler set to master.
604
605   if($@) {
606     $self->throw_exception("coderef returned an error: $@");
607   } else {
608     return $want_array ? @result : $result[0];
609   }
610 }
611
612 =head2 set_reliable_storage
613
614 Sets the current $schema to be 'reliable', that is all queries, both read and
615 write are sent to the master
616
617 =cut
618
619 sub set_reliable_storage {
620   my $self = shift @_;
621   my $schema = $self->schema;
622   my $write_handler = $self->schema->storage->write_handler;
623
624   $schema->storage->read_handler($write_handler);
625 }
626
627 =head2 set_balanced_storage
628
629 Sets the current $schema to be use the </balancer> for all reads, while all
630 writea are sent to the master only
631
632 =cut
633
634 sub set_balanced_storage {
635   my $self = shift @_;
636   my $schema = $self->schema;
637   my $balanced_handler = $self->schema->storage->balancer;
638
639   $schema->storage->read_handler($balanced_handler);
640 }
641
642 =head2 connected
643
644 Check that the master and at least one of the replicants is connected.
645
646 =cut
647
648 sub connected {
649   my $self = shift @_;
650   return
651     $self->master->connected &&
652     $self->pool->connected_replicants;
653 }
654
655 =head2 ensure_connected
656
657 Make sure all the storages are connected.
658
659 =cut
660
661 sub ensure_connected {
662   my $self = shift @_;
663   foreach my $source ($self->all_storages) {
664     $source->ensure_connected(@_);
665   }
666 }
667
668 =head2 limit_dialect
669
670 Set the limit_dialect for all existing storages
671
672 =cut
673
674 sub limit_dialect {
675   my $self = shift @_;
676   foreach my $source ($self->all_storages) {
677     $source->limit_dialect(@_);
678   }
679   return $self->master->quote_char;
680 }
681
682 =head2 quote_char
683
684 Set the quote_char for all existing storages
685
686 =cut
687
688 sub quote_char {
689   my $self = shift @_;
690   foreach my $source ($self->all_storages) {
691     $source->quote_char(@_);
692   }
693   return $self->master->quote_char;
694 }
695
696 =head2 name_sep
697
698 Set the name_sep for all existing storages
699
700 =cut
701
702 sub name_sep {
703   my $self = shift @_;
704   foreach my $source ($self->all_storages) {
705     $source->name_sep(@_);
706   }
707   return $self->master->name_sep;
708 }
709
710 =head2 set_schema
711
712 Set the schema object for all existing storages
713
714 =cut
715
716 sub set_schema {
717   my $self = shift @_;
718   foreach my $source ($self->all_storages) {
719     $source->set_schema(@_);
720   }
721 }
722
723 =head2 debug
724
725 set a debug flag across all storages
726
727 =cut
728
729 sub debug {
730   my $self = shift @_;
731   if(@_) {
732     foreach my $source ($self->all_storages) {
733       $source->debug(@_);
734     }   
735   }
736   return $self->master->debug;
737 }
738
739 =head2 debugobj
740
741 set a debug object across all storages
742
743 =cut
744
745 sub debugobj {
746   my $self = shift @_;
747   if(@_) {
748     foreach my $source ($self->all_storages) {
749       $source->debugobj(@_);
750     }   
751   }
752   return $self->master->debugobj;
753 }
754
755 =head2 debugfh
756
757 set a debugfh object across all storages
758
759 =cut
760
761 sub debugfh {
762   my $self = shift @_;
763   if(@_) {
764     foreach my $source ($self->all_storages) {
765       $source->debugfh(@_);
766     }   
767   }
768   return $self->master->debugfh;
769 }
770
771 =head2 debugcb
772
773 set a debug callback across all storages
774
775 =cut
776
777 sub debugcb {
778   my $self = shift @_;
779   if(@_) {
780     foreach my $source ($self->all_storages) {
781       $source->debugcb(@_);
782     }   
783   }
784   return $self->master->debugcb;
785 }
786
787 =head2 disconnect
788
789 disconnect everything
790
791 =cut
792
793 sub disconnect {
794   my $self = shift @_;
795   foreach my $source ($self->all_storages) {
796     $source->disconnect(@_);
797   }
798 }
799
800 =head2 cursor_class
801
802 set cursor class on all storages, or return master's
803
804 =cut
805
806 sub cursor_class {
807   my ($self, $cursor_class) = @_;
808
809   if ($cursor_class) {
810     $_->cursor_class($cursor_class) for $self->all_storages;
811   }
812   $self->master->cursor_class;
813 }
814
815 =head1 GOTCHAS
816
817 Due to the fact that replicants can lag behind a master, you must take care to
818 make sure you use one of the methods to force read queries to a master should
819 you need realtime data integrity.  For example, if you insert a row, and then
820 immediately re-read it from the database (say, by doing $row->discard_changes)
821 or you insert a row and then immediately build a query that expects that row
822 to be an item, you should force the master to handle reads.  Otherwise, due to
823 the lag, there is no certainty your data will be in the expected state.
824
825 For data integrity, all transactions automatically use the master storage for
826 all read and write queries.  Using a transaction is the preferred and recommended
827 method to force the master to handle all read queries.
828
829 Otherwise, you can force a single query to use the master with the 'force_pool'
830 attribute:
831
832   my $row = $resultset->search(undef, {force_pool=>'master'})->find($pk);
833
834 This attribute will safely be ignore by non replicated storages, so you can use
835 the same code for both types of systems.
836
837 Lastly, you can use the L</execute_reliably> method, which works very much like
838 a transaction.
839
840 For debugging, you can turn replication on/off with the methods L</set_reliable_storage>
841 and L</set_balanced_storage>, however this operates at a global level and is not
842 suitable if you have a shared Schema object being used by multiple processes,
843 such as on a web application server.  You can get around this limitation by
844 using the Schema clone method.
845
846   my $new_schema = $schema->clone;
847   $new_schema->set_reliable_storage;
848
849   ## $new_schema will use only the Master storage for all reads/writes while
850   ## the $schema object will use replicated storage.
851
852 =head1 AUTHOR
853
854   John Napiorkowski <john.napiorkowski@takkle.com>
855
856 Based on code originated by:
857
858   Norbert Csongrádi <bert@cpan.org>
859   Peter Siklósi <einon@einon.hu>
860
861 =head1 LICENSE
862
863 You may distribute this code under the same terms as Perl itself.
864
865 =cut
866
867 __PACKAGE__->meta->make_immutable;
868
869 1;