Cleanup exception handling
[dbsrgits/DBIx-Class.git] / lib / DBIx / Class / Storage / DBI / Replicated.pm
1 package DBIx::Class::Storage::DBI::Replicated;
2
3 BEGIN {
4   use Carp::Clan qw/^DBIx::Class/;
5
6   ## Modules required for Replication support not required for general DBIC
7   ## use, so we explicitly test for these.
8
9   my %replication_required = (
10     'Moose' => '0.87',
11     'MooseX::AttributeHelpers' => '0.21',
12     'MooseX::Types' => '0.16',
13     'namespace::clean' => '0.11',
14     'Hash::Merge' => '0.11'
15   );
16
17   my @didnt_load;
18
19   for my $module (keys %replication_required) {
20     eval "use $module $replication_required{$module}";
21     push @didnt_load, "$module $replication_required{$module}"
22       if $@;
23   }
24
25   croak("@{[ join ', ', @didnt_load ]} are missing and are required for Replication")
26     if @didnt_load;
27 }
28
29 use Moose;
30 use DBIx::Class::Storage::DBI;
31 use DBIx::Class::Storage::DBI::Replicated::Pool;
32 use DBIx::Class::Storage::DBI::Replicated::Balancer;
33 use DBIx::Class::Storage::DBI::Replicated::Types qw/BalancerClassNamePart DBICSchema DBICStorageDBI/;
34 use MooseX::Types::Moose qw/ClassName HashRef Object/;
35 use Scalar::Util 'reftype';
36 use Hash::Merge 'merge';
37
38 use namespace::clean -except => 'meta';
39
40 =head1 NAME
41
42 DBIx::Class::Storage::DBI::Replicated - BETA Replicated database support
43
44 =head1 SYNOPSIS
45
46 The Following example shows how to change an existing $schema to a replicated
47 storage type, add some replicated (readonly) databases, and perform reporting
48 tasks.
49
50 You should set the 'storage_type attribute to a replicated type.  You should
51 also define your arguments, such as which balancer you want and any arguments
52 that the Pool object should get.
53
54   $schema->storage_type( ['::DBI::Replicated', {balancer=>'::Random'}] );
55
56 Next, you need to add in the Replicants.  Basically this is an array of 
57 arrayrefs, where each arrayref is database connect information.  Think of these
58 arguments as what you'd pass to the 'normal' $schema->connect method.
59
60   $schema->storage->connect_replicants(
61     [$dsn1, $user, $pass, \%opts],
62     [$dsn2, $user, $pass, \%opts],
63     [$dsn3, $user, $pass, \%opts],
64   );
65
66 Now, just use the $schema as you normally would.  Automatically all reads will
67 be delegated to the replicants, while writes to the master.
68
69   $schema->resultset('Source')->search({name=>'etc'});
70
71 You can force a given query to use a particular storage using the search
72 attribute 'force_pool'.  For example:
73
74   my $RS = $schema->resultset('Source')->search(undef, {force_pool=>'master'});
75
76 Now $RS will force everything (both reads and writes) to use whatever was setup
77 as the master storage.  'master' is hardcoded to always point to the Master, 
78 but you can also use any Replicant name.  Please see:
79 L<DBIx::Class::Storage::DBI::Replicated::Pool> and the replicants attribute for more.
80
81 Also see transactions and L</execute_reliably> for alternative ways to
82 force read traffic to the master.  In general, you should wrap your statements
83 in a transaction when you are reading and writing to the same tables at the
84 same time, since your replicants will often lag a bit behind the master.
85
86 See L<DBIx::Class::Storage::DBI::Replicated::Instructions> for more help and
87 walkthroughs.
88
89 =head1 DESCRIPTION
90
91 Warning: This class is marked BETA.  This has been running a production
92 website using MySQL native replication as its backend and we have some decent
93 test coverage but the code hasn't yet been stressed by a variety of databases.
94 Individual DB's may have quirks we are not aware of.  Please use this in first
95 development and pass along your experiences/bug fixes.
96
97 This class implements replicated data store for DBI. Currently you can define
98 one master and numerous slave database connections. All write-type queries
99 (INSERT, UPDATE, DELETE and even LAST_INSERT_ID) are routed to master
100 database, all read-type queries (SELECTs) go to the slave database.
101
102 Basically, any method request that L<DBIx::Class::Storage::DBI> would normally
103 handle gets delegated to one of the two attributes: L</read_handler> or to
104 L</write_handler>.  Additionally, some methods need to be distributed
105 to all existing storages.  This way our storage class is a drop in replacement
106 for L<DBIx::Class::Storage::DBI>.
107
108 Read traffic is spread across the replicants (slaves) occuring to a user
109 selected algorithm.  The default algorithm is random weighted.
110
111 =head1 NOTES
112
113 The consistancy betweeen master and replicants is database specific.  The Pool
114 gives you a method to validate its replicants, removing and replacing them
115 when they fail/pass predefined criteria.  Please make careful use of the ways
116 to force a query to run against Master when needed.
117
118 =head1 REQUIREMENTS
119
120 Replicated Storage has additional requirements not currently part of L<DBIx::Class>
121
122   Moose => '0.87',
123   MooseX::AttributeHelpers => '0.20',
124   MooseX::Types => '0.16',
125   namespace::clean => '0.11',
126   Hash::Merge => '0.11'
127
128 You will need to install these modules manually via CPAN or make them part of the
129 Makefile for your distribution.
130
131 =head1 ATTRIBUTES
132
133 This class defines the following attributes.
134
135 =head2 schema
136
137 The underlying L<DBIx::Class::Schema> object this storage is attaching
138
139 =cut
140
141 has 'schema' => (
142     is=>'rw',
143     isa=>DBICSchema,
144     weak_ref=>1,
145     required=>1,
146 );
147
148 =head2 pool_type
149
150 Contains the classname which will instantiate the L</pool> object.  Defaults 
151 to: L<DBIx::Class::Storage::DBI::Replicated::Pool>.
152
153 =cut
154
155 has 'pool_type' => (
156   is=>'rw',
157   isa=>ClassName,
158   default=>'DBIx::Class::Storage::DBI::Replicated::Pool',
159   handles=>{
160     'create_pool' => 'new',
161   },
162 );
163
164 =head2 pool_args
165
166 Contains a hashref of initialized information to pass to the Balancer object.
167 See L<DBIx::Class::Storage::DBI::Replicated::Pool> for available arguments.
168
169 =cut
170
171 has 'pool_args' => (
172   is=>'rw',
173   isa=>HashRef,
174   lazy=>1,
175   default=>sub { {} },
176 );
177
178
179 =head2 balancer_type
180
181 The replication pool requires a balance class to provider the methods for
182 choose how to spread the query load across each replicant in the pool.
183
184 =cut
185
186 has 'balancer_type' => (
187   is=>'rw',
188   isa=>BalancerClassNamePart,
189   coerce=>1,
190   required=>1,
191   default=> 'DBIx::Class::Storage::DBI::Replicated::Balancer::First',
192   handles=>{
193     'create_balancer' => 'new',
194   },
195 );
196
197 =head2 balancer_args
198
199 Contains a hashref of initialized information to pass to the Balancer object.
200 See L<DBIx::Class::Storage::DBI::Replicated::Balancer> for available arguments.
201
202 =cut
203
204 has 'balancer_args' => (
205   is=>'rw',
206   isa=>HashRef,
207   lazy=>1,
208   required=>1,
209   default=>sub { {} },
210 );
211
212 =head2 pool
213
214 Is a <DBIx::Class::Storage::DBI::Replicated::Pool> or derived class.  This is a
215 container class for one or more replicated databases.
216
217 =cut
218
219 has 'pool' => (
220   is=>'ro',
221   isa=>'DBIx::Class::Storage::DBI::Replicated::Pool',
222   lazy_build=>1,
223   handles=>[qw/
224     connect_replicants
225     replicants
226     has_replicants
227   /],
228 );
229
230 =head2 balancer
231
232 Is a <DBIx::Class::Storage::DBI::Replicated::Balancer> or derived class.  This 
233 is a class that takes a pool (<DBIx::Class::Storage::DBI::Replicated::Pool>)
234
235 =cut
236
237 has 'balancer' => (
238   is=>'rw',
239   isa=>'DBIx::Class::Storage::DBI::Replicated::Balancer',
240   lazy_build=>1,
241   handles=>[qw/auto_validate_every/],
242 );
243
244 =head2 master
245
246 The master defines the canonical state for a pool of connected databases.  All
247 the replicants are expected to match this databases state.  Thus, in a classic
248 Master / Slaves distributed system, all the slaves are expected to replicate
249 the Master's state as quick as possible.  This is the only database in the
250 pool of databases that is allowed to handle write traffic.
251
252 =cut
253
254 has 'master' => (
255   is=> 'ro',
256   isa=>DBICStorageDBI,
257   lazy_build=>1,
258 );
259
260 =head1 ATTRIBUTES IMPLEMENTING THE DBIx::Storage::DBI INTERFACE
261
262 The following methods are delegated all the methods required for the 
263 L<DBIx::Class::Storage::DBI> interface.
264
265 =head2 read_handler
266
267 Defines an object that implements the read side of L<BIx::Class::Storage::DBI>.
268
269 =cut
270
271 has 'read_handler' => (
272   is=>'rw',
273   isa=>Object,
274   lazy_build=>1,
275   handles=>[qw/
276     select
277     select_single
278     columns_info_for
279   /],
280 );
281
282 =head2 write_handler
283
284 Defines an object that implements the write side of L<BIx::Class::Storage::DBI>.
285
286 =cut
287
288 has 'write_handler' => (
289   is=>'ro',
290   isa=>Object,
291   lazy_build=>1,
292   handles=>[qw/
293     on_connect_do
294     on_disconnect_do
295     connect_info
296     throw_exception
297     sql_maker
298     sqlt_type
299     create_ddl_dir
300     deployment_statements
301     datetime_parser
302     datetime_parser_type
303     build_datetime_parser
304     last_insert_id
305     insert
306     insert_bulk
307     update
308     delete
309     dbh
310     txn_begin
311     txn_do
312     txn_commit
313     txn_rollback
314     txn_scope_guard
315     sth
316     deploy
317     with_deferred_fk_checks
318     dbh_do
319     reload_row
320     with_deferred_fk_checks
321     _prep_for_execute
322
323     backup
324     is_datatype_numeric
325     _count_select
326     _subq_count_select
327     _subq_update_delete
328     _order_select_columns
329     svp_rollback
330     svp_begin
331     svp_release
332   /],
333 );
334
335 has _master_connect_info_opts =>
336   (is => 'rw', isa => HashRef, default => sub { {} });
337
338 =head2 around: connect_info
339
340 Preserve master's C<connect_info> options (for merging with replicants.)
341 Also set any Replicated related options from connect_info, such as
342 C<pool_type>, C<pool_args>, C<balancer_type> and C<balancer_args>.
343
344 =cut
345
346 around connect_info => sub {
347   my ($next, $self, $info, @extra) = @_;
348
349   my $wantarray = wantarray;
350
351   my %opts;
352   for my $arg (@$info) {
353     next unless (reftype($arg)||'') eq 'HASH';
354     %opts = %{ merge($arg, \%opts) };
355   }
356   delete $opts{dsn};
357
358   if (@opts{qw/pool_type pool_args/}) {
359     $self->pool_type(delete $opts{pool_type})
360       if $opts{pool_type};
361
362     $self->pool_args(
363       merge((delete $opts{pool_args} || {}), $self->pool_args)
364     );
365
366     $self->pool($self->_build_pool)
367       if $self->pool;
368   }
369
370   if (@opts{qw/balancer_type balancer_args/}) {
371     $self->balancer_type(delete $opts{balancer_type})
372       if $opts{balancer_type};
373
374     $self->balancer_args(
375       merge((delete $opts{balancer_args} || {}), $self->balancer_args)
376     );
377
378     $self->balancer($self->_build_balancer)
379       if $self->balancer;
380   }
381
382   $self->_master_connect_info_opts(\%opts);
383
384   my (@res, $res);
385   if ($wantarray) {
386     @res = $self->$next($info, @extra);
387   } else {
388     $res = $self->$next($info, @extra);
389   }
390
391   # Make sure master is blessed into the correct class and apply role to it.
392   my $master = $self->master;
393   $master->_determine_driver;
394   Moose::Meta::Class->initialize(ref $master);
395   DBIx::Class::Storage::DBI::Replicated::WithDSN->meta->apply($master);
396
397   $wantarray ? @res : $res;
398 };
399
400 =head1 METHODS
401
402 This class defines the following methods.
403
404 =head2 BUILDARGS
405
406 L<DBIx::Class::Schema> when instantiating its storage passed itself as the
407 first argument.  So we need to massage the arguments a bit so that all the
408 bits get put into the correct places.
409
410 =cut
411
412 sub BUILDARGS {
413   my ($class, $schema, $storage_type_args, @args) = @_; 
414
415   return {
416     schema=>$schema,
417     %$storage_type_args,
418     @args
419   }
420 }
421
422 =head2 _build_master
423
424 Lazy builder for the L</master> attribute.
425
426 =cut
427
428 sub _build_master {
429   my $self = shift @_;
430   my $master = DBIx::Class::Storage::DBI->new($self->schema);
431   $master
432 }
433
434 =head2 _build_pool
435
436 Lazy builder for the L</pool> attribute.
437
438 =cut
439
440 sub _build_pool {
441   my $self = shift @_;
442   $self->create_pool(%{$self->pool_args});
443 }
444
445 =head2 _build_balancer
446
447 Lazy builder for the L</balancer> attribute.  This takes a Pool object so that
448 the balancer knows which pool it's balancing.
449
450 =cut
451
452 sub _build_balancer {
453   my $self = shift @_;
454   $self->create_balancer(
455     pool=>$self->pool,
456     master=>$self->master,
457     %{$self->balancer_args},
458   );
459 }
460
461 =head2 _build_write_handler
462
463 Lazy builder for the L</write_handler> attribute.  The default is to set this to
464 the L</master>.
465
466 =cut
467
468 sub _build_write_handler {
469   return shift->master;
470 }
471
472 =head2 _build_read_handler
473
474 Lazy builder for the L</read_handler> attribute.  The default is to set this to
475 the L</balancer>.
476
477 =cut
478
479 sub _build_read_handler {
480   return shift->balancer;
481 }
482
483 =head2 around: connect_replicants
484
485 All calls to connect_replicants needs to have an existing $schema tacked onto
486 top of the args, since L<DBIx::Storage::DBI> needs it, and any C<connect_info>
487 options merged with the master, with replicant opts having higher priority.
488
489 =cut
490
491 around connect_replicants => sub {
492   my ($next, $self, @args) = @_;
493
494   for my $r (@args) {
495     $r = [ $r ] unless reftype $r eq 'ARRAY';
496
497     $self->throw_exception('coderef replicant connect_info not supported')
498       if ref $r->[0] && reftype $r->[0] eq 'CODE';
499
500 # any connect_info options?
501     my $i = 0;
502     $i++ while $i < @$r && (reftype($r->[$i])||'') ne 'HASH';
503
504 # make one if none
505     $r->[$i] = {} unless $r->[$i];
506
507 # merge if two hashes
508     my @hashes = @$r[$i .. $#{$r}];
509
510     $self->throw_exception('invalid connect_info options')
511       if (grep { reftype($_) eq 'HASH' } @hashes) != @hashes;
512
513     $self->throw_exception('too many hashrefs in connect_info')
514       if @hashes > 2;
515
516     my %opts = %{ merge(reverse @hashes) };
517
518 # delete them
519     splice @$r, $i+1, ($#{$r} - $i), ();
520
521 # make sure master/replicants opts don't clash
522     my %master_opts = %{ $self->_master_connect_info_opts };
523     if (exists $opts{dbh_maker}) {
524         delete @master_opts{qw/dsn user password/};
525     }
526     delete $master_opts{dbh_maker};
527
528 # merge with master
529     %opts = %{ merge(\%opts, \%master_opts) };
530
531 # update
532     $r->[$i] = \%opts;
533   }
534
535   $self->$next($self->schema, @args);
536 };
537
538 =head2 all_storages
539
540 Returns an array of of all the connected storage backends.  The first element
541 in the returned array is the master, and the remainings are each of the
542 replicants.
543
544 =cut
545
546 sub all_storages {
547   my $self = shift @_;
548   return grep {defined $_ && blessed $_} (
549      $self->master,
550      values %{ $self->replicants },
551   );
552 }
553
554 =head2 execute_reliably ($coderef, ?@args)
555
556 Given a coderef, saves the current state of the L</read_handler>, forces it to
557 use reliable storage (ie sets it to the master), executes a coderef and then
558 restores the original state.
559
560 Example:
561
562   my $reliably = sub {
563     my $name = shift @_;
564     $schema->resultset('User')->create({name=>$name});
565     my $user_rs = $schema->resultset('User')->find({name=>$name}); 
566     return $user_rs;
567   };
568
569   my $user_rs = $schema->storage->execute_reliably($reliably, 'John');
570
571 Use this when you must be certain of your database state, such as when you just
572 inserted something and need to get a resultset including it, etc.
573
574 =cut
575
576 sub execute_reliably {
577   my ($self, $coderef, @args) = @_;
578
579   unless( ref $coderef eq 'CODE') {
580     $self->throw_exception('Second argument must be a coderef');
581   }
582
583   ##Get copy of master storage
584   my $master = $self->master;
585
586   ##Get whatever the current read hander is
587   my $current = $self->read_handler;
588
589   ##Set the read handler to master
590   $self->read_handler($master);
591
592   ## do whatever the caller needs
593   my @result;
594   my $want_array = wantarray;
595
596   eval {
597     if($want_array) {
598       @result = $coderef->(@args);
599     } elsif(defined $want_array) {
600       ($result[0]) = ($coderef->(@args));
601     } else {
602       $coderef->(@args);
603     }
604   };
605
606   ##Reset to the original state
607   $self->read_handler($current);
608
609   ##Exception testing has to come last, otherwise you might leave the 
610   ##read_handler set to master.
611
612   if($@) {
613     $self->throw_exception("coderef returned an error: $@");
614   } else {
615     return $want_array ? @result : $result[0];
616   }
617 }
618
619 =head2 set_reliable_storage
620
621 Sets the current $schema to be 'reliable', that is all queries, both read and
622 write are sent to the master
623
624 =cut
625
626 sub set_reliable_storage {
627   my $self = shift @_;
628   my $schema = $self->schema;
629   my $write_handler = $self->schema->storage->write_handler;
630
631   $schema->storage->read_handler($write_handler);
632 }
633
634 =head2 set_balanced_storage
635
636 Sets the current $schema to be use the </balancer> for all reads, while all
637 writea are sent to the master only
638
639 =cut
640
641 sub set_balanced_storage {
642   my $self = shift @_;
643   my $schema = $self->schema;
644   my $balanced_handler = $self->schema->storage->balancer;
645
646   $schema->storage->read_handler($balanced_handler);
647 }
648
649 =head2 connected
650
651 Check that the master and at least one of the replicants is connected.
652
653 =cut
654
655 sub connected {
656   my $self = shift @_;
657   return
658     $self->master->connected &&
659     $self->pool->connected_replicants;
660 }
661
662 =head2 ensure_connected
663
664 Make sure all the storages are connected.
665
666 =cut
667
668 sub ensure_connected {
669   my $self = shift @_;
670   foreach my $source ($self->all_storages) {
671     $source->ensure_connected(@_);
672   }
673 }
674
675 =head2 limit_dialect
676
677 Set the limit_dialect for all existing storages
678
679 =cut
680
681 sub limit_dialect {
682   my $self = shift @_;
683   foreach my $source ($self->all_storages) {
684     $source->limit_dialect(@_);
685   }
686   return $self->master->quote_char;
687 }
688
689 =head2 quote_char
690
691 Set the quote_char for all existing storages
692
693 =cut
694
695 sub quote_char {
696   my $self = shift @_;
697   foreach my $source ($self->all_storages) {
698     $source->quote_char(@_);
699   }
700   return $self->master->quote_char;
701 }
702
703 =head2 name_sep
704
705 Set the name_sep for all existing storages
706
707 =cut
708
709 sub name_sep {
710   my $self = shift @_;
711   foreach my $source ($self->all_storages) {
712     $source->name_sep(@_);
713   }
714   return $self->master->name_sep;
715 }
716
717 =head2 set_schema
718
719 Set the schema object for all existing storages
720
721 =cut
722
723 sub set_schema {
724   my $self = shift @_;
725   foreach my $source ($self->all_storages) {
726     $source->set_schema(@_);
727   }
728 }
729
730 =head2 debug
731
732 set a debug flag across all storages
733
734 =cut
735
736 sub debug {
737   my $self = shift @_;
738   if(@_) {
739     foreach my $source ($self->all_storages) {
740       $source->debug(@_);
741     }
742   }
743   return $self->master->debug;
744 }
745
746 =head2 debugobj
747
748 set a debug object across all storages
749
750 =cut
751
752 sub debugobj {
753   my $self = shift @_;
754   if(@_) {
755     foreach my $source ($self->all_storages) {
756       $source->debugobj(@_);
757     }
758   }
759   return $self->master->debugobj;
760 }
761
762 =head2 debugfh
763
764 set a debugfh object across all storages
765
766 =cut
767
768 sub debugfh {
769   my $self = shift @_;
770   if(@_) {
771     foreach my $source ($self->all_storages) {
772       $source->debugfh(@_);
773     }
774   }
775   return $self->master->debugfh;
776 }
777
778 =head2 debugcb
779
780 set a debug callback across all storages
781
782 =cut
783
784 sub debugcb {
785   my $self = shift @_;
786   if(@_) {
787     foreach my $source ($self->all_storages) {
788       $source->debugcb(@_);
789     }
790   }
791   return $self->master->debugcb;
792 }
793
794 =head2 disconnect
795
796 disconnect everything
797
798 =cut
799
800 sub disconnect {
801   my $self = shift @_;
802   foreach my $source ($self->all_storages) {
803     $source->disconnect(@_);
804   }
805 }
806
807 =head2 cursor_class
808
809 set cursor class on all storages, or return master's
810
811 =cut
812
813 sub cursor_class {
814   my ($self, $cursor_class) = @_;
815
816   if ($cursor_class) {
817     $_->cursor_class($cursor_class) for $self->all_storages;
818   }
819   $self->master->cursor_class;
820 }
821
822 =head1 GOTCHAS
823
824 Due to the fact that replicants can lag behind a master, you must take care to
825 make sure you use one of the methods to force read queries to a master should
826 you need realtime data integrity.  For example, if you insert a row, and then
827 immediately re-read it from the database (say, by doing $row->discard_changes)
828 or you insert a row and then immediately build a query that expects that row
829 to be an item, you should force the master to handle reads.  Otherwise, due to
830 the lag, there is no certainty your data will be in the expected state.
831
832 For data integrity, all transactions automatically use the master storage for
833 all read and write queries.  Using a transaction is the preferred and recommended
834 method to force the master to handle all read queries.
835
836 Otherwise, you can force a single query to use the master with the 'force_pool'
837 attribute:
838
839   my $row = $resultset->search(undef, {force_pool=>'master'})->find($pk);
840
841 This attribute will safely be ignore by non replicated storages, so you can use
842 the same code for both types of systems.
843
844 Lastly, you can use the L</execute_reliably> method, which works very much like
845 a transaction.
846
847 For debugging, you can turn replication on/off with the methods L</set_reliable_storage>
848 and L</set_balanced_storage>, however this operates at a global level and is not
849 suitable if you have a shared Schema object being used by multiple processes,
850 such as on a web application server.  You can get around this limitation by
851 using the Schema clone method.
852
853   my $new_schema = $schema->clone;
854   $new_schema->set_reliable_storage;
855
856   ## $new_schema will use only the Master storage for all reads/writes while
857   ## the $schema object will use replicated storage.
858
859 =head1 AUTHOR
860
861   John Napiorkowski <john.napiorkowski@takkle.com>
862
863 Based on code originated by:
864
865   Norbert Csongrádi <bert@cpan.org>
866   Peter Siklósi <einon@einon.hu>
867
868 =head1 LICENSE
869
870 You may distribute this code under the same terms as Perl itself.
871
872 =cut
873
874 __PACKAGE__->meta->make_immutable;
875
876 1;