Prepare for new SQLA release
[dbsrgits/DBIx-Class.git] / lib / DBIx / Class / Storage / DBI / Replicated.pm
1 package DBIx::Class::Storage::DBI::Replicated;
2
3 BEGIN {
4   use Carp::Clan qw/^DBIx::Class/;
5
6   ## Modules required for Replication support not required for general DBIC
7   ## use, so we explicitly test for these.
8
9   my %replication_required = (
10     'Moose' => '0.90',
11     'MooseX::Types' => '0.21',
12     'namespace::clean' => '0.11',
13     'Hash::Merge' => '0.11'
14   );
15
16   my @didnt_load;
17
18   for my $module (keys %replication_required) {
19     eval "use $module $replication_required{$module}";
20     push @didnt_load, "$module $replication_required{$module}"
21       if $@;
22   }
23
24   croak("@{[ join ', ', @didnt_load ]} are missing and are required for Replication")
25     if @didnt_load;
26 }
27
28 use Moose;
29 use DBIx::Class::Storage::DBI;
30 use DBIx::Class::Storage::DBI::Replicated::Pool;
31 use DBIx::Class::Storage::DBI::Replicated::Balancer;
32 use DBIx::Class::Storage::DBI::Replicated::Types qw/BalancerClassNamePart DBICSchema DBICStorageDBI/;
33 use MooseX::Types::Moose qw/ClassName HashRef Object/;
34 use Scalar::Util 'reftype';
35 use Hash::Merge 'merge';
36
37 use namespace::clean -except => 'meta';
38
39 =head1 NAME
40
41 DBIx::Class::Storage::DBI::Replicated - BETA Replicated database support
42
43 =head1 SYNOPSIS
44
45 The Following example shows how to change an existing $schema to a replicated
46 storage type, add some replicated (readonly) databases, and perform reporting
47 tasks.
48
49 You should set the 'storage_type attribute to a replicated type.  You should
50 also define your arguments, such as which balancer you want and any arguments
51 that the Pool object should get.
52
53   my $schema = Schema::Class->clone;
54   $schema->storage_type( ['::DBI::Replicated', {balancer=>'::Random'}] );
55   $schema->connection(...);
56
57 Next, you need to add in the Replicants.  Basically this is an array of 
58 arrayrefs, where each arrayref is database connect information.  Think of these
59 arguments as what you'd pass to the 'normal' $schema->connect method.
60
61   $schema->storage->connect_replicants(
62     [$dsn1, $user, $pass, \%opts],
63     [$dsn2, $user, $pass, \%opts],
64     [$dsn3, $user, $pass, \%opts],
65   );
66
67 Now, just use the $schema as you normally would.  Automatically all reads will
68 be delegated to the replicants, while writes to the master.
69
70   $schema->resultset('Source')->search({name=>'etc'});
71
72 You can force a given query to use a particular storage using the search
73 attribute 'force_pool'.  For example:
74
75   my $RS = $schema->resultset('Source')->search(undef, {force_pool=>'master'});
76
77 Now $RS will force everything (both reads and writes) to use whatever was setup
78 as the master storage.  'master' is hardcoded to always point to the Master, 
79 but you can also use any Replicant name.  Please see:
80 L<DBIx::Class::Storage::DBI::Replicated::Pool> and the replicants attribute for more.
81
82 Also see transactions and L</execute_reliably> for alternative ways to
83 force read traffic to the master.  In general, you should wrap your statements
84 in a transaction when you are reading and writing to the same tables at the
85 same time, since your replicants will often lag a bit behind the master.
86
87 See L<DBIx::Class::Storage::DBI::Replicated::Instructions> for more help and
88 walkthroughs.
89
90 =head1 DESCRIPTION
91
92 Warning: This class is marked BETA.  This has been running a production
93 website using MySQL native replication as its backend and we have some decent
94 test coverage but the code hasn't yet been stressed by a variety of databases.
95 Individual DB's may have quirks we are not aware of.  Please use this in first
96 development and pass along your experiences/bug fixes.
97
98 This class implements replicated data store for DBI. Currently you can define
99 one master and numerous slave database connections. All write-type queries
100 (INSERT, UPDATE, DELETE and even LAST_INSERT_ID) are routed to master
101 database, all read-type queries (SELECTs) go to the slave database.
102
103 Basically, any method request that L<DBIx::Class::Storage::DBI> would normally
104 handle gets delegated to one of the two attributes: L</read_handler> or to
105 L</write_handler>.  Additionally, some methods need to be distributed
106 to all existing storages.  This way our storage class is a drop in replacement
107 for L<DBIx::Class::Storage::DBI>.
108
109 Read traffic is spread across the replicants (slaves) occuring to a user
110 selected algorithm.  The default algorithm is random weighted.
111
112 =head1 NOTES
113
114 The consistancy betweeen master and replicants is database specific.  The Pool
115 gives you a method to validate its replicants, removing and replacing them
116 when they fail/pass predefined criteria.  Please make careful use of the ways
117 to force a query to run against Master when needed.
118
119 =head1 REQUIREMENTS
120
121 Replicated Storage has additional requirements not currently part of L<DBIx::Class>
122
123   Moose => '0.90',
124   MooseX::Types => '0.21',
125   namespace::clean => '0.11',
126   Hash::Merge => '0.11'
127
128 You will need to install these modules manually via CPAN or make them part of the
129 Makefile for your distribution.
130
131 =head1 ATTRIBUTES
132
133 This class defines the following attributes.
134
135 =head2 schema
136
137 The underlying L<DBIx::Class::Schema> object this storage is attaching
138
139 =cut
140
141 has 'schema' => (
142     is=>'rw',
143     isa=>DBICSchema,
144     weak_ref=>1,
145     required=>1,
146 );
147
148 =head2 pool_type
149
150 Contains the classname which will instantiate the L</pool> object.  Defaults 
151 to: L<DBIx::Class::Storage::DBI::Replicated::Pool>.
152
153 =cut
154
155 has 'pool_type' => (
156   is=>'rw',
157   isa=>ClassName,
158   default=>'DBIx::Class::Storage::DBI::Replicated::Pool',
159   handles=>{
160     'create_pool' => 'new',
161   },
162 );
163
164 =head2 pool_args
165
166 Contains a hashref of initialized information to pass to the Balancer object.
167 See L<DBIx::Class::Storage::DBI::Replicated::Pool> for available arguments.
168
169 =cut
170
171 has 'pool_args' => (
172   is=>'rw',
173   isa=>HashRef,
174   lazy=>1,
175   default=>sub { {} },
176 );
177
178
179 =head2 balancer_type
180
181 The replication pool requires a balance class to provider the methods for
182 choose how to spread the query load across each replicant in the pool.
183
184 =cut
185
186 has 'balancer_type' => (
187   is=>'rw',
188   isa=>BalancerClassNamePart,
189   coerce=>1,
190   required=>1,
191   default=> 'DBIx::Class::Storage::DBI::Replicated::Balancer::First',
192   handles=>{
193     'create_balancer' => 'new',
194   },
195 );
196
197 =head2 balancer_args
198
199 Contains a hashref of initialized information to pass to the Balancer object.
200 See L<DBIx::Class::Storage::DBI::Replicated::Balancer> for available arguments.
201
202 =cut
203
204 has 'balancer_args' => (
205   is=>'rw',
206   isa=>HashRef,
207   lazy=>1,
208   required=>1,
209   default=>sub { {} },
210 );
211
212 =head2 pool
213
214 Is a <DBIx::Class::Storage::DBI::Replicated::Pool> or derived class.  This is a
215 container class for one or more replicated databases.
216
217 =cut
218
219 has 'pool' => (
220   is=>'ro',
221   isa=>'DBIx::Class::Storage::DBI::Replicated::Pool',
222   lazy_build=>1,
223   handles=>[qw/
224     connect_replicants
225     replicants
226     has_replicants
227   /],
228 );
229
230 =head2 balancer
231
232 Is a <DBIx::Class::Storage::DBI::Replicated::Balancer> or derived class.  This 
233 is a class that takes a pool (<DBIx::Class::Storage::DBI::Replicated::Pool>)
234
235 =cut
236
237 has 'balancer' => (
238   is=>'rw',
239   isa=>'DBIx::Class::Storage::DBI::Replicated::Balancer',
240   lazy_build=>1,
241   handles=>[qw/auto_validate_every/],
242 );
243
244 =head2 master
245
246 The master defines the canonical state for a pool of connected databases.  All
247 the replicants are expected to match this databases state.  Thus, in a classic
248 Master / Slaves distributed system, all the slaves are expected to replicate
249 the Master's state as quick as possible.  This is the only database in the
250 pool of databases that is allowed to handle write traffic.
251
252 =cut
253
254 has 'master' => (
255   is=> 'ro',
256   isa=>DBICStorageDBI,
257   lazy_build=>1,
258 );
259
260 =head1 ATTRIBUTES IMPLEMENTING THE DBIx::Storage::DBI INTERFACE
261
262 The following methods are delegated all the methods required for the 
263 L<DBIx::Class::Storage::DBI> interface.
264
265 =head2 read_handler
266
267 Defines an object that implements the read side of L<BIx::Class::Storage::DBI>.
268
269 =cut
270
271 has 'read_handler' => (
272   is=>'rw',
273   isa=>Object,
274   lazy_build=>1,
275   handles=>[qw/
276     select
277     select_single
278     columns_info_for
279   /],
280 );
281
282 =head2 write_handler
283
284 Defines an object that implements the write side of L<BIx::Class::Storage::DBI>.
285
286 =cut
287
288 has 'write_handler' => (
289   is=>'ro',
290   isa=>Object,
291   lazy_build=>1,
292   handles=>[qw/
293     on_connect_do
294     on_disconnect_do
295     connect_info
296     throw_exception
297     sql_maker
298     sqlt_type
299     create_ddl_dir
300     deployment_statements
301     datetime_parser
302     datetime_parser_type
303     build_datetime_parser
304     last_insert_id
305     insert
306     insert_bulk
307     update
308     delete
309     dbh
310     txn_begin
311     txn_do
312     txn_commit
313     txn_rollback
314     txn_scope_guard
315     sth
316     deploy
317     with_deferred_fk_checks
318     dbh_do
319     reload_row
320     with_deferred_fk_checks
321     _prep_for_execute
322
323     backup
324     is_datatype_numeric
325     _count_select
326     _subq_count_select
327     _subq_update_delete
328     svp_rollback
329     svp_begin
330     svp_release
331   /],
332 );
333
334 has _master_connect_info_opts =>
335   (is => 'rw', isa => HashRef, default => sub { {} });
336
337 =head2 around: connect_info
338
339 Preserve master's C<connect_info> options (for merging with replicants.)
340 Also set any Replicated related options from connect_info, such as
341 C<pool_type>, C<pool_args>, C<balancer_type> and C<balancer_args>.
342
343 =cut
344
345 around connect_info => sub {
346   my ($next, $self, $info, @extra) = @_;
347
348   my $wantarray = wantarray;
349
350   my %opts;
351   for my $arg (@$info) {
352     next unless (reftype($arg)||'') eq 'HASH';
353     %opts = %{ merge($arg, \%opts) };
354   }
355   delete $opts{dsn};
356
357   if (@opts{qw/pool_type pool_args/}) {
358     $self->pool_type(delete $opts{pool_type})
359       if $opts{pool_type};
360
361     $self->pool_args(
362       merge((delete $opts{pool_args} || {}), $self->pool_args)
363     );
364
365     $self->pool($self->_build_pool)
366       if $self->pool;
367   }
368
369   if (@opts{qw/balancer_type balancer_args/}) {
370     $self->balancer_type(delete $opts{balancer_type})
371       if $opts{balancer_type};
372
373     $self->balancer_args(
374       merge((delete $opts{balancer_args} || {}), $self->balancer_args)
375     );
376
377     $self->balancer($self->_build_balancer)
378       if $self->balancer;
379   }
380
381   $self->_master_connect_info_opts(\%opts);
382
383   my (@res, $res);
384   if ($wantarray) {
385     @res = $self->$next($info, @extra);
386   } else {
387     $res = $self->$next($info, @extra);
388   }
389
390   # Make sure master is blessed into the correct class and apply role to it.
391   my $master = $self->master;
392   $master->_determine_driver;
393   Moose::Meta::Class->initialize(ref $master);
394   DBIx::Class::Storage::DBI::Replicated::WithDSN->meta->apply($master);
395
396   $wantarray ? @res : $res;
397 };
398
399 =head1 METHODS
400
401 This class defines the following methods.
402
403 =head2 BUILDARGS
404
405 L<DBIx::Class::Schema> when instantiating its storage passed itself as the
406 first argument.  So we need to massage the arguments a bit so that all the
407 bits get put into the correct places.
408
409 =cut
410
411 sub BUILDARGS {
412   my ($class, $schema, $storage_type_args, @args) = @_;  
413
414   return {
415     schema=>$schema,
416     %$storage_type_args,
417     @args
418   }
419 }
420
421 =head2 _build_master
422
423 Lazy builder for the L</master> attribute.
424
425 =cut
426
427 sub _build_master {
428   my $self = shift @_;
429   my $master = DBIx::Class::Storage::DBI->new($self->schema);
430   $master
431 }
432
433 =head2 _build_pool
434
435 Lazy builder for the L</pool> attribute.
436
437 =cut
438
439 sub _build_pool {
440   my $self = shift @_;
441   $self->create_pool(%{$self->pool_args});
442 }
443
444 =head2 _build_balancer
445
446 Lazy builder for the L</balancer> attribute.  This takes a Pool object so that
447 the balancer knows which pool it's balancing.
448
449 =cut
450
451 sub _build_balancer {
452   my $self = shift @_;
453   $self->create_balancer(
454     pool=>$self->pool,
455     master=>$self->master,
456     %{$self->balancer_args},
457   );
458 }
459
460 =head2 _build_write_handler
461
462 Lazy builder for the L</write_handler> attribute.  The default is to set this to
463 the L</master>.
464
465 =cut
466
467 sub _build_write_handler {
468   return shift->master;
469 }
470
471 =head2 _build_read_handler
472
473 Lazy builder for the L</read_handler> attribute.  The default is to set this to
474 the L</balancer>.
475
476 =cut
477
478 sub _build_read_handler {
479   return shift->balancer;
480 }
481
482 =head2 around: connect_replicants
483
484 All calls to connect_replicants needs to have an existing $schema tacked onto
485 top of the args, since L<DBIx::Storage::DBI> needs it, and any C<connect_info>
486 options merged with the master, with replicant opts having higher priority.
487
488 =cut
489
490 around connect_replicants => sub {
491   my ($next, $self, @args) = @_;
492
493   for my $r (@args) {
494     $r = [ $r ] unless reftype $r eq 'ARRAY';
495
496     $self->throw_exception('coderef replicant connect_info not supported')
497       if ref $r->[0] && reftype $r->[0] eq 'CODE';
498
499 # any connect_info options?
500     my $i = 0;
501     $i++ while $i < @$r && (reftype($r->[$i])||'') ne 'HASH';
502
503 # make one if none
504     $r->[$i] = {} unless $r->[$i];
505
506 # merge if two hashes
507     my @hashes = @$r[$i .. $#{$r}];
508
509     $self->throw_exception('invalid connect_info options')
510       if (grep { reftype($_) eq 'HASH' } @hashes) != @hashes;
511
512     $self->throw_exception('too many hashrefs in connect_info')
513       if @hashes > 2;
514
515     my %opts = %{ merge(reverse @hashes) };
516
517 # delete them
518     splice @$r, $i+1, ($#{$r} - $i), ();
519
520 # make sure master/replicants opts don't clash
521     my %master_opts = %{ $self->_master_connect_info_opts };
522     if (exists $opts{dbh_maker}) {
523         delete @master_opts{qw/dsn user password/};
524     }
525     delete $master_opts{dbh_maker};
526
527 # merge with master
528     %opts = %{ merge(\%opts, \%master_opts) };
529
530 # update
531     $r->[$i] = \%opts;
532   }
533
534   $self->$next($self->schema, @args);
535 };
536
537 =head2 all_storages
538
539 Returns an array of of all the connected storage backends.  The first element
540 in the returned array is the master, and the remainings are each of the
541 replicants.
542
543 =cut
544
545 sub all_storages {
546   my $self = shift @_;
547   return grep {defined $_ && blessed $_} (
548      $self->master,
549      values %{ $self->replicants },
550   );
551 }
552
553 =head2 execute_reliably ($coderef, ?@args)
554
555 Given a coderef, saves the current state of the L</read_handler>, forces it to
556 use reliable storage (ie sets it to the master), executes a coderef and then
557 restores the original state.
558
559 Example:
560
561   my $reliably = sub {
562     my $name = shift @_;
563     $schema->resultset('User')->create({name=>$name});
564     my $user_rs = $schema->resultset('User')->find({name=>$name}); 
565     return $user_rs;
566   };
567
568   my $user_rs = $schema->storage->execute_reliably($reliably, 'John');
569
570 Use this when you must be certain of your database state, such as when you just
571 inserted something and need to get a resultset including it, etc.
572
573 =cut
574
575 sub execute_reliably {
576   my ($self, $coderef, @args) = @_;
577
578   unless( ref $coderef eq 'CODE') {
579     $self->throw_exception('Second argument must be a coderef');
580   }
581
582   ##Get copy of master storage
583   my $master = $self->master;
584
585   ##Get whatever the current read hander is
586   my $current = $self->read_handler;
587
588   ##Set the read handler to master
589   $self->read_handler($master);
590
591   ## do whatever the caller needs
592   my @result;
593   my $want_array = wantarray;
594
595   eval {
596     if($want_array) {
597       @result = $coderef->(@args);
598     } elsif(defined $want_array) {
599       ($result[0]) = ($coderef->(@args));
600     } else {
601       $coderef->(@args);
602     }
603   };
604
605   ##Reset to the original state
606   $self->read_handler($current);
607
608   ##Exception testing has to come last, otherwise you might leave the 
609   ##read_handler set to master.
610
611   if($@) {
612     $self->throw_exception("coderef returned an error: $@");
613   } else {
614     return $want_array ? @result : $result[0];
615   }
616 }
617
618 =head2 set_reliable_storage
619
620 Sets the current $schema to be 'reliable', that is all queries, both read and
621 write are sent to the master
622
623 =cut
624
625 sub set_reliable_storage {
626   my $self = shift @_;
627   my $schema = $self->schema;
628   my $write_handler = $self->schema->storage->write_handler;
629
630   $schema->storage->read_handler($write_handler);
631 }
632
633 =head2 set_balanced_storage
634
635 Sets the current $schema to be use the </balancer> for all reads, while all
636 writea are sent to the master only
637
638 =cut
639
640 sub set_balanced_storage {
641   my $self = shift @_;
642   my $schema = $self->schema;
643   my $balanced_handler = $self->schema->storage->balancer;
644
645   $schema->storage->read_handler($balanced_handler);
646 }
647
648 =head2 connected
649
650 Check that the master and at least one of the replicants is connected.
651
652 =cut
653
654 sub connected {
655   my $self = shift @_;
656   return
657     $self->master->connected &&
658     $self->pool->connected_replicants;
659 }
660
661 =head2 ensure_connected
662
663 Make sure all the storages are connected.
664
665 =cut
666
667 sub ensure_connected {
668   my $self = shift @_;
669   foreach my $source ($self->all_storages) {
670     $source->ensure_connected(@_);
671   }
672 }
673
674 =head2 limit_dialect
675
676 Set the limit_dialect for all existing storages
677
678 =cut
679
680 sub limit_dialect {
681   my $self = shift @_;
682   foreach my $source ($self->all_storages) {
683     $source->limit_dialect(@_);
684   }
685   return $self->master->quote_char;
686 }
687
688 =head2 quote_char
689
690 Set the quote_char for all existing storages
691
692 =cut
693
694 sub quote_char {
695   my $self = shift @_;
696   foreach my $source ($self->all_storages) {
697     $source->quote_char(@_);
698   }
699   return $self->master->quote_char;
700 }
701
702 =head2 name_sep
703
704 Set the name_sep for all existing storages
705
706 =cut
707
708 sub name_sep {
709   my $self = shift @_;
710   foreach my $source ($self->all_storages) {
711     $source->name_sep(@_);
712   }
713   return $self->master->name_sep;
714 }
715
716 =head2 set_schema
717
718 Set the schema object for all existing storages
719
720 =cut
721
722 sub set_schema {
723   my $self = shift @_;
724   foreach my $source ($self->all_storages) {
725     $source->set_schema(@_);
726   }
727 }
728
729 =head2 debug
730
731 set a debug flag across all storages
732
733 =cut
734
735 sub debug {
736   my $self = shift @_;
737   if(@_) {
738     foreach my $source ($self->all_storages) {
739       $source->debug(@_);
740     }
741   }
742   return $self->master->debug;
743 }
744
745 =head2 debugobj
746
747 set a debug object across all storages
748
749 =cut
750
751 sub debugobj {
752   my $self = shift @_;
753   if(@_) {
754     foreach my $source ($self->all_storages) {
755       $source->debugobj(@_);
756     }
757   }
758   return $self->master->debugobj;
759 }
760
761 =head2 debugfh
762
763 set a debugfh object across all storages
764
765 =cut
766
767 sub debugfh {
768   my $self = shift @_;
769   if(@_) {
770     foreach my $source ($self->all_storages) {
771       $source->debugfh(@_);
772     }
773   }
774   return $self->master->debugfh;
775 }
776
777 =head2 debugcb
778
779 set a debug callback across all storages
780
781 =cut
782
783 sub debugcb {
784   my $self = shift @_;
785   if(@_) {
786     foreach my $source ($self->all_storages) {
787       $source->debugcb(@_);
788     }
789   }
790   return $self->master->debugcb;
791 }
792
793 =head2 disconnect
794
795 disconnect everything
796
797 =cut
798
799 sub disconnect {
800   my $self = shift @_;
801   foreach my $source ($self->all_storages) {
802     $source->disconnect(@_);
803   }
804 }
805
806 =head2 cursor_class
807
808 set cursor class on all storages, or return master's
809
810 =cut
811
812 sub cursor_class {
813   my ($self, $cursor_class) = @_;
814
815   if ($cursor_class) {
816     $_->cursor_class($cursor_class) for $self->all_storages;
817   }
818   $self->master->cursor_class;
819 }
820
821 =head1 GOTCHAS
822
823 Due to the fact that replicants can lag behind a master, you must take care to
824 make sure you use one of the methods to force read queries to a master should
825 you need realtime data integrity.  For example, if you insert a row, and then
826 immediately re-read it from the database (say, by doing $row->discard_changes)
827 or you insert a row and then immediately build a query that expects that row
828 to be an item, you should force the master to handle reads.  Otherwise, due to
829 the lag, there is no certainty your data will be in the expected state.
830
831 For data integrity, all transactions automatically use the master storage for
832 all read and write queries.  Using a transaction is the preferred and recommended
833 method to force the master to handle all read queries.
834
835 Otherwise, you can force a single query to use the master with the 'force_pool'
836 attribute:
837
838   my $row = $resultset->search(undef, {force_pool=>'master'})->find($pk);
839
840 This attribute will safely be ignore by non replicated storages, so you can use
841 the same code for both types of systems.
842
843 Lastly, you can use the L</execute_reliably> method, which works very much like
844 a transaction.
845
846 For debugging, you can turn replication on/off with the methods L</set_reliable_storage>
847 and L</set_balanced_storage>, however this operates at a global level and is not
848 suitable if you have a shared Schema object being used by multiple processes,
849 such as on a web application server.  You can get around this limitation by
850 using the Schema clone method.
851
852   my $new_schema = $schema->clone;
853   $new_schema->set_reliable_storage;
854
855   ## $new_schema will use only the Master storage for all reads/writes while
856   ## the $schema object will use replicated storage.
857
858 =head1 AUTHOR
859
860   John Napiorkowski <john.napiorkowski@takkle.com>
861
862 Based on code originated by:
863
864   Norbert Csongrádi <bert@cpan.org>
865   Peter Siklósi <einon@einon.hu>
866
867 =head1 LICENSE
868
869 You may distribute this code under the same terms as Perl itself.
870
871 =cut
872
873 __PACKAGE__->meta->make_immutable;
874
875 1;