more tweaks
[dbsrgits/SQL-Abstract.git] / lib / SQL / Abstract.pm
1 package SQL::Abstract; # see doc at end of file
2
3 use Carp ();
4 use List::Util ();
5 use Scalar::Util ();
6 use Module::Runtime qw(use_module);
7 use Moo;
8
9 our $VERSION  = '1.72';
10
11 $VERSION = eval $VERSION;
12
13 sub belch (@) {
14   my($func) = (caller(1))[3];
15   Carp::carp "[$func] Warning: ", @_;
16 }
17
18 sub puke (@) {
19   my($func) = (caller(1))[3];
20   Carp::croak "[$func] Fatal: ", @_;
21 }
22
23 has converter => (is => 'lazy', clearer => 'clear_converter');
24
25 has case => (
26   is => 'ro', coerce => sub { $_[0] eq 'lower' ? 'lower' : undef }
27 );
28
29 has logic => (
30   is => 'ro', coerce => sub { uc($_[0]) }, default => sub { 'OR' }
31 );
32
33 has bindtype => (
34   is => 'ro', default => sub { 'normal' }
35 );
36
37 has cmp => (is => 'ro', default => sub { '=' });
38
39 has sqltrue => (is => 'ro', default => sub { '1=1' });
40 has sqlfalse => (is => 'ro', default => sub { '0=1' });
41
42 has special_ops => (is => 'ro', default => sub { [] });
43 has unary_ops => (is => 'ro', default => sub { [] });
44
45 # FIXME
46 # need to guard against ()'s in column names too, but this will break tons of
47 # hacks... ideas anyone?
48
49 has injection_guard => (
50   is => 'ro',
51   default => sub {
52     qr/
53       \;
54         |
55       ^ \s* go \s
56     /xmi;
57   }
58 );
59
60 has renderer => (is => 'lazy', clearer => 'clear_renderer');
61
62 has name_sep => (
63   is => 'rw', default => sub { '.' },
64   trigger => sub {
65     $_[0]->clear_renderer;
66     $_[0]->clear_converter;
67   },
68 );
69
70 has quote_char => (
71   is => 'rw',
72   trigger => sub {
73     $_[0]->clear_renderer;
74     $_[0]->clear_converter;
75   },
76 );
77
78 has collapse_aliases => (
79   is => 'ro',
80   default => sub { 0 }
81 );
82
83 has always_quote => (
84   is => 'rw', default => sub { 1 },
85   trigger => sub {
86     $_[0]->clear_renderer;
87     $_[0]->clear_converter;
88   },
89 );
90
91 has convert => (is => 'ro');
92
93 has array_datatypes => (is => 'ro');
94
95 has converter_class => (
96   is => 'ro', default => sub { 'SQL::Abstract::Converter' }
97 );
98
99 has renderer_class => (
100   is => 'ro', default => sub { 'Data::Query::Renderer::SQL::Naive' }
101 );
102
103 sub _converter_args {
104   my ($self) = @_;
105   Scalar::Util::weaken($self);
106   +{
107     lower_case => $self->case,
108     default_logic => $self->logic,
109     bind_meta => not($self->bindtype eq 'normal'),
110     identifier_sep => $self->name_sep,
111     (map +($_ => $self->$_), qw(
112       cmp sqltrue sqlfalse injection_guard convert array_datatypes
113     )),
114     special_ops => [
115       map {
116         my $sub = $_->{handler};
117         +{
118           %$_,
119           handler => sub { $self->$sub(@_) }
120         }
121       } @{$self->special_ops}
122     ],
123     renderer_will_quote => (
124       defined($self->quote_char) and $self->always_quote
125     ),
126   }
127 }
128
129 sub _build_converter {
130   my ($self) = @_;
131   use_module($self->converter_class)->new($self->_converter_args);
132 }
133
134 sub _renderer_args {
135   my ($self) = @_;
136   my ($chars);
137   for ($self->quote_char) {
138     $chars = defined() ? (ref() ? $_ : [$_]) : ['',''];
139   }
140   +{
141     quote_chars => $chars, always_quote => $self->always_quote,
142     identifier_sep => $self->name_sep,
143     collapse_aliases => $self->collapse_aliases,
144     ($self->case ? (lc_keywords => 1) : ()), # always 'lower' if it exists
145   };
146 }
147
148 sub _build_renderer {
149   my ($self) = @_;
150   use_module($self->renderer_class)->new($self->_renderer_args);
151 }
152
153 sub _render_dq {
154   my ($self, $dq) = @_;
155   if (!$dq) {
156     return '';
157   }
158   my ($sql, @bind) = @{$self->renderer->render($dq)};
159   wantarray ?
160     ($self->{bindtype} eq 'normal'
161       ? ($sql, map $_->{value}, @bind)
162       : ($sql, map [ $_->{value_meta}, $_->{value} ], @bind)
163     )
164     : $sql;
165 }
166
167 sub _render_sqla {
168   my ($self, $type, @args) = @_;
169   $self->_render_dq($self->converter->${\"_${type}_to_dq"}(@args));
170 }
171
172 sub insert { shift->_render_sqla(insert => @_) }
173
174 sub update { shift->_render_sqla(update => @_) }
175
176 sub select { shift->_render_sqla(select => @_) }
177
178 sub delete { shift->_render_sqla(delete => @_) }
179
180 sub where {
181   my ($self, $where, $order) = @_;
182
183   my $sql = '';
184   my @bind;
185
186   # where ?
187   ($sql, @bind) = $self->_recurse_where($where) if defined($where);
188   $sql = $sql ? $self->_sqlcase(' where ') . "( $sql )" : '';
189
190   # order by?
191   if ($order) {
192     $sql .= $self->_order_by($order);
193   }
194
195   return wantarray ? ($sql, @bind) : $sql;
196 }
197
198 sub _recurse_where { shift->_render_sqla(where => @_) }
199
200 sub _order_by {
201   my ($self, $arg) = @_;
202   if (my $dq = $self->converter->_order_by_to_dq($arg)) {
203     # SQLA generates ' ORDER BY foo'. The hilarity.
204     wantarray
205       ? do { my @r = $self->_render_dq($dq); $r[0] = ' '.$r[0]; @r }
206       : ' '.$self->_render_dq($dq);
207   } else {
208     '';
209   }
210 }
211
212 # highly optimized, as it's called way too often
213 sub _quote {
214   # my ($self, $label) = @_;
215
216   return '' unless defined $_[1];
217   return ${$_[1]} if ref($_[1]) eq 'SCALAR';
218
219   unless ($_[0]->{quote_char}) {
220     $_[0]->_assert_pass_injection_guard($_[1]);
221     return $_[1];
222   }
223
224   my $qref = ref $_[0]->{quote_char};
225   my ($l, $r);
226   if (!$qref) {
227     ($l, $r) = ( $_[0]->{quote_char}, $_[0]->{quote_char} );
228   }
229   elsif ($qref eq 'ARRAY') {
230     ($l, $r) = @{$_[0]->{quote_char}};
231   }
232   else {
233     puke "Unsupported quote_char format: $_[0]->{quote_char}";
234   }
235
236   # parts containing * are naturally unquoted
237   return join( $_[0]->{name_sep}||'', map
238     { $_ eq '*' ? $_ : $l . $_ . $r }
239     ( $_[0]->{name_sep} ? split (/\Q$_[0]->{name_sep}\E/, $_[1] ) : $_[1] )
240   );
241 }
242
243 sub _assert_pass_injection_guard {
244   if ($_[1] =~ $_[0]->{injection_guard}) {
245     my $class = ref $_[0];
246     die "Possible SQL injection attempt '$_[1]'. If this is indeed a part of the
247  "
248      . "desired SQL use literal SQL ( \'...' or \[ '...' ] ) or supply your own 
249 "
250      . "{injection_guard} attribute to ${class}->new()"
251   }
252 }
253
254 # Conversion, if applicable
255 sub _convert ($) {
256   #my ($self, $arg) = @_;
257
258 # LDNOTE : modified the previous implementation below because
259 # it was not consistent : the first "return" is always an array,
260 # the second "return" is context-dependent. Anyway, _convert
261 # seems always used with just a single argument, so make it a
262 # scalar function.
263 #     return @_ unless $self->{convert};
264 #     my $conv = $self->_sqlcase($self->{convert});
265 #     my @ret = map { $conv.'('.$_.')' } @_;
266 #     return wantarray ? @ret : $ret[0];
267   if ($_[0]->{convert}) {
268     return $_[0]->_sqlcase($_[0]->{convert}) .'(' . $_[1] . ')';
269   }
270   return $_[1];
271 }
272
273 # And bindtype
274 sub _bindtype (@) {
275   #my ($self, $col, @vals) = @_;
276
277   #LDNOTE : changed original implementation below because it did not make
278   # sense when bindtype eq 'columns' and @vals > 1.
279 #  return $self->{bindtype} eq 'columns' ? [ $col, @vals ] : @vals;
280
281   # called often - tighten code
282   return $_[0]->{bindtype} eq 'columns'
283     ? map {[$_[1], $_]} @_[2 .. $#_]
284     : @_[2 .. $#_]
285   ;
286 }
287
288 # Dies if any element of @bind is not in [colname => value] format
289 # if bindtype is 'columns'.
290 sub _assert_bindval_matches_bindtype {
291 #  my ($self, @bind) = @_;
292   my $self = shift;
293   if ($self->{bindtype} eq 'columns') {
294     for (@_) {
295       if (!defined $_ || ref($_) ne 'ARRAY' || @$_ != 2) {
296         puke "bindtype 'columns' selected, you need to pass: [column_name => bind_value]"
297       }
298     }
299   }
300 }
301
302 # Fix SQL case, if so requested
303 sub _sqlcase {
304   # LDNOTE: if $self->{case} is true, then it contains 'lower', so we
305   # don't touch the argument ... crooked logic, but let's not change it!
306   return $_[0]->{case} ? $_[1] : uc($_[1]);
307 }
308
309 sub values {
310     my $self = shift;
311     my $data = shift || return;
312     puke "Argument to ", __PACKAGE__, "->values must be a \\%hash"
313         unless ref $data eq 'HASH';
314
315     my @all_bind;
316     foreach my $k ( sort keys %$data ) {
317         my $v = $data->{$k};
318         local our $Cur_Col_Meta = $k;
319         my ($sql, @bind) = $self->_render_sqla(
320             mutation_rhs => $v
321         );
322         push @all_bind, @bind;
323     }
324
325     return @all_bind;
326 }
327
328 sub generate {
329     my $self  = shift;
330
331     my(@sql, @sqlq, @sqlv);
332
333     for (@_) {
334         my $ref = ref $_;
335         if ($ref eq 'HASH') {
336             for my $k (sort keys %$_) {
337                 my $v = $_->{$k};
338                 my $r = ref $v;
339                 my $label = $self->_quote($k);
340                 if ($r eq 'ARRAY') {
341                     # literal SQL with bind
342                     my ($sql, @bind) = @$v;
343                     $self->_assert_bindval_matches_bindtype(@bind);
344                     push @sqlq, "$label = $sql";
345                     push @sqlv, @bind;
346                 } elsif ($r eq 'SCALAR') {
347                     # literal SQL without bind
348                     push @sqlq, "$label = $$v";
349                 } else {
350                     push @sqlq, "$label = ?";
351                     push @sqlv, $self->_bindtype($k, $v);
352                 }
353             }
354             push @sql, $self->_sqlcase('set'), join ', ', @sqlq;
355         } elsif ($ref eq 'ARRAY') {
356             # unlike insert(), assume these are ONLY the column names, i.e. for SQL
357             for my $v (@$_) {
358                 my $r = ref $v;
359                 if ($r eq 'ARRAY') {   # literal SQL with bind
360                     my ($sql, @bind) = @$v;
361                     $self->_assert_bindval_matches_bindtype(@bind);
362                     push @sqlq, $sql;
363                     push @sqlv, @bind;
364                 } elsif ($r eq 'SCALAR') {  # literal SQL without bind
365                     # embedded literal SQL
366                     push @sqlq, $$v;
367                 } else {
368                     push @sqlq, '?';
369                     push @sqlv, $v;
370                 }
371             }
372             push @sql, '(' . join(', ', @sqlq) . ')';
373         } elsif ($ref eq 'SCALAR') {
374             # literal SQL
375             push @sql, $$_;
376         } else {
377             # strings get case twiddled
378             push @sql, $self->_sqlcase($_);
379         }
380     }
381
382     my $sql = join ' ', @sql;
383
384     # this is pretty tricky
385     # if ask for an array, return ($stmt, @bind)
386     # otherwise, s/?/shift @sqlv/ to put it inline
387     if (wantarray) {
388         return ($sql, @sqlv);
389     } else {
390         1 while $sql =~ s/\?/my $d = shift(@sqlv);
391                              ref $d ? $d->[1] : $d/e;
392         return $sql;
393     }
394 }
395
396 1;
397
398
399 __END__
400
401 =head1 NAME
402
403 SQL::Abstract - Generate SQL from Perl data structures
404
405 =head1 SYNOPSIS
406
407     use SQL::Abstract;
408
409     my $sql = SQL::Abstract->new;
410
411     my($stmt, @bind) = $sql->select($table, \@fields, \%where, \@order);
412
413     my($stmt, @bind) = $sql->insert($table, \%fieldvals || \@values);
414
415     my($stmt, @bind) = $sql->update($table, \%fieldvals, \%where);
416
417     my($stmt, @bind) = $sql->delete($table, \%where);
418
419     # Then, use these in your DBI statements
420     my $sth = $dbh->prepare($stmt);
421     $sth->execute(@bind);
422
423     # Just generate the WHERE clause
424     my($stmt, @bind) = $sql->where(\%where, \@order);
425
426     # Return values in the same order, for hashed queries
427     # See PERFORMANCE section for more details
428     my @bind = $sql->values(\%fieldvals);
429
430 =head1 DESCRIPTION
431
432 This module was inspired by the excellent L<DBIx::Abstract>.
433 However, in using that module I found that what I really wanted
434 to do was generate SQL, but still retain complete control over my
435 statement handles and use the DBI interface. So, I set out to
436 create an abstract SQL generation module.
437
438 While based on the concepts used by L<DBIx::Abstract>, there are
439 several important differences, especially when it comes to WHERE
440 clauses. I have modified the concepts used to make the SQL easier
441 to generate from Perl data structures and, IMO, more intuitive.
442 The underlying idea is for this module to do what you mean, based
443 on the data structures you provide it. The big advantage is that
444 you don't have to modify your code every time your data changes,
445 as this module figures it out.
446
447 To begin with, an SQL INSERT is as easy as just specifying a hash
448 of C<key=value> pairs:
449
450     my %data = (
451         name => 'Jimbo Bobson',
452         phone => '123-456-7890',
453         address => '42 Sister Lane',
454         city => 'St. Louis',
455         state => 'Louisiana',
456     );
457
458 The SQL can then be generated with this:
459
460     my($stmt, @bind) = $sql->insert('people', \%data);
461
462 Which would give you something like this:
463
464     $stmt = "INSERT INTO people
465                     (address, city, name, phone, state)
466                     VALUES (?, ?, ?, ?, ?)";
467     @bind = ('42 Sister Lane', 'St. Louis', 'Jimbo Bobson',
468              '123-456-7890', 'Louisiana');
469
470 These are then used directly in your DBI code:
471
472     my $sth = $dbh->prepare($stmt);
473     $sth->execute(@bind);
474
475 =head2 Inserting and Updating Arrays
476
477 If your database has array types (like for example Postgres),
478 activate the special option C<< array_datatypes => 1 >>
479 when creating the C<SQL::Abstract> object.
480 Then you may use an arrayref to insert and update database array types:
481
482     my $sql = SQL::Abstract->new(array_datatypes => 1);
483     my %data = (
484         planets => [qw/Mercury Venus Earth Mars/]
485     );
486
487     my($stmt, @bind) = $sql->insert('solar_system', \%data);
488
489 This results in:
490
491     $stmt = "INSERT INTO solar_system (planets) VALUES (?)"
492
493     @bind = (['Mercury', 'Venus', 'Earth', 'Mars']);
494
495
496 =head2 Inserting and Updating SQL
497
498 In order to apply SQL functions to elements of your C<%data> you may
499 specify a reference to an arrayref for the given hash value. For example,
500 if you need to execute the Oracle C<to_date> function on a value, you can
501 say something like this:
502
503     my %data = (
504         name => 'Bill',
505         date_entered => \["to_date(?,'MM/DD/YYYY')", "03/02/2003"],
506     );
507
508 The first value in the array is the actual SQL. Any other values are
509 optional and would be included in the bind values array. This gives
510 you:
511
512     my($stmt, @bind) = $sql->insert('people', \%data);
513
514     $stmt = "INSERT INTO people (name, date_entered)
515                 VALUES (?, to_date(?,'MM/DD/YYYY'))";
516     @bind = ('Bill', '03/02/2003');
517
518 An UPDATE is just as easy, all you change is the name of the function:
519
520     my($stmt, @bind) = $sql->update('people', \%data);
521
522 Notice that your C<%data> isn't touched; the module will generate
523 the appropriately quirky SQL for you automatically. Usually you'll
524 want to specify a WHERE clause for your UPDATE, though, which is
525 where handling C<%where> hashes comes in handy...
526
527 =head2 Complex where statements
528
529 This module can generate pretty complicated WHERE statements
530 easily. For example, simple C<key=value> pairs are taken to mean
531 equality, and if you want to see if a field is within a set
532 of values, you can use an arrayref. Let's say we wanted to
533 SELECT some data based on this criteria:
534
535     my %where = (
536        requestor => 'inna',
537        worker => ['nwiger', 'rcwe', 'sfz'],
538        status => { '!=', 'completed' }
539     );
540
541     my($stmt, @bind) = $sql->select('tickets', '*', \%where);
542
543 The above would give you something like this:
544
545     $stmt = "SELECT * FROM tickets WHERE
546                 ( requestor = ? ) AND ( status != ? )
547                 AND ( worker = ? OR worker = ? OR worker = ? )";
548     @bind = ('inna', 'completed', 'nwiger', 'rcwe', 'sfz');
549
550 Which you could then use in DBI code like so:
551
552     my $sth = $dbh->prepare($stmt);
553     $sth->execute(@bind);
554
555 Easy, eh?
556
557 =head1 FUNCTIONS
558
559 The functions are simple. There's one for each major SQL operation,
560 and a constructor you use first. The arguments are specified in a
561 similar order to each function (table, then fields, then a where
562 clause) to try and simplify things.
563
564
565
566
567 =head2 new(option => 'value')
568
569 The C<new()> function takes a list of options and values, and returns
570 a new B<SQL::Abstract> object which can then be used to generate SQL
571 through the methods below. The options accepted are:
572
573 =over
574
575 =item case
576
577 If set to 'lower', then SQL will be generated in all lowercase. By
578 default SQL is generated in "textbook" case meaning something like:
579
580     SELECT a_field FROM a_table WHERE some_field LIKE '%someval%'
581
582 Any setting other than 'lower' is ignored.
583
584 =item cmp
585
586 This determines what the default comparison operator is. By default
587 it is C<=>, meaning that a hash like this:
588
589     %where = (name => 'nwiger', email => 'nate@wiger.org');
590
591 Will generate SQL like this:
592
593     WHERE name = 'nwiger' AND email = 'nate@wiger.org'
594
595 However, you may want loose comparisons by default, so if you set
596 C<cmp> to C<like> you would get SQL such as:
597
598     WHERE name like 'nwiger' AND email like 'nate@wiger.org'
599
600 You can also override the comparsion on an individual basis - see
601 the huge section on L</"WHERE CLAUSES"> at the bottom.
602
603 =item sqltrue, sqlfalse
604
605 Expressions for inserting boolean values within SQL statements.
606 By default these are C<1=1> and C<1=0>. They are used
607 by the special operators C<-in> and C<-not_in> for generating
608 correct SQL even when the argument is an empty array (see below).
609
610 =item logic
611
612 This determines the default logical operator for multiple WHERE
613 statements in arrays or hashes. If absent, the default logic is "or"
614 for arrays, and "and" for hashes. This means that a WHERE
615 array of the form:
616
617     @where = (
618         event_date => {'>=', '2/13/99'},
619         event_date => {'<=', '4/24/03'},
620     );
621
622 will generate SQL like this:
623
624     WHERE event_date >= '2/13/99' OR event_date <= '4/24/03'
625
626 This is probably not what you want given this query, though (look
627 at the dates). To change the "OR" to an "AND", simply specify:
628
629     my $sql = SQL::Abstract->new(logic => 'and');
630
631 Which will change the above C<WHERE> to:
632
633     WHERE event_date >= '2/13/99' AND event_date <= '4/24/03'
634
635 The logic can also be changed locally by inserting
636 a modifier in front of an arrayref :
637
638     @where = (-and => [event_date => {'>=', '2/13/99'},
639                        event_date => {'<=', '4/24/03'} ]);
640
641 See the L</"WHERE CLAUSES"> section for explanations.
642
643 =item convert
644
645 This will automatically convert comparisons using the specified SQL
646 function for both column and value. This is mostly used with an argument
647 of C<upper> or C<lower>, so that the SQL will have the effect of
648 case-insensitive "searches". For example, this:
649
650     $sql = SQL::Abstract->new(convert => 'upper');
651     %where = (keywords => 'MaKe iT CAse inSeNSItive');
652
653 Will turn out the following SQL:
654
655     WHERE upper(keywords) like upper('MaKe iT CAse inSeNSItive')
656
657 The conversion can be C<upper()>, C<lower()>, or any other SQL function
658 that can be applied symmetrically to fields (actually B<SQL::Abstract> does
659 not validate this option; it will just pass through what you specify verbatim).
660
661 =item bindtype
662
663 This is a kludge because many databases suck. For example, you can't
664 just bind values using DBI's C<execute()> for Oracle C<CLOB> or C<BLOB> fields.
665 Instead, you have to use C<bind_param()>:
666
667     $sth->bind_param(1, 'reg data');
668     $sth->bind_param(2, $lots, {ora_type => ORA_CLOB});
669
670 The problem is, B<SQL::Abstract> will normally just return a C<@bind> array,
671 which loses track of which field each slot refers to. Fear not.
672
673 If you specify C<bindtype> in new, you can determine how C<@bind> is returned.
674 Currently, you can specify either C<normal> (default) or C<columns>. If you
675 specify C<columns>, you will get an array that looks like this:
676
677     my $sql = SQL::Abstract->new(bindtype => 'columns');
678     my($stmt, @bind) = $sql->insert(...);
679
680     @bind = (
681         [ 'column1', 'value1' ],
682         [ 'column2', 'value2' ],
683         [ 'column3', 'value3' ],
684     );
685
686 You can then iterate through this manually, using DBI's C<bind_param()>.
687
688     $sth->prepare($stmt);
689     my $i = 1;
690     for (@bind) {
691         my($col, $data) = @$_;
692         if ($col eq 'details' || $col eq 'comments') {
693             $sth->bind_param($i, $data, {ora_type => ORA_CLOB});
694         } elsif ($col eq 'image') {
695             $sth->bind_param($i, $data, {ora_type => ORA_BLOB});
696         } else {
697             $sth->bind_param($i, $data);
698         }
699         $i++;
700     }
701     $sth->execute;      # execute without @bind now
702
703 Now, why would you still use B<SQL::Abstract> if you have to do this crap?
704 Basically, the advantage is still that you don't have to care which fields
705 are or are not included. You could wrap that above C<for> loop in a simple
706 sub called C<bind_fields()> or something and reuse it repeatedly. You still
707 get a layer of abstraction over manual SQL specification.
708
709 Note that if you set L</bindtype> to C<columns>, the C<\[$sql, @bind]>
710 construct (see L</Literal SQL with placeholders and bind values (subqueries)>)
711 will expect the bind values in this format.
712
713 =item quote_char
714
715 This is the character that a table or column name will be quoted
716 with.  By default this is an empty string, but you could set it to
717 the character C<`>, to generate SQL like this:
718
719   SELECT `a_field` FROM `a_table` WHERE `some_field` LIKE '%someval%'
720
721 Alternatively, you can supply an array ref of two items, the first being the left
722 hand quote character, and the second the right hand quote character. For
723 example, you could supply C<['[',']']> for SQL Server 2000 compliant quotes
724 that generates SQL like this:
725
726   SELECT [a_field] FROM [a_table] WHERE [some_field] LIKE '%someval%'
727
728 Quoting is useful if you have tables or columns names that are reserved
729 words in your database's SQL dialect.
730
731 =item name_sep
732
733 This is the character that separates a table and column name.  It is
734 necessary to specify this when the C<quote_char> option is selected,
735 so that tables and column names can be individually quoted like this:
736
737   SELECT `table`.`one_field` FROM `table` WHERE `table`.`other_field` = 1
738
739 =item injection_guard
740
741 A regular expression C<qr/.../> that is applied to any C<-function> and unquoted
742 column name specified in a query structure. This is a safety mechanism to avoid
743 injection attacks when mishandling user input e.g.:
744
745   my %condition_as_column_value_pairs = get_values_from_user();
746   $sqla->select( ... , \%condition_as_column_value_pairs );
747
748 If the expression matches an exception is thrown. Note that literal SQL
749 supplied via C<\'...'> or C<\['...']> is B<not> checked in any way.
750
751 Defaults to checking for C<;> and the C<GO> keyword (TransactSQL)
752
753 =item array_datatypes
754
755 When this option is true, arrayrefs in INSERT or UPDATE are
756 interpreted as array datatypes and are passed directly
757 to the DBI layer.
758 When this option is false, arrayrefs are interpreted
759 as literal SQL, just like refs to arrayrefs
760 (but this behavior is for backwards compatibility; when writing
761 new queries, use the "reference to arrayref" syntax
762 for literal SQL).
763
764
765 =item special_ops
766
767 Takes a reference to a list of "special operators"
768 to extend the syntax understood by L<SQL::Abstract>.
769 See section L</"SPECIAL OPERATORS"> for details.
770
771 =item unary_ops
772
773 Takes a reference to a list of "unary operators"
774 to extend the syntax understood by L<SQL::Abstract>.
775 See section L</"UNARY OPERATORS"> for details.
776
777
778
779 =back
780
781 =head2 insert($table, \@values || \%fieldvals, \%options)
782
783 This is the simplest function. You simply give it a table name
784 and either an arrayref of values or hashref of field/value pairs.
785 It returns an SQL INSERT statement and a list of bind values.
786 See the sections on L</"Inserting and Updating Arrays"> and
787 L</"Inserting and Updating SQL"> for information on how to insert
788 with those data types.
789
790 The optional C<\%options> hash reference may contain additional
791 options to generate the insert SQL. Currently supported options
792 are:
793
794 =over 4
795
796 =item returning
797
798 Takes either a scalar of raw SQL fields, or an array reference of
799 field names, and adds on an SQL C<RETURNING> statement at the end.
800 This allows you to return data generated by the insert statement
801 (such as row IDs) without performing another C<SELECT> statement.
802 Note, however, this is not part of the SQL standard and may not
803 be supported by all database engines.
804
805 =back
806
807 =head2 update($table, \%fieldvals, \%where)
808
809 This takes a table, hashref of field/value pairs, and an optional
810 hashref L<WHERE clause|/WHERE CLAUSES>. It returns an SQL UPDATE function and a list
811 of bind values.
812 See the sections on L</"Inserting and Updating Arrays"> and
813 L</"Inserting and Updating SQL"> for information on how to insert
814 with those data types.
815
816 =head2 select($source, $fields, $where, $order)
817
818 This returns a SQL SELECT statement and associated list of bind values, as
819 specified by the arguments  :
820
821 =over
822
823 =item $source
824
825 Specification of the 'FROM' part of the statement.
826 The argument can be either a plain scalar (interpreted as a table
827 name, will be quoted), or an arrayref (interpreted as a list
828 of table names, joined by commas, quoted), or a scalarref
829 (literal table name, not quoted), or a ref to an arrayref
830 (list of literal table names, joined by commas, not quoted).
831
832 =item $fields
833
834 Specification of the list of fields to retrieve from
835 the source.
836 The argument can be either an arrayref (interpreted as a list
837 of field names, will be joined by commas and quoted), or a
838 plain scalar (literal SQL, not quoted).
839 Please observe that this API is not as flexible as for
840 the first argument C<$table>, for backwards compatibility reasons.
841
842 =item $where
843
844 Optional argument to specify the WHERE part of the query.
845 The argument is most often a hashref, but can also be
846 an arrayref or plain scalar --
847 see section L<WHERE clause|/"WHERE CLAUSES"> for details.
848
849 =item $order
850
851 Optional argument to specify the ORDER BY part of the query.
852 The argument can be a scalar, a hashref or an arrayref
853 -- see section L<ORDER BY clause|/"ORDER BY CLAUSES">
854 for details.
855
856 =back
857
858
859 =head2 delete($table, \%where)
860
861 This takes a table name and optional hashref L<WHERE clause|/WHERE CLAUSES>.
862 It returns an SQL DELETE statement and list of bind values.
863
864 =head2 where(\%where, \@order)
865
866 This is used to generate just the WHERE clause. For example,
867 if you have an arbitrary data structure and know what the
868 rest of your SQL is going to look like, but want an easy way
869 to produce a WHERE clause, use this. It returns an SQL WHERE
870 clause and list of bind values.
871
872
873 =head2 values(\%data)
874
875 This just returns the values from the hash C<%data>, in the same
876 order that would be returned from any of the other above queries.
877 Using this allows you to markedly speed up your queries if you
878 are affecting lots of rows. See below under the L</"PERFORMANCE"> section.
879
880 =head2 generate($any, 'number', $of, \@data, $struct, \%types)
881
882 Warning: This is an experimental method and subject to change.
883
884 This returns arbitrarily generated SQL. It's a really basic shortcut.
885 It will return two different things, depending on return context:
886
887     my($stmt, @bind) = $sql->generate('create table', \$table, \@fields);
888     my $stmt_and_val = $sql->generate('create table', \$table, \@fields);
889
890 These would return the following:
891
892     # First calling form
893     $stmt = "CREATE TABLE test (?, ?)";
894     @bind = (field1, field2);
895
896     # Second calling form
897     $stmt_and_val = "CREATE TABLE test (field1, field2)";
898
899 Depending on what you're trying to do, it's up to you to choose the correct
900 format. In this example, the second form is what you would want.
901
902 By the same token:
903
904     $sql->generate('alter session', { nls_date_format => 'MM/YY' });
905
906 Might give you:
907
908     ALTER SESSION SET nls_date_format = 'MM/YY'
909
910 You get the idea. Strings get their case twiddled, but everything
911 else remains verbatim.
912
913 =head1 WHERE CLAUSES
914
915 =head2 Introduction
916
917 This module uses a variation on the idea from L<DBIx::Abstract>. It
918 is B<NOT>, repeat I<not> 100% compatible. B<The main logic of this
919 module is that things in arrays are OR'ed, and things in hashes
920 are AND'ed.>
921
922 The easiest way to explain is to show lots of examples. After
923 each C<%where> hash shown, it is assumed you used:
924
925     my($stmt, @bind) = $sql->where(\%where);
926
927 However, note that the C<%where> hash can be used directly in any
928 of the other functions as well, as described above.
929
930 =head2 Key-value pairs
931
932 So, let's get started. To begin, a simple hash:
933
934     my %where  = (
935         user   => 'nwiger',
936         status => 'completed'
937     );
938
939 Is converted to SQL C<key = val> statements:
940
941     $stmt = "WHERE user = ? AND status = ?";
942     @bind = ('nwiger', 'completed');
943
944 One common thing I end up doing is having a list of values that
945 a field can be in. To do this, simply specify a list inside of
946 an arrayref:
947
948     my %where  = (
949         user   => 'nwiger',
950         status => ['assigned', 'in-progress', 'pending'];
951     );
952
953 This simple code will create the following:
954
955     $stmt = "WHERE user = ? AND ( status = ? OR status = ? OR status = ? )";
956     @bind = ('nwiger', 'assigned', 'in-progress', 'pending');
957
958 A field associated to an empty arrayref will be considered a
959 logical false and will generate 0=1.
960
961 =head2 Tests for NULL values
962
963 If the value part is C<undef> then this is converted to SQL <IS NULL>
964
965     my %where  = (
966         user   => 'nwiger',
967         status => undef,
968     );
969
970 becomes:
971
972     $stmt = "WHERE user = ? AND status IS NULL";
973     @bind = ('nwiger');
974
975 To test if a column IS NOT NULL:
976
977     my %where  = (
978         user   => 'nwiger',
979         status => { '!=', undef },
980     );
981
982 =head2 Specific comparison operators
983
984 If you want to specify a different type of operator for your comparison,
985 you can use a hashref for a given column:
986
987     my %where  = (
988         user   => 'nwiger',
989         status => { '!=', 'completed' }
990     );
991
992 Which would generate:
993
994     $stmt = "WHERE user = ? AND status != ?";
995     @bind = ('nwiger', 'completed');
996
997 To test against multiple values, just enclose the values in an arrayref:
998
999     status => { '=', ['assigned', 'in-progress', 'pending'] };
1000
1001 Which would give you:
1002
1003     "WHERE status = ? OR status = ? OR status = ?"
1004
1005
1006 The hashref can also contain multiple pairs, in which case it is expanded
1007 into an C<AND> of its elements:
1008
1009     my %where  = (
1010         user   => 'nwiger',
1011         status => { '!=', 'completed', -not_like => 'pending%' }
1012     );
1013
1014     # Or more dynamically, like from a form
1015     $where{user} = 'nwiger';
1016     $where{status}{'!='} = 'completed';
1017     $where{status}{'-not_like'} = 'pending%';
1018
1019     # Both generate this
1020     $stmt = "WHERE user = ? AND status != ? AND status NOT LIKE ?";
1021     @bind = ('nwiger', 'completed', 'pending%');
1022
1023
1024 To get an OR instead, you can combine it with the arrayref idea:
1025
1026     my %where => (
1027          user => 'nwiger',
1028          priority => [ { '=', 2 }, { '>', 5 } ]
1029     );
1030
1031 Which would generate:
1032
1033     $stmt = "WHERE ( priority = ? OR priority > ? ) AND user = ?";
1034     @bind = ('2', '5', 'nwiger');
1035
1036 If you want to include literal SQL (with or without bind values), just use a
1037 scalar reference or array reference as the value:
1038
1039     my %where  = (
1040         date_entered => { '>' => \["to_date(?, 'MM/DD/YYYY')", "11/26/2008"] },
1041         date_expires => { '<' => \"now()" }
1042     );
1043
1044 Which would generate:
1045
1046     $stmt = "WHERE date_entered > "to_date(?, 'MM/DD/YYYY') AND date_expires < now()";
1047     @bind = ('11/26/2008');
1048
1049
1050 =head2 Logic and nesting operators
1051
1052 In the example above,
1053 there is a subtle trap if you want to say something like
1054 this (notice the C<AND>):
1055
1056     WHERE priority != ? AND priority != ?
1057
1058 Because, in Perl you I<can't> do this:
1059
1060     priority => { '!=', 2, '!=', 1 }
1061
1062 As the second C<!=> key will obliterate the first. The solution
1063 is to use the special C<-modifier> form inside an arrayref:
1064
1065     priority => [ -and => {'!=', 2},
1066                           {'!=', 1} ]
1067
1068
1069 Normally, these would be joined by C<OR>, but the modifier tells it
1070 to use C<AND> instead. (Hint: You can use this in conjunction with the
1071 C<logic> option to C<new()> in order to change the way your queries
1072 work by default.) B<Important:> Note that the C<-modifier> goes
1073 B<INSIDE> the arrayref, as an extra first element. This will
1074 B<NOT> do what you think it might:
1075
1076     priority => -and => [{'!=', 2}, {'!=', 1}]   # WRONG!
1077
1078 Here is a quick list of equivalencies, since there is some overlap:
1079
1080     # Same
1081     status => {'!=', 'completed', 'not like', 'pending%' }
1082     status => [ -and => {'!=', 'completed'}, {'not like', 'pending%'}]
1083
1084     # Same
1085     status => {'=', ['assigned', 'in-progress']}
1086     status => [ -or => {'=', 'assigned'}, {'=', 'in-progress'}]
1087     status => [ {'=', 'assigned'}, {'=', 'in-progress'} ]
1088
1089
1090
1091 =head2 Special operators : IN, BETWEEN, etc.
1092
1093 You can also use the hashref format to compare a list of fields using the
1094 C<IN> comparison operator, by specifying the list as an arrayref:
1095
1096     my %where  = (
1097         status   => 'completed',
1098         reportid => { -in => [567, 2335, 2] }
1099     );
1100
1101 Which would generate:
1102
1103     $stmt = "WHERE status = ? AND reportid IN (?,?,?)";
1104     @bind = ('completed', '567', '2335', '2');
1105
1106 The reverse operator C<-not_in> generates SQL C<NOT IN> and is used in
1107 the same way.
1108
1109 If the argument to C<-in> is an empty array, 'sqlfalse' is generated
1110 (by default : C<1=0>). Similarly, C<< -not_in => [] >> generates
1111 'sqltrue' (by default : C<1=1>).
1112
1113 In addition to the array you can supply a chunk of literal sql or
1114 literal sql with bind:
1115
1116     my %where = {
1117       customer => { -in => \[
1118         'SELECT cust_id FROM cust WHERE balance > ?',
1119         2000,
1120       ],
1121       status => { -in => \'SELECT status_codes FROM states' },
1122     };
1123
1124 would generate:
1125
1126     $stmt = "WHERE (
1127           customer IN ( SELECT cust_id FROM cust WHERE balance > ? )
1128       AND status IN ( SELECT status_codes FROM states )
1129     )";
1130     @bind = ('2000');
1131
1132
1133
1134 Another pair of operators is C<-between> and C<-not_between>,
1135 used with an arrayref of two values:
1136
1137     my %where  = (
1138         user   => 'nwiger',
1139         completion_date => {
1140            -not_between => ['2002-10-01', '2003-02-06']
1141         }
1142     );
1143
1144 Would give you:
1145
1146     WHERE user = ? AND completion_date NOT BETWEEN ( ? AND ? )
1147
1148 Just like with C<-in> all plausible combinations of literal SQL
1149 are possible:
1150
1151     my %where = {
1152       start0 => { -between => [ 1, 2 ] },
1153       start1 => { -between => \["? AND ?", 1, 2] },
1154       start2 => { -between => \"lower(x) AND upper(y)" },
1155       start3 => { -between => [
1156         \"lower(x)",
1157         \["upper(?)", 'stuff' ],
1158       ] },
1159     };
1160
1161 Would give you:
1162
1163     $stmt = "WHERE (
1164           ( start0 BETWEEN ? AND ?                )
1165       AND ( start1 BETWEEN ? AND ?                )
1166       AND ( start2 BETWEEN lower(x) AND upper(y)  )
1167       AND ( start3 BETWEEN lower(x) AND upper(?)  )
1168     )";
1169     @bind = (1, 2, 1, 2, 'stuff');
1170
1171
1172 These are the two builtin "special operators"; but the
1173 list can be expanded : see section L</"SPECIAL OPERATORS"> below.
1174
1175 =head2 Unary operators: bool
1176
1177 If you wish to test against boolean columns or functions within your
1178 database you can use the C<-bool> and C<-not_bool> operators. For
1179 example to test the column C<is_user> being true and the column
1180 C<is_enabled> being false you would use:-
1181
1182     my %where  = (
1183         -bool       => 'is_user',
1184         -not_bool   => 'is_enabled',
1185     );
1186
1187 Would give you:
1188
1189     WHERE is_user AND NOT is_enabled
1190
1191 If a more complex combination is required, testing more conditions,
1192 then you should use the and/or operators:-
1193
1194     my %where  = (
1195         -and           => [
1196             -bool      => 'one',
1197             -bool      => 'two',
1198             -bool      => 'three',
1199             -not_bool  => 'four',
1200         ],
1201     );
1202
1203 Would give you:
1204
1205     WHERE one AND two AND three AND NOT four
1206
1207
1208 =head2 Nested conditions, -and/-or prefixes
1209
1210 So far, we've seen how multiple conditions are joined with a top-level
1211 C<AND>.  We can change this by putting the different conditions we want in
1212 hashes and then putting those hashes in an array. For example:
1213
1214     my @where = (
1215         {
1216             user   => 'nwiger',
1217             status => { -like => ['pending%', 'dispatched'] },
1218         },
1219         {
1220             user   => 'robot',
1221             status => 'unassigned',
1222         }
1223     );
1224
1225 This data structure would create the following:
1226
1227     $stmt = "WHERE ( user = ? AND ( status LIKE ? OR status LIKE ? ) )
1228                 OR ( user = ? AND status = ? ) )";
1229     @bind = ('nwiger', 'pending', 'dispatched', 'robot', 'unassigned');
1230
1231
1232 Clauses in hashrefs or arrayrefs can be prefixed with an C<-and> or C<-or>
1233 to change the logic inside :
1234
1235     my @where = (
1236          -and => [
1237             user => 'nwiger',
1238             [
1239                 -and => [ workhrs => {'>', 20}, geo => 'ASIA' ],
1240                 -or => { workhrs => {'<', 50}, geo => 'EURO' },
1241             ],
1242         ],
1243     );
1244
1245 That would yield:
1246
1247     WHERE ( user = ? AND (
1248                ( workhrs > ? AND geo = ? )
1249             OR ( workhrs < ? OR geo = ? )
1250           ) )
1251
1252 =head3 Algebraic inconsistency, for historical reasons
1253
1254 C<Important note>: when connecting several conditions, the C<-and->|C<-or>
1255 operator goes C<outside> of the nested structure; whereas when connecting
1256 several constraints on one column, the C<-and> operator goes
1257 C<inside> the arrayref. Here is an example combining both features :
1258
1259    my @where = (
1260      -and => [a => 1, b => 2],
1261      -or  => [c => 3, d => 4],
1262       e   => [-and => {-like => 'foo%'}, {-like => '%bar'} ]
1263    )
1264
1265 yielding
1266
1267   WHERE ( (    ( a = ? AND b = ? )
1268             OR ( c = ? OR d = ? )
1269             OR ( e LIKE ? AND e LIKE ? ) ) )
1270
1271 This difference in syntax is unfortunate but must be preserved for
1272 historical reasons. So be careful : the two examples below would
1273 seem algebraically equivalent, but they are not
1274
1275   {col => [-and => {-like => 'foo%'}, {-like => '%bar'}]}
1276   # yields : WHERE ( ( col LIKE ? AND col LIKE ? ) )
1277
1278   [-and => {col => {-like => 'foo%'}, {col => {-like => '%bar'}}]]
1279   # yields : WHERE ( ( col LIKE ? OR col LIKE ? ) )
1280
1281
1282 =head2 Literal SQL and value type operators
1283
1284 The basic premise of SQL::Abstract is that in WHERE specifications the "left
1285 side" is a column name and the "right side" is a value (normally rendered as
1286 a placeholder). This holds true for both hashrefs and arrayref pairs as you
1287 see in the L</WHERE CLAUSES> examples above. Sometimes it is necessary to
1288 alter this behavior. There are several ways of doing so.
1289
1290 =head3 -ident
1291
1292 This is a virtual operator that signals the string to its right side is an
1293 identifier (a column name) and not a value. For example to compare two
1294 columns you would write:
1295
1296     my %where = (
1297         priority => { '<', 2 },
1298         requestor => { -ident => 'submitter' },
1299     );
1300
1301 which creates:
1302
1303     $stmt = "WHERE priority < ? AND requestor = submitter";
1304     @bind = ('2');
1305
1306 If you are maintaining legacy code you may see a different construct as
1307 described in L</Deprecated usage of Literal SQL>, please use C<-ident> in new
1308 code.
1309
1310 =head3 -value
1311
1312 This is a virtual operator that signals that the construct to its right side
1313 is a value to be passed to DBI. This is for example necessary when you want
1314 to write a where clause against an array (for RDBMS that support such
1315 datatypes). For example:
1316
1317     my %where = (
1318         array => { -value => [1, 2, 3] }
1319     );
1320
1321 will result in:
1322
1323     $stmt = 'WHERE array = ?';
1324     @bind = ([1, 2, 3]);
1325
1326 Note that if you were to simply say:
1327
1328     my %where = (
1329         array => [1, 2, 3]
1330     );
1331
1332 the result would porbably be not what you wanted:
1333
1334     $stmt = 'WHERE array = ? OR array = ? OR array = ?';
1335     @bind = (1, 2, 3);
1336
1337 =head3 Literal SQL
1338
1339 Finally, sometimes only literal SQL will do. To include a random snippet
1340 of SQL verbatim, you specify it as a scalar reference. Consider this only
1341 as a last resort. Usually there is a better way. For example:
1342
1343     my %where = (
1344         priority => { '<', 2 },
1345         requestor => { -in => \'(SELECT name FROM hitmen)' },
1346     );
1347
1348 Would create:
1349
1350     $stmt = "WHERE priority < ? AND requestor IN (SELECT name FROM hitmen)"
1351     @bind = (2);
1352
1353 Note that in this example, you only get one bind parameter back, since
1354 the verbatim SQL is passed as part of the statement.
1355
1356 =head4 CAVEAT
1357
1358   Never use untrusted input as a literal SQL argument - this is a massive
1359   security risk (there is no way to check literal snippets for SQL
1360   injections and other nastyness). If you need to deal with untrusted input
1361   use literal SQL with placeholders as described next.
1362
1363 =head3 Literal SQL with placeholders and bind values (subqueries)
1364
1365 If the literal SQL to be inserted has placeholders and bind values,
1366 use a reference to an arrayref (yes this is a double reference --
1367 not so common, but perfectly legal Perl). For example, to find a date
1368 in Postgres you can use something like this:
1369
1370     my %where = (
1371        date_column => \[q/= date '2008-09-30' - ?::integer/, 10/]
1372     )
1373
1374 This would create:
1375
1376     $stmt = "WHERE ( date_column = date '2008-09-30' - ?::integer )"
1377     @bind = ('10');
1378
1379 Note that you must pass the bind values in the same format as they are returned
1380 by L</where>. That means that if you set L</bindtype> to C<columns>, you must
1381 provide the bind values in the C<< [ column_meta => value ] >> format, where
1382 C<column_meta> is an opaque scalar value; most commonly the column name, but
1383 you can use any scalar value (including references and blessed references),
1384 L<SQL::Abstract> will simply pass it through intact. So if C<bindtype> is set
1385 to C<columns> the above example will look like:
1386
1387     my %where = (
1388        date_column => \[q/= date '2008-09-30' - ?::integer/, [ dummy => 10 ]/]
1389     )
1390
1391 Literal SQL is especially useful for nesting parenthesized clauses in the
1392 main SQL query. Here is a first example :
1393
1394   my ($sub_stmt, @sub_bind) = ("SELECT c1 FROM t1 WHERE c2 < ? AND c3 LIKE ?",
1395                                100, "foo%");
1396   my %where = (
1397     foo => 1234,
1398     bar => \["IN ($sub_stmt)" => @sub_bind],
1399   );
1400
1401 This yields :
1402
1403   $stmt = "WHERE (foo = ? AND bar IN (SELECT c1 FROM t1
1404                                              WHERE c2 < ? AND c3 LIKE ?))";
1405   @bind = (1234, 100, "foo%");
1406
1407 Other subquery operators, like for example C<"E<gt> ALL"> or C<"NOT IN">,
1408 are expressed in the same way. Of course the C<$sub_stmt> and
1409 its associated bind values can be generated through a former call
1410 to C<select()> :
1411
1412   my ($sub_stmt, @sub_bind)
1413      = $sql->select("t1", "c1", {c2 => {"<" => 100},
1414                                  c3 => {-like => "foo%"}});
1415   my %where = (
1416     foo => 1234,
1417     bar => \["> ALL ($sub_stmt)" => @sub_bind],
1418   );
1419
1420 In the examples above, the subquery was used as an operator on a column;
1421 but the same principle also applies for a clause within the main C<%where>
1422 hash, like an EXISTS subquery :
1423
1424   my ($sub_stmt, @sub_bind)
1425      = $sql->select("t1", "*", {c1 => 1, c2 => \"> t0.c0"});
1426   my %where = ( -and => [
1427     foo   => 1234,
1428     \["EXISTS ($sub_stmt)" => @sub_bind],
1429   ]);
1430
1431 which yields
1432
1433   $stmt = "WHERE (foo = ? AND EXISTS (SELECT * FROM t1
1434                                         WHERE c1 = ? AND c2 > t0.c0))";
1435   @bind = (1234, 1);
1436
1437
1438 Observe that the condition on C<c2> in the subquery refers to
1439 column C<t0.c0> of the main query : this is I<not> a bind
1440 value, so we have to express it through a scalar ref.
1441 Writing C<< c2 => {">" => "t0.c0"} >> would have generated
1442 C<< c2 > ? >> with bind value C<"t0.c0"> ... not exactly
1443 what we wanted here.
1444
1445 Finally, here is an example where a subquery is used
1446 for expressing unary negation:
1447
1448   my ($sub_stmt, @sub_bind)
1449      = $sql->where({age => [{"<" => 10}, {">" => 20}]});
1450   $sub_stmt =~ s/^ where //i; # don't want "WHERE" in the subclause
1451   my %where = (
1452         lname  => {like => '%son%'},
1453         \["NOT ($sub_stmt)" => @sub_bind],
1454     );
1455
1456 This yields
1457
1458   $stmt = "lname LIKE ? AND NOT ( age < ? OR age > ? )"
1459   @bind = ('%son%', 10, 20)
1460
1461 =head3 Deprecated usage of Literal SQL
1462
1463 Below are some examples of archaic use of literal SQL. It is shown only as
1464 reference for those who deal with legacy code. Each example has a much
1465 better, cleaner and safer alternative that users should opt for in new code.
1466
1467 =over
1468
1469 =item *
1470
1471     my %where = ( requestor => \'IS NOT NULL' )
1472
1473     $stmt = "WHERE requestor IS NOT NULL"
1474
1475 This used to be the way of generating NULL comparisons, before the handling
1476 of C<undef> got formalized. For new code please use the superior syntax as
1477 described in L</Tests for NULL values>.
1478
1479 =item *
1480
1481     my %where = ( requestor => \'= submitter' )
1482
1483     $stmt = "WHERE requestor = submitter"
1484
1485 This used to be the only way to compare columns. Use the superior L</-ident>
1486 method for all new code. For example an identifier declared in such a way
1487 will be properly quoted if L</quote_char> is properly set, while the legacy
1488 form will remain as supplied.
1489
1490 =item *
1491
1492     my %where = ( is_ready  => \"", completed => { '>', '2012-12-21' } )
1493
1494     $stmt = "WHERE completed > ? AND is_ready"
1495     @bind = ('2012-12-21')
1496
1497 Using an empty string literal used to be the only way to express a boolean.
1498 For all new code please use the much more readable
1499 L<-bool|/Unary operators: bool> operator.
1500
1501 =back
1502
1503 =head2 Conclusion
1504
1505 These pages could go on for a while, since the nesting of the data
1506 structures this module can handle are pretty much unlimited (the
1507 module implements the C<WHERE> expansion as a recursive function
1508 internally). Your best bet is to "play around" with the module a
1509 little to see how the data structures behave, and choose the best
1510 format for your data based on that.
1511
1512 And of course, all the values above will probably be replaced with
1513 variables gotten from forms or the command line. After all, if you
1514 knew everything ahead of time, you wouldn't have to worry about
1515 dynamically-generating SQL and could just hardwire it into your
1516 script.
1517
1518 =head1 ORDER BY CLAUSES
1519
1520 Some functions take an order by clause. This can either be a scalar (just a
1521 column name,) a hash of C<< { -desc => 'col' } >> or C<< { -asc => 'col' } >>,
1522 or an array of either of the two previous forms. Examples:
1523
1524                Given            |         Will Generate
1525     ----------------------------------------------------------
1526                                 |
1527     \'colA DESC'                | ORDER BY colA DESC
1528                                 |
1529     'colA'                      | ORDER BY colA
1530                                 |
1531     [qw/colA colB/]             | ORDER BY colA, colB
1532                                 |
1533     {-asc  => 'colA'}           | ORDER BY colA ASC
1534                                 |
1535     {-desc => 'colB'}           | ORDER BY colB DESC
1536                                 |
1537     ['colA', {-asc => 'colB'}]  | ORDER BY colA, colB ASC
1538                                 |
1539     { -asc => [qw/colA colB/] } | ORDER BY colA ASC, colB ASC
1540                                 |
1541     [                           |
1542       { -asc => 'colA' },       | ORDER BY colA ASC, colB DESC,
1543       { -desc => [qw/colB/],    |          colC ASC, colD ASC
1544       { -asc => [qw/colC colD/],|
1545     ]                           |
1546     ===========================================================
1547
1548
1549
1550 =head1 SPECIAL OPERATORS
1551
1552   my $sqlmaker = SQL::Abstract->new(special_ops => [
1553      {
1554       regex => qr/.../,
1555       handler => sub {
1556         my ($self, $field, $op, $arg) = @_;
1557         ...
1558       },
1559      },
1560      {
1561       regex => qr/.../,
1562       handler => 'method_name',
1563      },
1564    ]);
1565
1566 A "special operator" is a SQL syntactic clause that can be
1567 applied to a field, instead of a usual binary operator.
1568 For example :
1569
1570    WHERE field IN (?, ?, ?)
1571    WHERE field BETWEEN ? AND ?
1572    WHERE MATCH(field) AGAINST (?, ?)
1573
1574 Special operators IN and BETWEEN are fairly standard and therefore
1575 are builtin within C<SQL::Abstract> (as the overridable methods
1576 C<_where_field_IN> and C<_where_field_BETWEEN>). For other operators,
1577 like the MATCH .. AGAINST example above which is specific to MySQL,
1578 you can write your own operator handlers - supply a C<special_ops>
1579 argument to the C<new> method. That argument takes an arrayref of
1580 operator definitions; each operator definition is a hashref with two
1581 entries:
1582
1583 =over
1584
1585 =item regex
1586
1587 the regular expression to match the operator
1588
1589 =item handler
1590
1591 Either a coderef or a plain scalar method name. In both cases
1592 the expected return is C<< ($sql, @bind) >>.
1593
1594 When supplied with a method name, it is simply called on the
1595 L<SQL::Abstract/> object as:
1596
1597  $self->$method_name ($field, $op, $arg)
1598
1599  Where:
1600
1601   $op is the part that matched the handler regex
1602   $field is the LHS of the operator
1603   $arg is the RHS
1604
1605 When supplied with a coderef, it is called as:
1606
1607  $coderef->($self, $field, $op, $arg)
1608
1609
1610 =back
1611
1612 For example, here is an implementation
1613 of the MATCH .. AGAINST syntax for MySQL
1614
1615   my $sqlmaker = SQL::Abstract->new(special_ops => [
1616
1617     # special op for MySql MATCH (field) AGAINST(word1, word2, ...)
1618     {regex => qr/^match$/i,
1619      handler => sub {
1620        my ($self, $field, $op, $arg) = @_;
1621        $arg = [$arg] if not ref $arg;
1622        my $label         = $self->_quote($field);
1623        my ($placeholder) = $self->_convert('?');
1624        my $placeholders  = join ", ", (($placeholder) x @$arg);
1625        my $sql           = $self->_sqlcase('match') . " ($label) "
1626                          . $self->_sqlcase('against') . " ($placeholders) ";
1627        my @bind = $self->_bindtype($field, @$arg);
1628        return ($sql, @bind);
1629        }
1630      },
1631
1632   ]);
1633
1634
1635 =head1 UNARY OPERATORS
1636
1637   my $sqlmaker = SQL::Abstract->new(unary_ops => [
1638      {
1639       regex => qr/.../,
1640       handler => sub {
1641         my ($self, $op, $arg) = @_;
1642         ...
1643       },
1644      },
1645      {
1646       regex => qr/.../,
1647       handler => 'method_name',
1648      },
1649    ]);
1650
1651 A "unary operator" is a SQL syntactic clause that can be
1652 applied to a field - the operator goes before the field
1653
1654 You can write your own operator handlers - supply a C<unary_ops>
1655 argument to the C<new> method. That argument takes an arrayref of
1656 operator definitions; each operator definition is a hashref with two
1657 entries:
1658
1659 =over
1660
1661 =item regex
1662
1663 the regular expression to match the operator
1664
1665 =item handler
1666
1667 Either a coderef or a plain scalar method name. In both cases
1668 the expected return is C<< $sql >>.
1669
1670 When supplied with a method name, it is simply called on the
1671 L<SQL::Abstract/> object as:
1672
1673  $self->$method_name ($op, $arg)
1674
1675  Where:
1676
1677   $op is the part that matched the handler regex
1678   $arg is the RHS or argument of the operator
1679
1680 When supplied with a coderef, it is called as:
1681
1682  $coderef->($self, $op, $arg)
1683
1684
1685 =back
1686
1687
1688 =head1 PERFORMANCE
1689
1690 Thanks to some benchmarking by Mark Stosberg, it turns out that
1691 this module is many orders of magnitude faster than using C<DBIx::Abstract>.
1692 I must admit this wasn't an intentional design issue, but it's a
1693 byproduct of the fact that you get to control your C<DBI> handles
1694 yourself.
1695
1696 To maximize performance, use a code snippet like the following:
1697
1698     # prepare a statement handle using the first row
1699     # and then reuse it for the rest of the rows
1700     my($sth, $stmt);
1701     for my $href (@array_of_hashrefs) {
1702         $stmt ||= $sql->insert('table', $href);
1703         $sth  ||= $dbh->prepare($stmt);
1704         $sth->execute($sql->values($href));
1705     }
1706
1707 The reason this works is because the keys in your C<$href> are sorted
1708 internally by B<SQL::Abstract>. Thus, as long as your data retains
1709 the same structure, you only have to generate the SQL the first time
1710 around. On subsequent queries, simply use the C<values> function provided
1711 by this module to return your values in the correct order.
1712
1713 However this depends on the values having the same type - if, for
1714 example, the values of a where clause may either have values
1715 (resulting in sql of the form C<column = ?> with a single bind
1716 value), or alternatively the values might be C<undef> (resulting in
1717 sql of the form C<column IS NULL> with no bind value) then the
1718 caching technique suggested will not work.
1719
1720 =head1 FORMBUILDER
1721
1722 If you use my C<CGI::FormBuilder> module at all, you'll hopefully
1723 really like this part (I do, at least). Building up a complex query
1724 can be as simple as the following:
1725
1726     #!/usr/bin/perl
1727
1728     use CGI::FormBuilder;
1729     use SQL::Abstract;
1730
1731     my $form = CGI::FormBuilder->new(...);
1732     my $sql  = SQL::Abstract->new;
1733
1734     if ($form->submitted) {
1735         my $field = $form->field;
1736         my $id = delete $field->{id};
1737         my($stmt, @bind) = $sql->update('table', $field, {id => $id});
1738     }
1739
1740 Of course, you would still have to connect using C<DBI> to run the
1741 query, but the point is that if you make your form look like your
1742 table, the actual query script can be extremely simplistic.
1743
1744 If you're B<REALLY> lazy (I am), check out C<HTML::QuickTable> for
1745 a fast interface to returning and formatting data. I frequently
1746 use these three modules together to write complex database query
1747 apps in under 50 lines.
1748
1749 =head1 REPO
1750
1751 =over
1752
1753 =item * gitweb: L<http://git.shadowcat.co.uk/gitweb/gitweb.cgi?p=dbsrgits/SQL-Abstract.git>
1754
1755 =item * git: L<git://git.shadowcat.co.uk/dbsrgits/SQL-Abstract.git>
1756
1757 =back
1758
1759 =head1 CHANGES
1760
1761 Version 1.50 was a major internal refactoring of C<SQL::Abstract>.
1762 Great care has been taken to preserve the I<published> behavior
1763 documented in previous versions in the 1.* family; however,
1764 some features that were previously undocumented, or behaved
1765 differently from the documentation, had to be changed in order
1766 to clarify the semantics. Hence, client code that was relying
1767 on some dark areas of C<SQL::Abstract> v1.*
1768 B<might behave differently> in v1.50.
1769
1770 The main changes are :
1771
1772 =over
1773
1774 =item *
1775
1776 support for literal SQL through the C<< \ [$sql, bind] >> syntax.
1777
1778 =item *
1779
1780 support for the { operator => \"..." } construct (to embed literal SQL)
1781
1782 =item *
1783
1784 support for the { operator => \["...", @bind] } construct (to embed literal SQL with bind values)
1785
1786 =item *
1787
1788 optional support for L<array datatypes|/"Inserting and Updating Arrays">
1789
1790 =item *
1791
1792 defensive programming : check arguments
1793
1794 =item *
1795
1796 fixed bug with global logic, which was previously implemented
1797 through global variables yielding side-effects. Prior versions would
1798 interpret C<< [ {cond1, cond2}, [cond3, cond4] ] >>
1799 as C<< "(cond1 AND cond2) OR (cond3 AND cond4)" >>.
1800 Now this is interpreted
1801 as C<< "(cond1 AND cond2) OR (cond3 OR cond4)" >>.
1802
1803
1804 =item *
1805
1806 fixed semantics of  _bindtype on array args
1807
1808 =item *
1809
1810 dropped the C<_anoncopy> of the %where tree. No longer necessary,
1811 we just avoid shifting arrays within that tree.
1812
1813 =item *
1814
1815 dropped the C<_modlogic> function
1816
1817 =back
1818
1819 =head1 ACKNOWLEDGEMENTS
1820
1821 There are a number of individuals that have really helped out with
1822 this module. Unfortunately, most of them submitted bugs via CPAN
1823 so I have no idea who they are! But the people I do know are:
1824
1825     Ash Berlin (order_by hash term support)
1826     Matt Trout (DBIx::Class support)
1827     Mark Stosberg (benchmarking)
1828     Chas Owens (initial "IN" operator support)
1829     Philip Collins (per-field SQL functions)
1830     Eric Kolve (hashref "AND" support)
1831     Mike Fragassi (enhancements to "BETWEEN" and "LIKE")
1832     Dan Kubb (support for "quote_char" and "name_sep")
1833     Guillermo Roditi (patch to cleanup "IN" and "BETWEEN", fix and tests for _order_by)
1834     Laurent Dami (internal refactoring, extensible list of special operators, literal SQL)
1835     Norbert Buchmuller (support for literal SQL in hashpair, misc. fixes & tests)
1836     Peter Rabbitson (rewrite of SQLA::Test, misc. fixes & tests)
1837     Oliver Charles (support for "RETURNING" after "INSERT")
1838
1839 Thanks!
1840
1841 =head1 SEE ALSO
1842
1843 L<DBIx::Class>, L<DBIx::Abstract>, L<CGI::FormBuilder>, L<HTML::QuickTable>.
1844
1845 =head1 AUTHOR
1846
1847 Copyright (c) 2001-2007 Nathan Wiger <nwiger@cpan.org>. All Rights Reserved.
1848
1849 This module is actively maintained by Matt Trout <mst@shadowcatsystems.co.uk>
1850
1851 For support, your best bet is to try the C<DBIx::Class> users mailing list.
1852 While not an official support venue, C<DBIx::Class> makes heavy use of
1853 C<SQL::Abstract>, and as such list members there are very familiar with
1854 how to create queries.
1855
1856 =head1 LICENSE
1857
1858 This module is free software; you may copy this under the same
1859 terms as perl itself (either the GNU General Public License or
1860 the Artistic License)
1861
1862 =cut
1863