bump version
[catagits/Web-Simple.git] / lib / Web / Simple.pm
1 package Web::Simple;
2
3 use strictures 1;
4 use 5.008;
5 use warnings::illegalproto ();
6 use Moo ();
7 use Web::Dispatch::Wrapper ();
8
9 our $VERSION = '0.011';
10
11 sub import {
12   my ($class, $app_package) = @_;
13   $app_package ||= caller;
14   $class->_export_into($app_package);
15   eval "package $app_package; use Web::Dispatch::Wrapper; use Moo; 1"
16     or die "Failed to setup app package: $@";
17   strictures->import;
18   warnings::illegalproto->unimport;
19 }
20
21 sub _export_into {
22   my ($class, $app_package) = @_;
23   {
24     no strict 'refs';
25     *{"${app_package}::PSGI_ENV"} = sub () { -1 };
26     require Web::Simple::Application;
27     unshift(@{"${app_package}::ISA"}, 'Web::Simple::Application');
28   }
29   (my $name = $app_package) =~ s/::/\//g;
30   $INC{"${name}.pm"} = 'Set by "use Web::Simple;" invocation';
31 }
32
33 =head1 NAME
34
35 Web::Simple - A quick and easy way to build simple web applications
36
37
38 =head1 SYNOPSIS
39
40   #!/usr/bin/env perl
41
42   package HelloWorld;
43   use Web::Simple
44
45   sub dispatch_request {
46     sub (GET) {
47       [ 200, [ 'Content-type', 'text/plain' ], [ 'Hello world!' ] ]
48     },
49     sub () {
50       [ 405, [ 'Content-type', 'text/plain' ], [ 'Method not allowed' ] ]
51     }
52   }
53
54   HelloWorld->run_if_script;
55
56 If you save this file into your cgi-bin as C<hello-world.cgi> and then visit:
57
58   http://my.server.name/cgi-bin/hello-world.cgi/
59
60 you'll get the "Hello world!" string output to your browser. At the same time
61 this file will also act as a class module, so you can save it as HelloWorld.pm
62 and use it as-is in test scripts or other deployment mechanisms.
63
64 Note that you should retain the ->run_if_script even if your app is a
65 module, since this additionally makes it valid as a .psgi file, which can
66 be extremely useful during development.
67
68 For more complex examples and non-CGI deployment, see
69 L<Web::Simple::Deployment>. To get help with L<Web::Simple>, please connect to
70 the irc.perl.org IRC network and join #web-simple.
71
72 =head1 DESCRIPTION
73
74 The philosophy of L<Web::Simple> is to keep to an absolute bare minimum for
75 everything. It is not designed to be used for large scale applications;
76 the L<Catalyst> web framework already works very nicely for that and is
77 a far more mature, well supported piece of software.
78
79 However, if you have an application that only does a couple of things, and
80 want to not have to think about complexities of deployment, then L<Web::Simple>
81 might be just the thing for you.
82
83 The only public interface the L<Web::Simple> module itself provides is an
84 C<import> based one:
85
86   use Web::Simple 'NameOfApplication';
87
88 This sets up your package (in this case "NameOfApplication" is your package)
89 so that it inherits from L<Web::Simple::Application> and imports L<strictures>,
90 as well as installs a C<PSGI_ENV> constant for convenience, as well as some
91 other subroutines.
92
93 Importing L<strictures> will automatically make your code use the C<strict> and
94 C<warnings> pragma, so you can skip the usual:
95
96   use strict;
97   use warnings FATAL => 'aa';
98
99 provided you 'use Web::Simple' at the top of the file. Note that we turn
100 on *fatal* warnings so if you have any warnings at any point from the file
101 that you did 'use Web::Simple' in, then your application will die. This is,
102 so far, considered a feature.
103
104 When we inherit from L<Web::Simple::Application> we also use L<Moo>, which is
105 the the equivalent of:
106
107   {
108     package NameOfApplication;
109     use Moo;
110     extends 'Web::Simple::Application';
111   }
112
113 So you can use L<Moo> features in your application, such as creating attributes
114 using the C<has> subroutine, etc.  Please see the documentation for L<Moo> for
115 more information.
116
117 It also exports the following subroutines for use in dispatchers:
118
119   response_filter { ... };
120
121   redispatch_to '/somewhere';
122
123 Finally, import sets
124
125   $INC{"NameOfApplication.pm"} = 'Set by "use Web::Simple;" invocation';
126
127 so that perl will not attempt to load the application again even if
128
129   require NameOfApplication;
130
131 is encountered in other code.
132
133 =head1 DISPATCH STRATEGY
134
135 L<Web::Simple> despite being straightforward to use, has a powerful system
136 for matching all sorts of incoming URLs to one or more subroutines.  These
137 subroutines can be simple actions to take for a given URL, or something
138 more complicated, including entire L<Plack> applications, L<Plack::Middleware>
139 and nested subdispatchers.
140
141 =head2 Examples
142
143  sub dispatch_request {
144    # matches: GET /user/1.htm?show_details=1
145    #          GET /user/1.htm
146    sub (GET + /user/* + ?show_details~ + .htm|.html|.xhtml) {
147      my ($self, $user_id, $show_details) = @_;
148      ...
149    },
150    # matches: POST /user?username=frew
151    #          POST /user?username=mst&first_name=matt&last_name=trout
152    sub (POST + /user + ?username=&*) {
153       my ($self, $username, $misc_params) = @_;
154      ...
155    },
156    # matches: DELETE /user/1/friend/2
157    sub (DELETE + /user/*/friend/*) {
158      my ($self, $user_id, $friend_id) = @_;
159      ...
160    },
161    # matches: PUT /user/1?first_name=Matt&last_name=Trout
162    sub (PUT + /user/* + ?first_name~&last_name~) {
163      my ($self, $user_id, $first_name, $last_name) = @_;
164      ...
165    },
166    sub (/user/*/...) {
167      my $user_id = $_[1];
168      # matches: PUT /user/1/role/1
169      sub (PUT + /role/*) {
170        my $role_id = $_[1];
171        ...
172      },
173      # matches: DELETE /user/1/role/1
174      sub (DELETE + /role/*) {
175        my $role_id = $_[1];
176        ...
177      },
178    },
179  }
180
181 =head2 The dispatch cycle
182
183 At the beginning of a request, your app's dispatch_request method is called
184 with the PSGI $env as an argument. You can handle the request entirely in
185 here and return a PSGI response arrayref if you want:
186
187   sub dispatch_request {
188     my ($self, $env) = @_;
189     [ 404, [ 'Content-type' => 'text/plain' ], [ 'Amnesia == fail' ] ]
190   }
191
192 However, generally, instead of that, you return a set of dispatch subs:
193
194   sub dispatch_request {
195     my $self = shift;
196     sub (/) { redispatch_to '/index.html' },
197     sub (/user/*) { $self->show_user($_[1]) },
198     ...
199   }
200
201 Well, a sub is a valid PSGI response too (for ultimate streaming and async
202 cleverness). If you want to return a PSGI sub you have to wrap it into an
203 array ref.
204
205   sub dispatch_request {
206     [ sub { 
207         my $respond = shift;
208         # This is pure PSGI here, so read perldoc PSGI
209     } ]
210   }
211
212 If you return a subroutine with a prototype, the prototype is treated
213 as a match specification - and if the test is passed, the body of the
214 sub is called as a method any matched arguments (see below for more details).
215
216 You can also return a plain subroutine which will be called with just $env
217 - remember that in this case if you need $self you -must- close over it.
218
219 If you return a normal object, L<Web::Simple> will simply return it upwards on
220 the assumption that a response_filter (or some arbitrary L<Plack::Middleware>)
221 somewhere will convert it to something useful.  This allows:
222
223   sub dispatch_request {
224     my $self = shift;
225     sub (.html) { response_filter { $self->render_zoom($_[0]) } },
226     sub (/user/*) { $self->users->get($_[1]) },
227   }
228
229 to render a user object to HTML, if there is an incoming URL such as:
230
231   http://myweb.org/user/111.html
232
233 This works because as we descend down the dispachers, we first match
234 C<sub (.html)>, which adds a C<response_filter> (basically a specialized routine
235 that follows the L<Plack::Middleware> specification), and then later we also
236 match C<sub (/user/*)> which gets a user and returns that as the response.
237 This user object 'bubbles up' through all the wrapping middleware until it hits
238 the C<response_filter> we defined, after which the return is converted to a
239 true html response.
240
241 However, two types of object are treated specially - a Plack::App object
242 will have its C<->to_app> method called and be used as a dispatcher:
243
244   sub dispatch_request {
245     my $self = shift;
246     sub (/static/...) { Plack::App::File->new(...) },
247     ...
248   }
249
250 A Plack::Middleware object will be used as a filter for the rest of the
251 dispatch being returned into:
252
253   ## responds to /admin/track_usage AND /admin/delete_accounts
254
255   sub dispatch_request {
256     my $self = shift;
257     sub (/admin/**) {
258       Plack::Middleware::Session->new(%opts);
259     },
260     sub (/admin/track_usage) {
261       ## something that needs a session
262     },
263     sub (/admin/delete_accounts) {
264       ## something else that needs a session
265     },
266   }
267
268 Note that this is for the dispatch being -returned- to, so if you want to
269 provide it inline you need to do:
270
271   ## ALSO responds to /admin/track_usage AND /admin/delete_accounts
272
273   sub dispatch_request {
274     my $self = shift;
275     sub (/admin/...) {
276       sub {
277         Plack::Middleware::Session->new(%opts);
278       },
279       sub (/track_usage) {
280         ## something that needs a session
281       },
282       sub (/delete_accounts) {
283         ## something else that needs a session
284       },
285     }
286   }
287
288 And that's it - but remember that all this happens recursively - it's
289 dispatchers all the way down.  A URL incoming pattern will run all matching
290 dispatchers and then hit all added filters or L<Plack::Middleware>.
291
292 =head2 Web::Simple match specifications
293
294 =head3 Method matches
295
296   sub (GET) {
297
298 A match specification beginning with a capital letter matches HTTP requests
299 with that request method.
300
301 =head3 Path matches
302
303   sub (/login) {
304
305 A match specification beginning with a / is a path match. In the simplest
306 case it matches a specific path. To match a path with a wildcard part, you
307 can do:
308
309   sub (/user/*) {
310     $self->handle_user($_[1])
311
312 This will match /user/<anything> where <anything> does not include a literal
313 / character. The matched part becomes part of the match arguments. You can
314 also match more than one part:
315
316   sub (/user/*/*) {
317     my ($self, $user_1, $user_2) = @_;
318
319   sub (/domain/*/user/*) {
320     my ($self, $domain, $user) = @_;
321
322 and so on. To match an arbitrary number of parts, use -
323
324   sub (/page/**) {
325
326 This will result in an element per /-separated part so matched. Note that
327 you can do
328
329   sub (/page/**/edit) {
330
331 to match an arbitrary number of parts up to but not including some final
332 part.
333
334 Finally,
335
336   sub (/foo/...) {
337
338 Will match /foo/ on the beginning of the path -and- strip it. This is designed
339 to be used to construct nested dispatch structures, but can also prove useful
340 for having e.g. an optional language specification at the start of a path.
341
342 Note that the '...' is a "maybe something here, maybe not" so the above
343 specification will match like this:
344
345   /foo         # no match
346   /foo/        # match and strip path to '/'
347   /foo/bar/baz # match and strip path to '/bar/baz'
348
349 Note: Since Web::Simple handles a concept of file extensions, * and **
350 matchers will not by default match things after a final dot, and this
351 can be modified by using *.* and **.* in the final position, i.e.:
352
353   /one/*       matches /one/two.three    and captures "two"
354   /one/*.*     matches /one/two.three    and captures "two.three"
355   /**          matches /one/two.three    and captures "one/two"
356   /**.*        matches /one/two.three    and captures "one/two.three"
357
358 =head3 Extension matches
359
360   sub (.html) {
361
362 will match .html from the path (assuming the subroutine itself returns
363 something, of course). This is normally used for rendering - e.g.
364
365   sub (.html) {
366     response_filter { $self->render_html($_[1]) }
367   }
368
369 Additionally,
370
371   sub (.*) {
372
373 will match any extension and supplies the extension as a match argument.
374
375 =head3 Query and body parameter matches
376
377 Query and body parameters can be match via
378
379   sub (?<param spec>) { # match URI query
380   sub (%<param spec>) { # match body params
381
382 The body spec will match if the request content is either
383 application/x-www-form-urlencoded or multipart/form-data - the latter
384 of which is required for uploads, which are now handled experimentally
385 - see below.
386
387 The param spec is elements of one of the following forms -
388
389   param~        # optional parameter
390   param=        # required parameter
391   @param~       # optional multiple parameter
392   @param=       # required multiple parameter
393   :param~       # optional parameter in hashref
394   :param=       # required parameter in hashref
395   :@param~      # optional multiple in hashref
396   :@param=      # required multiple in hashref
397   *             # include all other parameters in hashref
398   @*            # include all other parameters as multiple in hashref
399
400 separated by the & character. The arguments added to the request are
401 one per non-:/* parameter (scalar for normal, arrayref for multiple),
402 plus if any :/* specs exist a hashref containing those values.
403
404 Please note that if you specify a multiple type parameter match, you are
405 ensured of getting an arrayref for the value, EVEN if the current incoming
406 request has only one value.  However if a parameter is specified as single
407 and multiple values are found, the last one will be used.
408
409 For example to match a page parameter with an optional order_by parameter one
410 would write:
411
412   sub (?page=&order_by~) {
413     my ($self, $page, $order_by) = @_;
414     return unless $page =~ /^\d+$/;
415     $page ||= 'id';
416     response_filter {
417       $_[1]->search_rs({}, $p);
418     }
419   }
420
421 to implement paging and ordering against a L<DBIx::Class::ResultSet> object.
422
423 Another Example: To get all parameters as a hashref of arrayrefs, write:
424
425   sub(?@*) {
426     my ($self, $params) = @_;
427     ...
428
429 To get two parameters as a hashref, write:
430
431   sub(?:user~&:domain~) {
432     my ($self, $params) = @_; # params contains only 'user' and 'domain' keys
433
434 You can also mix these, so:
435
436   sub (?foo=&@bar~&:coffee=&@*) {
437      my ($self, $foo, $bar, $params);
438
439 where $bar is an arrayref (possibly an empty one), and $params contains
440 arrayref values for all parameters -not- mentioned and a scalar value for
441 the 'coffee' parameter.
442
443 Note, in the case where you combine arrayref, single parameter and named
444 hashref style, the arrayref and single parameters will appear in C<@_> in the
445 order you defined them in the protoype, but all hashrefs will merge into a
446 single C<$params>, as in the example above.
447
448 =head3 Upload matches (EXPERIMENTAL)
449
450 Note: This feature is experimental. This means that it may not remain
451 100% in its current form. If we change it, notes on updating your code
452 will be added to the L</CHANGES BETWEEN RELEASES> section below.
453
454   sub (*foo=) { # param specifier can be anything valid for query or body
455
456 The upload match system functions exactly like a query/body match, except
457 that the values returned (if any) are C<Web::Dispatch::Upload> objects.
458
459 Note that this match type will succeed in two circumstances where you might
460 not expect it to - first, when the field exists but is not an upload field
461 and second, when the field exists but the form is not an upload form (i.e.
462 content type "application/x-www-form-urlencoded" rather than
463 "multipart/form-data"). In either of these cases, what you'll get back is
464 a C<Web::Dispatch::NotAnUpload> object, which will C<die> with an error
465 pointing out the problem if you try and use it. To be sure you have a real
466 upload object, call
467
468   $upload->is_upload # returns 1 on a valid upload, 0 on a non-upload field
469
470 and to get the reason why such an object is not an upload, call
471
472   $upload->reason # returns a reason or '' on a valid upload.
473
474 Other than these two methods, the upload object provides the same interface
475 as L<Plack::Request::Upload> with the addition of a stringify to the temporary
476 filename to make copying it somewhere else easier to handle.
477
478 =head3 Combining matches
479
480 Matches may be combined with the + character - e.g.
481
482   sub (GET + /user/*) {
483
484 to create an AND match. They may also be combined withe the | character - e.g.
485
486   sub (GET|POST) {
487
488 to create an OR match. Matches can be nested with () - e.g.
489
490   sub ((GET|POST) + /user/*) {
491
492 and negated with ! - e.g.
493
494   sub (!/user/foo + /user/*) {
495
496 ! binds to the immediate rightmost match specification, so if you want
497 to negate a combination you will need to use
498
499   sub ( !(POST|PUT|DELETE) ) {
500
501 and | binds tighter than +, so
502
503   sub ((GET|POST) + /user/*) {
504
505 and
506
507   sub (GET|POST + /user/*) {
508
509 are equivalent, but
510
511   sub ((GET + /admin/...) | (POST + /admin/...)) {
512
513 and
514
515   sub (GET + /admin/... | POST + /admin/...) {
516
517 are not - the latter is equivalent to
518
519   sub (GET + (/admin/...|POST) + /admin/...) {
520
521 which will never match!
522
523 =head3 Whitespace
524
525 Note that for legibility you are permitted to use whitespace -
526
527   sub (GET + /user/*) {
528
529 but it will be ignored. This is because the perl parser strips whitespace
530 from subroutine prototypes, so this is equivalent to
531
532   sub (GET+/user/*) {
533
534 =head3 Accessing the PSGI env hash
535
536 In some cases you may wish to get the raw PSGI env hash - to do this,
537 you can either use a plain sub -
538
539   sub {
540     my ($env) = @_;
541     ...
542   }
543
544 or use the PSGI_ENV constant exported to retrieve it:
545
546   sub (GET + /foo + ?some_param=) {
547     my $param = $_[1];
548     my $env = $_[PSGI_ENV];
549   }
550
551 but note that if you're trying to add a middleware, you should simply use
552 Web::Simple's direct support for doing so.
553
554 =head1 EXPORTED SUBROUTINES
555
556 =head2 response_filter
557
558   response_filter {
559     # Hide errors from the user because we hates them, preciousss
560     if (ref($_[0]) eq 'ARRAY' && $_[0]->[0] == 500) {
561       $_[0] = [ 200, @{$_[0]}[1..$#{$_[0]}] ];
562     }
563     return $_[0];
564   };
565
566 The response_filter subroutine is designed for use inside dispatch subroutines.
567
568 It creates and returns a special dispatcher that always matches, and calls
569 the block passed to it as a filter on the result of running the rest of the
570 current dispatch chain.
571
572 Thus the filter above runs further dispatch as normal, but if the result of
573 dispatch is a 500 (Internal Server Error) response, changes this to a 200 (OK)
574 response without altering the headers or body.
575
576 =head2 redispatch_to
577
578   redispatch_to '/other/url';
579
580 The redispatch_to subroutine is designed for use inside dispatch subroutines.
581
582 It creates and returns a special dispatcher that always matches, and instead
583 of continuing dispatch re-delegates it to the start of the dispatch process,
584 but with the path of the request altered to the supplied URL.
585
586 Thus if you receive a POST to '/some/url' and return a redispatch to
587 '/other/url', the dispatch behaviour will be exactly as if the same POST
588 request had been made to '/other/url' instead.
589
590 Note, this is not the same as returning an HTTP 3xx redirect as a response;
591 rather it is a much more efficient internal process.
592
593 =head1 CHANGES BETWEEN RELEASES
594
595 =head2 Changes between 0.004 and 0.005
596
597 =over 4
598
599 =item * dispatch {} replaced by declaring a dispatch_request method
600
601 dispatch {} has gone away - instead, you write:
602
603   sub dispatch_request {
604     my $self = shift;
605     sub (GET /foo/) { ... },
606     ...
607   }
608
609 Note that this method is still -returning- the dispatch code - just like
610 dispatch did.
611
612 Also note that you need the 'my $self = shift' since the magic $self
613 variable went away.
614
615 =item * the magic $self variable went away.
616
617 Just add 'my $self = shift;' while writing your 'sub dispatch_request {'
618 like a normal perl method.
619
620 =item * subdispatch deleted - all dispatchers can now subdispatch
621
622 In earlier releases you needed to write:
623
624   subdispatch sub (/foo/...) {
625     ...
626     [
627       sub (GET /bar/) { ... },
628       ...
629     ]
630   }
631
632 As of 0.005, you can instead write simply:
633
634   sub (/foo/...) {
635     ...
636     (
637       sub (GET /bar/) { ... },
638       ...
639     )
640   }
641
642 =back
643
644 =head2 Changes since Antiquated Perl
645
646 =over 4
647
648 =item * filter_response renamed to response_filter
649
650 This is a pure rename; a global search and replace should fix it.
651
652 =item * dispatch [] changed to dispatch {}
653
654 Simply changing
655
656   dispatch [ sub(...) { ... }, ... ];
657
658 to
659
660   dispatch { sub(...) { ... }, ... };
661
662 should work fine.
663
664 =back
665
666 =head1 DEVELOPMENT HISTORY
667
668 Web::Simple was originally written to form part of my Antiquated Perl talk for
669 Italian Perl Workshop 2009, but in writing the bloggery example I realised
670 that having a bare minimum system for writing web applications that doesn't
671 drive me insane was rather nice and decided to spend my attempt at nanowrimo
672 for 2009 improving and documenting it to the point where others could use it.
673
674 The Antiquated Perl talk can be found at L<http://www.shadowcat.co.uk/archive/conference-video/> and the slides are reproduced in this distribution under
675 L<Web::Simple::AntiquatedPerl>.
676
677 =head1 COMMUNITY AND SUPPORT
678
679 =head2 IRC channel
680
681 irc.perl.org #web-simple
682
683 =head2 No mailing list yet
684
685 Because mst's non-work email is a bombsite so he'd never read it anyway.
686
687 =head2 Git repository
688
689 Gitweb is on http://git.shadowcat.co.uk/ and the clone URL is:
690
691   git clone git://git.shadowcat.co.uk/catagits/Web-Simple.git
692
693 =head1 AUTHOR
694
695 Matt S. Trout (mst) <mst@shadowcat.co.uk>
696
697 =head1 CONTRIBUTORS
698
699 Devin Austin (dhoss) <dhoss@cpan.org>
700
701 Arthur Axel 'fREW' Schmidt <frioux@gmail.com>
702
703 gregor herrmann (gregoa) <gregoa@debian.org>
704
705 John Napiorkowski (jnap) <jjn1056@yahoo.com>
706
707 Josh McMichael <jmcmicha@linus222.gsc.wustl.edu>
708
709 Justin Hunter <justin.d.hunter@gmail.com>
710
711 Kjetil Kjernsmo <kjetil@kjernsmo.net>
712
713 markie <markie@nulletch64.dreamhost.com>
714
715 Christian Walde (Mithaldu) <walde.christian@googlemail.com>
716
717 nperez <nperez@cpan.org>
718
719 Robin Edwards <robin.ge@gmail.com>
720
721 =head1 COPYRIGHT
722
723 Copyright (c) 2010 the Web::Simple L</AUTHOR> and L</CONTRIBUTORS>
724 as listed above.
725
726 =head1 LICENSE
727
728 This library is free software and may be distributed under the same terms
729 as perl itself.
730
731 =cut
732
733 1;