9d4135c5858338ba384de6f10cdbd4a911c4cf0b
[catagits/Web-Simple.git] / lib / Web / Simple.pm
1 package Web::Simple;
2
3 use strictures 1;
4 use 5.008;
5 use warnings::illegalproto ();
6 use Moo ();
7 use Web::Dispatch::Wrapper ();
8
9 our $VERSION = '0.004';
10
11 sub import {
12   my ($class, $app_package) = @_;
13   $app_package ||= caller;
14   $class->_export_into($app_package);
15   eval "package $app_package; use Web::Dispatch::Wrapper; use Moo; 1"
16     or die "Failed to setup app package: $@";
17   strictures->import;
18   warnings::illegalproto->unimport;
19 }
20
21 sub _export_into {
22   my ($class, $app_package) = @_;
23   {
24     no strict 'refs';
25     *{"${app_package}::PSGI_ENV"} = sub () { -1 };
26     require Web::Simple::Application;
27     unshift(@{"${app_package}::ISA"}, 'Web::Simple::Application');
28   }
29   (my $name = $app_package) =~ s/::/\//g;
30   $INC{"${name}.pm"} = 'Set by "use Web::Simple;" invocation';
31 }
32
33 =head1 NAME
34
35 Web::Simple - A quick and easy way to build simple web applications
36
37 =head1 WARNING
38
39 This is really quite new. If you're reading this on CPAN, it means the stuff
40 that's here we're probably happy with. But only probably. So we may have to
41 change stuff. And if you're reading this from git, come check with irc.perl.org
42 #web-simple that we're actually sure we're going to keep anything that's
43 different from the CPAN version.
44
45 If we do find we have to change stuff we'll add to the
46 L<CHANGES BETWEEN RELEASES> section explaining how to switch your code across
47 to the new version, and we'll do our best to make it as painless as possible
48 because we've got Web::Simple applications too. But we can't promise not to
49 change things at all. Not yet. Sorry.
50
51 =head1 SYNOPSIS
52
53   #!/usr/bin/env perl
54
55   use Web::Simple 'HelloWorld';
56
57   {
58     package HelloWorld;
59
60     sub dispatch_request {
61       sub (GET) {
62         [ 200, [ 'Content-type', 'text/plain' ], [ 'Hello world!' ] ]
63       },
64       sub () {
65         [ 405, [ 'Content-type', 'text/plain' ], [ 'Method not allowed' ] ]
66       }
67     }
68   }
69
70   HelloWorld->run_if_script;
71
72 If you save this file into your cgi-bin as C<hello-world.cgi> and then visit:
73
74   http://my.server.name/cgi-bin/hello-world.cgi/
75
76 you'll get the "Hello world!" string output to your browser. For more complex
77 examples and non-CGI deployment, see below. To get help with Web::Simple,
78 please connect to the irc.perl.org IRC network and join #web-simple.
79
80 =head1 DESCRIPTION
81
82 The philosophy of L<Web::Simple> is to keep to an absolute bare minimum, for
83 everything. It is not designed to be used for large scale applications;
84 the L<Catalyst> web framework already works very nicely for that and is
85 a far more mature, well supported piece of software.
86
87 However, if you have an application that only does a couple of things, and
88 want to not have to think about complexities of deployment, then L<Web::Simple>
89 might be just the thing for you.
90
91 The only public interface the Web::Simple module itself provides is an
92 import based one:
93
94   use Web::Simple 'NameOfApplication';
95
96 This setups up your package (in this case "NameOfApplication" is your package)
97 so that it inherits from L<Web::Simple::Application> and imports L<strictures>,
98 as well as installs a C<PSGI_ENV> constant for convenience, as well as some 
99 other subroutines.
100
101 Importing L<strictures> will automatically make you code use the C<strict> and
102 C<warnings> pragma, so you can skip the usual:
103
104   use strict;
105   use warnings FATAL => 'aa';
106
107 provided you 'use Web::Simple' at the top of the file. Note that we turn
108 on *fatal* warnings so if you have any warnings at any point from the file
109 that you did 'use Web::Simple' in, then your application will die. This is,
110 so far, considered a feature.
111
112 When we inherit from L<Web::Simple::Application> we also use <Moo>, which is
113 the the equivalent of:
114
115   {
116     package NameOfApplication;
117     use Moo;
118     extends 'Web::Simple::Application';
119   }
120
121 It also exports the following subroutines for use in dispatchers:
122
123   response_filter { ... };
124
125   redispatch_to '/somewhere';
126
127 Finally, import sets
128
129   $INC{"NameOfApplication.pm"} = 'Set by "use Web::Simple;" invocation';
130
131 so that perl will not attempt to load the application again even if
132
133   require NameOfApplication;
134
135 is encountered in other code.
136
137 =head1 DISPATCH STRATEGY
138
139 L<Web::Simple> dispite being straightforward to use, has a powerful system
140 for matching all sorts of incoming URLs to one or more subroutines.  These
141 subroutines can be simple actions to take for a given URL, or something
142 more complicated, including entire L<Plack> applications, L<Plack::Middleware>
143 and nested subdispatchers.
144
145 =head2 Examples
146
147  sub dispatch_request {
148    # matches: GET /user/1.htm?show_details=1
149    #          GET /user/1.htm
150    sub (GET + /user/* + ?show_details~ + .htm|.html|.xhtml) {
151      my ($self, $user_id, $show_details) = @_;
152      ...
153    },
154    # matches: POST /user?username=frew
155    #          POST /user?username=mst&first_name=matt&last_name=trout
156    sub (POST + /user + ?username=&*) {
157       my ($self, $username, $misc_params) = @_;
158      ...
159    },
160    # matches: DELETE /user/1/friend/2
161    sub (DELETE + /user/*/friend/*) {
162      my ($self, $user_id, $friend_id) = @_;
163      ...
164    },
165    # matches: PUT /user/1?first_name=Matt&last_name=Trout
166    sub (PUT + /user/* + ?first_name~&last_name~) {
167      my ($self, $user_id, $first_name, $last_name) = @_;
168      ...
169    },
170    sub (/user/*/...) {
171      my $user_id = $_[1];
172      # matches: PUT /user/1/role/1
173      sub (PUT + /role/*) {
174        my $role_id = $_[1];
175        ...
176      },
177      # matches: DELETE /user/1/role/1
178      sub (DELETE + /role/*) {
179        my $role_id = $_[1];
180        ...
181      },
182    },
183  }
184
185 =head2 The dispatch cycle
186
187 At the beginning of a request, your app's dispatch_request method is called
188 with the PSGI $env as an argument. You can handle the request entirely in
189 here and return a PSGI response arrayref if you want:
190
191   sub dispatch_request {
192     my ($self, $env) = @_;
193     [ 404, [ 'Content-type' => 'text/plain' ], [ 'Amnesia == fail' ] ]
194   }
195
196 However, generally, instead of that, you return a set of dispatch subs:
197
198   sub dispatch_request {
199     my $self = shift;
200     sub (/) { redispatch_to '/index.html' },
201     sub (/user/*) { $self->show_user($_[1]) },
202     ...
203   }
204
205 If you return a subroutine with a prototype, the prototype is treated
206 as a match specification - and if the test is passed, the body of the
207 sub is called as a method any matched arguments (see below for more details).
208
209 You can also return a plain subroutine which will be called with just $env
210 - remember that in this case if you need $self you -must- close over it.
211
212 If you return a normal object, L<Web::Simple> will simply return it upwards on
213 the assumption that a response_filter (or some arbitrary L<Plack::Middleware>)
214 somewhere will convert it to something useful.  This allows:
215
216   sub dispatch_request {
217     my $self = shift;
218     sub (.html) { response_filter { $self->render_zoom($_[0]) } },
219     sub (/user/*) { $self->users->get($_[1]) },
220   }
221
222 to render a user object to HTML, if there is an incoming URL such as:
223
224   http://myweb.org/user/111.html
225
226 This works because as we descend down the dispachers, we first match
227 C<sub (.html)>, which adds a C<response_filter> (basically a specialized routine
228 that follows the L<Plack::Middleware> specification), and then later we also
229 match C<sub (/user/*)> which gets a user and returns that as the response.
230 This user object 'bubbles up' through all the wrapping middleware until it hits
231 the C<response_filter> we defined, after which the return is converted to a
232 true html response.
233
234 However, two types of object are treated specially - a Plack::App object
235 will have its C<->to_app> method called and be used as a dispatcher:
236
237   sub dispatch_request {
238     my $self = shift;
239     sub (/static/...) { Plack::App::File->new(...) },
240     ...
241   }
242
243 A Plack::Middleware object will be used as a filter for the rest of the
244 dispatch being returned into:
245
246   ## responds to /admin/track_usage AND /admin/delete_accounts
247
248   sub dispatch_request {
249     my $self = shift;
250     sub (/admin/**) {
251       Plack::Middleware::Session->new(%opts);
252     },
253     sub (/admin/track_usage) {
254       ## something that needs a session
255     },
256     sub (/admin/delete_accounts) {
257       ## something else that needs a session
258     },
259   }
260
261 Note that this is for the dispatch being -returned- to, so if you want to
262 provide it inline you need to do:
263
264   ## ALSO responds to /admin/track_usage AND /admin/delete_accounts
265
266   sub dispatch_request {
267     my $self = shift;
268     sub (/admin/...) {
269       sub {
270         Plack::Middleware::Session->new(%opts);
271       },
272       sub (/track_usage) {
273         ## something that needs a session
274       },
275       sub (/delete_accounts) {
276         ## something else that needs a session
277       },
278     }
279   }
280
281 And that's it - but remember that all this happens recursively - it's
282 dispatchers all the way down.  A URL incoming pattern will run all matching
283 dispatchers and then hit all added filters or L<Plack::Middleware>.
284
285 =head2 Web::Simple match specifications
286
287 =head3 Method matches
288
289   sub (GET) {
290
291 A match specification beginning with a capital letter matches HTTP requests
292 with that request method.
293
294 =head3 Path matches
295
296   sub (/login) {
297
298 A match specification beginning with a / is a path match. In the simplest
299 case it matches a specific path. To match a path with a wildcard part, you
300 can do:
301
302   sub (/user/*) {
303     $self->handle_user($_[1])
304
305 This will match /user/<anything> where <anything> does not include a literal
306 / character. The matched part becomes part of the match arguments. You can
307 also match more than one part:
308
309   sub (/user/*/*) {
310     my ($self, $user_1, $user_2) = @_;
311
312   sub (/domain/*/user/*) {
313     my ($self, $domain, $user) = @_;
314
315 and so on. To match an arbitrary number of parts, use -
316
317   sub (/page/**) {
318
319 This will result in an element per /-separated part so matched. Note that
320 you can do
321
322   sub (/page/**/edit) {
323
324 to match an arbitrary number of parts up to but not including some final
325 part.
326
327 Finally,
328
329   sub (/foo/...) {
330
331 will match /foo/ on the beginning of the path -and- strip it, much like
332 .html strips the extension. This is designed to be used to construct
333 nested dispatch structures, but can also prove useful for having e.g. an
334 optional language specification at the start of a path.
335
336 Note that the '...' is a "maybe something here, maybe not" so the above
337 specification will match like this:
338
339   /foo         # no match
340   /foo/        # match and strip path to '/'
341   /foo/bar/baz # match and strip path to '/bar/baz'
342
343 =head3 Extension matches
344
345   sub (.html) {
346
347 will match and strip .html from the path (assuming the subroutine itself
348 returns something, of course). This is normally used for rendering - e.g.
349
350   sub (.html) {
351     response_filter { $self->render_html($_[1]) }
352   }
353
354 Additionally,
355
356   sub (.*) {
357
358 will match any extension and supplies the stripped extension as a match
359 argument.
360
361 =head3 Query and body parameter matches
362
363 Query and body parameters can be match via
364
365   sub (?<param spec>) { # match URI query
366   sub (%<param spec>) { # match body params
367
368 The body is only matched if the content type is
369 application/x-www-form-urlencoded (note this means that Web::Simple does
370 not yet handle uploads; this will be addressed in a later release).
371
372 The param spec is elements of one of the following forms -
373
374   param~        # optional parameter
375   param=        # required parameter
376   @param~       # optional multiple parameter
377   @param=       # required multiple parameter
378   :param~       # optional parameter in hashref
379   :param=       # required parameter in hashref
380   :@param~      # optional multiple in hashref
381   :@param=      # required multiple in hashref
382   *             # include all other parameters in hashref
383   @*            # include all other parameters as multiple in hashref
384
385 separated by the & character. The arguments added to the request are
386 one per non-:/* parameter (scalar for normal, arrayref for multiple),
387 plus if any :/* specs exist a hashref containing those values.
388
389 Please note that if you specify a multiple type parameter match, you are
390 ensured of getting an arrayref for the value, EVEN if the current incoming
391 request has only one value.  However if a parameter is specified as single
392 and multiple values are found, the last one will be used.
393
394 For example to match a page parameter with an optional order_by parameter one
395 would write:
396
397   sub (?page=&order_by~) {
398     my ($self, $page, $order_by) = @_;
399     return unless $page =~ /^\d+$/;
400     $page ||= 'id';
401     response_filter {
402       $_[1]->search_rs({}, $p);
403     }
404   }
405
406 to implement paging and ordering against a L<DBIx::Class::ResultSet> object.
407
408 Another Example: To get all parameters as a hashref of arrayrefs, write:
409
410   sub(?@*) {
411     my ($self, $params) = @_;
412     ...
413
414 To get two parameters as a hashref, write:
415
416   sub(?:user~&:domain~) {
417     my ($self, $params) = @_; # params contains only 'user' and 'domain' keys
418
419 You can also mix these, so:
420
421   sub (?foo=&@bar~&:coffee=&@*) {
422      my ($self, $foo, $bar, $params);
423
424 where $bar is an arrayref (possibly an empty one), and $params contains
425 arrayref values for all parameters -not- mentioned and a scalar value for
426 the 'coffee' parameter.
427
428 Note, in the case where you combine arrayref, single parameter and named
429 hashref style, the arrayref and single parameters will appear in C<@_> in the
430 order you defined them in the protoype, but all hashrefs will merge into a 
431 single C<$params>, as in the example above.
432
433 =head3 Combining matches
434
435 Matches may be combined with the + character - e.g.
436
437   sub (GET + /user/*) {
438
439 to create an AND match. They may also be combined withe the | character - e.g.
440
441   sub (GET|POST) {
442
443 to create an OR match. Matches can be nested with () - e.g.
444
445   sub ((GET|POST) + /user/*) {
446
447 and negated with ! - e.g.
448
449   sub (!/user/foo + /user/*) {
450
451 ! binds to the immediate rightmost match specification, so if you want
452 to negate a combination you will need to use
453
454   sub ( !(POST|PUT|DELETE) ) {
455
456 and | binds tighter than +, so
457
458   sub ((GET|POST) + /user/*) {
459
460 and
461
462   sub (GET|POST + /user/*) {
463
464 are equivalent, but
465
466   sub ((GET + .html) | (POST + .html)) {
467
468 and
469
470   sub (GET + .html | POST + .html) {
471
472 are not - the latter is equivalent to
473
474   sub (GET + (.html|POST) + .html) {
475
476 which will never match!
477
478 =head3 Whitespace
479
480 Note that for legibility you are permitted to use whitespace -
481
482   sub (GET + /user/*) {
483
484 but it will be ignored. This is because the perl parser strips whitespace
485 from subroutine prototypes, so this is equivalent to
486
487   sub (GET+/user/*) {
488
489 =head3 Accessing the PSGI env hash
490
491 In some cases you may wish to get the raw PSGI env hash - to do this,
492 you can either use a plain sub -
493
494   sub {
495     my ($env) = @_;
496     ...
497   }
498
499 or use the PSGI_ENV constant exported to retrieve it:
500
501   sub (GET + /foo + ?some_param=) {
502     my $param = $_[1];
503     my $env = $_[PSGI_ENV];
504   }
505
506 but note that if you're trying to add a middleware, you should simply use
507 Web::Simple's direct support for doing so.
508
509 =head1 EXPORTED SUBROUTINES
510
511 =head2 response_filter
512
513   response_filter {
514     # Hide errors from the user because we hates them, preciousss
515     if (ref($_[0]) eq 'ARRAY' && $_[0]->[0] == 500) {
516       $_[0] = [ 200, @{$_[0]}[1..$#{$_[0]}] ];
517     }
518     return $_[0];
519   };
520
521 The response_filter subroutine is designed for use inside dispatch subroutines.
522
523 It creates and returns a special dispatcher that always matches, and calls
524 the block passed to it as a filter on the result of running the rest of the
525 current dispatch chain.
526
527 Thus the filter above runs further dispatch as normal, but if the result of
528 dispatch is a 500 (Internal Server Error) response, changes this to a 200 (OK)
529 response without altering the headers or body.
530
531 =head2 redispatch_to
532
533   redispatch_to '/other/url';
534
535 The redispatch_to subroutine is designed for use inside dispatch subroutines.
536
537 It creates and returns a special dispatcher that always matches, and instead
538 of continuing dispatch re-delegates it to the start of the dispatch process,
539 but with the path of the request altered to the supplied URL.
540
541 Thus if you receive a POST to '/some/url' and return a redispatch to
542 '/other/url', the dispatch behaviour will be exactly as if the same POST
543 request had been made to '/other/url' instead.
544
545 Note, this is not the same as returning an HTTP 3xx redirect as a response;
546 rather it is a much more efficient internal process.  
547
548 =head1 CHANGES BETWEEN RELEASES
549
550 =head2 Changes between 0.004 and 0.005
551
552 =over 4
553
554 =item * dispatch {} replaced by declaring a dispatch_request method
555
556 dispatch {} has gone away - instead, you write:
557
558   sub dispatch_request {
559     my $self = shift;
560     sub (GET /foo/) { ... },
561     ...
562   }
563
564 Note that this method is still -returning- the dispatch code - just like
565 dispatch did.
566
567 Also note that you need the 'my $self = shift' since the magic $self
568 variable went away.
569
570 =item * the magic $self variable went away.
571
572 Just add 'my $self = shift;' while writing your 'sub dispatch_request {'
573 like a normal perl method.
574
575 =item * subdispatch deleted - all dispatchers can now subdispatch
576
577 In earlier releases you needed to write:
578
579   subdispatch sub (/foo/...) {
580     ...
581     [
582       sub (GET /bar/) { ... },
583       ...
584     ]
585   }
586
587 As of 0.005, you can instead write simply:
588
589   sub (/foo/...) {
590     ...
591     (
592       sub (GET /bar/) { ... },
593       ...
594     )
595   }
596
597 =head2 Changes since Antiquated Perl
598
599 =over 4
600
601 =item * filter_response renamed to response_filter
602
603 This is a pure rename; a global search and replace should fix it.
604
605 =item * dispatch [] changed to dispatch {}
606
607 Simply changing
608
609   dispatch [ sub(...) { ... }, ... ];
610
611 to
612
613   dispatch { sub(...) { ... }, ... };
614
615 should work fine.
616
617 =back
618
619 =head1 DEVELOPMENT HISTORY
620
621 Web::Simple was originally written to form part of my Antiquated Perl talk for
622 Italian Perl Workshop 2009, but in writing the bloggery example I realised
623 that having a bare minimum system for writing web applications that doesn't
624 drive me insane was rather nice and decided to spend my attempt at nanowrimo
625 for 2009 improving and documenting it to the point where others could use it.
626
627 The Antiquated Perl talk can be found at L<http://www.shadowcat.co.uk/archive/conference-video/>.
628
629 =head1 COMMUNITY AND SUPPORT
630
631 =head2 IRC channel
632
633 irc.perl.org #web-simple
634
635 =head2 No mailing list yet
636
637 Because mst's non-work email is a bombsite so he'd never read it anyway.
638
639 =head2 Git repository
640
641 Gitweb is on http://git.shadowcat.co.uk/ and the clone URL is:
642
643   git clone git://git.shadowcat.co.uk/catagits/Web-Simple.git
644
645 =head1 AUTHOR
646
647 Matt S. Trout <mst@shadowcat.co.uk>
648
649 =head1 CONTRIBUTORS
650
651 None required yet. Maybe this module is perfect (hahahahaha ...).
652
653 =head1 COPYRIGHT
654
655 Copyright (c) 2009 the Web::Simple L</AUTHOR> and L</CONTRIBUTORS>
656 as listed above.
657
658 =head1 LICENSE
659
660 This library is free software and may be distributed under the same terms
661 as perl itself.
662
663 =cut
664
665 1;