Add the HTTP::Request::AsCGI part of RT#50082
[catagits/HTTP-Request-AsCGI.git] / lib / HTTP / Request / AsCGI.pm
index ae4bf1c..f2ddbff 100644 (file)
@@ -1,18 +1,38 @@
 package HTTP::Request::AsCGI;
-
+# ABSTRACT: Set up a CGI environment from an HTTP::Request
 use strict;
 use warnings;
 use bytes;
 use base 'Class::Accessor::Fast';
 
+our $VERSION = '0.9';
+
 use Carp;
+use HTTP::Response;
 use IO::Handle;
 use IO::File;
+use URI ();
+use URI::Escape ();
+
+__PACKAGE__->mk_accessors(qw[ environment request stdin stdout stderr ]);
+
+# old typo
+=begin Pod::Coverage
 
-__PACKAGE__->mk_accessors(
-    qw[ enviroment request rawhandles stdin stdout stderr ]);
+  enviroment
+
+=end Pod::Coverage
+
+=cut
 
-our $VERSION = 0.4;
+*enviroment = \&environment;
+
+my %reserved = map { sprintf('%02x', ord($_)) => 1 } split //, $URI::reserved;
+sub _uri_safe_unescape {
+    my ($s) = @_;
+    $s =~ s/%([a-fA-F0-9]{2})/$reserved{lc($1)} ? "%$1" : pack('C', hex($1))/ge;
+    $s
+}
 
 sub new {
     my $class   = shift;
@@ -24,52 +44,61 @@ sub new {
 
     my $self = $class->SUPER::new( { restored => 0, setuped => 0 } );
     $self->request($request);
+    $self->stdin( IO::File->new_tmpfile );
+    $self->stdout( IO::File->new_tmpfile );
 
     my $host = $request->header('Host');
     my $uri  = $request->uri->clone;
     $uri->scheme('http')    unless $uri->scheme;
     $uri->host('localhost') unless $uri->host;
     $uri->port(80)          unless $uri->port;
-    $uri->host_port($host) unless !$host || ( $host eq $uri->host_port );
+    $uri->host_port($host)  unless !$host || ( $host eq $uri->host_port );
 
     $uri = $uri->canonical;
 
-    my $enviroment = {
+    my $environment = {
         GATEWAY_INTERFACE => 'CGI/1.1',
         HTTP_HOST         => $uri->host_port,
-        HTTPS => ( $uri->scheme eq 'https' ) ? 'ON' : 'OFF',   # not in RFC 3875
-        PATH_INFO       => $uri->path,
-        QUERY_STRING    => $uri->query || '',
-        SCRIPT_NAME     => '/',
-        SERVER_NAME     => $uri->host,
-        SERVER_PORT     => $uri->port,
-        SERVER_PROTOCOL => $request->protocol || 'HTTP/1.1',
-        SERVER_SOFTWARE => "HTTP-Request-AsCGI/$VERSION",
-        REMOTE_ADDR     => '127.0.0.1',
-        REMOTE_HOST     => 'localhost',
-        REMOTE_PORT     => int( rand(64000) + 1000 ),          # not in RFC 3875
-        REQUEST_URI     => $uri->path_query,                   # not in RFC 3875
-        REQUEST_METHOD  => $request->method,
+        HTTPS             => ( $uri->scheme eq 'https' ) ? 'ON' : 'OFF',  # not in RFC 3875
+        PATH_INFO         => $uri->path,
+        QUERY_STRING      => $uri->query || '',
+        SCRIPT_NAME       => '/',
+        SERVER_NAME       => $uri->host,
+        SERVER_PORT       => $uri->port,
+        SERVER_PROTOCOL   => $request->protocol || 'HTTP/1.1',
+        SERVER_SOFTWARE   => "HTTP-Request-AsCGI/$VERSION",
+        REMOTE_ADDR       => '127.0.0.1',
+        REMOTE_HOST       => 'localhost',
+        REMOTE_PORT       => int( rand(64000) + 1000 ),                   # not in RFC 3875
+        REQUEST_URI       => $uri->path_query,                            # not in RFC 3875
+        REQUEST_METHOD    => $request->method,
         @_
     };
 
+    # RFC 3875 says PATH_INFO is not URI-encoded. That's really
+    # annoying for applications that you can't tell "%2F" vs "/", but
+    # doing the partial decoding then makes it impossible to tell
+    # "%252F" vs "%2F". Encoding everything is more compatible to what
+    # web servers like Apache or lighttpd do, anyways.
+    $environment->{PATH_INFO} = URI::Escape::uri_unescape($environment->{PATH_INFO});
+
     foreach my $field ( $request->headers->header_field_names ) {
 
         my $key = uc("HTTP_$field");
         $key =~ tr/-/_/;
         $key =~ s/^HTTP_// if $field =~ /^Content-(Length|Type)$/;
 
-        unless ( exists $enviroment->{$key} ) {
-            $enviroment->{$key} = $request->headers->header($field);
+        unless ( exists $environment->{$key} ) {
+            $environment->{$key} = $request->headers->header($field);
         }
     }
 
-    unless ( $enviroment->{SCRIPT_NAME} eq '/' && $enviroment->{PATH_INFO} ) {
-        $enviroment->{PATH_INFO} =~ s/^\Q$enviroment->{SCRIPT_NAME}\E/\//;
-        $enviroment->{PATH_INFO} =~ s/^\/+/\//;
+    unless ( $environment->{SCRIPT_NAME} eq '/' && $environment->{PATH_INFO} ) {
+        $environment->{PATH_INFO} =~ s/^\Q$environment->{SCRIPT_NAME}\E/\//;
+        $environment->{PATH_INFO} =~ s/^\/+/\//;
     }
 
-    $self->enviroment($enviroment);
+    $self->environment($environment);
 
     return $self;
 }
@@ -77,67 +106,57 @@ sub new {
 sub setup {
     my $self = shift;
 
-    $self->{restore}->{enviroment} = {%ENV};
-
-    if ( $self->rawhandles ) {
-        $self->stdin( \*STDIN );
-        $self->stdout( \*STDOUT );
-    }
-    else {
-        $self->stdin( IO::File->new_tmpfile );
-        $self->stdout( IO::File->new_tmpfile );
-    }
+    $self->{restore}->{environment} = {%ENV};
 
     binmode( $self->stdin );
 
     if ( $self->request->content_length ) {
 
-        syswrite( $self->stdin, $self->request->content )
+        $self->stdin->print($self->request->content)
           or croak("Can't write request content to stdin handle: $!");
 
-        sysseek( $self->stdin, 0, SEEK_SET )
+        $self->stdin->seek(0, SEEK_SET)
           or croak("Can't seek stdin handle: $!");
-    }
-
-    unless ( $self->rawhandles ) {
 
-        open( $self->{restore}->{stdin}, '>&', STDIN->fileno )
-          or croak("Can't dup stdin: $!");
+        $self->stdin->flush
+          or croak("Can't flush stdin handle: $!");
+    }
 
-        open( STDIN, '<&=', $self->stdin->fileno )
-          or croak("Can't open stdin: $!");
+    open( $self->{restore}->{stdin}, '<&'. STDIN->fileno )
+      or croak("Can't dup stdin: $!");
 
-        binmode(STDIN);
+    open( STDIN, '<&='. $self->stdin->fileno )
+      or croak("Can't open stdin: $!");
 
-        if ( $self->stdout ) {
+    binmode( STDIN );
 
-            open( $self->{restore}->{stdout}, '>&', STDOUT->fileno )
-              or croak("Can't dup stdout: $!");
+    if ( $self->stdout ) {
 
-            open( STDOUT, '>&=', $self->stdout->fileno )
-              or croak("Can't open stdout: $!");
+        open( $self->{restore}->{stdout}, '>&'. STDOUT->fileno )
+          or croak("Can't dup stdout: $!");
 
-            binmode( $self->stdout );
-            binmode(STDOUT);
-        }
+        open( STDOUT, '>&='. $self->stdout->fileno )
+          or croak("Can't open stdout: $!");
 
-        if ( $self->stderr ) {
+        binmode( $self->stdout );
+        binmode( STDOUT);
+    }
 
-            open( $self->{restore}->{stderr}, '>&', STDERR->fileno )
-              or croak("Can't dup stderr: $!");
+    if ( $self->stderr ) {
 
-            open( STDERR, '>&=', $self->stderr->fileno )
-              or croak("Can't open stderr: $!");
+        open( $self->{restore}->{stderr}, '>&'. STDERR->fileno )
+          or croak("Can't dup stderr: $!");
 
-            binmode( $self->stderr );
-            binmode(STDERR);
-        }
+        open( STDERR, '>&='. $self->stderr->fileno )
+          or croak("Can't open stderr: $!");
 
+        binmode( $self->stderr );
+        binmode( STDERR );
     }
 
     {
         no warnings 'uninitialized';
-        %ENV = %{ $self->enviroment };
+        %ENV = %{ $self->environment };
     }
 
     if ( $INC{'CGI.pm'} ) {
@@ -154,63 +173,69 @@ sub response {
 
     return undef unless $self->stdout;
 
-    require HTTP::Response;
-
     seek( $self->stdout, 0, SEEK_SET )
       or croak("Can't seek stdout handle: $!");
 
-    my $message;
+    my $headers;
     while ( my $line = $self->stdout->getline ) {
-        $message .= $line;
-        last if $message =~ /\x0d?\x0a\x0d?\x0a$/;
+        $headers .= $line;
+        last if $headers =~ /\x0d?\x0a\x0d?\x0a$/;
     }
-
-    unless ( $message =~ /^HTTP/ ) {
-        $message = "HTTP/1.1 200 OK\x0d\x0a" . $message;
+    
+    unless ( defined $headers ) {
+        $headers = "HTTP/1.1 500 Internal Server Error\x0d\x0a";
     }
 
-    my $response = HTTP::Response->new;
-    my @headers  = split( /\x0d?\x0a/, $message );
-    my $status   = shift(@headers);
-
-    unless ( $status =~ s/^(HTTP\/\d\.\d) (\d{3}) (.*)$// ) {
-        croak("Invalid Status-Line: '$status'");
+    unless ( $headers =~ /^HTTP/ ) {
+        $headers = "HTTP/1.1 200 OK\x0d\x0a" . $headers;
     }
 
-    $response->protocol($1);
-    $response->code($2);
-    $response->message($3);
+    my $response = HTTP::Response->parse($headers);
+    $response->date( time() ) unless $response->date;
 
-    my $token = qr/[^][\x00-\x1f\x7f()<>@,;:\\"\/?={} \t]+/;
+    my $message = $response->message;
+    my $status  = $response->header('Status');
 
-    foreach my $header (@headers) {
+    if ( $message && $message =~ /^(.+)\x0d$/ ) {
+        $response->message($1);
+    }
 
-        unless ( $header =~ s/^($token):[\t ]*// ) {
-            croak("Invalid header field name : '$header'");
-        }
+    if ( $status && $status =~ /^(\d\d\d)\s?(.+)?$/ ) {
 
-        $response->push_header( $1 => $header );
-    }
+        my $code    = $1;
+        my $message = $2 || HTTP::Status::status_message($code);
 
-    if ( my $code = $response->header('Status') ) {
         $response->code($code);
-        $response->message( HTTP::Status::status_message($code) );
+        $response->message($message);
     }
+    
+    my $length = ( stat( $self->stdout ) )[7] - tell( $self->stdout );
+
+    if ( $response->code == 500 && !$length ) {
 
-    $response->headers->date( time() );
+        $response->content( $response->error_as_HTML );
+        $response->content_type('text/html');
+
+        return $response;
+    }
 
     if ($callback) {
-        $response->content(
-            sub {
-                if ( $self->stdout->read( my $buffer, 4096 ) ) {
-                    return $buffer;
-                }
-                return undef;
+
+        my $handle = $self->stdout;
+
+        $response->content( sub {
+
+            if ( $handle->read( my $buffer, 4096 ) ) {
+                return $buffer;
             }
-        );
+
+            return undef;
+        });
     }
     else {
+
         my $length = 0;
+
         while ( $self->stdout->read( my $buffer, 4096 ) ) {
             $length += length($buffer);
             $response->add_content($buffer);
@@ -229,41 +254,37 @@ sub restore {
 
     {
         no warnings 'uninitialized';
-        %ENV = %{ $self->{restore}->{enviroment} };
+        %ENV = %{ $self->{restore}->{environment} };
     }
 
-    unless ( $self->rawhandles ) {
-
-        open( STDIN, '>&', $self->{restore}->{stdin} )
-          or croak("Can't restore stdin: $!");
+    open( STDIN, '<&'. fileno($self->{restore}->{stdin}) )
+      or croak("Can't restore stdin: $!");
 
-        sysseek( $self->stdin, 0, SEEK_SET )
-          or croak("Can't seek stdin: $!");
+    sysseek( $self->stdin, 0, SEEK_SET )
+      or croak("Can't seek stdin: $!");
 
-        if ( $self->{restore}->{stdout} ) {
+    if ( $self->{restore}->{stdout} ) {
 
-            STDOUT->flush
-              or croak("Can't flush stdout: $!");
+        STDOUT->flush
+          or croak("Can't flush stdout: $!");
 
-            open( STDOUT, '>&', $self->{restore}->{stdout} )
-              or croak("Can't restore stdout: $!");
+        open( STDOUT, '>&'. fileno($self->{restore}->{stdout}) )
+          or croak("Can't restore stdout: $!");
 
-            sysseek( $self->stdout, 0, SEEK_SET )
-              or croak("Can't seek stdout: $!");
-        }
-
-        if ( $self->{restore}->{stderr} ) {
+        sysseek( $self->stdout, 0, SEEK_SET )
+          or croak("Can't seek stdout: $!");
+    }
 
-            STDERR->flush
-              or croak("Can't flush stderr: $!");
+    if ( $self->{restore}->{stderr} ) {
 
-            open( STDERR, '>&', $self->{restore}->{stderr} )
-              or croak("Can't restore stderr: $!");
+        STDERR->flush
+          or croak("Can't flush stderr: $!");
 
-            sysseek( $self->stderr, 0, SEEK_SET )
-              or croak("Can't seek stderr: $!");
-        }
+        open( STDERR, '>&'. fileno($self->{restore}->{stderr}) )
+          or croak("Can't restore stderr: $!");
 
+        sysseek( $self->stderr, 0, SEEK_SET )
+          or croak("Can't seek stderr: $!");
     }
 
     $self->{restored}++;
@@ -280,10 +301,6 @@ sub DESTROY {
 
 __END__
 
-=head1 NAME
-
-HTTP::Request::AsCGI - Setup a CGI enviroment from a HTTP::Request
-
 =head1 SYNOPSIS
 
     use CGI;
@@ -304,7 +321,7 @@ HTTP::Request::AsCGI - Setup a CGI enviroment from a HTTP::Request
         
         $stdout = $c->stdout;
         
-        # enviroment and descriptors will automatically be restored 
+        # environment and descriptors will automatically be restored
         # when $c is destructed.
     }
     
@@ -314,7 +331,7 @@ HTTP::Request::AsCGI - Setup a CGI enviroment from a HTTP::Request
     
 =head1 DESCRIPTION
 
-Provides a convinient way of setting up an CGI enviroment from a HTTP::Request.
+Provides a convenient way of setting up an CGI environment from an HTTP::Request.
 
 =head1 METHODS
 
@@ -322,25 +339,21 @@ Provides a convinient way of setting up an CGI enviroment from a HTTP::Request.
 
 =item new ( $request [, key => value ] )
 
-Contructor, first argument must be a instance of HTTP::Request
-followed by optional pairs of environment key and value.
+Constructor.  The first argument must be a instance of HTTP::Request, followed
+by optional pairs of environment key and value.
 
-=item enviroment
+=item environment
 
 Returns a hashref containing the environment that will be used in setup. 
 Changing the hashref after setup has been called will have no effect.
 
 =item setup
 
-Setups the environment and descriptors.
-
-=item rawhandles
-
-Don't redefine STDIN/STDOUT/STDERR internally.
+Sets up the environment and descriptors.
 
 =item restore
 
-Restores the enviroment and descriptors. Can only be called after setup.
+Restores the environment and descriptors. Can only be called after setup.
 
 =item request
 
@@ -383,13 +396,4 @@ handle with an file descriptor.
 
 Thomas L. Shinnick for his valuable win32 testing.
 
-=head1 AUTHOR
-
-Christian Hansen, C<ch@ngmedia.com>
-
-=head1 LICENSE
-
-This library is free software. You can redistribute it and/or modify 
-it under the same terms as perl itself.
-
 =cut