Finalize change #4232.
[p5sagit/p5-mst-13.2.git] / lib / File / Find.pm
index 612f145..28e2e90 100644 (file)
 package File::Find;
 require 5.000;
 require Exporter;
+require Cwd;
 
-@ISA = qw(Exporter);
-@EXPORT = qw(find finddepth);
+=head1 NAME
 
-# Usage:
-#      use File::Find;
-#
-#      find(\&wanted, '/foo','/bar');
-#
-#      sub wanted { ... }
-#              where wanted does whatever you want.  $dir contains the
-#              current directory name, and $_ the current filename within
-#              that directory.  $name contains "$dir/$_".  You are cd'ed
-#              to $dir when the function is called.  The function may
-#              set $prune to prune the tree.
-#
-# This library is primarily for find2perl, which, when fed
-#
-#   find2perl / -name .nfs\* -mtime +7 -exec rm -f {} \; -o -fstype nfs -prune
-#
-# spits out something like this
-#
-#      sub wanted {
-#          /^\.nfs.*$/ &&
-#          (($dev,$ino,$mode,$nlink,$uid,$gid) = lstat($_)) &&
-#          int(-M _) > 7 &&
-#          unlink($_)
-#          ||
-#          ($nlink || (($dev,$ino,$mode,$nlink,$uid,$gid) = lstat($_))) &&
-#          $dev < 0 &&
-#          ($prune = 1);
-#      }
-#
-# Set the variable $dont_use_nlink if you're using AFS, since AFS cheats.
+find - traverse a file tree
 
-sub find {
-    my $wanted = shift;
-    chop($cwd = `pwd`);
-    foreach $topdir (@_) {
-       (($topdev,$topino,$topmode,$topnlink) = stat($topdir))
-         || (warn("Can't stat $topdir: $!\n"), next);
-       if (-d _) {
-           if (chdir($topdir)) {
-               ($dir,$_) = ($topdir,'.');
-               $name = $topdir;
-               &$wanted;
-               ($fixtopdir = $topdir) =~ s,/$,, ;
-               &finddir($wanted,$fixtopdir,$topnlink);
-           }
-           else {
-               warn "Can't cd to $topdir: $!\n";
-           }
-       }
-       else {
-           unless (($dir,$_) = $topdir =~ m#^(.*/)(.*)$#) {
-               ($dir,$_) = ('.', $topdir);
-           }
-           $name = $topdir;
-           chdir $dir && &$wanted;
-       }
-       chdir $cwd;
-    }
-}
+finddepth - traverse a directory structure depth-first
 
-sub finddir {
-    local($wanted,$dir,$nlink) = @_;
-    local($dev,$ino,$mode,$subcount);
-    local($name);
+=head1 SYNOPSIS
 
-    # Get the list of files in the current directory.
+    use File::Find;
+    find(\&wanted, '/foo','/bar');
+    sub wanted { ... }
 
-    opendir(DIR,'.') || (warn "Can't open $dir: $!\n", return);
-    local(@filenames) = readdir(DIR);
-    closedir(DIR);
+    use File::Find;
+    finddepth(\&wanted, '/foo','/bar');
+    sub wanted { ... }
 
-    if ($nlink == 2 && !$dont_use_nlink) {  # This dir has no subdirectories.
-       for (@filenames) {
-           next if $_ eq '.';
-           next if $_ eq '..';
-           $name = "$dir/$_";
-           $nlink = 0;
-           &$wanted;
-       }
+=head1 DESCRIPTION
+
+The first argument to find() is either a hash reference describing the
+operations to be performed for each file, a code reference, or a string
+that contains a subroutine name.  If it is a hash reference, then the
+value for the key C<wanted> should be a code reference.  This code
+reference is called I<the wanted() function> below.
+
+Currently the only other supported key for the above hash is
+C<bydepth>, in presense of which the walk over directories is
+performed depth-first.  Entry point finddepth() is a shortcut for
+specifying C<{ bydepth => 1}> in the first argument of find().
+
+The wanted() function does whatever verifications you want.
+$File::Find::dir contains the current directory name, and $_ the
+current filename within that directory.  $File::Find::name contains
+C<"$File::Find::dir/$_">.  You are chdir()'d to $File::Find::dir when
+the function is called.  The function may set $File::Find::prune to
+prune the tree.
+
+File::Find assumes that you don't alter the $_ variable.  If you do then
+make sure you return it to its original value before exiting your function.
+
+This library is useful for the C<find2perl> tool, which when fed,
+
+    find2perl / -name .nfs\* -mtime +7 \
+       -exec rm -f {} \; -o -fstype nfs -prune
+
+produces something like:
+
+    sub wanted {
+        /^\.nfs.*$/ &&
+        (($dev,$ino,$mode,$nlink,$uid,$gid) = lstat($_)) &&
+        int(-M _) > 7 &&
+        unlink($_)
+        ||
+        ($nlink || (($dev,$ino,$mode,$nlink,$uid,$gid) = lstat($_))) &&
+        $dev < 0 &&
+        ($File::Find::prune = 1);
     }
-    else {                    # This dir has subdirectories.
-       $subcount = $nlink - 2;
-       for (@filenames) {
-           next if $_ eq '.';
-           next if $_ eq '..';
-           $nlink = $prune = 0;
-           $name = "$dir/$_";
-           &$wanted;
-           if ($subcount > 0 || $dont_use_nlink) {    # Seen all the subdirs?
 
-               # Get link count and check for directoriness.
+Set the variable $File::Find::dont_use_nlink if you're using AFS,
+since AFS cheats.
 
-               ($dev,$ino,$mode,$nlink) = lstat($_) unless $nlink;
-               
-               if (-d _) {
+C<finddepth> is just like C<find>, except that it does a depth-first
+search.
 
-                   # It really is a directory, so do it recursively.
+Here's another interesting wanted function.  It will find all symlinks
+that don't resolve:
 
-                   if (!$prune && chdir $_) {
-                       &finddir($wanted,$name,$nlink);
-                       chdir '..';
-                   }
-                   --$subcount;
-               }
-           }
-       }
+    sub wanted {
+       -l && !-e && print "bogus link: $File::Find::name\n";
     }
-}
 
-# Usage:
-#      use File::Find;
-#
-#      finddepth(\&wanted, '/foo','/bar');
-#
-#      sub wanted { ... }
-#              where wanted does whatever you want.  $dir contains the
-#              current directory name, and $_ the current filename within
-#              that directory.  $name contains "$dir/$_".  You are cd'ed
-#              to $dir when the function is called.  The function may
-#              set $prune to prune the tree.
-#
-# This library is primarily for find2perl, which, when fed
-#
-#   find2perl / -name .nfs\* -mtime +7 -exec rm -f {} \; -o -fstype nfs -prune
-#
-# spits out something like this
-#
-#      sub wanted {
-#          /^\.nfs.*$/ &&
-#          (($dev,$ino,$mode,$nlink,$uid,$gid) = lstat($_)) &&
-#          int(-M _) > 7 &&
-#          unlink($_)
-#          ||
-#          ($nlink || (($dev,$ino,$mode,$nlink,$uid,$gid) = lstat($_))) &&
-#          $dev < 0 &&
-#          ($prune = 1);
-#      }
+=head1 BUGS
 
-sub finddepth {
+There is no way to make find or finddepth follow symlinks.
+
+=cut
+
+@ISA = qw(Exporter);
+@EXPORT = qw(find finddepth);
+
+
+sub find_opt {
     my $wanted = shift;
-    chop($cwd = `pwd`);
+    my $bydepth = $wanted->{bydepth};
+    my $cwd = $bydepth ? Cwd::fastcwd() : Cwd::cwd();
+    # Localize these rather than lexicalizing them for backwards
+    # compatibility.
+    local($topdir,$topdev,$topino,$topmode,$topnlink);
     foreach $topdir (@_) {
-       (($topdev,$topino,$topmode,$topnlink) = stat($topdir))
+       (($topdev,$topino,$topmode,$topnlink) =
+         ($Is_VMS ? stat($topdir) : lstat($topdir)))
          || (warn("Can't stat $topdir: $!\n"), next);
        if (-d _) {
            if (chdir($topdir)) {
-               ($fixtopdir = $topdir) =~ s,/$,, ;
-               &finddepthdir($wanted,$fixtopdir,$topnlink);
-               ($dir,$_) = ($fixtopdir,'.');
-               $name = $fixtopdir;
-               &$wanted;
+               $prune = 0;
+               unless ($bydepth) {
+                 ($dir,$_) = ($topdir,'.');
+                 $name = $topdir;
+                 $wanted->{wanted}->();
+               }
+               next if $prune;
+               my $fixtopdir = $topdir;
+               $fixtopdir =~ s,/$,, ;
+               $fixtopdir =~ s/\.dir$// if $Is_VMS;
+               &finddir($wanted,$fixtopdir,$topnlink, $bydepth);
+               if ($bydepth) {
+                 ($dir,$_) = ($fixtopdir,'.');
+                 $name = $fixtopdir;
+                 $wanted->{wanted}->();
+               }
            }
            else {
                warn "Can't cd to $topdir: $!\n";
            }
        }
        else {
-           unless (($dir,$_) = $topdir =~ m#^(.*/)(.*)$#) {
+           require File::Basename;
+           unless (($_,$dir) = File::Basename::fileparse($topdir)) {
                ($dir,$_) = ('.', $topdir);
            }
-           chdir $dir && &$wanted;
+           if (chdir($dir)) {
+               $name = $topdir;
+               $wanted->{wanted}->();
+           }
+           else {
+               warn "Can't cd to $dir: $!\n";
+           }
        }
+    }
+    continue {
        chdir $cwd;
     }
 }
 
-sub finddepthdir {
-    my($wanted,$dir,$nlink) = @_;
-    my($dev,$ino,$mode,$subcount);
-    my($name);
+sub finddir {
+    my($wanted, $nlink, $bydepth);
+    local($dir, $name);
+    ($wanted, $dir, $nlink, $bydepth) = @_;
 
-    # Get the list of files in the current directory.
+    my($dev, $ino, $mode, $subcount);
 
-    opendir(DIR,'.') || warn "Can't open $dir: $!\n";
+    # Get the list of files in the current directory.
+    opendir(DIR,'.') || (warn("Can't open $dir: $!\n"), $bydepth || return);
     my(@filenames) = readdir(DIR);
     closedir(DIR);
 
-    if ($nlink == 2) {        # This dir has no subdirectories.
+    if ($nlink == 2 && !$dont_use_nlink) {  # This dir has no subdirectories.
        for (@filenames) {
            next if $_ eq '.';
            next if $_ eq '..';
            $name = "$dir/$_";
            $nlink = 0;
-           &$wanted;
+           $wanted->{wanted}->();
        }
     }
-    else {                    # This dir has subdirectories.
+    else {                   # This dir has subdirectories.
        $subcount = $nlink - 2;
        for (@filenames) {
            next if $_ eq '.';
            next if $_ eq '..';
-           $nlink = $prune = 0;
+           $nlink = 0;
+           $prune = 0 unless $bydepth;
            $name = "$dir/$_";
-           if ($subcount > 0) {    # Seen all the subdirs?
+           $wanted->{wanted}->() unless $bydepth;
+           if ($subcount > 0 || $dont_use_nlink) {    # Seen all the subdirs?
 
                # Get link count and check for directoriness.
 
-               ($dev,$ino,$mode,$nlink) = lstat($_) unless $nlink;
-               
+               $_ = "" if (!defined($_));
+               ($dev,$ino,$mode,$nlink) = ($Is_VMS ? stat($_) : lstat($_));
+                   # unless ($nlink || $dont_use_nlink);
+
                if (-d _) {
 
                    # It really is a directory, so do it recursively.
 
-                   if (!$prune && chdir $_) {
-                       &finddepthdir($wanted,$name,$nlink);
+                   --$subcount;
+                   next if $prune;
+                   if (chdir $_) {
+                       $name =~ s/\.dir$// if $Is_VMS;
+                       &finddir($wanted,$name,$nlink, $bydepth);
                        chdir '..';
                    }
-                   --$subcount;
+                   else {
+                       warn "Can't cd to $_: $!\n";
+                   }
                }
            }
-           &$wanted;
+           $wanted->{wanted}->() if $bydepth;
        }
     }
 }
 
+sub wrap_wanted {
+  my $wanted = shift;
+  ref($wanted) eq 'HASH' ? $wanted : { wanted => $wanted };
+}
+
+sub find {
+  my $wanted = shift;
+  find_opt(wrap_wanted($wanted), @_);
+}
+
+sub finddepth {
+  my $wanted = wrap_wanted(shift);
+  $wanted->{bydepth} = 1;
+  find_opt($wanted, @_);
+}
+
+# These are hard-coded for now, but may move to hint files.
+if ($^O eq 'VMS') {
+  $Is_VMS = 1;
+  $dont_use_nlink = 1;
+}
+
+$dont_use_nlink = 1
+    if $^O eq 'os2' || $^O eq 'dos' || $^O eq 'amigaos' || $^O eq 'MSWin32';
+
+# Set dont_use_nlink in your hint file if your system's stat doesn't
+# report the number of links in a directory as an indication
+# of the number of files.
+# See, e.g. hints/machten.sh for MachTen 2.2.
+unless ($dont_use_nlink) {
+  require Config;
+  $dont_use_nlink = 1 if ($Config::Config{'dont_use_nlink'});
+}
+
 1;