[inseperable changes from patch from perl-5.003_95 to perl-5.003_86]
[p5sagit/p5-mst-13.2.git] / pod / perlfunc.pod
1 =head1 NAME
2
3 perlfunc - Perl builtin functions
4
5 =head1 DESCRIPTION
6
7 The functions in this section can serve as terms in an expression.
8 They fall into two major categories: list operators and named unary
9 operators.  These differ in their precedence relationship with a
10 following comma.  (See the precedence table in L<perlop>.)  List
11 operators take more than one argument, while unary operators can never
12 take more than one argument.  Thus, a comma terminates the argument of
13 a unary operator, but merely separates the arguments of a list
14 operator.  A unary operator generally provides a scalar context to its
15 argument, while a list operator may provide either scalar and list
16 contexts for its arguments.  If it does both, the scalar arguments will
17 be first, and the list argument will follow.  (Note that there can ever
18 be only one list argument.)  For instance, splice() has three scalar
19 arguments followed by a list.
20
21 In the syntax descriptions that follow, list operators that expect a
22 list (and provide list context for the elements of the list) are shown
23 with LIST as an argument.  Such a list may consist of any combination
24 of scalar arguments or list values; the list values will be included
25 in the list as if each individual element were interpolated at that
26 point in the list, forming a longer single-dimensional list value.
27 Elements of the LIST should be separated by commas.
28
29 Any function in the list below may be used either with or without
30 parentheses around its arguments.  (The syntax descriptions omit the
31 parentheses.)  If you use the parentheses, the simple (but occasionally
32 surprising) rule is this: It I<LOOKS> like a function, therefore it I<IS> a
33 function, and precedence doesn't matter.  Otherwise it's a list
34 operator or unary operator, and precedence does matter.  And whitespace
35 between the function and left parenthesis doesn't count--so you need to
36 be careful sometimes:
37
38     print 1+2+4;        # Prints 7.
39     print(1+2) + 4;     # Prints 3.
40     print (1+2)+4;      # Also prints 3!
41     print +(1+2)+4;     # Prints 7.
42     print ((1+2)+4);    # Prints 7.
43
44 If you run Perl with the B<-w> switch it can warn you about this.  For
45 example, the third line above produces:
46
47     print (...) interpreted as function at - line 1.
48     Useless use of integer addition in void context at - line 1.
49
50 For functions that can be used in either a scalar or list context,
51 nonabortive failure is generally indicated in a scalar context by
52 returning the undefined value, and in a list context by returning the
53 null list.
54
55 Remember the following rule:
56
57 =over 8
58
59 =item  I<THERE IS NO GENERAL RULE FOR CONVERTING A LIST INTO A SCALAR!>
60
61 =back
62
63 Each operator and function decides which sort of value it would be most
64 appropriate to return in a scalar context.  Some operators return the
65 length of the list that would have been returned in a list context.  Some
66 operators return the first value in the list.  Some operators return the
67 last value in the list.  Some operators return a count of successful
68 operations.  In general, they do what you want, unless you want
69 consistency.
70
71 =head2 Perl Functions by Category
72
73 Here are Perl's functions (including things that look like
74 functions, like some of the keywords and named operators)
75 arranged by category.  Some functions appear in more
76 than one place.
77
78 =over
79
80 =item Functions for SCALARs or strings
81
82 chomp, chop, chr, crypt, hex, index, lc, lcfirst, length,
83 oct, ord, pack, q/STRING/, qq/STRING/, reverse, rindex,
84 sprintf, substr, tr///, uc, ucfirst, y///
85
86 =item Regular expressions and pattern matching
87
88 m//, pos, quotemeta, s///, split, study
89
90 =item Numeric functions
91
92 abs, atan2, cos, exp, hex, int, log, oct, rand, sin, sqrt,
93 srand
94
95 =item Functions for real @ARRAYs
96
97 pop, push, shift, splice, unshift
98
99 =item Functions for list data
100
101 grep, join, map, qw/STRING/, reverse, sort, unpack
102
103 =item Functions for real %HASHes
104
105 delete, each, exists, keys, values
106
107 =item Input and output functions
108
109 binmode, close, closedir, dbmclose, dbmopen, die, eof,
110 fileno, flock, format, getc, print, printf, read, readdir,
111 rewinddir, seek, seekdir, select, syscall, sysread,
112 syswrite, tell, telldir, truncate, warn, write
113
114 =item Functions for fixed length data or records
115
116 pack, read, syscall, sysread, syswrite, unpack, vec
117
118 =item Functions for filehandles, files, or directories
119
120 I<-X>, chdir, chmod, chown, chroot, fcntl, glob, ioctl, link,
121 lstat, mkdir, open, opendir, readlink, rename, rmdir,
122 stat, symlink, umask, unlink, utime
123
124 =item Keywords related to the control flow of your perl program
125
126 caller, continue, die, do, dump, eval, exit, goto, last,
127 next, redo, return, sub, wantarray
128
129 =item Keywords related to scoping
130
131 caller, import, local, my, package, use
132
133 =item Miscellaneous functions
134
135 defined, dump, eval, formline, local, my, reset, scalar,
136 undef, wantarray
137
138 =item Functions for processes and process groups
139
140 alarm, exec, fork, getpgrp, getppid, getpriority, kill,
141 pipe, qx/STRING/, setpgrp, setpriority, sleep, system,
142 times, wait, waitpid
143
144 =item Keywords related to perl modules
145
146 do, import, no, package, require, use
147
148 =item Keywords related to classes and object-orientedness
149
150 bless, dbmclose, dbmopen, package, ref, tie, tied, untie, use
151
152 =item Low-level socket functions
153
154 accept, bind, connect, getpeername, getsockname,
155 getsockopt, listen, recv, send, setsockopt, shutdown,
156 socket, socketpair
157
158 =item System V interprocess communication functions
159
160 msgctl, msgget, msgrcv, msgsnd, semctl, semget, semop,
161 shmctl, shmget, shmread, shmwrite
162
163 =item Fetching user and group info
164
165 endgrent, endhostent, endnetent, endpwent, getgrent,
166 getgrgid, getgrnam, getlogin, getpwent, getpwnam,
167 getpwuid, setgrent, setpwent
168
169 =item Fetching network info
170
171 endprotoent, endservent, gethostbyaddr, gethostbyname,
172 gethostent, getnetbyaddr, getnetbyname, getnetent,
173 getprotobyname, getprotobynumber, getprotoent,
174 getservbyname, getservbyport, getservent, sethostent,
175 setnetent, setprotoent, setservent
176
177 =item Time-related functions
178
179 gmtime, localtime, time, times
180
181 =item Functions new in perl5
182
183 abs, bless, chomp, chr, exists, formline, glob, import, lc,
184 lcfirst, map, my, no, prototype, qx, qw, readline, readpipe,
185 ref, sub*, sysopen, tie, tied, uc, ucfirst, untie, use
186
187 * - C<sub> was a keyword in perl4, but in perl5 it is an
188 operator which can be used in expressions.
189
190 =item Functions obsoleted in perl5
191
192 dbmclose, dbmopen
193
194 =back
195
196 =head2 Alphabetical Listing of Perl Functions
197
198 =over 8
199
200 =item -X FILEHANDLE
201
202 =item -X EXPR
203
204 =item -X
205
206 A file test, where X is one of the letters listed below.  This unary
207 operator takes one argument, either a filename or a filehandle, and
208 tests the associated file to see if something is true about it.  If the
209 argument is omitted, tests $_, except for C<-t>, which tests STDIN.
210 Unless otherwise documented, it returns C<1> for TRUE and C<''> for FALSE, or
211 the undefined value if the file doesn't exist.  Despite the funny
212 names, precedence is the same as any other named unary operator, and
213 the argument may be parenthesized like any other unary operator.  The
214 operator may be any of:
215
216     -r  File is readable by effective uid/gid.
217     -w  File is writable by effective uid/gid.
218     -x  File is executable by effective uid/gid.
219     -o  File is owned by effective uid.
220
221     -R  File is readable by real uid/gid.
222     -W  File is writable by real uid/gid.
223     -X  File is executable by real uid/gid.
224     -O  File is owned by real uid.
225
226     -e  File exists.
227     -z  File has zero size.
228     -s  File has nonzero size (returns size).
229
230     -f  File is a plain file.
231     -d  File is a directory.
232     -l  File is a symbolic link.
233     -p  File is a named pipe (FIFO).
234     -S  File is a socket.
235     -b  File is a block special file.
236     -c  File is a character special file.
237     -t  Filehandle is opened to a tty.
238
239     -u  File has setuid bit set.
240     -g  File has setgid bit set.
241     -k  File has sticky bit set.
242
243     -T  File is a text file.
244     -B  File is a binary file (opposite of -T).
245
246     -M  Age of file in days when script started.
247     -A  Same for access time.
248     -C  Same for inode change time.
249
250 The interpretation of the file permission operators C<-r>, C<-R>, C<-w>,
251 C<-W>, C<-x>, and C<-X> is based solely on the mode of the file and the
252 uids and gids of the user.  There may be other reasons you can't actually
253 read, write or execute the file.  Also note that, for the superuser,
254 C<-r>, C<-R>, C<-w>, and C<-W> always return 1, and C<-x> and C<-X> return
255 1 if any execute bit is set in the mode.  Scripts run by the superuser may
256 thus need to do a stat() to determine the actual mode of the
257 file, or temporarily set the uid to something else.
258
259 Example:
260
261     while (<>) {
262         chop;
263         next unless -f $_;      # ignore specials
264         ...
265     }
266
267 Note that C<-s/a/b/> does not do a negated substitution.  Saying
268 C<-exp($foo)> still works as expected, however--only single letters
269 following a minus are interpreted as file tests.
270
271 The C<-T> and C<-B> switches work as follows.  The first block or so of the
272 file is examined for odd characters such as strange control codes or
273 characters with the high bit set.  If too many odd characters (E<gt>30%)
274 are found, it's a C<-B> file, otherwise it's a C<-T> file.  Also, any file
275 containing null in the first block is considered a binary file.  If C<-T>
276 or C<-B> is used on a filehandle, the current stdio buffer is examined
277 rather than the first block.  Both C<-T> and C<-B> return TRUE on a null
278 file, or a file at EOF when testing a filehandle.  Because you have to
279 read a file to do the C<-T> test, on most occasions you want to use a C<-f>
280 against the file first, as in C<next unless -f $file && -T $file>.
281
282 If any of the file tests (or either the stat() or lstat() operators) are given
283 the special filehandle consisting of a solitary underline, then the stat
284 structure of the previous file test (or stat operator) is used, saving
285 a system call.  (This doesn't work with C<-t>, and you need to remember
286 that lstat() and C<-l> will leave values in the stat structure for the
287 symbolic link, not the real file.)  Example:
288
289     print "Can do.\n" if -r $a || -w _ || -x _;
290
291     stat($filename);
292     print "Readable\n" if -r _;
293     print "Writable\n" if -w _;
294     print "Executable\n" if -x _;
295     print "Setuid\n" if -u _;
296     print "Setgid\n" if -g _;
297     print "Sticky\n" if -k _;
298     print "Text\n" if -T _;
299     print "Binary\n" if -B _;
300
301 =item abs VALUE
302
303 =item abs
304
305 Returns the absolute value of its argument.
306 If VALUE is omitted, uses $_.
307
308 =item accept NEWSOCKET,GENERICSOCKET
309
310 Accepts an incoming socket connect, just as the accept(2) system call
311 does.  Returns the packed address if it succeeded, FALSE otherwise.
312 See example in L<perlipc/"Sockets: Client/Server Communication">.
313
314 =item alarm SECONDS
315
316 =item alarm
317
318 Arranges to have a SIGALRM delivered to this process after the
319 specified number of seconds have elapsed.  If SECONDS is not specified,
320 the value stored in $_ is used. (On some machines,
321 unfortunately, the elapsed time may be up to one second less than you
322 specified because of how seconds are counted.)  Only one timer may be
323 counting at once.  Each call disables the previous timer, and an
324 argument of 0 may be supplied to cancel the previous timer without
325 starting a new one.  The returned value is the amount of time remaining
326 on the previous timer.
327
328 For delays of finer granularity than one second, you may use Perl's
329 syscall() interface to access setitimer(2) if your system supports it,
330 or else see L</select()>.  It is usually a mistake to intermix alarm()
331 and sleep() calls.
332
333 If you want to use alarm() to time out a system call you need to use an
334 eval/die pair.  You can't rely on the alarm causing the system call to
335 fail with $! set to EINTR because Perl sets up signal handlers to
336 restart system calls on some systems.  Using eval/die always works.
337
338     eval {
339         local $SIG{ALRM} = sub { die "alarm\n" };       # NB \n required
340         alarm $timeout;
341         $nread = sysread SOCKET, $buffer, $size;
342         alarm 0;
343     };
344     die if $@ && $@ ne "alarm\n";       # propagate errors
345     if ($@) {
346         # timed out
347     }
348     else {
349         # didn't
350     }
351
352 =item atan2 Y,X
353
354 Returns the arctangent of Y/X in the range -PI to PI.
355
356 For the tangent operation, you may use the POSIX::tan()
357 function, or use the familiar relation:
358
359     sub tan { sin($_[0]) / cos($_[0])  }
360
361 =item bind SOCKET,NAME
362
363 Binds a network address to a socket, just as the bind system call
364 does.  Returns TRUE if it succeeded, FALSE otherwise.  NAME should be a
365 packed address of the appropriate type for the socket.  See the examples in
366 L<perlipc/"Sockets: Client/Server Communication">.
367
368 =item binmode FILEHANDLE
369
370 Arranges for the file to be read or written in "binary" mode in operating
371 systems that distinguish between binary and text files.  Files that are
372 not in binary mode have CR LF sequences translated to LF on input and LF
373 translated to CR LF on output.  Binmode has no effect under Unix; in MS-DOS
374 and similarly archaic systems, it may be imperative--otherwise your
375 MS-DOS-damaged C library may mangle your file.  The key distinction between
376 systems that need binmode and those that don't is their text file
377 formats.  Systems like Unix and Plan9 that delimit lines with a single
378 character, and that encode that character in C as '\n', do not need
379 C<binmode>.  The rest need it.  If FILEHANDLE is an expression, the value
380 is taken as the name of the filehandle.
381
382 =item bless REF,CLASSNAME
383
384 =item bless REF
385
386 This function tells the thingy referenced by REF that it is now
387 an object in the CLASSNAME package--or the current package if no CLASSNAME
388 is specified, which is often the case.  It returns the reference for
389 convenience, because a bless() is often the last thing in a constructor.
390 Always use the two-argument version if the function doing the blessing
391 might be inherited by a derived class.  See L<perlobj> for more about the
392 blessing (and blessings) of objects.
393
394 =item caller EXPR
395
396 =item caller
397
398 Returns the context of the current subroutine call.  In a scalar context,
399 returns the caller's package name if there is a caller, that is, if
400 we're in a subroutine or eval() or require(), and the undefined value
401 otherwise.  In a list context, returns
402
403     ($package, $filename, $line) = caller;
404
405 With EXPR, it returns some extra information that the debugger uses to
406 print a stack trace.  The value of EXPR indicates how many call frames
407 to go back before the current one.
408
409     ($package, $filename, $line, $subroutine,
410      $hasargs, $wantarray, $evaltext, $is_require) = caller($i);
411
412 Here $subroutine may be C<"(eval)"> if the frame is not a subroutine
413 call, but C<L<eval>>.  In such a case additional elements $evaltext and
414 $is_require are set: $is_require is true if the frame is created by
415 C<L<require>> or C<L<use>> statement, $evaltext contains the text of
416 C<L<eval EXPR>> statement.  In particular, for C<L<eval BLOCK>>
417 statement $filename is C<"(eval)">, but $evaltext is undefined. (Note
418 also that C<L<use>> statement creates a C<L<require>> frame inside
419 an C<L<eval EXPR>>) frame.
420
421 Furthermore, when called from within the DB package, caller returns more
422 detailed information: it sets the list variable @DB::args to be the
423 arguments with which the subroutine was invoked.
424
425 =item chdir EXPR
426
427 Changes the working directory to EXPR, if possible.  If EXPR is
428 omitted, changes to home directory.  Returns TRUE upon success, FALSE
429 otherwise.  See example under die().
430
431 =item chmod LIST
432
433 Changes the permissions of a list of files.  The first element of the
434 list must be the numerical mode, which should probably be an octal
435 number, and which definitely should I<not> a string of octal digits:
436 C<0644> is okay, C<'0644'> is not.  Returns the number of files
437 successfully changed.  See also L<oct>, if all you have is a string.
438
439     $cnt = chmod 0755, 'foo', 'bar';
440     chmod 0755, @executables;
441     $mode = '0644'; chmod $mode, 'foo';      # !!! sets mode to --w----r-T
442     $mode = '0644'; chmod oct($mode), 'foo'; # this is better
443     $mode = 0644;   chmod $mode, 'foo';      # this is best
444
445 =item chomp VARIABLE
446
447 =item chomp LIST
448
449 =item chomp
450
451 This is a slightly safer version of chop (see below).  It removes any
452 line ending that corresponds to the current value of C<$/> (also known as
453 $INPUT_RECORD_SEPARATOR in the C<English> module).  It returns the total
454 number of characters removed from all its arguments.  It's often used to
455 remove the newline from the end of an input record when you're worried
456 that the final record may be missing its newline.  When in paragraph mode
457 (C<$/ = "">), it removes all trailing newlines from the string.  If
458 VARIABLE is omitted, it chomps $_.  Example:
459
460     while (<>) {
461         chomp;  # avoid \n on last field
462         @array = split(/:/);
463         ...
464     }
465
466 You can actually chomp anything that's an lvalue, including an assignment:
467
468     chomp($cwd = `pwd`);
469     chomp($answer = <STDIN>);
470
471 If you chomp a list, each element is chomped, and the total number of
472 characters removed is returned.
473
474 =item chop VARIABLE
475
476 =item chop LIST
477
478 =item chop
479
480 Chops off the last character of a string and returns the character
481 chopped.  It's used primarily to remove the newline from the end of an
482 input record, but is much more efficient than C<s/\n//> because it neither
483 scans nor copies the string.  If VARIABLE is omitted, chops $_.
484 Example:
485
486     while (<>) {
487         chop;   # avoid \n on last field
488         @array = split(/:/);
489         ...
490     }
491
492 You can actually chop anything that's an lvalue, including an assignment:
493
494     chop($cwd = `pwd`);
495     chop($answer = <STDIN>);
496
497 If you chop a list, each element is chopped.  Only the value of the
498 last chop is returned.
499
500 Note that chop returns the last character.  To return all but the last
501 character, use C<substr($string, 0, -1)>.
502
503 =item chown LIST
504
505 Changes the owner (and group) of a list of files.  The first two
506 elements of the list must be the I<NUMERICAL> uid and gid, in that order.
507 Returns the number of files successfully changed.
508
509     $cnt = chown $uid, $gid, 'foo', 'bar';
510     chown $uid, $gid, @filenames;
511
512 Here's an example that looks up nonnumeric uids in the passwd file:
513
514     print "User: ";
515     chop($user = <STDIN>);
516     print "Files: "
517     chop($pattern = <STDIN>);
518
519     ($login,$pass,$uid,$gid) = getpwnam($user)
520         or die "$user not in passwd file";
521
522     @ary = <${pattern}>;        # expand filenames
523     chown $uid, $gid, @ary;
524
525 On most systems, you are not allowed to change the ownership of the
526 file unless you're the superuser, although you should be able to change
527 the group to any of your secondary groups.  On insecure systems, these
528 restrictions may be relaxed, but this is not a portable assumption.
529
530 =item chr NUMBER
531
532 =item chr
533
534 Returns the character represented by that NUMBER in the character set.
535 For example, C<chr(65)> is "A" in ASCII.  For the reverse, use L<ord>.
536
537 If NUMBER is omitted, uses $_.
538
539 =item chroot FILENAME
540
541 =item chroot
542
543 This function works as the system call by the same name: it makes the
544 named directory the new root directory for all further pathnames that
545 begin with a "/" by your process and all of its children.  (It doesn't
546 change your current working directory, which is unaffected.)  For security
547 reasons, this call is restricted to the superuser.  If FILENAME is
548 omitted, does chroot to $_.
549
550 =item close FILEHANDLE
551
552 Closes the file or pipe associated with the file handle, returning TRUE
553 only if stdio successfully flushes buffers and closes the system file
554 descriptor.  You don't have to close FILEHANDLE if you are immediately
555 going to do another open() on it, because open() will close it for you.  (See
556 open().)  However, an explicit close on an input file resets the line
557 counter ($.), while the implicit close done by open() does not.  Also,
558 closing a pipe will wait for the process executing on the pipe to
559 complete, in case you want to look at the output of the pipe
560 afterwards.  Closing a pipe explicitly also puts the status value of
561 the command into C<$?>.  Example:
562
563     open(OUTPUT, '|sort >foo'); # pipe to sort
564     ...                         # print stuff to output
565     close OUTPUT;               # wait for sort to finish
566     open(INPUT, 'foo');         # get sort's results
567
568 FILEHANDLE may be an expression whose value gives the real filehandle name.
569
570 =item closedir DIRHANDLE
571
572 Closes a directory opened by opendir().
573
574 =item connect SOCKET,NAME
575
576 Attempts to connect to a remote socket, just as the connect system call
577 does.  Returns TRUE if it succeeded, FALSE otherwise.  NAME should be a
578 packed address of the appropriate type for the socket.  See the examples in
579 L<perlipc/"Sockets: Client/Server Communication">.
580
581 =item continue BLOCK
582
583 Actually a flow control statement rather than a function.  If there is a
584 C<continue> BLOCK attached to a BLOCK (typically in a C<while> or
585 C<foreach>), it is always executed just before the conditional is about to
586 be evaluated again, just like the third part of a C<for> loop in C.  Thus
587 it can be used to increment a loop variable, even when the loop has been
588 continued via the C<next> statement (which is similar to the C C<continue>
589 statement).
590
591 =item cos EXPR
592
593 Returns the cosine of EXPR (expressed in radians).  If EXPR is omitted
594 takes cosine of $_.
595
596 For the inverse cosine operation, you may use the POSIX::acos()
597 function, or use this relation:
598
599     sub acos { atan2( sqrt(1 - $_[0] * $_[0]), $_[0] ) }
600
601 =item crypt PLAINTEXT,SALT
602
603 Encrypts a string exactly like the crypt(3) function in the C library
604 (assuming that you actually have a version there that has not been
605 extirpated as a potential munition).  This can prove useful for checking
606 the password file for lousy passwords, amongst other things.  Only the
607 guys wearing white hats should do this.
608
609 Note that crypt is intended to be a one-way function, much like breaking
610 eggs to make an omelette.  There is no (known) corresponding decrypt
611 function.  As a result, this function isn't all that useful for
612 cryptography.  (For that, see your nearby CPAN mirror.)
613
614 Here's an example that makes sure that whoever runs this program knows
615 their own password:
616
617     $pwd = (getpwuid($<))[1];
618     $salt = substr($pwd, 0, 2);
619
620     system "stty -echo";
621     print "Password: ";
622     chop($word = <STDIN>);
623     print "\n";
624     system "stty echo";
625
626     if (crypt($word, $salt) ne $pwd) {
627         die "Sorry...\n";
628     } else {
629         print "ok\n";
630     }
631
632 Of course, typing in your own password to whomever asks you
633 for it is unwise.
634
635 =item dbmclose HASH
636
637 [This function has been superseded by the untie() function.]
638
639 Breaks the binding between a DBM file and a hash.
640
641 =item dbmopen HASH,DBNAME,MODE
642
643 [This function has been superseded by the tie() function.]
644
645 This binds a dbm(3), ndbm(3), sdbm(3), gdbm(), or Berkeley DB file to a
646 hash.  HASH is the name of the hash.  (Unlike normal open, the first
647 argument is I<NOT> a filehandle, even though it looks like one).  DBNAME
648 is the name of the database (without the F<.dir> or F<.pag> extension if
649 any).  If the database does not exist, it is created with protection
650 specified by MODE (as modified by the umask()).  If your system supports
651 only the older DBM functions, you may perform only one dbmopen() in your
652 program.  In older versions of Perl, if your system had neither DBM nor
653 ndbm, calling dbmopen() produced a fatal error; it now falls back to
654 sdbm(3).
655
656 If you don't have write access to the DBM file, you can only read hash
657 variables, not set them.  If you want to test whether you can write,
658 either use file tests or try setting a dummy hash entry inside an eval(),
659 which will trap the error.
660
661 Note that functions such as keys() and values() may return huge array
662 values when used on large DBM files.  You may prefer to use the each()
663 function to iterate over large DBM files.  Example:
664
665     # print out history file offsets
666     dbmopen(%HIST,'/usr/lib/news/history',0666);
667     while (($key,$val) = each %HIST) {
668         print $key, ' = ', unpack('L',$val), "\n";
669     }
670     dbmclose(%HIST);
671
672 See also L<AnyDBM_File> for a more general description of the pros and
673 cons of the various dbm approaches, as well as L<DB_File> for a particularly
674 rich implementation.
675
676 =item defined EXPR
677
678 =item defined
679
680 Returns a Boolean value telling whether EXPR has a value other than
681 the undefined value C<undef>.  If EXPR is not present, C<$_> will be
682 checked.
683
684 Many operations return C<undef> to indicate failure, end of file,
685 system error, uninitialized variable, and other exceptional
686 conditions.  This function allows you to distinguish C<undef> from
687 other values.  (A simple Boolean test will not distinguish among
688 C<undef>, zero, the empty string, and "0", which are all equally
689 false.)  Note that since C<undef> is a valid scalar, its presence
690 doesn't I<necessarily> indicate an exceptional condition: pop()
691 returns C<undef> when its argument is an empty array, I<or> when the
692 element to return happens to be C<undef>.
693
694 You may also use defined() to check whether a subroutine exists.  On
695 the other hand, use of defined() upon aggregates (hashes and arrays)
696 is not guaranteed to produce intuitive results, and should probably be
697 avoided.
698
699 When used on a hash element, it tells you whether the value is defined,
700 not whether the key exists in the hash.  Use L<exists> for the latter
701 purpose.
702
703 Examples:
704
705     print if defined $switch{'D'};
706     print "$val\n" while defined($val = pop(@ary));
707     die "Can't readlink $sym: $!"
708         unless defined($value = readlink $sym);
709     sub foo { defined &$bar ? &$bar(@_) : die "No bar"; }
710     $debugging = 0 unless defined $debugging;
711
712 Note:  Many folks tend to overuse defined(), and then are surprised to
713 discover that the number 0 and "" (the zero-length string) are, in fact,
714 defined values.  For example, if you say
715
716     "ab" =~ /a(.*)b/;
717
718 the pattern match succeeds, and $1 is defined, despite the fact that it
719 matched "nothing".  But it didn't really match nothing--rather, it
720 matched something that happened to be 0 characters long.  This is all
721 very above-board and honest.  When a function returns an undefined value,
722 it's an admission that it couldn't give you an honest answer.  So you
723 should use defined() only when you're questioning the integrity of what
724 you're trying to do.  At other times, a simple comparison to 0 or "" is
725 what you want.
726
727 Currently, using defined() on an entire array or hash reports whether
728 memory for that aggregate has ever been allocated.  So an array you set
729 to the empty list appears undefined initially, and one that once was full
730 and that you then set to the empty list still appears defined.  You
731 should instead use a simple test for size:
732
733     if (@an_array) { print "has array elements\n" }
734     if (%a_hash)   { print "has hash members\n"   }
735
736 Using undef() on these, however, does clear their memory and then report
737 them as not defined anymore, but you shoudln't do that unless you don't
738 plan to use them again, because it saves time when you load them up
739 again to have memory already ready to be filled.
740
741 This counterintuitive behaviour of defined() on aggregates may be
742 changed, fixed, or broken in a future release of Perl.
743
744 See also L<undef>, L<exists>, L<ref>.
745
746 =item delete EXPR
747
748 Deletes the specified key(s) and their associated values from a hash.
749 For each key, returns the deleted value associated with that key, or
750 the undefined value if there was no such key.  Deleting from C<$ENV{}>
751 modifies the environment.  Deleting from a hash tied to a DBM file
752 deletes the entry from the DBM file.  (But deleting from a tie()d hash
753 doesn't necessarily return anything.)
754
755 The following deletes all the values of a hash:
756
757     foreach $key (keys %HASH) {
758         delete $HASH{$key};
759     }
760
761 And so does this:
762
763     delete @HASH{keys %HASH}
764
765 (But both of these are slower than the undef() command.)  Note that the
766 EXPR can be arbitrarily complicated as long as the final operation is a
767 hash element lookup or hash slice:
768
769     delete $ref->[$x][$y]{$key};
770     delete @{$ref->[$x][$y]}{$key1, $key2, @morekeys};
771
772 =item die LIST
773
774 Outside of an eval(), prints the value of LIST to C<STDERR> and exits with
775 the current value of C<$!> (errno).  If C<$!> is 0, exits with the value of
776 C<($? E<gt>E<gt> 8)> (backtick `command` status).  If C<($? E<gt>E<gt> 8)>
777 is 0, exits with 255.  Inside an eval(), the error message is stuffed into
778 C<$@>, and the eval() is terminated with the undefined value; this makes
779 die() the way to raise an exception.
780
781 Equivalent examples:
782
783     die "Can't cd to spool: $!\n" unless chdir '/usr/spool/news';
784     chdir '/usr/spool/news' or die "Can't cd to spool: $!\n"
785
786 If the value of EXPR does not end in a newline, the current script line
787 number and input line number (if any) are also printed, and a newline
788 is supplied.  Hint: sometimes appending ", stopped" to your message
789 will cause it to make better sense when the string "at foo line 123" is
790 appended.  Suppose you are running script "canasta".
791
792     die "/etc/games is no good";
793     die "/etc/games is no good, stopped";
794
795 produce, respectively
796
797     /etc/games is no good at canasta line 123.
798     /etc/games is no good, stopped at canasta line 123.
799
800 See also exit() and warn().
801
802 You can arrange for a callback to be called just before the die() does
803 its deed, by setting the C<$SIG{__DIE__}> hook.  The associated handler
804 will be called with the error text and can change the error message, if
805 it sees fit, by calling die() again.  See L<perlvar> for details on
806 setting C<%SIG> entries, and eval() for some examples.
807
808 =item do BLOCK
809
810 Not really a function.  Returns the value of the last command in the
811 sequence of commands indicated by BLOCK.  When modified by a loop
812 modifier, executes the BLOCK once before testing the loop condition.
813 (On other statements the loop modifiers test the conditional first.)
814
815 =item do SUBROUTINE(LIST)
816
817 A deprecated form of subroutine call.  See L<perlsub>.
818
819 =item do EXPR
820
821 Uses the value of EXPR as a filename and executes the contents of the
822 file as a Perl script.  Its primary use is to include subroutines
823 from a Perl subroutine library.
824
825     do 'stat.pl';
826
827 is just like
828
829     eval `cat stat.pl`;
830
831 except that it's more efficient, more concise, keeps track of the
832 current filename for error messages, and searches all the B<-I>
833 libraries if the file isn't in the current directory (see also the @INC
834 array in L<perlvar/Predefined Names>).  It's the same, however, in that it does
835 reparse the file every time you call it, so you probably don't want to
836 do this inside a loop.
837
838 Note that inclusion of library modules is better done with the
839 use() and require() operators, which also do error checking
840 and raise an exception if there's a problem.
841
842 =item dump LABEL
843
844 This causes an immediate core dump.  Primarily this is so that you can
845 use the B<undump> program to turn your core dump into an executable binary
846 after having initialized all your variables at the beginning of the
847 program.  When the new binary is executed it will begin by executing a
848 C<goto LABEL> (with all the restrictions that C<goto> suffers).  Think of
849 it as a goto with an intervening core dump and reincarnation.  If LABEL
850 is omitted, restarts the program from the top.  WARNING: any files
851 opened at the time of the dump will NOT be open any more when the
852 program is reincarnated, with possible resulting confusion on the part
853 of Perl.  See also B<-u> option in L<perlrun>.
854
855 Example:
856
857     #!/usr/bin/perl
858     require 'getopt.pl';
859     require 'stat.pl';
860     %days = (
861         'Sun' => 1,
862         'Mon' => 2,
863         'Tue' => 3,
864         'Wed' => 4,
865         'Thu' => 5,
866         'Fri' => 6,
867         'Sat' => 7,
868     );
869
870     dump QUICKSTART if $ARGV[0] eq '-d';
871
872     QUICKSTART:
873     Getopt('f');
874
875 =item each HASH
876
877 When called in a list context, returns a 2-element array consisting of the
878 key and value for the next element of a hash, so that you can iterate over
879 it.  When called in a scalar context, returns the key for only the next
880 element in the hash.  (Note: Keys may be "0" or "", which are logically
881 false; you may wish to avoid constructs like C<while ($k = each %foo) {}>
882 for this reason.)
883
884 Entries are returned in an apparently random order.  When the hash is
885 entirely read, a null array is returned in list context (which when
886 assigned produces a FALSE (0) value), and C<undef> is returned in a
887 scalar context.  The next call to each() after that will start iterating
888 again.  There is a single iterator for each hash, shared by all each(),
889 keys(), and values() function calls in the program; it can be reset by
890 reading all the elements from the hash, or by evaluating C<keys HASH> or
891 C<values HASH>.  If you add or delete elements of a hash while you're
892 iterating over it, you may get entries skipped or duplicated, so don't.
893
894 The following prints out your environment like the printenv(1) program,
895 only in a different order:
896
897     while (($key,$value) = each %ENV) {
898         print "$key=$value\n";
899     }
900
901 See also keys() and values().
902
903 =item eof FILEHANDLE
904
905 =item eof ()
906
907 =item eof
908
909 Returns 1 if the next read on FILEHANDLE will return end of file, or if
910 FILEHANDLE is not open.  FILEHANDLE may be an expression whose value
911 gives the real filehandle name.  (Note that this function actually
912 reads a character and then ungetc()s it, so it is not very useful in an
913 interactive context.)  Do not read from a terminal file (or call
914 C<eof(FILEHANDLE)> on it) after end-of-file is reached.  Filetypes such
915 as terminals may lose the end-of-file condition if you do.
916
917 An C<eof> without an argument uses the last file read as argument.
918 Empty parentheses () may be used to indicate the pseudo file formed of
919 the files listed on the command line, i.e., C<eof()> is reasonable to
920 use inside a C<while (E<lt>E<gt>)> loop to detect the end of only the
921 last file.  Use C<eof(ARGV)> or eof without the parentheses to test
922 I<EACH> file in a while (E<lt>E<gt>) loop.  Examples:
923
924     # reset line numbering on each input file
925     while (<>) {
926         print "$.\t$_";
927         close(ARGV) if (eof);   # Not eof().
928     }
929
930     # insert dashes just before last line of last file
931     while (<>) {
932         if (eof()) {
933             print "--------------\n";
934             close(ARGV);        # close or break; is needed if we
935                                 # are reading from the terminal
936         }
937         print;
938     }
939
940 Practical hint: you almost never need to use C<eof> in Perl, because the
941 input operators return undef when they run out of data.
942
943 =item eval EXPR
944
945 =item eval BLOCK
946
947 EXPR is parsed and executed as if it were a little Perl program.  It
948 is executed in the context of the current Perl program, so that any
949 variable settings or subroutine and format definitions remain afterwards.
950 The value returned is the value of the last expression evaluated, or a
951 return statement may be used, just as with subroutines.  The last
952 expression is evaluated in scalar or array context, depending on the
953 context of the eval.
954
955 If there is a syntax error or runtime error, or a die() statement is
956 executed, an undefined value is returned by eval(), and C<$@> is set to the
957 error message.  If there was no error, C<$@> is guaranteed to be a null
958 string.  If EXPR is omitted, evaluates C<$_>.  The final semicolon, if
959 any, may be omitted from the expression.  Beware that using eval()
960 neither silences perl from printing warnings to STDERR, nor does it
961 stuff the text of warning messages into C<$@>.  To do either of those,
962 you have to use the C<$SIG{__WARN__}> facility.  See warn() and L<perlvar>.
963
964 Note that, because eval() traps otherwise-fatal errors, it is useful for
965 determining whether a particular feature (such as socket() or symlink())
966 is implemented.  It is also Perl's exception trapping mechanism, where
967 the die operator is used to raise exceptions.
968
969 If the code to be executed doesn't vary, you may use the eval-BLOCK
970 form to trap run-time errors without incurring the penalty of
971 recompiling each time.  The error, if any, is still returned in C<$@>.
972 Examples:
973
974     # make divide-by-zero nonfatal
975     eval { $answer = $a / $b; }; warn $@ if $@;
976
977     # same thing, but less efficient
978     eval '$answer = $a / $b'; warn $@ if $@;
979
980     # a compile-time error
981     eval { $answer = };
982
983     # a run-time error
984     eval '$answer =';   # sets $@
985
986 When using the eval{} form as an exception trap in libraries, you may
987 wish not to trigger any C<__DIE__> hooks that user code may have
988 installed.  You can use the C<local $SIG{__DIE__}> construct for this
989 purpose, as shown in this example:
990
991     # a very private exception trap for divide-by-zero
992     eval { local $SIG{'__DIE__'}; $answer = $a / $b; }; warn $@ if $@;
993
994 This is especially significant, given that C<__DIE__> hooks can call
995 die() again, which has the effect of changing their error messages:
996
997     # __DIE__ hooks may modify error messages
998     {
999        local $SIG{'__DIE__'} = sub { (my $x = $_[0]) =~ s/foo/bar/g; die $x };
1000        eval { die "foo foofs here" };
1001        print $@ if $@;                # prints "bar barfs here"
1002     }
1003
1004 With an eval(), you should be especially careful to remember what's
1005 being looked at when:
1006
1007     eval $x;            # CASE 1
1008     eval "$x";          # CASE 2
1009
1010     eval '$x';          # CASE 3
1011     eval { $x };        # CASE 4
1012
1013     eval "\$$x++"       # CASE 5
1014     $$x++;              # CASE 6
1015
1016 Cases 1 and 2 above behave identically: they run the code contained in
1017 the variable $x.  (Although case 2 has misleading double quotes making
1018 the reader wonder what else might be happening (nothing is).)  Cases 3
1019 and 4 likewise behave in the same way: they run the code '$x', which
1020 does nothing but return the value of C<$x>.  (Case 4 is preferred for
1021 purely visual reasons, but it also has the advantage of compiling at
1022 compile-time instead of at run-time.)  Case 5 is a place where
1023 normally you I<WOULD> like to use double quotes, except that in this
1024 particular situation, you can just use symbolic references instead, as
1025 in case 6.
1026
1027 =item exec LIST
1028
1029 The exec() function executes a system command I<AND NEVER RETURNS>,
1030 unless the command does not exist and is executed directly instead of
1031 via C</bin/sh -c> (see below).  Use system() instead of exec() if you
1032 want it to return.
1033
1034 If there is more than one argument in LIST, or if LIST is an array with
1035 more than one value, calls execvp(3) with the arguments in LIST.  If
1036 there is only one scalar argument, the argument is checked for shell
1037 metacharacters.  If there are any, the entire argument is passed to
1038 C</bin/sh -c> for parsing.  If there are none, the argument is split
1039 into words and passed directly to execvp(), which is more efficient.
1040 Note: exec() and system() do not flush your output buffer, so you may
1041 need to set C<$|> to avoid lost output.  Examples:
1042
1043     exec '/bin/echo', 'Your arguments are: ', @ARGV;
1044     exec "sort $outfile | uniq";
1045
1046 If you don't really want to execute the first argument, but want to lie
1047 to the program you are executing about its own name, you can specify
1048 the program you actually want to run as an "indirect object" (without a
1049 comma) in front of the LIST.  (This always forces interpretation of the
1050 LIST as a multivalued list, even if there is only a single scalar in
1051 the list.)  Example:
1052
1053     $shell = '/bin/csh';
1054     exec $shell '-sh';          # pretend it's a login shell
1055
1056 or, more directly,
1057
1058     exec {'/bin/csh'} '-sh';    # pretend it's a login shell
1059
1060 =item exists EXPR
1061
1062 Returns TRUE if the specified hash key exists in its hash array, even
1063 if the corresponding value is undefined.
1064
1065     print "Exists\n" if exists $array{$key};
1066     print "Defined\n" if defined $array{$key};
1067     print "True\n" if $array{$key};
1068
1069 A hash element can be TRUE only if it's defined, and defined if
1070 it exists, but the reverse doesn't necessarily hold true.
1071
1072 Note that the EXPR can be arbitrarily complicated as long as the final
1073 operation is a hash key lookup:
1074
1075     if (exists $ref->[$x][$y]{$key}) { ... }
1076
1077 =item exit EXPR
1078
1079 Evaluates EXPR and exits immediately with that value.  (Actually, it
1080 calls any defined C<END> routines first, but the C<END> routines may not
1081 abort the exit.  Likewise any object destructors that need to be called
1082 are called before exit.)  Example:
1083
1084     $ans = <STDIN>;
1085     exit 0 if $ans =~ /^[Xx]/;
1086
1087 See also die().  If EXPR is omitted, exits with 0 status.  The only
1088 universally portable values for EXPR are 0 for success and 1 for error;
1089 all other values are subject to unpredictable interpretation depending
1090 on the environment in which the Perl program is running.
1091
1092 You shouldn't use exit() to abort a subroutine if there's any chance that
1093 someone might want to trap whatever error happened.  Use die() instead,
1094 which can be trapped by an eval().
1095
1096 =item exp EXPR
1097
1098 =item exp
1099
1100 Returns I<e> (the natural logarithm base) to the power of EXPR.
1101 If EXPR is omitted, gives C<exp($_)>.
1102
1103 =item fcntl FILEHANDLE,FUNCTION,SCALAR
1104
1105 Implements the fcntl(2) function.  You'll probably have to say
1106
1107     use Fcntl;
1108
1109 first to get the correct function definitions.  Argument processing and
1110 value return works just like ioctl() below.  Note that fcntl() will produce
1111 a fatal error if used on a machine that doesn't implement fcntl(2).
1112 For example:
1113
1114     use Fcntl;
1115     fcntl($filehandle, F_GETLK, $packed_return_buffer);
1116
1117 =item fileno FILEHANDLE
1118
1119 Returns the file descriptor for a filehandle.  This is useful for
1120 constructing bitmaps for select().  If FILEHANDLE is an expression, the
1121 value is taken as the name of the filehandle.
1122
1123 =item flock FILEHANDLE,OPERATION
1124
1125 Calls flock(2), or an emulation of it, on FILEHANDLE.  Returns TRUE for
1126 success, FALSE on failure.  Produces a fatal error if used on a machine
1127 that doesn't implement flock(2), fcntl(2) locking, or lockf(3).  flock()
1128 is Perl's portable file locking interface, although it locks only entire
1129 files, not records.
1130
1131 OPERATION is one of LOCK_SH, LOCK_EX, or LOCK_UN, possibly combined with
1132 LOCK_NB.  These constants are traditionally valued 1, 2, 8 and 4, but
1133 you can use the symbolic names if import them from the Fcntl module,
1134 either individually, or as a group using the ':flock' tag.  LOCK_SH
1135 requests a shared lock, LOCK_EX requests an exclusive lock, and LOCK_UN
1136 releases a previously requested lock.  If LOCK_NB is added to LOCK_SH or
1137 LOCK_EX then flock() will return immediately rather than blocking
1138 waiting for the lock (check the return status to see if you got it).
1139
1140 To avoid the possibility of mis-coordination, Perl flushes FILEHANDLE
1141 before (un)locking it.
1142
1143 Note that the emulation built with lockf(3) doesn't provide shared
1144 locks, and it requires that FILEHANDLE be open with write intent.  These
1145 are the semantics that lockf(3) implements.  Most (all?) systems
1146 implement lockf(3) in terms of fcntl(2) locking, though, so the
1147 differing semantics shouldn't bite too many people.
1148
1149 Note also that some versions of flock() cannot lock things over the
1150 network; you would need to use the more system-specific fcntl() for
1151 that.  If you like you can force Perl to ignore your system's flock(2)
1152 function, and so provide its own fcntl(2)-based emulation, by passing
1153 the switch C<-Ud_flock> to the F<Configure> program when you configure
1154 perl.
1155
1156 Here's a mailbox appender for BSD systems.
1157
1158     use Fcntl ':flock'; # import LOCK_* constants
1159
1160     sub lock {
1161         flock(MBOX,LOCK_EX);
1162         # and, in case someone appended
1163         # while we were waiting...
1164         seek(MBOX, 0, 2);
1165     }
1166
1167     sub unlock {
1168         flock(MBOX,LOCK_UN);
1169     }
1170
1171     open(MBOX, ">>/usr/spool/mail/$ENV{'USER'}")
1172             or die "Can't open mailbox: $!";
1173
1174     lock();
1175     print MBOX $msg,"\n\n";
1176     unlock();
1177
1178 See also L<DB_File> for other flock() examples.
1179
1180 =item fork
1181
1182 Does a fork(2) system call.  Returns the child pid to the parent process
1183 and 0 to the child process, or C<undef> if the fork is unsuccessful.
1184 Note: unflushed buffers remain unflushed in both processes, which means
1185 you may need to set C<$|> ($AUTOFLUSH in English) or call the autoflush()
1186 method of IO::Handle to avoid duplicate output.
1187
1188 If you fork() without ever waiting on your children, you will accumulate
1189 zombies:
1190
1191     $SIG{CHLD} = sub { wait };
1192
1193 There's also the double-fork trick (error checking on
1194 fork() returns omitted);
1195
1196     unless ($pid = fork) {
1197         unless (fork) {
1198             exec "what you really wanna do";
1199             die "no exec";
1200             # ... or ...
1201             ## (some_perl_code_here)
1202             exit 0;
1203         }
1204         exit 0;
1205     }
1206     waitpid($pid,0);
1207
1208 See also L<perlipc> for more examples of forking and reaping
1209 moribund children.
1210
1211 Note that if your forked child inherits system file descriptors like
1212 STDIN and STDOUT that are actually connected by a pipe or socket, even
1213 if you exit, the remote server (such as, say, httpd or rsh) won't think
1214 you're done.  You should reopen those to /dev/null if it's any issue.
1215
1216 =item format
1217
1218 Declare a picture format with use by the write() function.  For
1219 example:
1220
1221     format Something =
1222         Test: @<<<<<<<< @||||| @>>>>>
1223               $str,     $%,    '$' . int($num)
1224     .
1225
1226     $str = "widget";
1227     $num = $cost/$quantity;
1228     $~ = 'Something';
1229     write;
1230
1231 See L<perlform> for many details and examples.
1232
1233
1234 =item formline PICTURE, LIST
1235
1236 This is an internal function used by C<format>s, though you may call it
1237 too.  It formats (see L<perlform>) a list of values according to the
1238 contents of PICTURE, placing the output into the format output
1239 accumulator, C<$^A> (or $ACCUMULATOR in English).
1240 Eventually, when a write() is done, the contents of
1241 C<$^A> are written to some filehandle, but you could also read C<$^A>
1242 yourself and then set C<$^A> back to "".  Note that a format typically
1243 does one formline() per line of form, but the formline() function itself
1244 doesn't care how many newlines are embedded in the PICTURE.  This means
1245 that the C<~> and C<~~> tokens will treat the entire PICTURE as a single line.
1246 You may therefore need to use multiple formlines to implement a single
1247 record format, just like the format compiler.
1248
1249 Be careful if you put double quotes around the picture, because an "C<@>"
1250 character may be taken to mean the beginning of an array name.
1251 formline() always returns TRUE.  See L<perlform> for other examples.
1252
1253 =item getc FILEHANDLE
1254
1255 =item getc
1256
1257 Returns the next character from the input file attached to FILEHANDLE,
1258 or a null string at end of file.  If FILEHANDLE is omitted, reads from STDIN.
1259 This is not particularly efficient.  It cannot be used to get unbuffered
1260 single-characters, however.  For that, try something more like:
1261
1262     if ($BSD_STYLE) {
1263         system "stty cbreak </dev/tty >/dev/tty 2>&1";
1264     }
1265     else {
1266         system "stty", '-icanon', 'eol', "\001";
1267     }
1268
1269     $key = getc(STDIN);
1270
1271     if ($BSD_STYLE) {
1272         system "stty -cbreak </dev/tty >/dev/tty 2>&1";
1273     }
1274     else {
1275         system "stty", 'icanon', 'eol', '^@'; # ASCII null
1276     }
1277     print "\n";
1278
1279 Determination of whether $BSD_STYLE should be set
1280 is left as an exercise to the reader.
1281
1282 The POSIX::getattr() function can do this more portably on systems
1283 alleging POSIX compliance.
1284 See also the C<Term::ReadKey> module from your nearest CPAN site;
1285 details on CPAN can be found on L<perlmod/CPAN>.
1286
1287 =item getlogin
1288
1289 Returns the current login from F</etc/utmp>, if any.  If null, use
1290 getpwuid().
1291
1292     $login = getlogin || getpwuid($<) || "Kilroy";
1293
1294 Do not consider getlogin() for authentication: it is not as
1295 secure as getpwuid().
1296
1297 =item getpeername SOCKET
1298
1299 Returns the packed sockaddr address of other end of the SOCKET connection.
1300
1301     use Socket;
1302     $hersockaddr    = getpeername(SOCK);
1303     ($port, $iaddr) = unpack_sockaddr_in($hersockaddr);
1304     $herhostname    = gethostbyaddr($iaddr, AF_INET);
1305     $herstraddr     = inet_ntoa($iaddr);
1306
1307 =item getpgrp PID
1308
1309 Returns the current process group for the specified PID.  Use
1310 a PID of 0 to get the current process group for the
1311 current process.  Will raise an exception if used on a machine that
1312 doesn't implement getpgrp(2).  If PID is omitted, returns process
1313 group of current process.  Note that the POSIX version of getpgrp()
1314 does not accept a PID argument, so only PID==0 is truly portable.
1315
1316 =item getppid
1317
1318 Returns the process id of the parent process.
1319
1320 =item getpriority WHICH,WHO
1321
1322 Returns the current priority for a process, a process group, or a user.
1323 (See L<getpriority(2)>.)  Will raise a fatal exception if used on a
1324 machine that doesn't implement getpriority(2).
1325
1326 =item getpwnam NAME
1327
1328 =item getgrnam NAME
1329
1330 =item gethostbyname NAME
1331
1332 =item getnetbyname NAME
1333
1334 =item getprotobyname NAME
1335
1336 =item getpwuid UID
1337
1338 =item getgrgid GID
1339
1340 =item getservbyname NAME,PROTO
1341
1342 =item gethostbyaddr ADDR,ADDRTYPE
1343
1344 =item getnetbyaddr ADDR,ADDRTYPE
1345
1346 =item getprotobynumber NUMBER
1347
1348 =item getservbyport PORT,PROTO
1349
1350 =item getpwent
1351
1352 =item getgrent
1353
1354 =item gethostent
1355
1356 =item getnetent
1357
1358 =item getprotoent
1359
1360 =item getservent
1361
1362 =item setpwent
1363
1364 =item setgrent
1365
1366 =item sethostent STAYOPEN
1367
1368 =item setnetent STAYOPEN
1369
1370 =item setprotoent STAYOPEN
1371
1372 =item setservent STAYOPEN
1373
1374 =item endpwent
1375
1376 =item endgrent
1377
1378 =item endhostent
1379
1380 =item endnetent
1381
1382 =item endprotoent
1383
1384 =item endservent
1385
1386 These routines perform the same functions as their counterparts in the
1387 system library.  Within a list context, the return values from the
1388 various get routines are as follows:
1389
1390     ($name,$passwd,$uid,$gid,
1391        $quota,$comment,$gcos,$dir,$shell) = getpw*
1392     ($name,$passwd,$gid,$members) = getgr*
1393     ($name,$aliases,$addrtype,$length,@addrs) = gethost*
1394     ($name,$aliases,$addrtype,$net) = getnet*
1395     ($name,$aliases,$proto) = getproto*
1396     ($name,$aliases,$port,$proto) = getserv*
1397
1398 (If the entry doesn't exist you get a null list.)
1399
1400 Within a scalar context, you get the name, unless the function was a
1401 lookup by name, in which case you get the other thing, whatever it is.
1402 (If the entry doesn't exist you get the undefined value.)  For example:
1403
1404     $uid = getpwnam
1405     $name = getpwuid
1406     $name = getpwent
1407     $gid = getgrnam
1408     $name = getgrgid
1409     $name = getgrent
1410     etc.
1411
1412 The $members value returned by I<getgr*()> is a space separated list of
1413 the login names of the members of the group.
1414
1415 For the I<gethost*()> functions, if the C<h_errno> variable is supported in
1416 C, it will be returned to you via C<$?> if the function call fails.  The
1417 @addrs value returned by a successful call is a list of the raw
1418 addresses returned by the corresponding system library call.  In the
1419 Internet domain, each address is four bytes long and you can unpack it
1420 by saying something like:
1421
1422     ($a,$b,$c,$d) = unpack('C4',$addr[0]);
1423
1424 =item getsockname SOCKET
1425
1426 Returns the packed sockaddr address of this end of the SOCKET connection.
1427
1428     use Socket;
1429     $mysockaddr = getsockname(SOCK);
1430     ($port, $myaddr) = unpack_sockaddr_in($mysockaddr);
1431
1432 =item getsockopt SOCKET,LEVEL,OPTNAME
1433
1434 Returns the socket option requested, or undefined if there is an error.
1435
1436 =item glob EXPR
1437
1438 =item glob
1439
1440 Returns the value of EXPR with filename expansions such as a shell would
1441 do.  This is the internal function implementing the C<E<lt>*.cE<gt>>
1442 operator, but you can use it directly.  If EXPR is omitted, $_ is used.
1443 The C<E<lt>*.cE<gt>> operator is discussed in more detail in
1444 L<perlop/"I/O Operators">.
1445
1446 =item gmtime EXPR
1447
1448 Converts a time as returned by the time function to a 9-element array
1449 with the time localized for the standard Greenwich time zone.
1450 Typically used as follows:
1451
1452     #  0    1    2     3     4    5     6     7     8
1453     ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) =
1454                                             gmtime(time);
1455
1456 All array elements are numeric, and come straight out of a struct tm.
1457 In particular this means that $mon has the range 0..11 and $wday has
1458 the range 0..6 with sunday as day 0.  Also, $year is the number of
1459 years since 1900, I<not> simply the last two digits of the year.
1460
1461 If EXPR is omitted, does C<gmtime(time())>.
1462
1463 In a scalar context, returns the ctime(3) value:
1464
1465     $now_string = gmtime;  # e.g., "Thu Oct 13 04:54:34 1994"
1466
1467 Also see the timegm() function provided by the Time::Local module,
1468 and the strftime(3) function available via the POSIX module.
1469
1470 =item goto LABEL
1471
1472 =item goto EXPR
1473
1474 =item goto &NAME
1475
1476 The goto-LABEL form finds the statement labeled with LABEL and resumes
1477 execution there.  It may not be used to go into any construct that
1478 requires initialization, such as a subroutine or a foreach loop.  It
1479 also can't be used to go into a construct that is optimized away,
1480 or to get out of a block or subroutine given to sort().
1481 It can be used to go almost anywhere else within the dynamic scope,
1482 including out of subroutines, but it's usually better to use some other
1483 construct such as last or die.  The author of Perl has never felt the
1484 need to use this form of goto (in Perl, that is--C is another matter).
1485
1486 The goto-EXPR form expects a label name, whose scope will be resolved
1487 dynamically.  This allows for computed gotos per FORTRAN, but isn't
1488 necessarily recommended if you're optimizing for maintainability:
1489
1490     goto ("FOO", "BAR", "GLARCH")[$i];
1491
1492 The goto-&NAME form is highly magical, and substitutes a call to the
1493 named subroutine for the currently running subroutine.  This is used by
1494 AUTOLOAD subroutines that wish to load another subroutine and then
1495 pretend that the other subroutine had been called in the first place
1496 (except that any modifications to @_ in the current subroutine are
1497 propagated to the other subroutine.)  After the goto, not even caller()
1498 will be able to tell that this routine was called first.
1499
1500 =item grep BLOCK LIST
1501
1502 =item grep EXPR,LIST
1503
1504 This is similar in spirit to, but not the same as, grep(1)
1505 and its relatives.  In particular, it is not limited to using
1506 regular expressions.
1507
1508 Evaluates the BLOCK or EXPR for each element of LIST (locally setting
1509 $_ to each element) and returns the list value consisting of those
1510 elements for which the expression evaluated to TRUE.  In a scalar
1511 context, returns the number of times the expression was TRUE.
1512
1513     @foo = grep(!/^#/, @bar);    # weed out comments
1514
1515 or equivalently,
1516
1517     @foo = grep {!/^#/} @bar;    # weed out comments
1518
1519 Note that, because $_ is a reference into the list value, it can be used
1520 to modify the elements of the array.  While this is useful and
1521 supported, it can cause bizarre results if the LIST is not a named
1522 array.  Similarly, grep returns aliases into the original list,
1523 much like the way that L<Foreach Loops>'s index variable aliases the list
1524 elements.  That is, modifying an element of a list returned by grep
1525 actually modifies the element in the original list.
1526
1527 =item hex EXPR
1528
1529 =item hex
1530
1531 Interprets EXPR as a hex string and returns the corresponding
1532 value.  (To convert strings that might start with either 0 or 0x
1533 see L<oct>.)  If EXPR is omitted, uses $_.
1534
1535     print hex '0xAf'; # prints '175'
1536     print hex 'aF';   # same
1537
1538 =item import
1539
1540 There is no builtin import() function.  It is merely an ordinary
1541 method (subroutine) defined (or inherited) by modules that wish to export
1542 names to another module.  The use() function calls the import() method
1543 for the package used.  See also L</use()>, L<perlmod>, and L<Exporter>.
1544
1545 =item index STR,SUBSTR,POSITION
1546
1547 =item index STR,SUBSTR
1548
1549 Returns the position of the first occurrence of SUBSTR in STR at or after
1550 POSITION.  If POSITION is omitted, starts searching from the beginning of
1551 the string.  The return value is based at 0 (or whatever you've set the C<$[>
1552 variable to--but don't do that).  If the substring is not found, returns
1553 one less than the base, ordinarily -1.
1554
1555 =item int EXPR
1556
1557 =item int
1558
1559 Returns the integer portion of EXPR.  If EXPR is omitted, uses $_.
1560
1561 =item ioctl FILEHANDLE,FUNCTION,SCALAR
1562
1563 Implements the ioctl(2) function.  You'll probably have to say
1564
1565     require "ioctl.ph"; # probably in /usr/local/lib/perl/ioctl.ph
1566
1567 first to get the correct function definitions.  If F<ioctl.ph> doesn't
1568 exist or doesn't have the correct definitions you'll have to roll your
1569 own, based on your C header files such as F<E<lt>sys/ioctl.hE<gt>>.
1570 (There is a Perl script called B<h2ph> that comes with the Perl kit which
1571 may help you in this, but it's nontrivial.)  SCALAR will be read and/or
1572 written depending on the FUNCTION--a pointer to the string value of SCALAR
1573 will be passed as the third argument of the actual ioctl call.  (If SCALAR
1574 has no string value but does have a numeric value, that value will be
1575 passed rather than a pointer to the string value.  To guarantee this to be
1576 TRUE, add a 0 to the scalar before using it.)  The pack() and unpack()
1577 functions are useful for manipulating the values of structures used by
1578 ioctl().  The following example sets the erase character to DEL.
1579
1580     require 'ioctl.ph';
1581     $getp = &TIOCGETP;
1582     die "NO TIOCGETP" if $@ || !$getp;
1583     $sgttyb_t = "ccccs";                # 4 chars and a short
1584     if (ioctl(STDIN,$getp,$sgttyb)) {
1585         @ary = unpack($sgttyb_t,$sgttyb);
1586         $ary[2] = 127;
1587         $sgttyb = pack($sgttyb_t,@ary);
1588         ioctl(STDIN,&TIOCSETP,$sgttyb)
1589             || die "Can't ioctl: $!";
1590     }
1591
1592 The return value of ioctl (and fcntl) is as follows:
1593
1594         if OS returns:          then Perl returns:
1595             -1                    undefined value
1596              0                  string "0 but true"
1597         anything else               that number
1598
1599 Thus Perl returns TRUE on success and FALSE on failure, yet you can
1600 still easily determine the actual value returned by the operating
1601 system:
1602
1603     ($retval = ioctl(...)) || ($retval = -1);
1604     printf "System returned %d\n", $retval;
1605
1606 =item join EXPR,LIST
1607
1608 Joins the separate strings of LIST into a single string with
1609 fields separated by the value of EXPR, and returns the string.
1610 Example:
1611
1612     $_ = join(':', $login,$passwd,$uid,$gid,$gcos,$home,$shell);
1613
1614 See L<perlfunc/split>.
1615
1616 =item keys HASH
1617
1618 Returns a normal array consisting of all the keys of the named hash.  (In
1619 a scalar context, returns the number of keys.)  The keys are returned in
1620 an apparently random order, but it is the same order as either the
1621 values() or each() function produces (given that the hash has not been
1622 modified).  As a side effect, it resets HASH's iterator.
1623
1624 Here is yet another way to print your environment:
1625
1626     @keys = keys %ENV;
1627     @values = values %ENV;
1628     while ($#keys >= 0) {
1629         print pop(@keys), '=', pop(@values), "\n";
1630     }
1631
1632 or how about sorted by key:
1633
1634     foreach $key (sort(keys %ENV)) {
1635         print $key, '=', $ENV{$key}, "\n";
1636     }
1637
1638 To sort an array by value, you'll need to use a C<sort> function.
1639 Here's a descending numeric sort of a hash by its values:
1640
1641     foreach $key (sort { $hash{$b} <=> $hash{$a} } keys %hash)) {
1642         printf "%4d %s\n", $hash{$key}, $key;
1643     }
1644
1645 As an lvalue C<keys> allows you to increase the number of hash buckets
1646 allocated for the given hash.  This can gain you a measure of efficiency if
1647 you know the hash is going to get big.  (This is similar to pre-extending
1648 an array by assigning a larger number to $#array.)  If you say
1649
1650     keys %hash = 200;
1651
1652 then C<%hash> will have at least 200 buckets allocated for it.  These
1653 buckets will be retained even if you do C<%hash = ()>, use C<undef
1654 %hash> if you want to free the storage while C<%hash> is still in scope.
1655 You can't shrink the number of buckets allocated for the hash using
1656 C<keys> in this way (but you needn't worry about doing this by accident,
1657 as trying has no effect).
1658
1659 =item kill LIST
1660
1661 Sends a signal to a list of processes.  The first element of
1662 the list must be the signal to send.  Returns the number of
1663 processes successfully signaled.
1664
1665     $cnt = kill 1, $child1, $child2;
1666     kill 9, @goners;
1667
1668 Unlike in the shell, in Perl if the I<SIGNAL> is negative, it kills
1669 process groups instead of processes.  (On System V, a negative I<PROCESS>
1670 number will also kill process groups, but that's not portable.)  That
1671 means you usually want to use positive not negative signals.  You may also
1672 use a signal name in quotes.  See L<perlipc/"Signals"> for details.
1673
1674 =item last LABEL
1675
1676 =item last
1677
1678 The C<last> command is like the C<break> statement in C (as used in
1679 loops); it immediately exits the loop in question.  If the LABEL is
1680 omitted, the command refers to the innermost enclosing loop.  The
1681 C<continue> block, if any, is not executed:
1682
1683     LINE: while (<STDIN>) {
1684         last LINE if /^$/;      # exit when done with header
1685         ...
1686     }
1687
1688 =item lc EXPR
1689
1690 =item lc
1691
1692 Returns an lowercased version of EXPR.  This is the internal function
1693 implementing the \L escape in double-quoted strings.
1694 Respects current LC_CTYPE locale if C<use locale> in force.  See L<perllocale>.
1695
1696 If EXPR is omitted, uses $_.
1697
1698 =item lcfirst EXPR
1699
1700 =item lcfirst
1701
1702 Returns the value of EXPR with the first character lowercased.  This is
1703 the internal function implementing the \l escape in double-quoted strings.
1704 Respects current LC_CTYPE locale if C<use locale> in force.  See L<perllocale>.
1705
1706 If EXPR is omitted, uses $_.
1707
1708 =item length EXPR
1709
1710 =item length
1711
1712 Returns the length in characters of the value of EXPR.  If EXPR is
1713 omitted, returns length of $_.
1714
1715 =item link OLDFILE,NEWFILE
1716
1717 Creates a new filename linked to the old filename.  Returns 1 for
1718 success, 0 otherwise.
1719
1720 =item listen SOCKET,QUEUESIZE
1721
1722 Does the same thing that the listen system call does.  Returns TRUE if
1723 it succeeded, FALSE otherwise.  See example in L<perlipc/"Sockets: Client/Server Communication">.
1724
1725 =item local EXPR
1726
1727 A local modifies the listed variables to be local to the enclosing block,
1728 subroutine, C<eval{}>, or C<do>.  If more than one value is listed, the
1729 list must be placed in parentheses.  See L<perlsub/"Temporary Values via
1730 local()"> for details.
1731
1732 But you really probably want to be using my() instead, because local() isn't
1733 what most people think of as "local").  See L<perlsub/"Private Variables
1734 via my()"> for details.
1735
1736 =item localtime EXPR
1737
1738 Converts a time as returned by the time function to a 9-element array
1739 with the time analyzed for the local time zone.  Typically used as
1740 follows:
1741
1742     #  0    1    2     3     4    5     6     7     8
1743     ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) =
1744                                                 localtime(time);
1745
1746 All array elements are numeric, and come straight out of a struct tm.
1747 In particular this means that $mon has the range 0..11 and $wday has
1748 the range 0..6 with sunday as day 0.  Also, $year is the number of
1749 years since 1900, that is, $year is 123 in year 2023.
1750
1751 If EXPR is omitted, uses the current time (C<localtime(time)>).
1752
1753 In a scalar context, returns the ctime(3) value:
1754
1755     $now_string = localtime;  # e.g., "Thu Oct 13 04:54:34 1994"
1756
1757 Also see the Time::Local module, and the strftime(3) and mktime(3)
1758 function available via the POSIX module.
1759
1760 =item log EXPR
1761
1762 =item log
1763
1764 Returns logarithm (base I<e>) of EXPR.  If EXPR is omitted, returns log
1765 of $_.
1766
1767 =item lstat FILEHANDLE
1768
1769 =item lstat EXPR
1770
1771 =item lstat
1772
1773 Does the same thing as the stat() function, but stats a symbolic link
1774 instead of the file the symbolic link points to.  If symbolic links are
1775 unimplemented on your system, a normal stat() is done.
1776
1777 If EXPR is omitted, stats $_.
1778
1779 =item m//
1780
1781 The match operator.  See L<perlop>.
1782
1783 =item map BLOCK LIST
1784
1785 =item map EXPR,LIST
1786
1787 Evaluates the BLOCK or EXPR for each element of LIST (locally setting $_ to each
1788 element) and returns the list value composed of the results of each such
1789 evaluation.  Evaluates BLOCK or EXPR in a list context, so each element of LIST
1790 may produce zero, one, or more elements in the returned value.
1791
1792     @chars = map(chr, @nums);
1793
1794 translates a list of numbers to the corresponding characters.  And
1795
1796     %hash = map { getkey($_) => $_ } @array;
1797
1798 is just a funny way to write
1799
1800     %hash = ();
1801     foreach $_ (@array) {
1802         $hash{getkey($_)} = $_;
1803     }
1804
1805 =item mkdir FILENAME,MODE
1806
1807 Creates the directory specified by FILENAME, with permissions specified
1808 by MODE (as modified by umask).  If it succeeds it returns 1, otherwise
1809 it returns 0 and sets C<$!> (errno).
1810
1811 =item msgctl ID,CMD,ARG
1812
1813 Calls the System V IPC function msgctl(2).  If CMD is &IPC_STAT, then ARG
1814 must be a variable which will hold the returned msqid_ds structure.
1815 Returns like ioctl: the undefined value for error, "0 but true" for
1816 zero, or the actual return value otherwise.
1817
1818 =item msgget KEY,FLAGS
1819
1820 Calls the System V IPC function msgget(2).  Returns the message queue id,
1821 or the undefined value if there is an error.
1822
1823 =item msgsnd ID,MSG,FLAGS
1824
1825 Calls the System V IPC function msgsnd to send the message MSG to the
1826 message queue ID.  MSG must begin with the long integer message type,
1827 which may be created with C<pack("l", $type)>.  Returns TRUE if
1828 successful, or FALSE if there is an error.
1829
1830 =item msgrcv ID,VAR,SIZE,TYPE,FLAGS
1831
1832 Calls the System V IPC function msgrcv to receive a message from
1833 message queue ID into variable VAR with a maximum message size of
1834 SIZE.  Note that if a message is received, the message type will be the
1835 first thing in VAR, and the maximum length of VAR is SIZE plus the size
1836 of the message type.  Returns TRUE if successful, or FALSE if there is
1837 an error.
1838
1839 =item my EXPR
1840
1841 A "my" declares the listed variables to be local (lexically) to the
1842 enclosing block, subroutine, C<eval>, or C<do/require/use>'d file.  If
1843 more than one value is listed, the list must be placed in parentheses.  See
1844 L<perlsub/"Private Variables via my()"> for details.
1845
1846 =item next LABEL
1847
1848 =item next
1849
1850 The C<next> command is like the C<continue> statement in C; it starts
1851 the next iteration of the loop:
1852
1853     LINE: while (<STDIN>) {
1854         next LINE if /^#/;      # discard comments
1855         ...
1856     }
1857
1858 Note that if there were a C<continue> block on the above, it would get
1859 executed even on discarded lines.  If the LABEL is omitted, the command
1860 refers to the innermost enclosing loop.
1861
1862 =item no Module LIST
1863
1864 See the "use" function, which "no" is the opposite of.
1865
1866 =item oct EXPR
1867
1868 =item oct
1869
1870 Interprets EXPR as an octal string and returns the corresponding
1871 value.  (If EXPR happens to start off with 0x, interprets it as
1872 a hex string instead.)  The following will handle decimal, octal, and
1873 hex in the standard Perl or C notation:
1874
1875     $val = oct($val) if $val =~ /^0/;
1876
1877 If EXPR is omitted, uses $_.  This function is commonly used when
1878 a string such as "644" needs to be converted into a file mode, for
1879 example. (Although perl will automatically convert strings into
1880 numbers as needed, this automatic conversion assumes base 10.)
1881
1882 =item open FILEHANDLE,EXPR
1883
1884 =item open FILEHANDLE
1885
1886 Opens the file whose filename is given by EXPR, and associates it with
1887 FILEHANDLE.  If FILEHANDLE is an expression, its value is used as the
1888 name of the real filehandle wanted.  If EXPR is omitted, the scalar
1889 variable of the same name as the FILEHANDLE contains the filename.
1890 (Note that lexical variables--those declared with C<my>--will not work
1891 for this purpose; so if you're using C<my>, specify EXPR in your call
1892 to open.)
1893
1894 If the filename begins with '<' or nothing, the file is opened for input.
1895 If the filename begins with '>', the file is truncated and opened for
1896 output.  If the filename begins with '>>', the file is opened for
1897 appending.  You can put a '+' in front of the '>' or '<' to indicate that
1898 you want both read and write access to the file; thus '+<' is almost
1899 always preferred for read/write updates--the '+>' mode would clobber the
1900 file first.  The prefix and the filename may be separated with spaces.
1901 These various prefixes correspond to the fopen(3) modes of 'r', 'r+', 'w',
1902 'w+', 'a', and 'a+'.
1903
1904 If the filename begins with "|", the filename is interpreted as a command
1905 to which output is to be piped, and if the filename ends with a "|", the
1906 filename is interpreted See L<perlipc/"Using open() for IPC"> for more
1907 examples of this.  as command which pipes input to us.  (You may not have
1908 a raw open() to a command that pipes both in I<and> out, but see
1909 L<IPC::Open2>, L<IPC::Open3>, and L<perlipc/"Bidirectional Communication">
1910 for alternatives.)
1911
1912 Opening '-' opens STDIN and opening 'E<gt>-' opens STDOUT.  Open returns
1913 nonzero upon success, the undefined value otherwise.  If the open
1914 involved a pipe, the return value happens to be the pid of the
1915 subprocess.
1916
1917 If you're unfortunate enough to be running Perl on a system that
1918 distinguishes between text files and binary files (modern operating
1919 systems don't care), then you should check out L</binmode> for tips for
1920 dealing with this.  The key distinction between systems that need binmode
1921 and those that don't is their text file formats.  Systems like Unix and
1922 Plan9 that delimit lines with a single character, and that encode that
1923 character in C as '\n', do not need C<binmode>.  The rest need it.
1924
1925 Examples:
1926
1927     $ARTICLE = 100;
1928     open ARTICLE or die "Can't find article $ARTICLE: $!\n";
1929     while (<ARTICLE>) {...
1930
1931     open(LOG, '>>/usr/spool/news/twitlog'); # (log is reserved)
1932
1933     open(DBASE, '+<dbase.mine');            # open for update
1934
1935     open(ARTICLE, "caesar <$article |");    # decrypt article
1936
1937     open(EXTRACT, "|sort >/tmp/Tmp$$");     # $$ is our process id
1938
1939     # process argument list of files along with any includes
1940
1941     foreach $file (@ARGV) {
1942         process($file, 'fh00');
1943     }
1944
1945     sub process {
1946         local($filename, $input) = @_;
1947         $input++;               # this is a string increment
1948         unless (open($input, $filename)) {
1949             print STDERR "Can't open $filename: $!\n";
1950             return;
1951         }
1952
1953         while (<$input>) {              # note use of indirection
1954             if (/^#include "(.*)"/) {
1955                 process($1, $input);
1956                 next;
1957             }
1958             ...         # whatever
1959         }
1960     }
1961
1962 You may also, in the Bourne shell tradition, specify an EXPR beginning
1963 with "E<gt>&", in which case the rest of the string is interpreted as the
1964 name of a filehandle (or file descriptor, if numeric) which is to be
1965 duped and opened.  You may use & after E<gt>, E<gt>E<gt>, E<lt>, +E<gt>,
1966 +E<gt>E<gt>, and +E<lt>.  The
1967 mode you specify should match the mode of the original filehandle.
1968 (Duping a filehandle does not take into account any existing contents of
1969 stdio buffers.)
1970 Here is a script that saves, redirects, and restores STDOUT and
1971 STDERR:
1972
1973     #!/usr/bin/perl
1974     open(SAVEOUT, ">&STDOUT");
1975     open(SAVEERR, ">&STDERR");
1976
1977     open(STDOUT, ">foo.out") || die "Can't redirect stdout";
1978     open(STDERR, ">&STDOUT") || die "Can't dup stdout";
1979
1980     select(STDERR); $| = 1;     # make unbuffered
1981     select(STDOUT); $| = 1;     # make unbuffered
1982
1983     print STDOUT "stdout 1\n";  # this works for
1984     print STDERR "stderr 1\n";  # subprocesses too
1985
1986     close(STDOUT);
1987     close(STDERR);
1988
1989     open(STDOUT, ">&SAVEOUT");
1990     open(STDERR, ">&SAVEERR");
1991
1992     print STDOUT "stdout 2\n";
1993     print STDERR "stderr 2\n";
1994
1995
1996 If you specify "E<lt>&=N", where N is a number, then Perl will do an
1997 equivalent of C's fdopen() of that file descriptor; this is more
1998 parsimonious of file descriptors.  For example:
1999
2000     open(FILEHANDLE, "<&=$fd")
2001
2002 If you open a pipe on the command "-", i.e., either "|-" or "-|", then
2003 there is an implicit fork done, and the return value of open is the pid
2004 of the child within the parent process, and 0 within the child
2005 process.  (Use C<defined($pid)> to determine whether the open was successful.)
2006 The filehandle behaves normally for the parent, but i/o to that
2007 filehandle is piped from/to the STDOUT/STDIN of the child process.
2008 In the child process the filehandle isn't opened--i/o happens from/to
2009 the new STDOUT or STDIN.  Typically this is used like the normal
2010 piped open when you want to exercise more control over just how the
2011 pipe command gets executed, such as when you are running setuid, and
2012 don't want to have to scan shell commands for metacharacters.
2013 The following pairs are more or less equivalent:
2014
2015     open(FOO, "|tr '[a-z]' '[A-Z]'");
2016     open(FOO, "|-") || exec 'tr', '[a-z]', '[A-Z]';
2017
2018     open(FOO, "cat -n '$file'|");
2019     open(FOO, "-|") || exec 'cat', '-n', $file;
2020
2021 See L<perlipc/"Safe Pipe Opens"> for more examples of this.
2022
2023 Explicitly closing any piped filehandle causes the parent process to
2024 wait for the child to finish, and returns the status value in C<$?>.
2025 Note: on any operation which may do a fork, unflushed buffers remain
2026 unflushed in both processes, which means you may need to set C<$|> to
2027 avoid duplicate output.
2028
2029 Using the constructor from the IO::Handle package (or one of its
2030 subclasses, such as IO::File or IO::Socket),
2031 you can generate anonymous filehandles which have the scope of whatever
2032 variables hold references to them, and automatically close whenever
2033 and however you leave that scope:
2034
2035     use IO::File;
2036     ...
2037     sub read_myfile_munged {
2038         my $ALL = shift;
2039         my $handle = new IO::File;
2040         open($handle, "myfile") or die "myfile: $!";
2041         $first = <$handle>
2042             or return ();     # Automatically closed here.
2043         mung $first or die "mung failed";       # Or here.
2044         return $first, <$handle> if $ALL;       # Or here.
2045         $first;                                 # Or here.
2046     }
2047
2048 The filename that is passed to open will have leading and trailing
2049 whitespace deleted.  To open a file with arbitrary weird
2050 characters in it, it's necessary to protect any leading and trailing
2051 whitespace thusly:
2052
2053     $file =~ s#^(\s)#./$1#;
2054     open(FOO, "< $file\0");
2055
2056 If you want a "real" C open() (see L<open(2)> on your system), then
2057 you should use the sysopen() function.  This is another way to
2058 protect your filenames from interpretation.  For example:
2059
2060     use IO::Handle;
2061     sysopen(HANDLE, $path, O_RDWR|O_CREAT|O_EXCL, 0700)
2062         or die "sysopen $path: $!";
2063     HANDLE->autoflush(1);
2064     HANDLE->print("stuff $$\n");
2065     seek(HANDLE, 0, 0);
2066     print "File contains: ", <HANDLE>;
2067
2068 See L</seek()> for some details about mixing reading and writing.
2069
2070 =item opendir DIRHANDLE,EXPR
2071
2072 Opens a directory named EXPR for processing by readdir(), telldir(),
2073 seekdir(), rewinddir(), and closedir().  Returns TRUE if successful.
2074 DIRHANDLEs have their own namespace separate from FILEHANDLEs.
2075
2076 =item ord EXPR
2077
2078 =item ord
2079
2080 Returns the numeric ascii value of the first character of EXPR.  If
2081 EXPR is omitted, uses $_.  For the reverse, see L<chr>.
2082
2083 =item pack TEMPLATE,LIST
2084
2085 Takes an array or list of values and packs it into a binary structure,
2086 returning the string containing the structure.  The TEMPLATE is a
2087 sequence of characters that give the order and type of values, as
2088 follows:
2089
2090     A   An ascii string, will be space padded.
2091     a   An ascii string, will be null padded.
2092     b   A bit string (ascending bit order, like vec()).
2093     B   A bit string (descending bit order).
2094     h   A hex string (low nybble first).
2095     H   A hex string (high nybble first).
2096
2097     c   A signed char value.
2098     C   An unsigned char value.
2099     s   A signed short value.
2100     S   An unsigned short value.
2101     i   A signed integer value.
2102     I   An unsigned integer value.
2103     l   A signed long value.
2104     L   An unsigned long value.
2105
2106     n   A short in "network" order.
2107     N   A long in "network" order.
2108     v   A short in "VAX" (little-endian) order.
2109     V   A long in "VAX" (little-endian) order.
2110
2111     f   A single-precision float in the native format.
2112     d   A double-precision float in the native format.
2113
2114     p   A pointer to a null-terminated string.
2115     P   A pointer to a structure (fixed-length string).
2116
2117     u   A uuencoded string.
2118
2119     w A BER compressed integer.  Bytes give an unsigned integer base
2120       128, most significant digit first, with as few digits as
2121       possible, and with the bit 8 of each byte except the last set
2122       to "1."
2123
2124     x   A null byte.
2125     X   Back up a byte.
2126     @   Null fill to absolute position.
2127
2128 Each letter may optionally be followed by a number which gives a repeat
2129 count.  With all types except "a", "A", "b", "B", "h", "H", and "P" the
2130 pack function will gobble up that many values from the LIST.  A * for the
2131 repeat count means to use however many items are left.  The "a" and "A"
2132 types gobble just one value, but pack it as a string of length count,
2133 padding with nulls or spaces as necessary.  (When unpacking, "A" strips
2134 trailing spaces and nulls, but "a" does not.)  Likewise, the "b" and "B"
2135 fields pack a string that many bits long.  The "h" and "H" fields pack a
2136 string that many nybbles long.  The "P" packs a pointer to a structure of
2137 the size indicated by the length.  Real numbers (floats and doubles) are
2138 in the native machine format only; due to the multiplicity of floating
2139 formats around, and the lack of a standard "network" representation, no
2140 facility for interchange has been made.  This means that packed floating
2141 point data written on one machine may not be readable on another - even if
2142 both use IEEE floating point arithmetic (as the endian-ness of the memory
2143 representation is not part of the IEEE spec).  Note that Perl uses doubles
2144 internally for all numeric calculation, and converting from double into
2145 float and thence back to double again will lose precision (i.e.,
2146 C<unpack("f", pack("f", $foo)>) will not in general equal $foo).
2147
2148 Examples:
2149
2150     $foo = pack("cccc",65,66,67,68);
2151     # foo eq "ABCD"
2152     $foo = pack("c4",65,66,67,68);
2153     # same thing
2154
2155     $foo = pack("ccxxcc",65,66,67,68);
2156     # foo eq "AB\0\0CD"
2157
2158     $foo = pack("s2",1,2);
2159     # "\1\0\2\0" on little-endian
2160     # "\0\1\0\2" on big-endian
2161
2162     $foo = pack("a4","abcd","x","y","z");
2163     # "abcd"
2164
2165     $foo = pack("aaaa","abcd","x","y","z");
2166     # "axyz"
2167
2168     $foo = pack("a14","abcdefg");
2169     # "abcdefg\0\0\0\0\0\0\0"
2170
2171     $foo = pack("i9pl", gmtime);
2172     # a real struct tm (on my system anyway)
2173
2174     sub bintodec {
2175         unpack("N", pack("B32", substr("0" x 32 . shift, -32)));
2176     }
2177
2178 The same template may generally also be used in the unpack function.
2179
2180 =item package NAMESPACE
2181
2182 Declares the compilation unit as being in the given namespace.  The scope
2183 of the package declaration is from the declaration itself through the end of
2184 the enclosing block (the same scope as the local() operator).  All further
2185 unqualified dynamic identifiers will be in this namespace.  A package
2186 statement affects only dynamic variables--including those you've used
2187 local() on--but I<not> lexical variables created with my().  Typically it
2188 would be the first declaration in a file to be included by the C<require>
2189 or C<use> operator.  You can switch into a package in more than one place;
2190 it influences merely which symbol table is used by the compiler for the
2191 rest of that block.  You can refer to variables and filehandles in other
2192 packages by prefixing the identifier with the package name and a double
2193 colon:  C<$Package::Variable>.  If the package name is null, the C<main>
2194 package as assumed.  That is, C<$::sail> is equivalent to C<$main::sail>.
2195
2196 See L<perlmod/"Packages"> for more information about packages, modules,
2197 and classes.  See L<perlsub> for other scoping issues.
2198
2199 =item pipe READHANDLE,WRITEHANDLE
2200
2201 Opens a pair of connected pipes like the corresponding system call.
2202 Note that if you set up a loop of piped processes, deadlock can occur
2203 unless you are very careful.  In addition, note that Perl's pipes use
2204 stdio buffering, so you may need to set C<$|> to flush your WRITEHANDLE
2205 after each command, depending on the application.
2206
2207 See L<IPC::Open2>, L<IPC::Open3>, and L<perlipc/"Bidirectional Communication">
2208 for examples of such things.
2209
2210 =item pop ARRAY
2211
2212 =item pop
2213
2214 Pops and returns the last value of the array, shortening the array by
2215 1.  Has a similar effect to
2216
2217     $tmp = $ARRAY[$#ARRAY--];
2218
2219 If there are no elements in the array, returns the undefined value.
2220 If ARRAY is omitted, pops the
2221 @ARGV array in the main program, and the @_ array in subroutines, just
2222 like shift().
2223
2224 =item pos SCALAR
2225
2226 =item pos
2227
2228 Returns the offset of where the last C<m//g> search left off for the variable
2229 is in question ($_ is used when the variable is not specified).  May be
2230 modified to change that offset.  Such modification will also influence
2231 the C<\G> zero-width assertion in regular expressions.  See L<perlre> and
2232 L<perlop>.
2233
2234 =item print FILEHANDLE LIST
2235
2236 =item print LIST
2237
2238 =item print
2239
2240 Prints a string or a comma-separated list of strings.  Returns TRUE
2241 if successful.  FILEHANDLE may be a scalar variable name, in which case
2242 the variable contains the name of or a reference to the filehandle, thus introducing one
2243 level of indirection.  (NOTE: If FILEHANDLE is a variable and the next
2244 token is a term, it may be misinterpreted as an operator unless you
2245 interpose a + or put parentheses around the arguments.)  If FILEHANDLE is
2246 omitted, prints by default to standard output (or to the last selected
2247 output channel--see L</select>).  If LIST is also omitted, prints $_ to
2248 STDOUT.  To set the default output channel to something other than
2249 STDOUT use the select operation.  Note that, because print takes a
2250 LIST, anything in the LIST is evaluated in a list context, and any
2251 subroutine that you call will have one or more of its expressions
2252 evaluated in a list context.  Also be careful not to follow the print
2253 keyword with a left parenthesis unless you want the corresponding right
2254 parenthesis to terminate the arguments to the print--interpose a + or
2255 put parentheses around all the arguments.
2256
2257 Note that if you're storing FILEHANDLES in an array or other expression,
2258 you will have to use a block returning its value instead:
2259
2260     print { $files[$i] } "stuff\n";
2261     print { $OK ? STDOUT : STDERR } "stuff\n";
2262
2263 =item printf FILEHANDLE FORMAT, LIST
2264
2265 =item printf FORMAT, LIST
2266
2267 Equivalent to C<print FILEHANDLE sprintf(FORMAT, LIST)>.  The first argument
2268 of the list will be interpreted as the printf format.  If C<use locale> is
2269 in effect, the character used for the decimal point in formatted real numbers
2270 is affected by the LC_NUMERIC locale.  See L<perllocale>.
2271
2272 Don't fall into the trap of using a printf() when a simple
2273 print() would do.  The print() is more efficient, and less
2274 error prone.
2275
2276 =item prototype FUNCTION
2277
2278 Returns the prototype of a function as a string (or C<undef> if the
2279 function has no prototype).  FUNCTION is a reference to, or the name of,
2280 the function whose prototype you want to retrieve.
2281
2282 =item push ARRAY,LIST
2283
2284 Treats ARRAY as a stack, and pushes the values of LIST
2285 onto the end of ARRAY.  The length of ARRAY increases by the length of
2286 LIST.  Has the same effect as
2287
2288     for $value (LIST) {
2289         $ARRAY[++$#ARRAY] = $value;
2290     }
2291
2292 but is more efficient.  Returns the new number of elements in the array.
2293
2294 =item q/STRING/
2295
2296 =item qq/STRING/
2297
2298 =item qx/STRING/
2299
2300 =item qw/STRING/
2301
2302 Generalized quotes.  See L<perlop>.
2303
2304 =item quotemeta EXPR
2305
2306 =item quotemeta
2307
2308 Returns the value of EXPR with all non-alphanumeric
2309 characters backslashed.  (That is, all characters not matching
2310 C</[A-Za-z_0-9]/> will be preceded by a backslash in the
2311 returned string, regardless of any locale settings.)
2312 This is the internal function implementing
2313 the \Q escape in double-quoted strings.
2314
2315 If EXPR is omitted, uses $_.
2316
2317 =item rand EXPR
2318
2319 =item rand
2320
2321 Returns a random fractional number between 0 and the value of EXPR.
2322 (EXPR should be positive.)  If EXPR is omitted, returns a value between
2323 0 and 1.  Automatically calls srand() unless srand() has already been
2324 called.  See also srand().
2325
2326 (Note: If your rand function consistently returns numbers that are too
2327 large or too small, then your version of Perl was probably compiled
2328 with the wrong number of RANDBITS.)
2329
2330 =item read FILEHANDLE,SCALAR,LENGTH,OFFSET
2331
2332 =item read FILEHANDLE,SCALAR,LENGTH
2333
2334 Attempts to read LENGTH bytes of data into variable SCALAR from the
2335 specified FILEHANDLE.  Returns the number of bytes actually read, or
2336 undef if there was an error.  SCALAR will be grown or shrunk to the
2337 length actually read.  An OFFSET may be specified to place the read
2338 data at some other place than the beginning of the string.  This call
2339 is actually implemented in terms of stdio's fread call.  To get a true
2340 read system call, see sysread().
2341
2342 =item readdir DIRHANDLE
2343
2344 Returns the next directory entry for a directory opened by opendir().
2345 If used in a list context, returns all the rest of the entries in the
2346 directory.  If there are no more entries, returns an undefined value in
2347 a scalar context or a null list in a list context.
2348
2349 If you're planning to filetest the return values out of a readdir(), you'd
2350 better prepend the directory in question.  Otherwise, because we didn't
2351 chdir() there, it would have been testing the wrong file.
2352
2353     opendir(DIR, $some_dir) || die "can't opendir $some_dir: $!";
2354     @dots = grep { /^\./ && -f "$some_dir/$_" } readdir(DIR);
2355     closedir DIR;
2356
2357 =item readlink EXPR
2358
2359 =item readlink
2360
2361 Returns the value of a symbolic link, if symbolic links are
2362 implemented.  If not, gives a fatal error.  If there is some system
2363 error, returns the undefined value and sets C<$!> (errno).  If EXPR is
2364 omitted, uses $_.
2365
2366 =item recv SOCKET,SCALAR,LEN,FLAGS
2367
2368 Receives a message on a socket.  Attempts to receive LENGTH bytes of
2369 data into variable SCALAR from the specified SOCKET filehandle.
2370 Actually does a C recvfrom(), so that it can returns the address of the
2371 sender.  Returns the undefined value if there's an error.  SCALAR will
2372 be grown or shrunk to the length actually read.  Takes the same flags
2373 as the system call of the same name.
2374 See L<perlipc/"UDP: Message Passing"> for examples.
2375
2376 =item redo LABEL
2377
2378 =item redo
2379
2380 The C<redo> command restarts the loop block without evaluating the
2381 conditional again.  The C<continue> block, if any, is not executed.  If
2382 the LABEL is omitted, the command refers to the innermost enclosing
2383 loop.  This command is normally used by programs that want to lie to
2384 themselves about what was just input:
2385
2386     # a simpleminded Pascal comment stripper
2387     # (warning: assumes no { or } in strings)
2388     LINE: while (<STDIN>) {
2389         while (s|({.*}.*){.*}|$1 |) {}
2390         s|{.*}| |;
2391         if (s|{.*| |) {
2392             $front = $_;
2393             while (<STDIN>) {
2394                 if (/}/) {      # end of comment?
2395                     s|^|$front{|;
2396                     redo LINE;
2397                 }
2398             }
2399         }
2400         print;
2401     }
2402
2403 =item ref EXPR
2404
2405 =item ref
2406
2407 Returns a TRUE value if EXPR is a reference, FALSE otherwise.  If EXPR
2408 is not specified, $_ will be used.  The value returned depends on the
2409 type of thing the reference is a reference to.
2410 Builtin types include:
2411
2412     REF
2413     SCALAR
2414     ARRAY
2415     HASH
2416     CODE
2417     GLOB
2418
2419 If the referenced object has been blessed into a package, then that package
2420 name is returned instead.  You can think of ref() as a typeof() operator.
2421
2422     if (ref($r) eq "HASH") {
2423         print "r is a reference to a hash.\n";
2424     }
2425     if (!ref ($r) {
2426         print "r is not a reference at all.\n";
2427     }
2428
2429 See also L<perlref>.
2430
2431 =item rename OLDNAME,NEWNAME
2432
2433 Changes the name of a file.  Returns 1 for success, 0 otherwise.  Will
2434 not work across file system boundaries.
2435
2436 =item require EXPR
2437
2438 =item require
2439
2440 Demands some semantics specified by EXPR, or by $_ if EXPR is not
2441 supplied.  If EXPR is numeric, demands that the current version of Perl
2442 (C<$]> or $PERL_VERSION) be equal or greater than EXPR.
2443
2444 Otherwise, demands that a library file be included if it hasn't already
2445 been included.  The file is included via the do-FILE mechanism, which is
2446 essentially just a variety of eval().  Has semantics similar to the following
2447 subroutine:
2448
2449     sub require {
2450         local($filename) = @_;
2451         return 1 if $INC{$filename};
2452         local($realfilename,$result);
2453         ITER: {
2454             foreach $prefix (@INC) {
2455                 $realfilename = "$prefix/$filename";
2456                 if (-f $realfilename) {
2457                     $result = do $realfilename;
2458                     last ITER;
2459                 }
2460             }
2461             die "Can't find $filename in \@INC";
2462         }
2463         die $@ if $@;
2464         die "$filename did not return true value" unless $result;
2465         $INC{$filename} = $realfilename;
2466         $result;
2467     }
2468
2469 Note that the file will not be included twice under the same specified
2470 name.  The file must return TRUE as the last statement to indicate
2471 successful execution of any initialization code, so it's customary to
2472 end such a file with "1;" unless you're sure it'll return TRUE
2473 otherwise.  But it's better just to put the "C<1;>", in case you add more
2474 statements.
2475
2476 If EXPR is a bareword, the require assumes a "F<.pm>" extension and
2477 replaces "F<::>" with "F</>" in the filename for you,
2478 to make it easy to load standard modules.  This form of loading of
2479 modules does not risk altering your namespace.
2480
2481 For a yet-more-powerful import facility, see L</use> and
2482 L<perlmod>.
2483
2484 =item reset EXPR
2485
2486 =item reset
2487
2488 Generally used in a C<continue> block at the end of a loop to clear
2489 variables and reset ?? searches so that they work again.  The
2490 expression is interpreted as a list of single characters (hyphens
2491 allowed for ranges).  All variables and arrays beginning with one of
2492 those letters are reset to their pristine state.  If the expression is
2493 omitted, one-match searches (?pattern?) are reset to match again.  Resets
2494 only variables or searches in the current package.  Always returns
2495 1.  Examples:
2496
2497     reset 'X';          # reset all X variables
2498     reset 'a-z';        # reset lower case variables
2499     reset;              # just reset ?? searches
2500
2501 Resetting "A-Z" is not recommended because you'll wipe out your
2502 ARGV and ENV arrays.  Resets only package variables--lexical variables
2503 are unaffected, but they clean themselves up on scope exit anyway,
2504 so you'll probably want to use them instead.  See L</my>.
2505
2506 =item return EXPR
2507
2508 =item return
2509
2510 Returns from a subroutine, eval(), or do FILE with the value of the
2511 given EXPR.  Evaluation of EXPR may be in a list, scalar, or void
2512 context, depending on how the return value will be used, and the context
2513 may vary from one execution to the next (see wantarray()).  If no EXPR
2514 is given, returns an empty list in a list context, an undefined value in
2515 a scalar context, or nothing in a void context.
2516
2517 (Note that in the absence of a return, a subroutine, eval, or do FILE
2518 will automatically return the value of the last expression evaluated.)
2519
2520 =item reverse LIST
2521
2522 In a list context, returns a list value consisting of the elements
2523 of LIST in the opposite order.  In a scalar context, concatenates the
2524 elements of LIST, and returns a string value consisting of those bytes,
2525 but in the opposite order.
2526
2527     print reverse <>;           # line tac, last line first
2528
2529     undef $/;                   # for efficiency of <>
2530     print scalar reverse <>;    # byte tac, last line tsrif
2531
2532 This operator is also handy for inverting a hash, although there are some
2533 caveats.  If a value is duplicated in the original hash, only one of those
2534 can be represented as a key in the inverted hash.  Also, this has to
2535 unwind one hash and build a whole new one, which may take some time
2536 on a large hash.
2537
2538     %by_name = reverse %by_address;     # Invert the hash
2539
2540 =item rewinddir DIRHANDLE
2541
2542 Sets the current position to the beginning of the directory for the
2543 readdir() routine on DIRHANDLE.
2544
2545 =item rindex STR,SUBSTR,POSITION
2546
2547 =item rindex STR,SUBSTR
2548
2549 Works just like index except that it returns the position of the LAST
2550 occurrence of SUBSTR in STR.  If POSITION is specified, returns the
2551 last occurrence at or before that position.
2552
2553 =item rmdir FILENAME
2554
2555 =item rmdir
2556
2557 Deletes the directory specified by FILENAME if it is empty.  If it
2558 succeeds it returns 1, otherwise it returns 0 and sets C<$!> (errno).  If
2559 FILENAME is omitted, uses $_.
2560
2561 =item s///
2562
2563 The substitution operator.  See L<perlop>.
2564
2565 =item scalar EXPR
2566
2567 Forces EXPR to be interpreted in a scalar context and returns the value
2568 of EXPR.
2569
2570     @counts = ( scalar @a, scalar @b, scalar @c );
2571
2572 There is no equivalent operator to force an expression to
2573 be interpolated in a list context because it's in practice never
2574 needed.  If you really wanted to do so, however, you could use
2575 the construction C<@{[ (some expression) ]}>, but usually a simple
2576 C<(some expression)> suffices.
2577
2578 =item seek FILEHANDLE,POSITION,WHENCE
2579
2580 Randomly positions the file pointer for FILEHANDLE, just like the fseek()
2581 call of stdio.  FILEHANDLE may be an expression whose value gives the name
2582 of the filehandle.  The values for WHENCE are 0 to set the file pointer to
2583 POSITION, 1 to set the it to current plus POSITION, and 2 to set it to EOF
2584 plus offset.  You may use the values SEEK_SET, SEEK_CUR, and SEEK_END for
2585 this from the POSIX module.  Returns 1 upon success, 0 otherwise.
2586
2587 On some systems you have to do a seek whenever you switch between reading
2588 and writing.  Amongst other things, this may have the effect of calling
2589 stdio's clearerr(3).  A "whence" of 1 (SEEK_CUR) is useful for not moving
2590 the file pointer:
2591
2592     seek(TEST,0,1);
2593
2594 This is also useful for applications emulating C<tail -f>.  Once you hit
2595 EOF on your read, and then sleep for a while, you might have to stick in a
2596 seek() to reset things.  First the simple trick listed above to clear the
2597 filepointer.  The seek() doesn't change the current position, but it
2598 I<does> clear the end-of-file condition on the handle, so that the next
2599 C<E<lt>FILEE<gt>> makes Perl try again to read something.  We hope.
2600
2601 If that doesn't work (some stdios are particularly cantankerous), then
2602 you may need something more like this:
2603
2604     for (;;) {
2605         for ($curpos = tell(FILE); $_ = <FILE>; $curpos = tell(FILE)) {
2606             # search for some stuff and put it into files
2607         }
2608         sleep($for_a_while);
2609         seek(FILE, $curpos, 0);
2610     }
2611
2612 =item seekdir DIRHANDLE,POS
2613
2614 Sets the current position for the readdir() routine on DIRHANDLE.  POS
2615 must be a value returned by telldir().  Has the same caveats about
2616 possible directory compaction as the corresponding system library
2617 routine.
2618
2619 =item select FILEHANDLE
2620
2621 =item select
2622
2623 Returns the currently selected filehandle.  Sets the current default
2624 filehandle for output, if FILEHANDLE is supplied.  This has two
2625 effects: first, a C<write> or a C<print> without a filehandle will
2626 default to this FILEHANDLE.  Second, references to variables related to
2627 output will refer to this output channel.  For example, if you have to
2628 set the top of form format for more than one output channel, you might
2629 do the following:
2630
2631     select(REPORT1);
2632     $^ = 'report1_top';
2633     select(REPORT2);
2634     $^ = 'report2_top';
2635
2636 FILEHANDLE may be an expression whose value gives the name of the
2637 actual filehandle.  Thus:
2638
2639     $oldfh = select(STDERR); $| = 1; select($oldfh);
2640
2641 Some programmers may prefer to think of filehandles as objects with
2642 methods, preferring to write the last example as:
2643
2644     use IO::Handle;
2645     STDERR->autoflush(1);
2646
2647 =item select RBITS,WBITS,EBITS,TIMEOUT
2648
2649 This calls the select(2) system call with the bit masks specified, which
2650 can be constructed using fileno() and vec(), along these lines:
2651
2652     $rin = $win = $ein = '';
2653     vec($rin,fileno(STDIN),1) = 1;
2654     vec($win,fileno(STDOUT),1) = 1;
2655     $ein = $rin | $win;
2656
2657 If you want to select on many filehandles you might wish to write a
2658 subroutine:
2659
2660     sub fhbits {
2661         local(@fhlist) = split(' ',$_[0]);
2662         local($bits);
2663         for (@fhlist) {
2664             vec($bits,fileno($_),1) = 1;
2665         }
2666         $bits;
2667     }
2668     $rin = fhbits('STDIN TTY SOCK');
2669
2670 The usual idiom is:
2671
2672     ($nfound,$timeleft) =
2673       select($rout=$rin, $wout=$win, $eout=$ein, $timeout);
2674
2675 or to block until something becomes ready just do this
2676
2677     $nfound = select($rout=$rin, $wout=$win, $eout=$ein, undef);
2678
2679 Most systems do not bother to return anything useful in $timeleft, so
2680 calling select() in a scalar context just returns $nfound.
2681
2682 Any of the bit masks can also be undef.  The timeout, if specified, is
2683 in seconds, which may be fractional.  Note: not all implementations are
2684 capable of returning the $timeleft.  If not, they always return
2685 $timeleft equal to the supplied $timeout.
2686
2687 You can effect a sleep of 250 milliseconds this way:
2688
2689     select(undef, undef, undef, 0.25);
2690
2691 B<WARNING>: Do not attempt to mix buffered I/O (like read() or E<lt>FHE<gt>)
2692 with select().  You have to use sysread() instead.
2693
2694 =item semctl ID,SEMNUM,CMD,ARG
2695
2696 Calls the System V IPC function semctl.  If CMD is &IPC_STAT or
2697 &GETALL, then ARG must be a variable which will hold the returned
2698 semid_ds structure or semaphore value array.  Returns like ioctl: the
2699 undefined value for error, "0 but true" for zero, or the actual return
2700 value otherwise.
2701
2702 =item semget KEY,NSEMS,FLAGS
2703
2704 Calls the System V IPC function semget.  Returns the semaphore id, or
2705 the undefined value if there is an error.
2706
2707 =item semop KEY,OPSTRING
2708
2709 Calls the System V IPC function semop to perform semaphore operations
2710 such as signaling and waiting.  OPSTRING must be a packed array of
2711 semop structures.  Each semop structure can be generated with
2712 C<pack("sss", $semnum, $semop, $semflag)>.  The number of semaphore
2713 operations is implied by the length of OPSTRING.  Returns TRUE if
2714 successful, or FALSE if there is an error.  As an example, the
2715 following code waits on semaphore $semnum of semaphore id $semid:
2716
2717     $semop = pack("sss", $semnum, -1, 0);
2718     die "Semaphore trouble: $!\n" unless semop($semid, $semop);
2719
2720 To signal the semaphore, replace "-1" with "1".
2721
2722 =item send SOCKET,MSG,FLAGS,TO
2723
2724 =item send SOCKET,MSG,FLAGS
2725
2726 Sends a message on a socket.  Takes the same flags as the system call
2727 of the same name.  On unconnected sockets you must specify a
2728 destination to send TO, in which case it does a C sendto().  Returns
2729 the number of characters sent, or the undefined value if there is an
2730 error.
2731 See L<perlipc/"UDP: Message Passing"> for examples.
2732
2733 =item setpgrp PID,PGRP
2734
2735 Sets the current process group for the specified PID, 0 for the current
2736 process.  Will produce a fatal error if used on a machine that doesn't
2737 implement setpgrp(2).  If the arguments are omitted, it defaults to
2738 0,0.  Note that the POSIX version of setpgrp() does not accept any
2739 arguments, so only setpgrp 0,0 is portable.
2740
2741 =item setpriority WHICH,WHO,PRIORITY
2742
2743 Sets the current priority for a process, a process group, or a user.
2744 (See setpriority(2).)  Will produce a fatal error if used on a machine
2745 that doesn't implement setpriority(2).
2746
2747 =item setsockopt SOCKET,LEVEL,OPTNAME,OPTVAL
2748
2749 Sets the socket option requested.  Returns undefined if there is an
2750 error.  OPTVAL may be specified as undef if you don't want to pass an
2751 argument.
2752
2753 =item shift ARRAY
2754
2755 =item shift
2756
2757 Shifts the first value of the array off and returns it, shortening the
2758 array by 1 and moving everything down.  If there are no elements in the
2759 array, returns the undefined value.  If ARRAY is omitted, shifts the
2760 @ARGV array in the main program, and the @_ array in subroutines.
2761 (This is determined lexically.)  See also unshift(), push(), and pop().
2762 Shift() and unshift() do the same thing to the left end of an array
2763 that pop() and push() do to the right end.
2764
2765 =item shmctl ID,CMD,ARG
2766
2767 Calls the System V IPC function shmctl.  If CMD is &IPC_STAT, then ARG
2768 must be a variable which will hold the returned shmid_ds structure.
2769 Returns like ioctl: the undefined value for error, "0 but true" for
2770 zero, or the actual return value otherwise.
2771
2772 =item shmget KEY,SIZE,FLAGS
2773
2774 Calls the System V IPC function shmget.  Returns the shared memory
2775 segment id, or the undefined value if there is an error.
2776
2777 =item shmread ID,VAR,POS,SIZE
2778
2779 =item shmwrite ID,STRING,POS,SIZE
2780
2781 Reads or writes the System V shared memory segment ID starting at
2782 position POS for size SIZE by attaching to it, copying in/out, and
2783 detaching from it.  When reading, VAR must be a variable which will
2784 hold the data read.  When writing, if STRING is too long, only SIZE
2785 bytes are used; if STRING is too short, nulls are written to fill out
2786 SIZE bytes.  Return TRUE if successful, or FALSE if there is an error.
2787
2788 =item shutdown SOCKET,HOW
2789
2790 Shuts down a socket connection in the manner indicated by HOW, which
2791 has the same interpretation as in the system call of the same name.
2792
2793 =item sin EXPR
2794
2795 =item sin
2796
2797 Returns the sine of EXPR (expressed in radians).  If EXPR is omitted,
2798 returns sine of $_.
2799
2800 For the inverse sine operation, you may use the POSIX::asin()
2801 function, or use this relation:
2802
2803     sub asin { atan2($_[0], sqrt(1 - $_[0] * $_[0])) }
2804
2805 =item sleep EXPR
2806
2807 =item sleep
2808
2809 Causes the script to sleep for EXPR seconds, or forever if no EXPR.
2810 May be interrupted by sending the process a SIGALRM.  Returns the
2811 number of seconds actually slept.  You probably cannot mix alarm() and
2812 sleep() calls, because sleep() is often implemented using alarm().
2813
2814 On some older systems, it may sleep up to a full second less than what
2815 you requested, depending on how it counts seconds.  Most modern systems
2816 always sleep the full amount.
2817
2818 For delays of finer granularity than one second, you may use Perl's
2819 syscall() interface to access setitimer(2) if your system supports it,
2820 or else see L</select()> below.
2821
2822 See also the POSIX module's sigpause() function.
2823
2824 =item socket SOCKET,DOMAIN,TYPE,PROTOCOL
2825
2826 Opens a socket of the specified kind and attaches it to filehandle
2827 SOCKET.  DOMAIN, TYPE, and PROTOCOL are specified the same as for the
2828 system call of the same name.  You should "use Socket;" first to get
2829 the proper definitions imported.  See the example in L<perlipc/"Sockets: Client/Server Communication">.
2830
2831 =item socketpair SOCKET1,SOCKET2,DOMAIN,TYPE,PROTOCOL
2832
2833 Creates an unnamed pair of sockets in the specified domain, of the
2834 specified type.  DOMAIN, TYPE, and PROTOCOL are specified the same as
2835 for the system call of the same name.  If unimplemented, yields a fatal
2836 error.  Returns TRUE if successful.
2837
2838 =item sort SUBNAME LIST
2839
2840 =item sort BLOCK LIST
2841
2842 =item sort LIST
2843
2844 Sorts the LIST and returns the sorted list value.  If SUBNAME or BLOCK
2845 is omitted, sorts in standard string comparison order.  If SUBNAME is
2846 specified, it gives the name of a subroutine that returns an integer
2847 less than, equal to, or greater than 0, depending on how the elements
2848 of the array are to be ordered.  (The C<E<lt>=E<gt>> and C<cmp>
2849 operators are extremely useful in such routines.)  SUBNAME may be a
2850 scalar variable name, in which case the value provides the name of the
2851 subroutine to use.  In place of a SUBNAME, you can provide a BLOCK as
2852 an anonymous, in-line sort subroutine.
2853
2854 In the interests of efficiency the normal calling code for subroutines is
2855 bypassed, with the following effects: the subroutine may not be a
2856 recursive subroutine, and the two elements to be compared are passed into
2857 the subroutine not via @_ but as the package global variables $a and
2858 $b (see example below).  They are passed by reference, so don't
2859 modify $a and $b.  And don't try to declare them as lexicals either.
2860
2861 You also cannot exit out of the sort block or subroutine using any of the
2862 loop control operators described in L<perlsyn> or with goto().
2863
2864 When C<use locale> is in effect, C<sort LIST> sorts LIST according to the
2865 current collation locale.  See L<perllocale>.
2866
2867 Examples:
2868
2869     # sort lexically
2870     @articles = sort @files;
2871
2872     # same thing, but with explicit sort routine
2873     @articles = sort {$a cmp $b} @files;
2874
2875     # now case-insensitively
2876     @articles = sort {uc($a) cmp uc($b)} @files;
2877
2878     # same thing in reversed order
2879     @articles = sort {$b cmp $a} @files;
2880
2881     # sort numerically ascending
2882     @articles = sort {$a <=> $b} @files;
2883
2884     # sort numerically descending
2885     @articles = sort {$b <=> $a} @files;
2886
2887     # sort using explicit subroutine name
2888     sub byage {
2889         $age{$a} <=> $age{$b};  # presuming numeric
2890     }
2891     @sortedclass = sort byage @class;
2892
2893     # this sorts the %age hash by value instead of key
2894     # using an in-line function
2895     @eldest = sort { $age{$b} <=> $age{$a} } keys %age;
2896
2897     sub backwards { $b cmp $a; }
2898     @harry = ('dog','cat','x','Cain','Abel');
2899     @george = ('gone','chased','yz','Punished','Axed');
2900     print sort @harry;
2901             # prints AbelCaincatdogx
2902     print sort backwards @harry;
2903             # prints xdogcatCainAbel
2904     print sort @george, 'to', @harry;
2905             # prints AbelAxedCainPunishedcatchaseddoggonetoxyz
2906
2907     # inefficiently sort by descending numeric compare using
2908     # the first integer after the first = sign, or the
2909     # whole record case-insensitively otherwise
2910
2911     @new = sort {
2912         ($b =~ /=(\d+)/)[0] <=> ($a =~ /=(\d+)/)[0]
2913                             ||
2914                     uc($a)  cmp  uc($b)
2915     } @old;
2916
2917     # same thing, but much more efficiently;
2918     # we'll build auxiliary indices instead
2919     # for speed
2920     @nums = @caps = ();
2921     for (@old) {
2922         push @nums, /=(\d+)/;
2923         push @caps, uc($_);
2924     }
2925
2926     @new = @old[ sort {
2927                         $nums[$b] <=> $nums[$a]
2928                                  ||
2929                         $caps[$a] cmp $caps[$b]
2930                        } 0..$#old
2931                ];
2932
2933     # same thing using a Schwartzian Transform (no temps)
2934     @new = map { $_->[0] }
2935         sort { $b->[1] <=> $a->[1]
2936                         ||
2937                $a->[2] cmp $b->[2]
2938         } map { [$_, /=(\d+)/, uc($_)] } @old;
2939
2940 If you're using strict, you I<MUST NOT> declare $a
2941 and $b as lexicals.  They are package globals.  That means
2942 if you're in the C<main> package, it's
2943
2944     @articles = sort {$main::b <=> $main::a} @files;
2945
2946 or just
2947
2948     @articles = sort {$::b <=> $::a} @files;
2949
2950 but if you're in the C<FooPack> package, it's
2951
2952     @articles = sort {$FooPack::b <=> $FooPack::a} @files;
2953
2954 The comparison function is required to behave.  If it returns
2955 inconsistent results (sometimes saying $x[1] is less than $x[2] and
2956 sometimes saying the opposite, for example) the Perl interpreter will
2957 probably crash and dump core.  This is entirely due to and dependent
2958 upon your system's qsort(3) library routine; this routine often avoids
2959 sanity checks in the interest of speed.
2960
2961 =item splice ARRAY,OFFSET,LENGTH,LIST
2962
2963 =item splice ARRAY,OFFSET,LENGTH
2964
2965 =item splice ARRAY,OFFSET
2966
2967 Removes the elements designated by OFFSET and LENGTH from an array, and
2968 replaces them with the elements of LIST, if any.  Returns the elements
2969 removed from the array.  The array grows or shrinks as necessary.  If
2970 LENGTH is omitted, removes everything from OFFSET onward.  The
2971 following equivalences hold (assuming C<$[ == 0>):
2972
2973     push(@a,$x,$y)      splice(@a,$#a+1,0,$x,$y)
2974     pop(@a)             splice(@a,-1)
2975     shift(@a)           splice(@a,0,1)
2976     unshift(@a,$x,$y)   splice(@a,0,0,$x,$y)
2977     $a[$x] = $y         splice(@a,$x,1,$y);
2978
2979 Example, assuming array lengths are passed before arrays:
2980
2981     sub aeq {   # compare two list values
2982         local(@a) = splice(@_,0,shift);
2983         local(@b) = splice(@_,0,shift);
2984         return 0 unless @a == @b;       # same len?
2985         while (@a) {
2986             return 0 if pop(@a) ne pop(@b);
2987         }
2988         return 1;
2989     }
2990     if (&aeq($len,@foo[1..$len],0+@bar,@bar)) { ... }
2991
2992 =item split /PATTERN/,EXPR,LIMIT
2993
2994 =item split /PATTERN/,EXPR
2995
2996 =item split /PATTERN/
2997
2998 =item split
2999
3000 Splits a string into an array of strings, and returns it.
3001
3002 If not in a list context, returns the number of fields found and splits into
3003 the @_ array.  (In a list context, you can force the split into @_ by
3004 using C<??> as the pattern delimiters, but it still returns the array
3005 value.)  The use of implicit split to @_ is deprecated, however.
3006
3007 If EXPR is omitted, splits the $_ string.  If PATTERN is also omitted,
3008 splits on whitespace (after skipping any leading whitespace).  Anything
3009 matching PATTERN is taken to be a delimiter separating the fields.  (Note
3010 that the delimiter may be longer than one character.)  If LIMIT is
3011 specified and is not negative, splits into no more than that many fields
3012 (though it may split into fewer).  If LIMIT is unspecified, trailing null
3013 fields are stripped (which potential users of pop() would do well to
3014 remember).  If LIMIT is negative, it is treated as if an arbitrarily large
3015 LIMIT had been specified.
3016
3017 A pattern matching the null string (not to be confused with
3018 a null pattern C<//>, which is just one member of the set of patterns
3019 matching a null string) will split the value of EXPR into separate
3020 characters at each point it matches that way.  For example:
3021
3022     print join(':', split(/ */, 'hi there'));
3023
3024 produces the output 'h:i:t:h:e:r:e'.
3025
3026 The LIMIT parameter can be used to split a line partially
3027
3028     ($login, $passwd, $remainder) = split(/:/, $_, 3);
3029
3030 When assigning to a list, if LIMIT is omitted, Perl supplies a LIMIT
3031 one larger than the number of variables in the list, to avoid
3032 unnecessary work.  For the list above LIMIT would have been 4 by
3033 default.  In time critical applications it behooves you not to split
3034 into more fields than you really need.
3035
3036 If the PATTERN contains parentheses, additional array elements are
3037 created from each matching substring in the delimiter.
3038
3039     split(/([,-])/, "1-10,20", 3);
3040
3041 produces the list value
3042
3043     (1, '-', 10, ',', 20)
3044
3045 If you had the entire header of a normal Unix email message in $header,
3046 you could split it up into fields and their values this way:
3047
3048     $header =~ s/\n\s+/ /g;  # fix continuation lines
3049     %hdrs   =  (UNIX_FROM => split /^(.*?):\s*/m, $header);
3050
3051 The pattern C</PATTERN/> may be replaced with an expression to specify
3052 patterns that vary at runtime.  (To do runtime compilation only once,
3053 use C</$variable/o>.)
3054
3055 As a special case, specifying a PATTERN of space (C<' '>) will split on
3056 white space just as split with no arguments does.  Thus, split(' ') can
3057 be used to emulate B<awk>'s default behavior, whereas C<split(/ /)>
3058 will give you as many null initial fields as there are leading spaces.
3059 A split on /\s+/ is like a split(' ') except that any leading
3060 whitespace produces a null first field.  A split with no arguments
3061 really does a C<split(' ', $_)> internally.
3062
3063 Example:
3064
3065     open(passwd, '/etc/passwd');
3066     while (<passwd>) {
3067         ($login, $passwd, $uid, $gid, $gcos,
3068             $home, $shell) = split(/:/);
3069         ...
3070     }
3071
3072 (Note that $shell above will still have a newline on it.  See L</chop>,
3073 L</chomp>, and L</join>.)
3074
3075 =item sprintf FORMAT, LIST
3076
3077 Returns a string formatted by the usual printf conventions of the C
3078 language.  See L<sprintf(3)> or L<printf(3)> on your system for details.
3079 (The * character for an indirectly specified length is not
3080 supported, but you can get the same effect by interpolating a variable
3081 into the pattern.)  If C<use locale> is
3082 in effect, the character used for the decimal point in formatted real numbers
3083 is affected by the LC_NUMERIC locale.  See L<perllocale>.
3084 Some C libraries' implementations of sprintf() can
3085 dump core when fed ludicrous arguments.
3086
3087 =item sqrt EXPR
3088
3089 =item sqrt
3090
3091 Return the square root of EXPR.  If EXPR is omitted, returns square
3092 root of $_.
3093
3094 =item srand EXPR
3095
3096 =item srand
3097
3098 Sets the random number seed for the C<rand> operator.  If EXPR is
3099 omitted, uses a semi-random value based on the current time and process
3100 ID, among other things.  In versions of Perl prior to 5.004 the default
3101 seed was just the current time().  This isn't a particularly good seed,
3102 so many old programs supply their own seed value (often C<time ^ $$> or
3103 C<time ^ ($$ + ($$ << 15))>), but that isn't necessary any more.
3104
3105 In fact, it's usually not necessary to call srand() at all, because if
3106 it is not called explicitly, it is called implicitly at the first use of
3107 the C<rand> operator.  However, this was not the case in version of Perl
3108 before 5.004, so if your script will run under older Perl versions, it
3109 should call srand().
3110
3111 Note that you need something much more random than the default seed for
3112 cryptographic purposes.  Checksumming the compressed output of one or more
3113 rapidly changing operating system status programs is the usual method.  For
3114 example:
3115
3116     srand (time ^ $$ ^ unpack "%L*", `ps axww | gzip`);
3117
3118 If you're particularly concerned with this, see the Math::TrulyRandom
3119 module in CPAN.
3120
3121 Do I<not> call srand() multiple times in your program unless you know
3122 exactly what you're doing and why you're doing it.  The point of the
3123 function is to "seed" the rand() function so that rand() can produce
3124 a different sequence each time you run your program.  Just do it once at the
3125 top of your program, or you I<won't> get random numbers out of rand()!
3126
3127 Frequently called programs (like CGI scripts) that simply use
3128
3129     time ^ $$
3130
3131 for a seed can fall prey to the mathematical property that
3132
3133     a^b == (a+1)^(b+1)
3134
3135 one-third of the time.  So don't do that.
3136
3137 =item stat FILEHANDLE
3138
3139 =item stat EXPR
3140
3141 =item stat
3142
3143 Returns a 13-element array giving the status info for a file, either the
3144 file opened via FILEHANDLE, or named by EXPR.  If EXPR is omitted, it
3145 stats $_.  Returns a null list if the stat fails.  Typically used as
3146 follows:
3147
3148
3149     ($dev,$ino,$mode,$nlink,$uid,$gid,$rdev,$size,
3150        $atime,$mtime,$ctime,$blksize,$blocks)
3151            = stat($filename);
3152
3153 Not all fields are supported on all filesystem types.  Here are the
3154 meaning of the fields:
3155
3156   0 dev      device number of filesystem
3157   1 ino      inode number
3158   2 mode     file mode  (type and permissions)
3159   3 nlink    number of (hard) links to the file
3160   4 uid      numeric user ID of file's owner
3161   5 gid      numeric group ID of file's owner
3162   6 rdev     the device identifier (special files only)
3163   7 size     total size of file, in bytes
3164   8 atime    last access time since the epoch
3165   9 mtime    last modify time since the epoch
3166  10 ctime    inode change time (NOT creation time!) since the epoch
3167  11 blksize  preferred block size for file system I/O
3168  12 blocks   actual number of blocks allocated
3169
3170 (The epoch was at 00:00 January 1, 1970 GMT.)
3171
3172 If stat is passed the special filehandle consisting of an underline, no
3173 stat is done, but the current contents of the stat structure from the
3174 last stat or filetest are returned.  Example:
3175
3176     if (-x $file && (($d) = stat(_)) && $d < 0) {
3177         print "$file is executable NFS file\n";
3178     }
3179
3180 (This works on machines only for which the device number is negative under NFS.)
3181
3182 =item study SCALAR
3183
3184 =item study
3185
3186 Takes extra time to study SCALAR (C<$_> if unspecified) in anticipation of
3187 doing many pattern matches on the string before it is next modified.
3188 This may or may not save time, depending on the nature and number of
3189 patterns you are searching on, and on the distribution of character
3190 frequencies in the string to be searched -- you probably want to compare
3191 run times with and without it to see which runs faster.  Those loops
3192 which scan for many short constant strings (including the constant
3193 parts of more complex patterns) will benefit most.  You may have only
3194 one study active at a time -- if you study a different scalar the first
3195 is "unstudied".  (The way study works is this: a linked list of every
3196 character in the string to be searched is made, so we know, for
3197 example, where all the 'k' characters are.  From each search string,
3198 the rarest character is selected, based on some static frequency tables
3199 constructed from some C programs and English text.  Only those places
3200 that contain this "rarest" character are examined.)
3201
3202 For example, here is a loop which inserts index producing entries
3203 before any line containing a certain pattern:
3204
3205     while (<>) {
3206         study;
3207         print ".IX foo\n" if /\bfoo\b/;
3208         print ".IX bar\n" if /\bbar\b/;
3209         print ".IX blurfl\n" if /\bblurfl\b/;
3210         ...
3211         print;
3212     }
3213
3214 In searching for /\bfoo\b/, only those locations in $_ that contain "f"
3215 will be looked at, because "f" is rarer than "o".  In general, this is
3216 a big win except in pathological cases.  The only question is whether
3217 it saves you more time than it took to build the linked list in the
3218 first place.
3219
3220 Note that if you have to look for strings that you don't know till
3221 runtime, you can build an entire loop as a string and eval that to
3222 avoid recompiling all your patterns all the time.  Together with
3223 undefining $/ to input entire files as one record, this can be very
3224 fast, often faster than specialized programs like fgrep(1).  The following
3225 scans a list of files (C<@files>) for a list of words (C<@words>), and prints
3226 out the names of those files that contain a match:
3227
3228     $search = 'while (<>) { study;';
3229     foreach $word (@words) {
3230         $search .= "++\$seen{\$ARGV} if /\\b$word\\b/;\n";
3231     }
3232     $search .= "}";
3233     @ARGV = @files;
3234     undef $/;
3235     eval $search;               # this screams
3236     $/ = "\n";          # put back to normal input delimiter
3237     foreach $file (sort keys(%seen)) {
3238         print $file, "\n";
3239     }
3240
3241 =item sub BLOCK
3242
3243 =item sub NAME
3244
3245 =item sub NAME BLOCK
3246
3247 This is subroutine definition, not a real function I<per se>.  With just a
3248 NAME (and possibly prototypes), it's just a forward declaration.  Without
3249 a NAME, it's an anonymous function declaration, and does actually return a
3250 value: the CODE ref of the closure you just created.  See L<perlsub> and
3251 L<perlref> for details.
3252
3253 =item substr EXPR,OFFSET,LEN
3254
3255 =item substr EXPR,OFFSET
3256
3257 Extracts a substring out of EXPR and returns it.  First character is at
3258 offset 0, or whatever you've set C<$[> to (but don't do that).
3259 If OFFSET is negative, starts
3260 that far from the end of the string.  If LEN is omitted, returns
3261 everything to the end of the string.  If LEN is negative, leaves that
3262 many characters off the end of the string.
3263
3264 You can use the substr() function
3265 as an lvalue, in which case EXPR must be an lvalue.  If you assign
3266 something shorter than LEN, the string will shrink, and if you assign
3267 something longer than LEN, the string will grow to accommodate it.  To
3268 keep the string the same length you may need to pad or chop your value
3269 using sprintf().
3270
3271 =item symlink OLDFILE,NEWFILE
3272
3273 Creates a new filename symbolically linked to the old filename.
3274 Returns 1 for success, 0 otherwise.  On systems that don't support
3275 symbolic links, produces a fatal error at run time.  To check for that,
3276 use eval:
3277
3278     $symlink_exists = (eval {symlink("","")};, $@ eq '');
3279
3280 =item syscall LIST
3281
3282 Calls the system call specified as the first element of the list,
3283 passing the remaining elements as arguments to the system call.  If
3284 unimplemented, produces a fatal error.  The arguments are interpreted
3285 as follows: if a given argument is numeric, the argument is passed as
3286 an int.  If not, the pointer to the string value is passed.  You are
3287 responsible to make sure a string is pre-extended long enough to
3288 receive any result that might be written into a string.  If your
3289 integer arguments are not literals and have never been interpreted in a
3290 numeric context, you may need to add 0 to them to force them to look
3291 like numbers.
3292
3293     require 'syscall.ph';               # may need to run h2ph
3294     syscall(&SYS_write, fileno(STDOUT), "hi there\n", 9);
3295
3296 Note that Perl supports passing of up to only 14 arguments to your system call,
3297 which in practice should usually suffice.
3298
3299 =item sysopen FILEHANDLE,FILENAME,MODE
3300
3301 =item sysopen FILEHANDLE,FILENAME,MODE,PERMS
3302
3303 Opens the file whose filename is given by FILENAME, and associates it
3304 with FILEHANDLE.  If FILEHANDLE is an expression, its value is used as
3305 the name of the real filehandle wanted.  This function calls the
3306 underlying operating system's C<open> function with the parameters
3307 FILENAME, MODE, PERMS.
3308
3309 The possible values and flag bits of the MODE parameter are
3310 system-dependent; they are available via the standard module C<Fcntl>.
3311 However, for historical reasons, some values are universal: zero means
3312 read-only, one means write-only, and two means read/write.
3313
3314 If the file named by FILENAME does not exist and the C<open> call
3315 creates it (typically because MODE includes the O_CREAT flag), then
3316 the value of PERMS specifies the permissions of the newly created
3317 file.  If PERMS is omitted, the default value is 0666, which allows
3318 read and write for all.  This default is reasonable: see C<umask>.
3319
3320 The IO::File module provides a more object-oriented approach, if you're
3321 into that kind of thing.
3322
3323 =item sysread FILEHANDLE,SCALAR,LENGTH,OFFSET
3324
3325 =item sysread FILEHANDLE,SCALAR,LENGTH
3326
3327 Attempts to read LENGTH bytes of data into variable SCALAR from the
3328 specified FILEHANDLE, using the system call read(2).  It bypasses
3329 stdio, so mixing this with other kinds of reads may cause confusion.
3330 Returns the number of bytes actually read, or undef if there was an
3331 error.  SCALAR will be grown or shrunk so that the last byte actually
3332 read is the last byte of the scalar after the read.
3333
3334 An OFFSET may be specified to place the read data at some place in the
3335 string other than the beginning.  A negative OFFSET specifies
3336 placement at that many bytes counting backwards from the end of the
3337 string.  A positive OFFSET greater than the length of SCALAR results
3338 in the string being padded to the required size with "\0" bytes before
3339 the result of the read is appended.
3340
3341 =item system LIST
3342
3343 Does exactly the same thing as "exec LIST" except that a fork is done
3344 first, and the parent process waits for the child process to complete.
3345 Note that argument processing varies depending on the number of
3346 arguments.  The return value is the exit status of the program as
3347 returned by the wait() call.  To get the actual exit value divide by
3348 256.  See also L</exec>.  This is I<NOT> what you want to use to capture
3349 the output from a command, for that you should use merely backticks or
3350 qx//, as described in L<perlop/"`STRING`">.
3351
3352 Because system() and backticks block SIGINT and SIGQUIT, killing the
3353 program they're running doesn't actually interrupt your program.
3354
3355     @args = ("command", "arg1", "arg2");
3356     system(@args) == 0
3357          or die "system @args failed: $?"
3358
3359 Here's a more elaborate example of analysing the return value from
3360 system() on a Unix system to check for all possibilities, including for
3361 signals and core dumps.
3362
3363     $rc = 0xffff & system @args;
3364     printf "system(%s) returned %#04x: ", "@args", $rc;
3365     if ($rc == 0) {
3366         print "ran with normal exit\n";
3367     }
3368     elsif ($rc == 0xff00) {
3369         print "command failed: $!\n";
3370     }
3371     elsif ($rc > 0x80) {
3372         $rc >>= 8;
3373         print "ran with non-zero exit status $rc\n";
3374     }
3375     else {
3376         print "ran with ";
3377         if ($rc &   0x80) {
3378             $rc &= ~0x80;
3379             print "core dump from ";
3380         }
3381         print "signal $rc\n"
3382     }
3383     $ok = ($rc != 0);
3384
3385 =item syswrite FILEHANDLE,SCALAR,LENGTH,OFFSET
3386
3387 =item syswrite FILEHANDLE,SCALAR,LENGTH
3388
3389 Attempts to write LENGTH bytes of data from variable SCALAR to the
3390 specified FILEHANDLE, using the system call write(2).  It bypasses
3391 stdio, so mixing this with prints may cause confusion.  Returns the
3392 number of bytes actually written, or undef if there was an error.
3393 If the length is greater than the available data, only as much data as
3394 is available will be written.
3395
3396 An OFFSET may be specified to write the data from some part of the
3397 string other than the beginning.  A negative OFFSET specifies writing
3398 that many bytes counting backwards from the end of the string.
3399
3400 =item tell FILEHANDLE
3401
3402 =item tell
3403
3404 Returns the current file position for FILEHANDLE.  FILEHANDLE may be an
3405 expression whose value gives the name of the actual filehandle.  If
3406 FILEHANDLE is omitted, assumes the file last read.
3407
3408 =item telldir DIRHANDLE
3409
3410 Returns the current position of the readdir() routines on DIRHANDLE.
3411 Value may be given to seekdir() to access a particular location in a
3412 directory.  Has the same caveats about possible directory compaction as
3413 the corresponding system library routine.
3414
3415 =item tie VARIABLE,CLASSNAME,LIST
3416
3417 This function binds a variable to a package class that will provide the
3418 implementation for the variable.  VARIABLE is the name of the variable
3419 to be enchanted.  CLASSNAME is the name of a class implementing objects
3420 of correct type.  Any additional arguments are passed to the "new"
3421 method of the class (meaning TIESCALAR, TIEARRAY, or TIEHASH).
3422 Typically these are arguments such as might be passed to the dbm_open()
3423 function of C.  The object returned by the "new" method is also
3424 returned by the tie() function, which would be useful if you want to
3425 access other methods in CLASSNAME.
3426
3427 Note that functions such as keys() and values() may return huge array
3428 values when used on large objects, like DBM files.  You may prefer to
3429 use the each() function to iterate over such.  Example:
3430
3431     # print out history file offsets
3432     use NDBM_File;
3433     tie(%HIST, 'NDBM_File', '/usr/lib/news/history', 1, 0);
3434     while (($key,$val) = each %HIST) {
3435         print $key, ' = ', unpack('L',$val), "\n";
3436     }
3437     untie(%HIST);
3438
3439 A class implementing a hash should have the following methods:
3440
3441     TIEHASH classname, LIST
3442     DESTROY this
3443     FETCH this, key
3444     STORE this, key, value
3445     DELETE this, key
3446     EXISTS this, key
3447     FIRSTKEY this
3448     NEXTKEY this, lastkey
3449
3450 A class implementing an ordinary array should have the following methods:
3451
3452     TIEARRAY classname, LIST
3453     DESTROY this
3454     FETCH this, key
3455     STORE this, key, value
3456     [others TBD]
3457
3458 A class implementing a scalar should have the following methods:
3459
3460     TIESCALAR classname, LIST
3461     DESTROY this
3462     FETCH this,
3463     STORE this, value
3464
3465 Unlike dbmopen(), the tie() function will not use or require a module
3466 for you--you need to do that explicitly yourself.  See L<DB_File>
3467 or the F<Config> module for interesting tie() implementations.
3468
3469 =item tied VARIABLE
3470
3471 Returns a reference to the object underlying VARIABLE (the same value
3472 that was originally returned by the tie() call which bound the variable
3473 to a package.)  Returns the undefined value if VARIABLE isn't tied to a
3474 package.
3475
3476 =item time
3477
3478 Returns the number of non-leap seconds since whatever time the system
3479 considers to be the epoch (that's 00:00:00, January 1, 1904 for MacOS,
3480 and 00:00:00 UTC, January 1, 1970 for most other systems).
3481 Suitable for feeding to gmtime() and localtime().
3482
3483 =item times
3484
3485 Returns a four-element array giving the user and system times, in
3486 seconds, for this process and the children of this process.
3487
3488     ($user,$system,$cuser,$csystem) = times;
3489
3490 =item tr///
3491
3492 The translation operator.  Same as y///. See L<perlop>.
3493
3494 =item truncate FILEHANDLE,LENGTH
3495
3496 =item truncate EXPR,LENGTH
3497
3498 Truncates the file opened on FILEHANDLE, or named by EXPR, to the
3499 specified length.  Produces a fatal error if truncate isn't implemented
3500 on your system.
3501
3502 =item uc EXPR
3503
3504 =item uc
3505
3506 Returns an uppercased version of EXPR.  This is the internal function
3507 implementing the \U escape in double-quoted strings.
3508 Respects current LC_CTYPE locale if C<use locale> in force.  See L<perllocale>.
3509
3510 If EXPR is omitted, uses $_.
3511
3512 =item ucfirst EXPR
3513
3514 =item ucfirst
3515
3516 Returns the value of EXPR with the first character uppercased.  This is
3517 the internal function implementing the \u escape in double-quoted strings.
3518 Respects current LC_CTYPE locale if C<use locale> in force.  See L<perllocale>.
3519
3520 If EXPR is omitted, uses $_.
3521
3522 =item umask EXPR
3523
3524 =item umask
3525
3526 Sets the umask for the process to EXPR and returns the previous value.
3527 If EXPR is omitted, merely returns the current umask.  Remember that a
3528 umask is a number, usually given in octal; it is I<not> a string of octal
3529 digits.  See also L<oct>, if all you have is a string.
3530
3531 =item undef EXPR
3532
3533 =item undef
3534
3535 Undefines the value of EXPR, which must be an lvalue.  Use only on a
3536 scalar value, an entire array, an entire hash, or a subroutine name (using
3537 "&").  (Using undef() will probably not do what you expect on most
3538 predefined variables or DBM list values, so don't do that.)  Always
3539 returns the undefined value.  You can omit the EXPR, in which case
3540 nothing is undefined, but you still get an undefined value that you
3541 could, for instance, return from a subroutine, assign to a variable or
3542 pass as a parameter.  Examples:
3543
3544     undef $foo;
3545     undef $bar{'blurfl'};             # Compare to: delete $bar{'blurfl'};
3546     undef @ary;
3547     undef %hash;
3548     undef &mysub;
3549     return (wantarray ? (undef, $errmsg) : undef) if $they_blew_it;
3550     select undef, undef, undef, 0.25;
3551     ($a, $b, undef, $c) = &foo;       # Ignore third value returned
3552
3553 =item unlink LIST
3554
3555 =item unlink
3556
3557 Deletes a list of files.  Returns the number of files successfully
3558 deleted.
3559
3560     $cnt = unlink 'a', 'b', 'c';
3561     unlink @goners;
3562     unlink <*.bak>;
3563
3564 Note: unlink will not delete directories unless you are superuser and
3565 the B<-U> flag is supplied to Perl.  Even if these conditions are
3566 met, be warned that unlinking a directory can inflict damage on your
3567 filesystem.  Use rmdir instead.
3568
3569 If LIST is omitted, uses $_.
3570
3571 =item unpack TEMPLATE,EXPR
3572
3573 Unpack does the reverse of pack: it takes a string representing a
3574 structure and expands it out into a list value, returning the array
3575 value.  (In a scalar context, it returns merely the first value
3576 produced.)  The TEMPLATE has the same format as in the pack function.
3577 Here's a subroutine that does substring:
3578
3579     sub substr {
3580         local($what,$where,$howmuch) = @_;
3581         unpack("x$where a$howmuch", $what);
3582     }
3583
3584 and then there's
3585
3586     sub ordinal { unpack("c",$_[0]); } # same as ord()
3587
3588 In addition, you may prefix a field with a %E<lt>numberE<gt> to indicate that
3589 you want a E<lt>numberE<gt>-bit checksum of the items instead of the items
3590 themselves.  Default is a 16-bit checksum.  For example, the following
3591 computes the same number as the System V sum program:
3592
3593     while (<>) {
3594         $checksum += unpack("%16C*", $_);
3595     }
3596     $checksum %= 65536;
3597
3598 The following efficiently counts the number of set bits in a bit vector:
3599
3600     $setbits = unpack("%32b*", $selectmask);
3601
3602 =item untie VARIABLE
3603
3604 Breaks the binding between a variable and a package.  (See tie().)
3605
3606 =item unshift ARRAY,LIST
3607
3608 Does the opposite of a C<shift>.  Or the opposite of a C<push>,
3609 depending on how you look at it.  Prepends list to the front of the
3610 array, and returns the new number of elements in the array.
3611
3612     unshift(ARGV, '-e') unless $ARGV[0] =~ /^-/;
3613
3614 Note the LIST is prepended whole, not one element at a time, so the
3615 prepended elements stay in the same order.  Use reverse to do the
3616 reverse.
3617
3618 =item use Module LIST
3619
3620 =item use Module
3621
3622 =item use Module VERSION LIST
3623
3624 =item use VERSION
3625
3626 Imports some semantics into the current package from the named module,
3627 generally by aliasing certain subroutine or variable names into your
3628 package.  It is exactly equivalent to
3629
3630     BEGIN { require Module; import Module LIST; }
3631
3632 except that Module I<must> be a bareword.
3633
3634 If the first argument to C<use> is a number, it is treated as a version
3635 number instead of a module name.  If the version of the Perl interpreter
3636 is less than VERSION, then an error message is printed and Perl exits
3637 immediately.  This is often useful if you need to check the current
3638 Perl version before C<use>ing library modules which have changed in
3639 incompatible ways from older versions of Perl.  (We try not to do
3640 this more than we have to.)
3641
3642 The BEGIN forces the require and import to happen at compile time.  The
3643 require makes sure the module is loaded into memory if it hasn't been
3644 yet.  The import is not a builtin--it's just an ordinary static method
3645 call into the "Module" package to tell the module to import the list of
3646 features back into the current package.  The module can implement its
3647 import method any way it likes, though most modules just choose to
3648 derive their import method via inheritance from the Exporter class that
3649 is defined in the Exporter module.  See L<Exporter>.  If no import
3650 method can be found then the error is currently silently ignored.  This
3651 may change to a fatal error in a future version.
3652
3653 If you don't want your namespace altered, explicitly supply an empty list:
3654
3655     use Module ();
3656
3657 That is exactly equivalent to
3658
3659     BEGIN { require Module; }
3660
3661 If the VERSION argument is present between Module and LIST, then the
3662 C<use> will call the VERSION method in class Module with the given
3663 version as an argument.  The default VERSION method, inherited from
3664 the Universal class, croaks if the given version is larger than the
3665 value of the variable $Module::VERSION.  (Note that there is not a
3666 comma after VERSION!)
3667
3668 Because this is a wide-open interface, pragmas (compiler directives)
3669 are also implemented this way.  Currently implemented pragmas are:
3670
3671     use integer;
3672     use diagnostics;
3673     use sigtrap qw(SEGV BUS);
3674     use strict  qw(subs vars refs);
3675     use subs    qw(afunc blurfl);
3676
3677 These pseudo-modules import semantics into the current block scope, unlike
3678 ordinary modules, which import symbols into the current package (which are
3679 effective through the end of the file).
3680
3681 There's a corresponding "no" command that unimports meanings imported
3682 by use, i.e., it calls C<unimport Module LIST> instead of C<import>.
3683
3684     no integer;
3685     no strict 'refs';
3686
3687 If no unimport method can be found the call fails with a fatal error.
3688
3689 See L<perlmod> for a list of standard modules and pragmas.
3690
3691 =item utime LIST
3692
3693 Changes the access and modification times on each file of a list of
3694 files.  The first two elements of the list must be the NUMERICAL access
3695 and modification times, in that order.  Returns the number of files
3696 successfully changed.  The inode modification time of each file is set
3697 to the current time.  Example of a "touch" command:
3698
3699     #!/usr/bin/perl
3700     $now = time;
3701     utime $now, $now, @ARGV;
3702
3703 =item values HASH
3704
3705 Returns a normal array consisting of all the values of the named hash.
3706 (In a scalar context, returns the number of values.)  The values are
3707 returned in an apparently random order, but it is the same order as either
3708 the keys() or each() function would produce on the same hash.  As a side
3709 effect, it resets HASH's iterator.  See also keys(), each(), and sort().
3710
3711 =item vec EXPR,OFFSET,BITS
3712
3713 Treats the string in EXPR as a vector of unsigned integers, and
3714 returns the value of the bit field specified by OFFSET.  BITS specifies
3715 the number of bits that are reserved for each entry in the bit
3716 vector.  This must be a power of two from 1 to 32. vec() may also be
3717 assigned to, in which case parentheses are needed to give the expression
3718 the correct precedence as in
3719
3720     vec($image, $max_x * $x + $y, 8) = 3;
3721
3722 Vectors created with vec() can also be manipulated with the logical
3723 operators |, &, and ^, which will assume a bit vector operation is
3724 desired when both operands are strings.
3725
3726 To transform a bit vector into a string or array of 0's and 1's, use these:
3727
3728     $bits = unpack("b*", $vector);
3729     @bits = split(//, unpack("b*", $vector));
3730
3731 If you know the exact length in bits, it can be used in place of the *.
3732
3733 =item wait
3734
3735 Waits for a child process to terminate and returns the pid of the
3736 deceased process, or -1 if there are no child processes.  The status is
3737 returned in C<$?>.
3738
3739 =item waitpid PID,FLAGS
3740
3741 Waits for a particular child process to terminate and returns the pid
3742 of the deceased process, or -1 if there is no such child process.  The
3743 status is returned in C<$?>.  If you say
3744
3745     use POSIX ":sys_wait_h";
3746     ...
3747     waitpid(-1,&WNOHANG);
3748
3749 then you can do a non-blocking wait for any process.  Non-blocking wait
3750 is available on machines supporting either the waitpid(2) or
3751 wait4(2) system calls.  However, waiting for a particular pid with
3752 FLAGS of 0 is implemented everywhere.  (Perl emulates the system call
3753 by remembering the status values of processes that have exited but have
3754 not been harvested by the Perl script yet.)
3755
3756 =item wantarray
3757
3758 Returns TRUE if the context of the currently executing subroutine is
3759 looking for a list value.  Returns FALSE if the context is looking
3760 for a scalar.  Returns the undefined value if the context is looking
3761 for no value (void context).
3762
3763     return unless defined wantarray;    # don't bother doing more
3764     my @a = complex_calculation();
3765     return wantarray ? @a : "@a";
3766
3767 =item warn LIST
3768
3769 Produces a message on STDERR just like die(), but doesn't exit or throw
3770 an exception.
3771
3772 No message is printed if there is a C<$SIG{__WARN__}> handler
3773 installed.  It is the handler's responsibility to deal with the message
3774 as it sees fit (like, for instance, converting it into a die()).  Most
3775 handlers must therefore make arrangements to actually display the
3776 warnings that they are not prepared to deal with, by calling warn()
3777 again in the handler.  Note that this is quite safe and will not
3778 produce an endless loop, since C<__WARN__> hooks are not called from
3779 inside one.
3780
3781 You will find this behavior is slightly different from that of
3782 C<$SIG{__DIE__}> handlers (which don't suppress the error text, but can
3783 instead call die() again to change it).
3784
3785 Using a C<__WARN__> handler provides a powerful way to silence all
3786 warnings (even the so-called mandatory ones).  An example:
3787
3788     # wipe out *all* compile-time warnings
3789     BEGIN { $SIG{'__WARN__'} = sub { warn $_[0] if $DOWARN } }
3790     my $foo = 10;
3791     my $foo = 20;          # no warning about duplicate my $foo,
3792                            # but hey, you asked for it!
3793     # no compile-time or run-time warnings before here
3794     $DOWARN = 1;
3795
3796     # run-time warnings enabled after here
3797     warn "\$foo is alive and $foo!";     # does show up
3798
3799 See L<perlvar> for details on setting C<%SIG> entries, and for more
3800 examples.
3801
3802 =item write FILEHANDLE
3803
3804 =item write EXPR
3805
3806 =item write
3807
3808 Writes a formatted record (possibly multiline) to the specified file,
3809 using the format associated with that file.  By default the format for
3810 a file is the one having the same name as the filehandle, but the
3811 format for the current output channel (see the select() function) may be set
3812 explicitly by assigning the name of the format to the C<$~> variable.
3813
3814 Top of form processing is handled automatically:  if there is
3815 insufficient room on the current page for the formatted record, the
3816 page is advanced by writing a form feed, a special top-of-page format
3817 is used to format the new page header, and then the record is written.
3818 By default the top-of-page format is the name of the filehandle with
3819 "_TOP" appended, but it may be dynamically set to the format of your
3820 choice by assigning the name to the C<$^> variable while the filehandle is
3821 selected.  The number of lines remaining on the current page is in
3822 variable C<$->, which can be set to 0 to force a new page.
3823
3824 If FILEHANDLE is unspecified, output goes to the current default output
3825 channel, which starts out as STDOUT but may be changed by the
3826 C<select> operator.  If the FILEHANDLE is an EXPR, then the expression
3827 is evaluated and the resulting string is used to look up the name of
3828 the FILEHANDLE at run time.  For more on formats, see L<perlform>.
3829
3830 Note that write is I<NOT> the opposite of read.  Unfortunately.
3831
3832 =item y///
3833
3834 The translation operator.  Same as tr///.  See L<perlop>.
3835
3836 =back