73515e89684bbbbeb3ecb26b2967949230ebdc2c
[p5sagit/p5-mst-13.2.git] / pod / perldelta.pod
1 =head1 NAME
2
3 perldelta - what is new for perl v5.8.0
4
5 =head1 DESCRIPTION
6
7 This document describes differences between the 5.6.0 release and
8 the 5.8.0 release.
9
10 Many of the bug fixes in 5.8.0 were already seen in the 5.6.1
11 maintenance release since the two releases were kept closely
12 coordinated (while 5.8.0 was still called 5.7.something).
13
14 Changes that were integrated into the 5.6.1 release are marked C<[561]>.
15 Many of these changes have been further developed since 5.6.1 was released,
16 those are marked C<[561+]>.
17
18 You can see the list of changes in the 5.6.1 release (both from the
19 5.005_03 release and the 5.6.0 release) by reading L<perl561delta>.
20
21 =head1 Highlights In 5.8.0
22
23 =over 4
24
25 =item *
26
27 Better Unicode support
28
29 =item *
30
31 New IO Implementation
32
33 =item *
34
35 New Thread Implementation
36
37 =item *
38
39 Better Numeric Accuracy
40
41 =item *
42
43 Safe Signals
44
45 =item *
46
47 Many New Modules
48
49 =item *
50
51 More Extensive Regression Testing
52
53 =back
54
55 =head1 Incompatible Changes
56
57 =head2 Binary Incompatibility
58
59 B<Perl 5.8 is not binary compatible with earlier releases of Perl.>
60
61 B<You have to recompile your XS modules.>
62
63 (Pure Perl modules should continue to work.)
64
65 The major reason for the discontinuity is the new IO architecture
66 called PerlIO.  PerlIO is the default configuration because without
67 it many new features of Perl 5.8 cannot be used.  In other words:
68 you just have to recompile your modules containing XS code, sorry
69 about that.
70
71 In future releases of Perl, non-PerlIO aware XS modules may become
72 completely unsupported.  This shouldn't be too difficult for module
73 authors, however: PerlIO has been designed as a drop-in replacement
74 (at the source code level) for the stdio interface.
75
76 Depending on your platform, there are also other reasons why
77 we decided to break binary compatibility, please read on.
78
79 =head2 64-bit platforms and malloc
80
81 If your pointers are 64 bits wide, the Perl malloc is no longer being
82 used because it does not work well with 8-byte pointers.  Also,
83 usually the system mallocs on such platforms are much better optimized
84 for such large memory models than the Perl malloc.  Some memory-hungry
85 Perl applications like the PDL don't work well with Perl's malloc.
86 Finally, other applications than Perl (such as mod_perl) tend to prefer
87 the system malloc.  Such platforms include Alpha and 64-bit HPPA,
88 MIPS, PPC, and Sparc.
89
90 =head2 AIX Dynaloading
91
92 The AIX dynaloading now uses in AIX releases 4.3 and newer the native
93 dlopen interface of AIX instead of the old emulated interface.  This
94 change will probably break backward compatibility with compiled
95 modules.  The change was made to make Perl more compliant with other
96 applications like mod_perl which are using the AIX native interface.
97
98 =head2 Attributes for C<my> variables now handled at run-time.
99
100 The C<my EXPR : ATTRS> syntax now applies variable attributes at
101 run-time.  (Subroutine and C<our> variables still get attributes applied
102 at compile-time.)  See L<attributes> for additional details.  In particular,
103 however, this allows variable attributes to be useful for C<tie> interfaces,
104 which was a deficiency of earlier releases.  Note that the new semantics
105 doesn't work with the Attribute::Handlers module (as of version 0.76).
106
107 =head2 Socket Extension Dynamic in VMS
108
109 The Socket extension is now dynamically loaded instead of being
110 statically built in.  This may or may not be a problem with ancient
111 TCP/IP stacks of VMS: we do not know since we weren't able to test
112 Perl in such configurations.
113
114 =head2 IEEE-format Floating Point Default on OpenVMS Alpha
115
116 Perl now uses IEEE format (T_FLOAT) as the default internal floating
117 point format on OpenVMS Alpha, potentially breaking binary compatibility
118 with external libraries or existing data.  G_FLOAT is still available as
119 a configuration option.  The default on VAX (D_FLOAT) has not changed.
120
121 =head2 New Unicode Properties
122
123 Unicode I<scripts> are now supported. Scripts are similar to (and superior
124 to) Unicode I<blocks>. The difference between scripts and blocks is that
125 scripts are the glyphs used by a language or a group of languages, while
126 the blocks are more artificial groupings of (mostly) 256 characters based
127 on the Unicode numbering.
128
129 In general, scripts are more inclusive, but not universally so. For
130 example, while the script C<Latin> includes all the Latin characters and
131 their various diacritic-adorned versions, it does not include the various
132 punctuation or digits (since they are not solely C<Latin>).
133
134 A number of other properties are now supported, including C<\p{L&}>,
135 C<\p{Any}> C<\p{Assigned}>, C<\p{Unassigned}>, C<\p{Blank}> [561] and
136 C<\p{SpacePerl}> [561] (along with their C<\P{...}> versions, of course).
137 See L<perlunicode> for details, and more additions.
138
139 The C<In> or C<Is> prefix to names used with the C<\p{...}> and C<\P{...}>
140 are now almost always optional. The only exception is that a C<In> prefix
141 is required to signify a Unicode block when a block name conflicts with a
142 script name. For example, C<\p{Tibetan}> refers to the script, while
143 C<\p{InTibetan}> refers to the block. When there is no name conflict, you
144 can omit the C<In> from the block name (e.g. C<\p{BraillePatterns}>), but
145 to be safe, it's probably best to always use the C<In>).
146
147 =head2 REF(...) Instead Of SCALAR(...)
148
149 A reference to a reference now stringifies as "REF(0x81485ec)" instead
150 of "SCALAR(0x81485ec)" in order to be more consistent with the return
151 value of ref().
152
153 =head2 pack/unpack D/F recycled
154
155 The undocumented pack/unpack template letters D/F have been recycled
156 for better use: now they stand for long double (if supported by the
157 platform) and NV (Perl internal floating point type).  (They used
158 to be aliases for d/f, but you never knew that.)
159
160 =head2 Deprecations
161
162 =over 4
163
164 =item *
165
166 The semantics of bless(REF, REF) were unclear and until someone proves
167 it to make some sense, it is forbidden.
168
169 =item *
170
171 The obsolete chat2 library that should never have been allowed
172 to escape the laboratory has been decommissioned.
173
174 =item *
175
176 The builtin dump() function has probably outlived most of its
177 usefulness.  The core-dumping functionality will remain in future
178 available as an explicit call to C<CORE::dump()>, but in future
179 releases the behaviour of an unqualified C<dump()> call may change.
180
181 =item *
182
183 The very dusty examples in the eg/ directory have been removed.
184 Suggestions for new shiny examples welcome but the main issue is that
185 the examples need to be documented, tested and (most importantly)
186 maintained.
187
188 =item *
189
190 The (bogus) escape sequences \8 and \9 now give an optional warning
191 ("Unrecognized escape passed through").  There is no need to \-escape
192 any C<\w> character.
193
194 =item *
195
196 The list of filenames from glob() (or <...>) is now by default sorted
197 alphabetically to be csh-compliant (which is what happened before
198 in most UNIX platforms).  (bsd_glob() does still sort platform
199 natively, ASCII or EBCDIC, unless GLOB_ALPHASORT is specified.) [561]
200
201 =item *
202
203 Spurious syntax errors generated in certain situations, when glob()
204 caused File::Glob to be loaded for the first time, have been fixed. [561]
205
206 =item *
207
208 Although "you shouldn't do that", it was possible to write code that
209 depends on Perl's hashed key order (Data::Dumper does this).  The new
210 algorithm "One-at-a-Time" produces a different hashed key order.
211 More details are in L</"Performance Enhancements">.
212
213 =item *
214
215 lstat(FILEHANDLE) now gives a warning because the operation makes no sense.
216 In future releases this may become a fatal error.
217
218 =item *
219
220 The C<package;> syntax (C<package> without an argument) has been
221 deprecated.  Its semantics were never that clear and its
222 implementation even less so.  If you have used that feature to
223 disallow all but fully qualified variables, C<use strict;> instead.
224
225 =item *
226
227 The unimplemented POSIX regex features [[.cc.]] and [[=c=]] are still
228 recognised but now cause fatal errors.  The previous behaviour of
229 ignoring them by default and warning if requested was unacceptable
230 since it, in a way, falsely promised that the features could be used.
231
232 =item *
233
234 In future releases, non-PerlIO aware XS modules may become completely
235 unsupported.  Since PerlIO is a drop-in replacement for stdio at the
236 source code level, this shouldn't be that drastic a change.
237
238 =item *
239
240 Previous versions of perl and some readings of some sections of Camel III
241 implied that C<:raw> "discipline" was the inverse of  C<:crlf>.
242 Turning off "clrfness" is no longer enough to make a stream truly
243 binary. So the PerlIO C<:raw> discipline is now formally defined as being
244 equivalent to binmode(FH) - which is in turn defined as doing whatever
245 is necessary to pass each byte as-is without any translation.
246 In particular binmode(FH) - and hence C<:raw> - will now turn off both CRLF
247 and UTF-8  translation and remove other "layers" (e.g. :encoding()) which
248 would modify byte stream.
249
250 =item *
251
252 The current user-visible implementation of pseudo-hashes (the weird
253 use of the first array element) is deprecated starting from Perl 5.8.0
254 and will be removed in Perl 5.10.0, and the feature will be
255 implemented differently.  Not only is the current interface rather
256 ugly, but the current implementation slows down normal array and hash
257 use quite noticeably. The C<fields> pragma interface will remain
258 available.  The I<restricted hashes> interface is expected to
259 be the replacement interface (see L<Hash::Util>).
260
261 =item *
262
263 The syntaxes C<< @a->[...] >> and  C<< %h->{...} >> have now been deprecated.
264
265 =item *
266
267 After years of trying, suidperl is considered to be too complex to
268 ever be considered truly secure.  The suidperl functionality is likely
269 to be removed in a future release.
270
271 =item *
272
273 The 5.005 threads model (module C<Thread>) is deprecated and expected
274 to be removed in Perl 5.10.  Multithreaded code should be migrated to
275 the new ithreads model (see L<threads>, L<threads::shared> and
276 L<perlthrtut>).
277
278 =item *
279
280 The long deprecated uppercase aliases for the string comparison
281 operators (EQ, NE, LT, LE, GE, GT) have now been removed.
282
283 =item *
284
285 The tr///C and tr///U features have been removed and will not return;
286 the interface was a mistake.  Sorry about that.  For similar
287 functionality, see pack('U0', ...) and pack('C0', ...). [561]
288
289 =item *
290
291 Earlier Perls treated "sub foo (@bar)" as equivalent to "sub foo (@)".
292 The prototypes are now checked better at compile-time for invalid
293 syntax.  An optional warning is generated ("Illegal character in
294 prototype...")  but this may be upgraded to a fatal error in a future
295 release.
296
297 =item *
298
299 The C<exec LIST> and C<system LIST> operations will produce fatal
300 errors on tainted data in some future release.
301
302 =item *
303
304 The existing behaviour when localising tied arrays and hashes is wrong,
305 and will be changed in a future release, so do not rely on the existing
306 behaviour. See L<"Localising Tied Arrays and Hashes Is Broken">.
307
308 =back
309
310 =head1 Core Enhancements
311
312 =head2 PerlIO is Now The Default
313
314 =over 4
315
316 =item *
317
318 IO is now by default done via PerlIO rather than system's "stdio".
319 PerlIO allows "layers" to be "pushed" onto a file handle to alter the
320 handle's behaviour.  Layers can be specified at open time via 3-arg
321 form of open:
322
323    open($fh,'>:crlf :utf8', $path) || ...
324
325 or on already opened handles via extended C<binmode>:
326
327    binmode($fh,':encoding(iso-8859-7)');
328
329 The built-in layers are: unix (low level read/write), stdio (as in
330 previous Perls), perlio (re-implementation of stdio buffering in a
331 portable manner), crlf (does CRLF <=> "\n" translation as on Win32,
332 but available on any platform).  A mmap layer may be available if
333 platform supports it (mostly UNIXes).
334
335 Layers to be applied by default may be specified via the 'open' pragma.
336
337 See L</"Installation and Configuration Improvements"> for the effects
338 of PerlIO on your architecture name.
339
340 =item *
341
342 If your platform supports fork(), you can use the list form of C<open>
343 for pipes.  For example:
344
345     open KID_PS, "-|", "ps", "aux" or die $!;
346
347 forks the ps(1) command (without spawning a shell, as there are more
348 than three arguments to open()), and reads its standard output via the
349 C<KID_PS> filehandle.  See L<perlipc>.
350
351 =item *
352
353 File handles can be marked as accepting Perl's internal encoding of Unicode
354 (UTF-8 or UTF-EBCDIC depending on platform) by a pseudo layer ":utf8" :
355
356    open($fh,">:utf8","Uni.txt");
357
358 Note for EBCDIC users: the pseudo layer ":utf8" is erroneously named
359 for you since it's not UTF-8 what you will be getting but instead
360 UTF-EBCDIC.  See L<perlunicode>, L<utf8>, and
361 http://www.unicode.org/unicode/reports/tr16/ for more information.
362 In future releases this naming may change.  See L<perluniintro>
363 for more information about UTF-8.
364
365 =item *
366
367 If your environment variables (LC_ALL, LC_CTYPE, LANG, LANGUAGE) look
368 like you want to use UTF-8 (any of the the variables match C</utf-?8/i>),
369 your STDIN, STDOUT, STDERR handles and the default open discipline
370 (see L<open>) are marked as UTF-8.  (This feature, like other new
371 features that combine Unicode and I/O, work only if you are using
372 PerlIO, but that's is the default.)
373
374 Note that after this Perl really does assume that everything is UTF-8:
375 for example if some input handle is not, Perl will probably very soon
376 complain about the input data like this "Malformed UTF-8 ..." since
377 any old eight-bit data is not legal UTF-8.
378
379 Note for code authors: if you want to enable your users to use UTF-8
380 as their default encoding  but in your code still have eight-bit I/O streams
381 (such as images or zip files), you need to explicitly open() or binmode()
382 with C<:bytes> (see L<perlfunc/open> and L<perlfunc/binmode>), or you
383 can just use C<binmode(FH)> (nice for pre-5.8.0 backward compatibility).
384
385 =item *
386
387 File handles can translate character encodings from/to Perl's internal
388 Unicode form on read/write via the ":encoding()" layer.
389
390 =item *
391
392 File handles can be opened to "in memory" files held in Perl scalars via:
393
394    open($fh,'>', \$variable) || ...
395
396 =item *
397
398 Anonymous temporary files are available without need to
399 'use FileHandle' or other module via
400
401    open($fh,"+>", undef) || ...
402
403 That is a literal undef, not an undefined value.
404
405 =item *
406
407 The list form of C<open> is now implemented for pipes (at least on UNIX):
408
409    open($fh,"-|", 'cat', '/etc/motd')
410
411 creates a pipe, and runs the equivalent of exec('cat', '/etc/motd') in
412 the child process.
413
414 =item *
415
416 If your locale environment variables (LANGUAGE, LC_ALL, LC_CTYPE, LANG)
417 contain the strings 'UTF-8' or 'UTF8' (case-insensitive matching),
418 the default encoding of your STDIN, STDOUT, and STDERR, and of
419 B<any subsequent file open>, is UTF-8.
420
421 =back
422
423 =head2 Restricted Hashes
424
425 A restricted hash is restricted to a certain set of keys, no keys
426 outside the set can be added.  Also individual keys can be restricted
427 so that the key cannot be deleted and the value cannot be changed.
428 No new syntax is involved: the Hash::Util module is the interface.
429
430 =head2 Safe Signals
431
432 Perl used to be fragile in that signals arriving at inopportune moments
433 could corrupt Perl's internal state.  Now Perl postpones handling of
434 signals until it's safe (between opcodes).
435
436 This change may have surprising side effects because signals no longer
437 interrupt Perl instantly.  Perl will now first finish whatever it was
438 doing, like finishing an internal operation (like sort()) or an
439 external operation (like an I/O operation), and only then look at any
440 arrived signals (and before starting the next operation).  No more corrupt
441 internal state since the current operation is always finished first,
442 but the signal may take more time to get heard.  Note that breaking
443 out from potentially blocking operations should still work, though.
444
445 =head2 Unicode Overhaul
446
447 Unicode in general should be now much more usable than in Perl 5.6.0
448 (or even in 5.6.1).  Unicode can be used in hash keys, Unicode in
449 regular expressions should work now, Unicode in tr/// should work now,
450 Unicode in I/O should work now.  See L<perluniintro> for introduction
451 and L<perlunicode> for details.
452
453 =over 4
454
455 =item *
456
457 The Unicode Character Database coming with Perl has been upgraded
458 to Unicode 3.2.0.  For more information, see http://www.unicode.org/ .
459 [561+] (5.6.1 has UCD 3.0.1.)
460
461 =item *
462
463 For developers interested in enhancing Perl's Unicode capabilities:
464 almost all the UCD files are included with the Perl distribution in
465 the F<lib/unicore> subdirectory.  The most notable omission, for space
466 considerations, is the Unihan database.
467
468 =item *
469
470 The properties \p{Blank} and \p{SpacePerl} have been added. "Blank" is like
471 C isblank(), that is, it contains only "horizontal whitespace" (the space
472 character is, the newline isn't), and the "SpacePerl" is the Unicode
473 equivalent of C<\s> (\p{Space} isn't, since that includes the vertical
474 tabulator character, whereas C<\s> doesn't.)
475
476 See "New Unicode Properties" earlier in this document for additional
477 information on changes with Unicode properties.
478
479 =back
480
481 =head2 Understanding of Numbers
482
483 In general a lot of fixing has happened in the area of Perl's
484 understanding of numbers, both integer and floating point.  Since in
485 many systems the standard number parsing functions like C<strtoul()>
486 and C<atof()> seem to have bugs, Perl tries to work around their
487 deficiencies.  This results hopefully in more accurate numbers.
488
489 Perl now tries internally to use integer values in numeric conversions
490 and basic arithmetics (+ - * /) if the arguments are integers, and
491 tries also to keep the results stored internally as integers.
492 This change leads to often slightly faster and always less lossy
493 arithmetics. (Previously Perl always preferred floating point numbers
494 in its math.)
495
496 =head2 Arrays now always interpolate into double-quoted strings [561]
497
498 In double-quoted strings, arrays now interpolate, no matter what.  The
499 behavior in earlier versions of perl 5 was that arrays would interpolate
500 into strings if the array had been mentioned before the string was
501 compiled, and otherwise Perl would raise a fatal compile-time error.
502 In versions 5.000 through 5.003, the error was
503
504         Literal @example now requires backslash
505
506 In versions 5.004_01 through 5.6.0, the error was
507
508         In string, @example now must be written as \@example
509
510 The idea here was to get people into the habit of writing
511 C<"fred\@example.com"> when they wanted a literal C<@> sign, just as
512 they have always written C<"Give me back my \$5"> when they wanted a
513 literal C<$> sign.
514
515 Starting with 5.6.1, when Perl now sees an C<@> sign in a
516 double-quoted string, it I<always> attempts to interpolate an array,
517 regardless of whether or not the array has been used or declared
518 already.  The fatal error has been downgraded to an optional warning:
519
520         Possible unintended interpolation of @example in string
521
522 This warns you that C<"fred@example.com"> is going to turn into
523 C<fred.com> if you don't backslash the C<@>.
524 See http://www.plover.com/~mjd/perl/at-error.html for more details
525 about the history here.
526
527 =head2 Miscellaneous Changes
528
529 =over 4
530
531 =item *
532
533 AUTOLOAD is now lvaluable, meaning that you can add the :lvalue attribute
534 to AUTOLOAD subroutines and you can assign to the AUTOLOAD return value.
535
536 =item *
537
538 The $Config{byteorder} (and corresponding BYTEORDER in config.h) was
539 previously wrong in platforms if sizeof(long) was 4, but sizeof(IV)
540 was 8.  The byteorder was only sizeof(long) bytes long (1234 or 4321),
541 but now it is correctly sizeof(IV) bytes long, (12345678 or 87654321).
542 (This problem didn't affect Windows platforms.)
543
544 Also, $Config{byteorder} is now computed dynamically--this is more
545 robust with "fat binaries" where an executable image contains binaries
546 for more than one binary platform, and when cross-compiling.
547
548 =item *
549
550 C<perl -d:Module=arg,arg,arg> now works (previously one couldn't pass
551 in multiple arguments.)
552
553 =item *
554
555 C<do> followed by a bareword now ensures that this bareword isn't
556 a keyword (to avoid a bug where C<do q(foo.pl)> tried to call a
557 subroutine called C<q>).  This means that for example instead of
558 C<do format()> you must write C<do &format()>.
559
560 =item *
561
562 The builtin dump() now gives an optional warning
563 C<dump() better written as CORE::dump()>,
564 meaning that by default C<dump(...)> is resolved as the builtin
565 dump() which dumps core and aborts, not as (possibly) user-defined
566 C<sub dump>.  To call the latter, qualify the call as C<&dump(...)>.
567 (The whole dump() feature is to considered deprecated, and possibly
568 removed/changed in future releases.)
569
570 =item *
571
572 chomp() and chop() are now overridable.  Note, however, that their
573 prototype (as given by C<prototype("CORE::chomp")> is undefined,
574 because it cannot be expressed and therefore one cannot really write
575 replacements to override these builtins.
576
577 =item *
578
579 END blocks are now run even if you exit/die in a BEGIN block.
580 Internally, the execution of END blocks is now controlled by
581 PL_exit_flags & PERL_EXIT_DESTRUCT_END. This enables the new
582 behaviour for Perl embedders. This will default in 5.10. See
583 L<perlembed>.
584
585 =item *
586
587 Formats now support zero-padded decimal fields.
588
589 =item *
590
591 Lvalue subroutines can now return C<undef> in list context.  However,
592 the lvalue subroutine feature still remains experimental.  [561+]
593
594 =item *
595
596 A lost warning "Can't declare ... dereference in my" has been
597 restored (Perl had it earlier but it became lost in later releases.)
598
599 =item *
600
601 A new special regular expression variable has been introduced:
602 C<$^N>, which contains the most-recently closed group (submatch).
603
604 =item *
605
606 C<no Module;> does not produce an error even if Module does not have an
607 unimport() method.  This parallels the behavior of C<use> vis-a-vis
608 C<import>. [561]
609
610 =item *
611
612 The numerical comparison operators return C<undef> if either operand
613 is a NaN.  Previously the behaviour was unspecified.
614
615 =item *
616
617 C<our> can now have an experimental optional attribute C<unique> that
618 affects how global variables are shared among multiple interpreters,
619 see L<perlfunc/our>.
620
621 =item *
622
623 The following builtin functions are now overridable: each(), keys(),
624 pop(), push(), shift(), splice(), unshift(). [561]
625
626 =item *
627
628 C<pack() / unpack()> can now group template letters with C<()> and then
629 apply repetition/count modifiers on the groups.
630
631 =item *
632
633 C<pack() / unpack()> can now process the Perl internal numeric types:
634 IVs, UVs, NVs-- and also long doubles, if supported by the platform.
635 The template letters are C<j>, C<J>, C<F>, and C<D>.
636
637 =item *
638
639 C<pack('U0a*', ...)> can now be used to force a string to UTF8.
640
641 =item *
642
643 my __PACKAGE__ $obj now works. [561]
644
645 =item *
646
647 POSIX::sleep() now returns the number of I<unslept> seconds
648 (as the POSIX standard says), as opposed to CORE::sleep() which
649 returns the number of slept seconds.
650
651 =item *
652
653 The printf() and sprintf() now support parameter reordering using the
654 C<%\d+\$> and C<*\d+\$> syntaxes.  For example
655
656     print "%2\$s %1\$s\n", "foo", "bar";
657
658 will print "bar foo\n".  This feature helps in writing
659 internationalised software, and in general when the order
660 of the parameters can vary.
661
662 =item *
663
664 The (\&) prototype now works properly. [561]
665
666 =item *
667
668 prototype(\[$@%&]) is now available to implicitly create references
669 (useful for example if you want to emulate the tie() interface).
670
671 =item *
672
673 A new command-line option, C<-t> is available.  It is the
674 little brother of C<-T>: instead of dying on taint violations,
675 lexical warnings are given.  B<This is only meant as a temporary
676 debugging aid while securing the code of old legacy applications.
677 This is not a substitute for -T.>
678
679 =item *
680
681 In other taint news, the C<exec LIST> and C<system LIST> have now been
682 considered too risky (think C<exec @ARGV>: it can start any program
683 with any arguments), and now the said forms cause a warning under
684 lexical warnings.  You should carefully launder the arguments to
685 guarantee their validity.  In future releases of Perl the forms will
686 become fatal errors so consider starting laundering now.
687
688 =item *
689
690 Tied hash interfaces are now required to have the EXISTS and DELETE
691 methods (either own or inherited).
692
693 =item *
694
695 If tr/// is just counting characters, it doesn't attempt to
696 modify its target.
697
698 =item *
699
700 untie() will now call an UNTIE() hook if it exists.  See L<perltie>
701 for details. [561]
702
703 =item *
704
705 L<utime> now supports C<utime undef, undef, @files> to change the
706 file timestamps to the current time.
707
708 =item *
709
710 The rules for allowing underscores (underbars) in numeric constants
711 have been relaxed and simplified: now you can have an underscore
712 simply B<between digits>.
713
714 =item *
715
716 Rather than relying on C's argv[0] (which may not contain a full pathname)
717 where possible $^X is now set by asking the operating system.
718 (eg by reading F</proc/self/exe> on Linux, F</proc/curproc/file> on FreeBSD)
719
720 =item *
721
722 A new variable, C<${^TAINT}>, indicates whether taint mode is enabled.
723
724 =item *
725
726 You can now override the readline() builtin, and this overrides also
727 the <FILEHANDLE> angle bracket operator.
728
729 =item *
730
731 The command-line options -s and -F are now recognized on the shebang
732 (#!) line.
733
734 =item *
735
736 Use of the C</c> match modifier without an accompanying C</g> modifier
737 elicits a new warning: C<Use of /c modifier is meaningless without /g>.
738
739 Use of C</c> in substitutions, even with C</g>, elicits
740 C<Use of /c modifier is meaningless in s///>.
741
742 Use of C</g> with C<split> elicits C<Use of /g modifier is meaningless
743 in split>.
744
745 =item *
746
747 Support for the C<CLONE> special subroutine had been added.
748 With ithreads, when a new thread is created, all Perl data is cloned,
749 however non-Perl data cannot be cloned automatically.  In C<CLONE> you
750 can do whatever you need to do, like for example handle the cloning of
751 non-Perl data, if necessary.  C<CLONE> will be executed once for every
752 package that has it defined or inherited.  It will be called in the
753 context of the new thread, so all modifications are made in the new area.
754
755 See L<perlmod>
756
757 =back
758
759 =head1 Modules and Pragmata
760
761 =head2 New Modules and Pragmata
762
763 =over 4
764
765 =item *
766
767 C<Attribute::Handlers>, originally by Damian Conway and now maintained
768 by Arthur Bergman, allows a class to define attribute handlers.
769
770     package MyPack;
771     use Attribute::Handlers;
772     sub Wolf :ATTR(SCALAR) { print "howl!\n" }
773
774     # later, in some package using or inheriting from MyPack...
775
776     my MyPack $Fluffy : Wolf; # the attribute handler Wolf will be called
777
778 Both variables and routines can have attribute handlers.  Handlers can
779 be specific to type (SCALAR, ARRAY, HASH, or CODE), or specific to the
780 exact compilation phase (BEGIN, CHECK, INIT, or END).
781 See L<Attribute::Handlers>.
782
783 =item *
784
785 C<B::Concise>, by Stephen McCamant, is a new compiler backend for
786 walking the Perl syntax tree, printing concise info about ops.
787 The output is highly customisable.  See L<B::Concise>. [561+]
788
789 =item *
790
791 The new bignum, bigint, and bigrat pragmas, by Tels, implement
792 transparent bignum support (using the Math::BigInt, Math::BigFloat,
793 and Math::BigRat backends).
794
795 =item *
796
797 C<Class::ISA>, by Sean Burke, is a module for reporting the search
798 path for a class's ISA tree.  See L<Class::ISA>.
799
800 =item *
801
802 C<Cwd> now has a split personality: if possible, an XS extension is
803 used, (this will hopefully be faster, more secure, and more robust)
804 but if not possible, the familiar Perl implementation is used.
805
806 =item *
807
808 C<Devel::PPPort>, originally by Kenneth Albanowski and now
809 maintained by Paul Marquess, has been added.  It is primarily used
810 by C<h2xs> to enhance portability of XS modules between different
811 versions of Perl.  See L<Devel::PPPort>.
812
813 =item *
814
815 C<Digest>, frontend module for calculating digests (checksums), from
816 Gisle Aas, has been added.  See L<Digest>.
817
818 =item *
819
820 C<Digest::MD5> for calculating MD5 digests (checksums) as defined in
821 RFC 1321, from Gisle Aas, has been added.  See L<Digest::MD5>.
822
823     use Digest::MD5 'md5_hex';
824
825     $digest = md5_hex("Thirsty Camel");
826
827     print $digest, "\n"; # 01d19d9d2045e005c3f1b80e8b164de1
828
829 NOTE: the C<MD5> backward compatibility module is deliberately not
830 included since its further use is discouraged.
831
832 =item *
833
834 C<Encode>, originally by Nick Ing-Simmons and now maintained by Dan
835 Kogai, provides a mechanism to translate between different character
836 encodings.  Support for Unicode, ISO-8859-1, and ASCII are compiled in
837 to the module.  Several other encodings (like the rest of the
838 ISO-8859, CP*/Win*, Mac, KOI8-R, three variants EBCDIC, Chinese,
839 Japanese, and Korean encodings) are included and can be loaded at
840 runtime.  (For space considerations, the largest Chinese encodings
841 have been separated into their own CPAN module, Encode::HanExtra,
842 which Encode will use if available).  See L<Encode>.
843
844 Any encoding supported by Encode module is also available to the
845 ":encoding()" layer if PerlIO is used.
846
847 =item *
848
849 C<Hash::Util> is the interface to the new I<restricted hashes>
850 feature.  (Implemented by Jeffrey Friedl, Nick Ing-Simmons, and
851 Michael Schwern.)  See L<Hash::Util>.
852
853 =item *
854
855 C<I18N::Langinfo> can be used to query locale information.
856 See L<I18N::Langinfo>.
857
858 =item *
859
860 C<I18N::LangTags>, by Sean Burke, has functions for dealing with
861 RFC3066-style language tags.  See L<I18N::LangTags>.
862
863 =item *
864
865 C<ExtUtils::Constant>, by Nicholas Clark, is a new tool for extension
866 writers for generating XS code to import C header constants.
867 See L<ExtUtils::Constant>.
868
869 =item *
870
871 C<Filter::Simple>, by Damian Conway, is an easy-to-use frontend to
872 Filter::Util::Call.  See L<Filter::Simple>.
873
874     # in MyFilter.pm:
875
876     package MyFilter;
877
878     use Filter::Simple sub {
879         while (my ($from, $to) = splice @_, 0, 2) {
880                 s/$from/$to/g;
881         }
882     };
883
884     1;
885
886     # in user's code:
887
888     use MyFilter qr/red/ => 'green';
889
890     print "red\n";   # this code is filtered, will print "green\n"
891     print "bored\n"; # this code is filtered, will print "bogreen\n"
892
893     no MyFilter;
894
895     print "red\n";   # this code is not filtered, will print "red\n"
896
897 =item *
898
899 C<File::Temp>, by Tim Jenness, allows one to create temporary files
900 and directories in an easy, portable, and secure way.  See L<File::Temp>.
901 [561+]
902
903 =item *
904
905 C<Filter::Util::Call>, by Paul Marquess, provides you with the
906 framework to write I<source filters> in Perl.  For most uses, the
907 frontend Filter::Simple is to be preferred.  See L<Filter::Util::Call>.
908
909 =item *
910
911 C<if>, by Ilya Zakharevich, is a new pragma for conditional inclusion
912 of modules.
913
914 =item *
915
916 L<libnet>, by Graham Barr, is a collection of perl5 modules related
917 to network programming.  See L<Net::FTP>, L<Net::NNTP>, L<Net::Ping>
918 (not part of libnet, but related), L<Net::POP3>, L<Net::SMTP>,
919 and L<Net::Time>.
920
921 Perl installation leaves libnet unconfigured; use F<libnetcfg>
922 to configure it.
923
924 =item *
925
926 C<List::Util>, by Graham Barr, is a selection of general-utility
927 list subroutines, such as sum(), min(), first(), and shuffle().
928 See L<List::Util>.
929
930 =item *
931
932 C<Locale::Constants>, C<Locale::Country>, C<Locale::Currency>
933 C<Locale::Language>, and L<Locale::Script>, by Neil Bowers, have
934 been added.  They provide the codes for various locale standards, such
935 as "fr" for France, "usd" for US Dollar, and "ja" for Japanese.
936
937     use Locale::Country;
938
939     $country = code2country('jp');               # $country gets 'Japan'
940     $code    = country2code('Norway');           # $code gets 'no'
941
942 See L<Locale::Constants>, L<Locale::Country>, L<Locale::Currency>,
943 and L<Locale::Language>.
944
945 =item *
946
947 C<Locale::Maketext>, by Sean Burke, is a localization framework.  See
948 L<Locale::Maketext>, and L<Locale::Maketext::TPJ13>.  The latter is an
949 article about software localization, originally published in The Perl
950 Journal #13, and republished here with kind permission.
951
952 =item *
953
954 C<Math::BigRat> for big rational numbers, to accompany Math::BigInt and
955 Math::BigFloat, from Tels.  See L<Math::BigRat>.
956
957 =item *
958
959 C<Memoize> can make your functions faster by trading space for time,
960 from Mark-Jason Dominus.  See L<Memoize>.
961
962 =item *
963
964 C<MIME::Base64>, by Gisle Aas, allows you to encode data in base64,
965 as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
966 Extensions)>.
967
968     use MIME::Base64;
969
970     $encoded = encode_base64('Aladdin:open sesame');
971     $decoded = decode_base64($encoded);
972
973     print $encoded, "\n"; # "QWxhZGRpbjpvcGVuIHNlc2FtZQ=="
974
975 See L<MIME::Base64>.
976
977 =item *
978
979 C<MIME::QuotedPrint>, by Gisle Aas, allows you to encode data
980 in quoted-printable encoding, as defined in RFC 2045 - I<MIME
981 (Multipurpose Internet Mail Extensions)>.
982
983     use MIME::QuotedPrint;
984
985     $encoded = encode_qp("Smiley in Unicode: \x{263a}");
986     $decoded = decode_qp($encoded);
987
988     print $encoded, "\n"; # "Smiley in Unicode: =263A"
989
990 MIME::QuotedPrint has been enhanced to provide the basic methods
991 necessary to use it with PerlIO::Via as in :
992
993     use MIME::QuotedPrint;
994     open($fh,">Via(MIME::QuotedPrint)",$path);
995
996 See L<MIME::QuotedPrint>.
997
998 =item *
999
1000 C<NEXT>, by Damian Conway, is a pseudo-class for method redispatch.
1001 See L<NEXT>.
1002
1003 =item *
1004
1005 C<open> is a new pragma for setting the default I/O disciplines
1006 for open().
1007
1008 =item *
1009
1010 C<PerlIO::Scalar>, by Nick Ing-Simmons, provides the implementation
1011 of IO to "in memory" Perl scalars as discussed above.  It also serves
1012 as an example of a loadable PerlIO layer.  Other future possibilities
1013 include PerlIO::Array and PerlIO::Code.  See L<PerlIO::Scalar>.
1014
1015 =item *
1016
1017 C<PerlIO::Via>, by Nick Ing-Simmons, acts as a PerlIO layer and wraps
1018 PerlIO layer functionality provided by a class (typically implemented
1019 in perl code).
1020
1021     use MIME::QuotedPrint;
1022     open($fh,">Via(MIME::QuotedPrint)",$path);
1023
1024 This will automatically convert everything output to C<$fh>
1025 to Quoted-Printable.  See L<PerlIO::Via>.
1026
1027 =item *
1028
1029 C<Pod::ParseLink>, by Russ Allbery, has been added,
1030 to parse LZ<><> links in pods as described in the new
1031 perlpodspec.
1032
1033 =item *
1034
1035 C<Pod::Text::Overstrike>, by Joe Smith, has been added.
1036 It converts POD data to formatted overstrike text.
1037 See L<Pod::Text::Overstrike>. [561+]
1038
1039 =item *
1040
1041 C<Scalar::Util> is a selection of general-utility scalar subroutines,
1042 such as blessed(), reftype(), and tainted().  See L<Scalar::Util>.
1043
1044 =item *
1045
1046 C<sort> is a new pragma for controlling the behaviour of sort().
1047
1048 =item *
1049
1050 C<Storable> gives persistence to Perl data structures by allowing the
1051 storage and retrieval of Perl data to and from files in a fast and
1052 compact binary format.  Because in effect Storable does serialisation
1053 of Perl data structues, with it you can also clone deep, hierarchical
1054 datastructures.  Storable was originally created by Raphael Manfredi,
1055 but it is now maintained by Abhijit Menon-Sen.  Storable has been
1056 enhanced to understand the two new hash features, Unicode keys and
1057 restricted hashes.  See L<Storable>.
1058
1059 =item *
1060
1061 C<Switch>, by Damian Conway, has been added.  Just by saying
1062
1063     use Switch;
1064
1065 you have C<switch> and C<case> available in Perl.
1066
1067     use Switch;
1068
1069     switch ($val) {
1070
1071                 case 1          { print "number 1" }
1072                 case "a"        { print "string a" }
1073                 case [1..10,42] { print "number in list" }
1074                 case (@array)   { print "number in list" }
1075                 case /\w+/      { print "pattern" }
1076                 case qr/\w+/    { print "pattern" }
1077                 case (%hash)    { print "entry in hash" }
1078                 case (\%hash)   { print "entry in hash" }
1079                 case (\&sub)    { print "arg to subroutine" }
1080                 else            { print "previous case not true" }
1081     }
1082
1083 See L<Switch>.
1084
1085 =item *
1086
1087 C<Test::More>, by Michael Schwern, is yet another framework for writing
1088 test scripts, more extensive than Test::Simple.  See L<Test::More>.
1089
1090 =item *
1091
1092 C<Test::Simple>, by Michael Schwern, has basic utilities for writing
1093 tests.   See L<Test::Simple>.
1094
1095 =item *
1096
1097 C<Text::Balanced>, by Damian Conway, has been added, for extracting
1098 delimited text sequences from strings.
1099
1100     use Text::Balanced 'extract_delimited';
1101
1102     ($a, $b) = extract_delimited("'never say never', he never said", "'", '');
1103
1104 $a will be "'never say never'", $b will be ', he never said'.
1105
1106 In addition to extract_delimited(), there are also extract_bracketed(),
1107 extract_quotelike(), extract_codeblock(), extract_variable(),
1108 extract_tagged(), extract_multiple(), gen_delimited_pat(), and
1109 gen_extract_tagged().  With these, you can implement rather advanced
1110 parsing algorithms.  See L<Text::Balanced>.
1111
1112 =item *
1113
1114 C<threads>, by Arthur Bergman, is an interface to interpreter threads.
1115 Interpreter threads (ithreads) is the new thread model introduced in
1116 Perl 5.6 but only available as an internal interface for extension
1117 writers (and for Win32 Perl for C<fork()> emulation).  See L<threads>,
1118 L<threads::shared>, and L<perlthrtut>.
1119
1120 =item *
1121
1122 C<threads::shared>, by Arthur Bergman, allows data sharing for
1123 interpreter threads.  In the ithreads model any data sharing between
1124 threads must be explicit, as opposed to the old 5.005 thread model
1125 where data sharing was implicit.  See L<threads::shared>.
1126
1127 =item *
1128
1129 C<Tie::File>, by Mark-Jason Dominus, associates a Perl array with the
1130 lines of a file.  See L<Tie::File>.
1131
1132 =item *
1133
1134 C<Tie::Memoize>, by Ilya Zakharevich, provides on-demand loaded hashes.
1135 See L<Tie::Memoize>.
1136
1137 =item *
1138
1139 C<Tie::RefHash::Nestable>, by Edward Avis, allows storing hash
1140 references (unlike the standard Tie::RefHash)  The module is contained
1141 within Tie::RefHash.  See L<Tie::RefHash>.
1142
1143 =item *
1144
1145 C<Time::HiRes>, by Douglas E. Wegscheid, provides high resolution
1146 timing (ualarm, usleep, and gettimeofday).  See L<Time::HiRes>.
1147
1148 =item *
1149
1150 C<Unicode::UCD> offers a querying interface to the Unicode Character
1151 Database.  See L<Unicode::UCD>.
1152
1153 =item *
1154
1155 C<Unicode::Collate>, by SADAHIRO Tomoyuki, implements the UCA
1156 (Unicode Collation Algorithm) for sorting Unicode strings.
1157 See L<Unicode::Collate>.
1158
1159 =item *
1160
1161 C<Unicode::Normalize>, by SADAHIRO Tomoyuki, implements the various
1162 Unicode normalization forms.  See L<Unicode::Normalize>.
1163
1164 =item *
1165
1166 C<XS::APItest>, by Tim Jenness, is a test extension that exercises XS
1167 APIs.  Currently only C<printf()> is tested: how to output various
1168 basic data types from XS.
1169
1170 =item *
1171
1172 C<XS::Typemap>, by Tim Jenness, is a test extension that exercises
1173 XS typemaps.  Nothing gets installed, but the code is worth studying
1174 for extension writers.
1175
1176 =back
1177
1178 =head2 Updated And Improved Modules and Pragmata
1179
1180 =over 4
1181
1182 =item *
1183
1184 The following independently supported modules have been updated to the
1185 newest versions from CPAN: CGI, CPAN, DB_File, File::Spec, File::Temp,
1186 Getopt::Long, Math::BigFloat, Math::BigInt, the podlators bundle
1187 (Pod::Man, Pod::Text), Pod::LaTeX [561+], Pod::Parser, Storable,
1188 Term::ANSIColor, Test, Text-Tabs+Wrap.
1189
1190 =item *
1191
1192 attributes::reftype() now works on tied arguments.
1193
1194 =item *
1195
1196 AutoLoader can now be disabled with C<no AutoLoader;>.
1197
1198 =item *
1199
1200 B::Deparse has been significantly enhanced by Robin Houston.  It can
1201 now deparse almost all of the standard test suite (so that the tests
1202 still succeed).  There is a make target "test.deparse" for trying this
1203 out.
1204
1205 =item *
1206
1207 Carp now has better interface documentation, and the @CARP_NOT
1208 interface has been added to get optional control over where errors
1209 are reported independently of @ISA, by Ben Tilly.
1210
1211 =item *
1212
1213 Class::Struct can now define the classes in compile time.
1214
1215 =item *
1216
1217 Class::Struct now assigns the array/hash element if the accessor
1218 is called with an array/hash element as the B<sole> argument.
1219
1220 =item *
1221
1222 The return value of Cwd::fastcwd() is now tainted.
1223
1224 =item *
1225
1226 Data::Dumper now has an option to sort hashes.
1227
1228 =item *
1229
1230 Data::Dumper now has an option to dump code references
1231 using B::Deparse.
1232
1233 =item *
1234
1235 DB_File now supports newer Berkeley DB versions, among
1236 other improvements.
1237
1238 =item *
1239
1240 Devel::Peek now has an interface for the Perl memory statistics
1241 (this works only if you are using perl's malloc, and if you have
1242 compiled with debugging).
1243
1244 =item *
1245
1246 The English module can now be used without the infamous performance
1247 hit by saying
1248
1249         use English '-no_match_vars';
1250
1251 (Assuming, of course, that you don't need the troublesome variables
1252 C<$`>, C<$&>, or C<$'>.)  Also, introduced C<@LAST_MATCH_START> and
1253 C<@LAST_MATCH_END> English aliases for C<@-> and C<@+>.
1254
1255 =item *
1256
1257 ExtUtils::MakeMaker has been significantly cleaned up and fixed.
1258 The enhanced version has also been backported to earlier releases
1259 of Perl and submitted to CPAN so that the earlier releases can
1260 enjoy the fixes.
1261
1262 =item *
1263
1264 The arguments of WriteMakefile() in Makefile.PL are now checked
1265 for sanity much more carefully than before.  This may cause new
1266 warnings when modules are being insalled.  See L<ExtUtils::MakeMaker>
1267 for more details.
1268
1269 =item *
1270
1271 ExtUtils::MakeMaker now uses File::Spec internally, which hopefully
1272 leads to better portability.
1273
1274 =item *
1275
1276 Fcntl, Socket, and Sys::Syslog have been rewritten by Nicholas Clark
1277 to use the new-style constant dispatch section (see L<ExtUtils::Constant>).
1278 This means that they will be more robust and hopefully faster.
1279
1280 =item *
1281
1282 File::Find now chdir()s correctly when chasing symbolic links. [561]
1283
1284 =item *
1285
1286 File::Find now has pre- and post-processing callbacks.  It also
1287 correctly changes directories when chasing symbolic links.  Callbacks
1288 (naughtily) exiting with "next;" instead of "return;" now work.
1289
1290 =item *
1291
1292 File::Find is now (again) reentrant.  It also has been made
1293 more portable.
1294
1295 =item *
1296
1297 The warnings issued by File::Find now belong to their own category.
1298 You can enable/disable them with C<use/no warnings 'File::Find';>.
1299
1300 =item *
1301
1302 File::Glob::glob() has been renamed to File::Glob::bsd_glob()
1303 because the name clashes with the builtin glob().  The older
1304 name is still available for compatibility, but is deprecated. [561]
1305
1306 =item *
1307
1308 File::Glob now supports C<GLOB_LIMIT> constant to limit the size of
1309 the returned list of filenames.
1310
1311 =item *
1312
1313 IPC::Open3 now allows the use of numeric file descriptors.
1314
1315 =item *
1316
1317 IO::Socket now has an atmark() method, which returns true if the socket
1318 is positioned at the out-of-band mark.  The method is also exportable
1319 as a sockatmark() function.
1320
1321 =item *
1322
1323 IO::Socket::INET failed to open the specified port if the service name
1324 was not known.  It now correctly uses the supplied port number as is. [561]
1325
1326 =item *
1327
1328 IO::Socket::INET has support for the ReusePort option (if your
1329 platform supports it).  The Reuse option now has an alias, ReuseAddr.
1330 For clarity, you may want to prefer ReuseAddr.
1331
1332 =item *
1333
1334 IO::Socket::INET now supports a value of zero for C<LocalPort>
1335 (usually meaning that the operating system will make one up.)
1336
1337 =item *
1338
1339 'use lib' now works identically to @INC.  Removing directories
1340 with 'no lib' now works.
1341
1342 =item *
1343
1344 Math::BigFloat and Math::BigInt have undergone a full rewrite by Tels.
1345 They are now magnitudes faster, and they support various bignum
1346 libraries such as GMP and PARI as their backends.
1347
1348 =item *
1349
1350 Math::Complex handles inf, NaN etc., better.
1351
1352 =item *
1353
1354 Net::Ping has been considerably enhanced by Rob Brown: multihoming is
1355 now supported, Win32 functionality is better, there is now time
1356 measuring functionality (optionally high-resolution using
1357 Time::HiRes), and there is now "external" protocol which uses
1358 Net::Ping::External module which runs your external ping utility and
1359 parses the output.  A version of Net::Ping::External is available in
1360 CPAN.
1361
1362 Note that some of the Net::Ping tests are disabled when running
1363 under the Perl distribution since one cannot assume one or more
1364 of the following: enabled echo port at localhost, full Internet
1365 connectivity, or sympathetic firewalls.  You can set the environment
1366 variable PERL_TEST_Net_Ping to "1" (one) before running the Perl test
1367 suite to enable all the Net::Ping tests.
1368
1369 =item *
1370
1371 POSIX::sigaction() is now much more flexible and robust.
1372 You can now install coderef handlers, 'DEFAULT', and 'IGNORE'
1373 handlers, installing new handlers was not atomic.
1374
1375 =item *
1376
1377 In Safe, C<%INC> is now localised in a Safe compartment so that
1378 use/require work.
1379
1380 =item *
1381
1382 In SDBM_File on dosish platforms, some keys went missing because of
1383 lack of support for files with "holes".  A workaround for the problem
1384 has been added.
1385
1386 =item *
1387
1388 In Search::Dict one can now have a pre-processing hook for the
1389 lines being searched.
1390
1391 =item *
1392
1393 The Shell module now has an OO interface.
1394
1395 =item *
1396
1397 In Sys::Syslog there is now a failover mechanism that will go
1398 through alternative connection mechanisms until the message
1399 is successfully logged.
1400
1401 =item *
1402
1403 The Test module has been significantly enhanced.
1404
1405 =item *
1406
1407 Time::Local::timelocal() does not handle fractional seconds anymore.
1408 The rationale is that neither does localtime(), and timelocal() and
1409 localtime() are supposed to be inverses of each other.
1410
1411 =item *
1412
1413 The vars pragma now supports declaring fully qualified variables.
1414 (Something that C<our()> does not and will not support.)
1415
1416 =item *
1417
1418 The C<utf8::> name space (as in the pragma) provides various
1419 Perl-callable functions to provide low level access to Perl's
1420 internal Unicode representation.  At the moment only length()
1421 has been implemented.
1422
1423 =back
1424
1425 =head1 Utility Changes
1426
1427 =over 4
1428
1429 =item *
1430
1431 Emacs perl mode (emacs/cperl-mode.el) has been updated to version
1432 4.31.
1433
1434 =item *
1435
1436 F<emacs/e2ctags.pl> is now much faster.
1437
1438 =item *
1439
1440 C<enc2xs> is a tool for people adding their own encodings to the
1441 Encode module.
1442
1443 =item *
1444
1445 C<h2ph> now supports C trigraphs.
1446
1447 =item *
1448
1449 C<h2xs> now produces a template README.
1450
1451 =item *
1452
1453 C<h2xs> now uses C<Devel::PPPort> for better portability between
1454 different versions of Perl.
1455
1456 =item *
1457
1458 C<h2xs> uses the new L<ExtUtils::Constant|ExtUtils::Constant> module
1459 which will affect newly created extensions that define constants.
1460 Since the new code is more correct (if you have two constants where the
1461 first one is a prefix of the second one, the first constant B<never>
1462 got defined), less lossy (it uses integers for integer constant,
1463 as opposed to the old code that used floating point numbers even for
1464 integer constants), and slightly faster, you might want to consider
1465 regenerating your extension code (the new scheme makes regenerating
1466 easy).  L<h2xs> now also supports C trigraphs.
1467
1468 =item *
1469
1470 C<libnetcfg> has been added to configure libnet.
1471
1472 =item *
1473
1474 C<perlbug> is now much more robust.  It also sends the bug report to
1475 perl.org, not perl.com.
1476
1477 =item *
1478
1479 C<perlcc> has been rewritten and its user interface (that is,
1480 command line) is much more like that of the UNIX C compiler, cc.
1481 (The perlbc tools has been removed.  Use C<perlcc -B> instead.)
1482 B<Note that perlcc is still considered very experimental and
1483 unsupported.> [561]
1484
1485 =item *
1486
1487 C<perlivp> is a new Installation Verification Procedure utility
1488 for running any time after installing Perl.
1489
1490 =item *
1491
1492 C<piconv> is an implementation of the character conversion utility
1493 C<iconv>, demonstrating the new Encode module.
1494
1495 =item *
1496
1497 C<pod2html> now allows specifying a cache directory.
1498
1499 =item *
1500
1501 C<pod2html> now produces XHTML 1.0.
1502
1503 =item *
1504
1505 C<pod2html> now understands POD written using different line endings
1506 (PC-like CRLF versus UNIX-like LF versus MacClassic-like CR).
1507
1508 =item *
1509
1510 C<s2p> has been completely rewritten in Perl.  (It is in fact a full
1511 implementation of sed in Perl: you can use the sed functionality by
1512 using the C<psed> utility.)
1513
1514 =item *
1515
1516 C<xsubpp> now understands POD documentation embedded in the *.xs
1517 files. [561]
1518
1519 =item *
1520
1521 C<xsubpp> now supports the OUT keyword.
1522
1523 =back
1524
1525 =head1 New Documentation
1526
1527 =over 4
1528
1529 =item *
1530
1531 perl56delta details the changes between the 5.005 release and the
1532 5.6.0 release.
1533
1534 =item *
1535
1536 perlclib documents the internal replacements for standard C library
1537 functions.  (Interesting only for extension writers and Perl core
1538 hackers.) [561+]
1539
1540 =item *
1541
1542 perldebtut is a Perl debugging tutorial. [561+]
1543
1544 =item *
1545
1546 perlebcdic contains considerations for running Perl on EBCDIC
1547 platforms. [561+]
1548
1549 =item *
1550
1551 perlintro is a gentle introduction to Perl.
1552
1553 =item *
1554
1555 perliol documents the internals of PerlIO with layers.
1556
1557 =item *
1558
1559 perlmodstyle is a style guide for writing modules.
1560
1561 =item *
1562
1563 perlnewmod tells about writing and submitting a new module. [561+]
1564
1565 =item *
1566
1567 perlpacktut is a pack() tutorial.
1568
1569 =item *
1570
1571 perlpod has been rewritten to be clearer and to record the best
1572 practices gathered over the years.
1573
1574 =item *
1575
1576 perlpodspec is a more formal specification of the pod format,
1577 mainly of interest for writers of pod applications, not to
1578 people writing in pod.
1579
1580 =item *
1581
1582 perlretut is a regular expression tutorial. [561+]
1583
1584 =item *
1585
1586 perlrequick is a regular expressions quick-start guide.
1587 Yes, much quicker than perlretut. [561]
1588
1589 =item *
1590
1591 perltodo has been updated.
1592
1593 =item *
1594
1595 perltootc has been renamed as perltooc (to not to conflict
1596 with perltoot in filesystems restricted to "8.3" names).
1597
1598 =item *
1599
1600 perluniintro is an introduction to using Unicode in Perl.
1601 (perlunicode is more of a detailed reference and background
1602 information)
1603
1604 =item *
1605
1606 perlutil explains the command line utilities packaged with the Perl
1607 distribution. [561+]
1608
1609 =back
1610
1611 The following platform-specific documents are available before
1612 the installation as README.I<platform>, and after the installation
1613 as perlI<platform>:
1614
1615     perlaix perlamiga perlapollo perlbeos perlbs2000
1616     perlce perlcygwin perldgux perldos perlepoc perlfreebsd perlhpux
1617     perlhurd perlirix perlmachten perlmacos perlmint perlmpeix
1618     perlnetware perlos2 perlos390 perlplan9 perlqnx perlsolaris
1619     perltru64 perluts perlvmesa perlvms perlvos perlwin32
1620
1621 These documents usually detail one or more of the following subjects:
1622 configuring, building, testing, installing, and sometimes also using
1623 Perl on the said platform.
1624
1625 Eastern Asian Perl users are now welcomed in their own languages:
1626 README.jp (Japanese), README.ko (Korean), README.cn (simplified
1627 Chinese) and README.tw (traditional Chinese), which are written in
1628 normal pod but encoded in EUC-JP, EUC-KR, EUC-CN and Big5.  These
1629 will get installed as
1630
1631    perljp perlko perlcn perltw
1632
1633 =over 4
1634
1635 =item *
1636
1637 The documentation for the POSIX-BC platform is called "BS2000", to avoid
1638 confusion with the Perl POSIX module.
1639
1640 =item *
1641
1642 The documentation for the WinCE platform is called perlce (README.ce
1643 in the source code kit), to avoid confusion with the perlwin32
1644 documentation on 8.3-restricted filesystems.
1645
1646 =back
1647
1648 =head1 Performance Enhancements
1649
1650 =over 4
1651
1652 =item *
1653
1654 map() could get pathologically slow when the result list it generates
1655 is larger than the source list.  The performance has been improved for
1656 common scenarios. [561]
1657
1658 =item *
1659
1660 sort() is also fully reentrant, in the sense that the sort function
1661 can itself call sort().  This did not work reliably in previous
1662 releases. [561]
1663
1664 =item *
1665
1666 sort() has been changed to use primarily mergesort internally as
1667 opposed to the earlier quicksort.  For very small lists this may
1668 result in slightly slower sorting times, but in general the speedup
1669 should be at least 20%.  Additional bonuses are that the worst case
1670 behaviour of sort() is now better (in computer science terms it now
1671 runs in time O(N log N), as opposed to quicksort's Theta(N**2)
1672 worst-case run time behaviour), and that sort() is now stable
1673 (meaning that elements with identical keys will stay ordered as they
1674 were before the sort).  See the C<sort> pragma for information.
1675
1676 The story in more detail: suppose you want to serve yourself a little
1677 slice of Pi.
1678
1679     @digits = ( 3,1,4,1,5,9 );
1680
1681 A numerical sort of the digits will yield (1,1,3,4,5,9), as expected.
1682 Which C<1> comes first is hard to know, since one C<1> looks pretty
1683 much like any other.  You can regard this as totally trivial,
1684 or somewhat profound.  However, if you just want to sort the even
1685 digits ahead of the odd ones, then what will
1686
1687     sort { ($a % 2) <=> ($b % 2) } @digits;
1688
1689 yield?  The only even digit, C<4>, will come first.  But how about
1690 the odd numbers, which all compare equal?  With the quicksort algorithm
1691 used to implement Perl 5.6 and earlier, the order of ties is left up
1692 to the sort.  So, as you add more and more digits of Pi, the order
1693 in which the sorted even and odd digits appear will change.
1694 and, for sufficiently large slices of Pi, the quicksort algorithm
1695 in Perl 5.8 won't return the same results even if reinvoked with the
1696 same input.  The justification for this rests with quicksort's
1697 worst case behavior.  If you run
1698
1699    sort { $a <=> $b } ( 1 .. $N , 1 .. $N );
1700
1701 (something you might approximate if you wanted to merge two sorted
1702 arrays using sort), doubling $N doesn't just double the quicksort time,
1703 it I<quadruples> it.  Quicksort has a worst case run time that can
1704 grow like N**2, so-called I<quadratic> behaviour, and it can happen
1705 on patterns that may well arise in normal use.  You won't notice this
1706 for small arrays, but you I<will> notice it with larger arrays,
1707 and you may not live long enough for the sort to complete on arrays
1708 of a million elements.  So the 5.8 quicksort scrambles large arrays
1709 before sorting them, as a statistical defence against quadratic behaviour.
1710 But that means if you sort the same large array twice, ties may be
1711 broken in different ways.
1712
1713 Because of the unpredictability of tie-breaking order, and the quadratic
1714 worst-case behaviour, quicksort was I<almost> replaced completely with
1715 a stable mergesort.  I<Stable> means that ties are broken to preserve
1716 the original order of appearance in the input array.  So
1717
1718     sort { ($a % 2) <=> ($b % 2) } (3,1,4,1,5,9);
1719
1720 will yield (4,3,1,1,5,9), guaranteed.  The even and odd numbers
1721 appear in the output in the same order they appeared in the input.
1722 Mergesort has worst case O(N log N) behaviour, the best value
1723 attainable.  And, ironically, this mergesort does particularly
1724 well where quicksort goes quadratic:  mergesort sorts (1..$N, 1..$N)
1725 in O(N) time.  But quicksort was rescued at the last moment because
1726 it is faster than mergesort on certain inputs and platforms.
1727 For example, if you really I<don't> care about the order of even
1728 and odd digits, quicksort will run in O(N) time; it's very good
1729 at sorting many repetitions of a small number of distinct elements.
1730 The quicksort divide and conquer strategy works well on platforms
1731 with relatively small, very fast, caches.  Eventually, the problem gets
1732 whittled down to one that fits in the cache, from which point it
1733 benefits from the increased memory speed.
1734
1735 Quicksort was rescued by implementing a sort pragma to control aspects
1736 of the sort.  The B<stable> subpragma forces stable behaviour,
1737 regardless of algorithm.  The B<_quicksort> and B<_mergesort>
1738 subpragmas are heavy-handed ways to select the underlying implementation.
1739 The leading C<_> is a reminder that these subpragmas may not survive
1740 beyond 5.8.  More appropriate mechanisms for selecting the implementation
1741 exist, but they wouldn't have arrived in time to save quicksort.
1742
1743 =item *
1744
1745 Hashes now use Bob Jenkins "One-at-a-Time" hashing key algorithm
1746 ( http://burtleburtle.net/bob/hash/doobs.html ).  This algorithm is
1747 reasonably fast while producing a much better spread of values than
1748 the old hashing algorithm (originally by Chris Torek, later tweaked by
1749 Ilya Zakharevich).  Hash values output from the algorithm on a hash of
1750 all 3-char printable ASCII keys comes much closer to passing the
1751 DIEHARD random number generation tests.  According to perlbench, this
1752 change has not affected the overall speed of Perl.
1753
1754 =item *
1755
1756 unshift() should now be noticeably faster.
1757
1758 =back
1759
1760 =head1 Installation and Configuration Improvements
1761
1762 =head2 Generic Improvements
1763
1764 =over 4
1765
1766 =item *
1767
1768 INSTALL now explains how you can configure Perl to use 64-bit
1769 integers even on non-64-bit platforms.
1770
1771 =item *
1772
1773 Policy.sh policy change: if you are reusing a Policy.sh file
1774 (see INSTALL) and you use Configure -Dprefix=/foo/bar and in the old
1775 Policy $prefix eq $siteprefix and $prefix eq $vendorprefix, all of
1776 them will now be changed to the new prefix, /foo/bar.  (Previously
1777 only $prefix changed.)  If you do not like this new behaviour,
1778 specify prefix, siteprefix, and vendorprefix explicitly.
1779
1780 =item *
1781
1782 A new optional location for Perl libraries, otherlibdirs, is available.
1783 It can be used for example for vendor add-ons without disturbing Perl's
1784 own library directories.
1785
1786 =item *
1787
1788 In many platforms, the vendor-supplied 'cc' is too stripped-down to
1789 build Perl (basically, 'cc' doesn't do ANSI C).  If this seems
1790 to be the case and 'cc' does not seem to be the GNU C compiler
1791 'gcc', an automatic attempt is made to find and use 'gcc' instead.
1792
1793 =item *
1794
1795 gcc needs to closely track the operating system release to avoid
1796 build problems. If Configure finds that gcc was built for a different
1797 operating system release than is running, it now gives a clearly visible
1798 warning that there may be trouble ahead.
1799
1800 =item *
1801
1802 Since Perl 5.8 is not binary-compatible with previous releases
1803 of Perl, Configure no longer suggests including the 5.005
1804 modules in @INC.
1805
1806 =item *
1807
1808 Configure C<-S> can now run non-interactively. [561]
1809
1810 =item *
1811
1812 Configure support for pdp11-style memory models has been removed due
1813 to obsolescence. [561]
1814
1815 =item *
1816
1817 configure.gnu now works with options with whitespace in them.
1818
1819 =item *
1820
1821 installperl now outputs everything to STDERR.
1822
1823 =item *
1824
1825 Because PerlIO is now the default on most platforms, "-perlio" doesn't
1826 get appended to the $Config{archname} (also known as $^O) anymore.
1827 Instead, if you explicitly choose not to use perlio (Configure command
1828 line option -Uuseperlio), you will get "-stdio" appended.
1829
1830 =item *
1831
1832 Another change related to the architecture name is that "-64all"
1833 (-Duse64bitall, or "maximally 64-bit") is appended only if your
1834 pointers are 64 bits wide.  (To be exact, the use64bitall is ignored.)
1835
1836 =item *
1837
1838 In AFS installations, one can configure the root of the AFS to be
1839 somewhere else than the default F</afs> by using the Configure
1840 parameter C<-Dafsroot=/some/where/else>.
1841
1842 =item *
1843
1844 APPLLIB_EXP, a lesser-known configuration-time definition, has been
1845 documented.  It can be used to prepend site-specific directories
1846 to Perl's default search path (@INC); see INSTALL for information.
1847
1848 =item *
1849
1850 The version of Berkeley DB used when the Perl (and, presumably, the
1851 DB_File extension) was built is now available as
1852 C<@Config{qw(db_version_major db_version_minor db_version_patch)}>
1853 from Perl and as C<DB_VERSION_MAJOR_CFG DB_VERSION_MINOR_CFG
1854 DB_VERSION_PATCH_CFG> from C.
1855
1856 =item *
1857
1858 Building Berkeley DB3 for compatibility modes for DB, NDBM, and ODBM
1859 has been documented in INSTALL.
1860
1861 =item *
1862
1863 If you have CPAN access (either network or a local copy such as a
1864 CD-ROM) you can during specify extra modules to Configure to build and
1865 install with Perl using the -Dextras=...  option.  See INSTALL for
1866 more details.
1867
1868 =item *
1869
1870 In addition to config.over, a new override file, config.arch, is
1871 available.  This file is supposed to be used by hints file writers
1872 for architecture-wide changes (as opposed to config.over which is
1873 for site-wide changes).
1874
1875 =item *
1876
1877 If your file system supports symbolic links, you can build Perl outside
1878 of the source directory by
1879
1880         mkdir /tmp/perl/build/directory
1881         cd /tmp/perl/build/directory
1882         sh /path/to/perl/source/Configure -Dmksymlinks ...
1883
1884 This will create in /tmp/perl/build/directory a tree of symbolic links
1885 pointing to files in /path/to/perl/source.  The original files are left
1886 unaffected.  After Configure has finished, you can just say
1887
1888         make all test
1889
1890 and Perl will be built and tested, all in /tmp/perl/build/directory.
1891 [561]
1892
1893 =item *
1894
1895 For Perl developers, several new make targets for profiling
1896 and debugging have been added; see L<perlhack>.
1897
1898 =over 8
1899
1900 =item *
1901
1902 Use of the F<gprof> tool to profile Perl has been documented in
1903 L<perlhack>.  There is a make target called "perl.gprof" for
1904 generating a gprofiled Perl executable.
1905
1906 =item *
1907
1908 If you have GCC 3, there is a make target called "perl.gcov" for
1909 creating a gcoved Perl executable for coverage analysis.  See
1910 L<perlhack>.
1911
1912 =item *
1913
1914 If you are on IRIX or Tru64 platforms, new profiling/debugging options
1915 have been added; see L<perlhack> for more information about pixie and
1916 Third Degree.
1917
1918 =back
1919
1920 =item *
1921
1922 Guidelines of how to construct minimal Perl installations have
1923 been added to INSTALL.
1924
1925 =item *
1926
1927 The Thread extension is now not built at all under ithreads
1928 (C<Configure -Duseithreads>) because it wouldn't work anyway (the
1929 Thread extension requires being Configured with C<-Duse5005threads>).
1930
1931 But note that the Thread.pm interface is now shared by both
1932 thread models.
1933
1934 =item *
1935
1936 The Gconvert macro ($Config{d_Gconvert}) used by perl for stringifying
1937 floating-point numbers is now more picky about using sprintf %.*g
1938 rules for the conversion.  Some platforms that used to use gcvt may
1939 now resort to the slower sprintf.
1940
1941 =item *
1942
1943 The obsolete method of making a special (e.g., debugging) flavor
1944 of perl by saying
1945
1946         make LIBPERL=libperld.a
1947
1948 has been removed. Use -DDEBUGGING instead.
1949
1950 =back
1951
1952 =head2 New Or Improved Platforms
1953
1954 For the list of platforms known to support Perl,
1955 see L<perlport/"Supported Platforms">.
1956
1957 =over 4
1958
1959 =item *
1960
1961 AIX dynamic loading should be now better supported.
1962
1963 =item *
1964
1965 AIX should now work better with gcc, threads, and 64-bitness.  Also the
1966 long doubles support in AIX should be better now.  See L<perlaix>.
1967
1968 =item *
1969
1970 AtheOS ( http://www.atheos.cx/ ) is a new platform.
1971
1972 =item *
1973
1974 BeOS has been reclaimed.
1975
1976 =item *
1977
1978 The DG/UX platform now supports 5.005-style threads.
1979 See L<perldgux>.
1980
1981 =item *
1982
1983 The DYNIX/ptx platform (a.k.a. dynixptx) is supported at or near
1984 osvers 4.5.2.
1985
1986 =item *
1987
1988 EBCDIC platforms (z/OS (also known as OS/390), POSIX-BC, and VM/ESA)
1989 have been regained.  Many test suite tests still fail and the
1990 co-existence of Unicode and EBCDIC isn't quite settled, but the
1991 situation is much better than with Perl 5.6.  See L<perlos390>,
1992 L<perlbs2000> (for POSIX-BC), and L<perlvmesa> for more information.
1993
1994 =item *
1995
1996 Building perl with -Duseithreads or -Duse5005threads now works under
1997 HP-UX 10.20 (previously it only worked under 10.30 or later). You will
1998 need a thread library package installed. See README.hpux. [561]
1999
2000 =item *
2001
2002 Mac OS Classic is now supported in the mainstream source package
2003 (MacPerl has of course been available since perl 5.004 but now the
2004 source code bases of standard Perl and MacPerl have been synchronised)
2005 [561]
2006
2007 =item *
2008
2009 Mac OS X (or Darwin) should now be able to build Perl even on HFS+
2010 filesystems.  (The case-insensitivity used to confuse the Perl build
2011 process.)
2012
2013 =item *
2014
2015 NCR MP-RAS is now supported. [561]
2016
2017 =item *
2018
2019 All the NetBSD specific patches (except for the installation
2020 specific ones) have been merged back to the main distribution.
2021
2022 =item *
2023
2024 NetWare from Novell is now supported.  See L<perlnetware>.
2025
2026 =item *
2027
2028 NonStop-UX is now supported. [561]
2029
2030 =item *
2031
2032 NEC SUPER-UX is now supported.
2033
2034 =item *
2035
2036 All the OpenBSD specific patches (except for the installation
2037 specific ones) have been merged back to the main distribution.
2038
2039 =item *
2040
2041 Perl has been tested with the GNU pth userlevel thread package
2042 ( http://www.gnu.org/software/pth/pth.html ).  All thread tests
2043 of Perl now work, but not without adding some yield()s to the tests,
2044 so while pth (and other userlevel thread implementations) can be
2045 considered to be "working" with Perl ithreads, keep in mind the
2046 possible non-preemptability of the underlying thread implementation.
2047
2048 =item *
2049
2050 Stratus VOS is now supported using Perl's native build method
2051 (Configure).  This is the recommended method to build Perl on
2052 VOS.  The older methods, which build miniperl, are still
2053 available.  See L<perlvos>. [561+]
2054
2055 =item *
2056
2057 The Amdahl UTS UNIX mainframe platform is now supported. [561]
2058
2059 =item *
2060
2061 WinCE is now supported.  See L<perlce>.
2062
2063 =item *
2064
2065 z/OS (formerly known as OS/390, formerly known as MVS OE) now has
2066 support for dynamic loading.  This is not selected by default,
2067 however, you must specify -Dusedl in the arguments of Configure. [561]
2068
2069 =back
2070
2071 =head1 Selected Bug Fixes
2072
2073 Numerous memory leaks and uninitialized memory accesses have been
2074 hunted down.  Most importantly, anonymous subs used to leak quite
2075 a bit. [561]
2076
2077 =over 4
2078
2079 =item *
2080
2081 The autouse pragma didn't work for Multi::Part::Function::Names.
2082
2083 =item *
2084
2085 caller() could cause core dumps in certain situations.  Carp was
2086 sometimes affected by this problem.  In particular, caller() now
2087 returns a subroutine name of C<(unknown)> for subroutines that have
2088 been removed from the symbol table.
2089
2090 =item *
2091
2092 chop(@list) in list context returned the characters chopped in
2093 reverse order.  This has been reversed to be in the right order. [561]
2094
2095 =item *
2096
2097 Configure no longer includes the DBM libraries (dbm, gdbm, db, ndbm)
2098 when building the Perl binary.  The only exception to this is SunOS 4.x,
2099 which needs them. [561]
2100
2101 =item *
2102
2103 The behaviour of non-decimal but numeric string constants such as
2104 "0x23" was platform-dependent: in some platforms that was seen as 35,
2105 in some as 0, in some as a floating point number (don't ask).  This
2106 was caused by Perl's using the operating system libraries in a situation
2107 where the result of the string to number conversion is undefined: now
2108 Perl consistently handles such strings as zero in numeric contexts.
2109
2110 =item *
2111
2112 The order of DESTROYs has been made more predictable.
2113
2114 =item *
2115
2116 Perl 5.6.0 could emit spurious warnings about redefinition of
2117 dl_error() when statically building extensions into perl.
2118 This has been corrected. [561]
2119
2120 =item *
2121
2122 L<dprofpp> -R didn't work.
2123
2124 =item *
2125
2126 C<*foo{FORMAT}> now works.
2127
2128 =item *
2129
2130 Infinity is now recognized as a number.
2131
2132 =item *
2133
2134 UNIVERSAL::isa no longer caches methods incorrectly.  (This broke
2135 the Tk extension with 5.6.0.) [561]
2136
2137 =item *
2138
2139 Lexicals I: lexicals outside an eval "" weren't resolved
2140 correctly inside a subroutine definition inside the eval "" if they
2141 were not already referenced in the top level of the eval""ed code.
2142
2143 =item *
2144
2145 Lexicals II: lexicals leaked at file scope into subroutines that
2146 were declared before the lexicals.
2147
2148 =item *
2149
2150 Lexical warnings now propagating correctly between scopes
2151 and into C<eval "...">.
2152
2153 =item *
2154
2155 C<use warnings qw(FATAL all)> did not work as intended.  This has been
2156 corrected. [561]
2157
2158 =item *
2159
2160 warnings::enabled() now reports the state of $^W correctly if the caller
2161 isn't using lexical warnings. [561]
2162
2163 =item *
2164
2165 Line renumbering with eval and C<#line> now works. [561]
2166
2167 =item *
2168
2169 Fixed numerous memory leaks, especially in eval "".
2170
2171 =item *
2172
2173 Localised tied variables no longer leak memory
2174
2175     use Tie::Hash;
2176     tie my %tied_hash => 'Tie::StdHash';
2177
2178     ...
2179
2180     # Used to leak memory every time local() was called;
2181     # in a loop, this added up.
2182     local($tied_hash{Foo}) = 1;
2183
2184 =item *
2185
2186 Localised hash elements (and %ENV) are correctly unlocalised to not
2187 exist, if they didn't before they were localised.
2188
2189
2190     use Tie::Hash;
2191     tie my %tied_hash => 'Tie::StdHash';
2192
2193     ...
2194
2195     # Nothing has set the FOO element so far
2196
2197     { local $tied_hash{FOO} = 'Bar' }
2198
2199     # This used to print, but not now.
2200     print "exists!\n" if exists $tied_hash{FOO};
2201
2202 As a side effect of this fix, tied hash interfaces B<must> define
2203 the EXISTS and DELETE methods.
2204
2205 =item *
2206
2207 mkdir() now ignores trailing slashes in the directory name,
2208 as mandated by POSIX.
2209
2210 =item *
2211
2212 Some versions of glibc have a broken modfl().  This affects builds
2213 with C<-Duselongdouble>.  This version of Perl detects this brokenness
2214 and has a workaround for it.  The glibc release 2.2.2 is known to have
2215 fixed the modfl() bug.
2216
2217 =item *
2218
2219 Modulus of unsigned numbers now works (4063328477 % 65535 used to
2220 return 27406, instead of 27047). [561]
2221
2222 =item *
2223
2224 Some "not a number" warnings introduced in 5.6.0 eliminated to be
2225 more compatible with 5.005.  Infinity is now recognised as a number. [561]
2226
2227 =item *
2228
2229 Numeric conversions did not recognize changes in the string value
2230 properly in certain circumstances. [561]
2231
2232 =item *
2233
2234 Attributes (such as :shared) didn't work with our().
2235
2236 =item *
2237
2238 our() variables will not cause bogus "Variable will not stay shared"
2239 warnings. [561]
2240
2241 =item *
2242
2243 "our" variables of the same name declared in two sibling blocks
2244 resulted in bogus warnings about "redeclaration" of the variables.
2245 The problem has been corrected. [561]
2246
2247 =item *
2248
2249 pack "Z" now correctly terminates the string with "\0".
2250
2251 =item *
2252
2253 Fix password routines which in some shadow password platforms
2254 (e.g. HP-UX) caused getpwent() to return every other entry.
2255
2256 =item *
2257
2258 The PERL5OPT environment variable (for passing command line arguments
2259 to Perl) didn't work for more than a single group of options. [561]
2260
2261 =item *
2262
2263 PERL5OPT with embedded spaces didn't work.
2264
2265 =item *
2266
2267 printf() no longer resets the numeric locale to "C".
2268
2269 =item *
2270
2271 C<qw(a\\b)> now parses correctly as C<'a\\b'>: that is, as three
2272 characters, not four. [561]
2273
2274 =item *
2275
2276 pos() did not return the correct value within s///ge in earlier
2277 versions.  This is now handled correctly. [561]
2278
2279 =item *
2280
2281 Printing quads (64-bit integers) with printf/sprintf now works
2282 without the q L ll prefixes (assuming you are on a quad-capable platform).
2283
2284 =item *
2285
2286 Regular expressions on references and overloaded scalars now work. [561+]
2287
2288 =item *
2289
2290 Right-hand side magic (GMAGIC) could in many cases such as string
2291 concatenation be invoked too many times.
2292
2293 =item *
2294
2295 scalar() now forces scalar context even when used in void context.
2296
2297 =item *
2298
2299 SOCKS support is now much more robust.
2300
2301 =item *
2302
2303 sort() arguments are now compiled in the right wantarray context
2304 (they were accidentally using the context of the sort() itself).
2305 The comparison block is now run in scalar context, and the arguments
2306 to be sorted are always provided list context. [561]
2307
2308 =item *
2309
2310 Changed the POSIX character class C<[[:space:]]> to include the (very
2311 rarely used) vertical tab character.  Added a new POSIX-ish character
2312 class C<[[:blank:]]> which stands for horizontal whitespace
2313 (currently, the space and the tab).
2314
2315 =item *
2316
2317 The tainting behaviour of sprintf() has been rationalized.  It does
2318 not taint the result of floating point formats anymore, making the
2319 behaviour consistent with that of string interpolation. [561]
2320
2321 =item *
2322
2323 Some cases of inconsistent taint propagation (such as within hash
2324 values) have been fixed.
2325
2326 =item *
2327
2328 The RE engine found in Perl 5.6.0 accidentally pessimised certain kinds
2329 of simple pattern matches.  These are now handled better. [561]
2330
2331 =item *
2332
2333 Regular expression debug output (whether through C<use re 'debug'>
2334 or via C<-Dr>) now looks better. [561]
2335
2336 =item *
2337
2338 Multi-line matches like C<"a\nxb\n" =~ /(?!\A)x/m> were flawed.  The
2339 bug has been fixed. [561]
2340
2341 =item *
2342
2343 Use of $& could trigger a core dump under some situations.  This
2344 is now avoided. [561]
2345
2346 =item *
2347
2348 The regular expression captured submatches ($1, $2, ...) are now
2349 more consistently unset if the match fails, instead of leaving false
2350 data lying around in them. [561]
2351
2352 =item *
2353
2354 readline() on files opened in "slurp" mode could return an extra
2355 "" (blank line) at the end in certain situations.  This has been
2356 corrected. [561]
2357
2358 =item *
2359
2360 Autovivification of symbolic references of special variables described
2361 in L<perlvar> (as in C<${$num}>) was accidentally disabled.  This works
2362 again now. [561]
2363
2364 =item *
2365
2366 Sys::Syslog ignored the C<LOG_AUTH> constant.
2367
2368 =item *
2369
2370 $AUTOLOAD, sort(), lock(), and spawning subprocesses
2371 in multiple threads simultaneously are now thread-safe.
2372
2373 =item *
2374
2375 Tie::Array's SPLICE method was broken.
2376
2377 =item *
2378
2379 Allow a read-only string on the left-hand side of a non-modifying tr///.
2380
2381 =item *
2382
2383 If C<STDERR> is tied, warnings caused by C<warn> and C<die> now
2384 correctly pass to it.
2385
2386 =item *
2387
2388 Several Unicode fixes.
2389
2390 =over 8
2391
2392 =item *
2393
2394 BOMs (byte order marks) at the beginning of Perl files
2395 (scripts, modules) should now be transparently skipped.
2396 UTF-16 and UCS-2 encoded Perl files should now be read correctly.
2397
2398 =item *
2399
2400 The character tables have been updated to Unicode 3.2.0.
2401
2402 =item *
2403
2404 Comparing with utf8 data does not magically upgrade non-utf8 data
2405 into utf8.  (This was a problem for example if you were mixing data
2406 from I/O and Unicode data: your output might have got magically encoded
2407 as UTF-8.)
2408
2409 =item *
2410
2411 Generating illegal Unicode code points such as U+FFFE, or the UTF-16
2412 surrogates, now also generates an optional warning.
2413
2414 =item *
2415
2416 C<IsAlnum>, C<IsAlpha>, and C<IsWord> now match titlecase.
2417
2418 =item *
2419
2420 Concatenation with the C<.> operator or via variable interpolation,
2421 C<eq>, C<substr>, C<reverse>, C<quotemeta>, the C<x> operator,
2422 substitution with C<s///>, single-quoted UTF8, should now work.
2423
2424 =item *
2425
2426 The C<tr///> operator now works.  Note that the C<tr///CU>
2427 functionality has been removed (but see pack('U0', ...)).
2428
2429 =item *
2430
2431 C<eval "v200"> now works.
2432
2433 =item *
2434
2435 Perl 5.6.0 parsed m/\x{ab}/ incorrectly, leading to spurious warnings.
2436 This has been corrected. [561]
2437
2438 =item *
2439
2440 Zero entries were missing from the Unicode classes such as C<IsDigit>.
2441
2442 =back
2443
2444 =item *
2445
2446 Large unsigned numbers (those above 2**31) could sometimes lose their
2447 unsignedness, causing bogus results in arithmetic operations. [561]
2448
2449 =item *
2450
2451 The Perl parser has been stress tested using both random input and
2452 Markov chain input and the few found crashes and lockups have been
2453 fixed.
2454
2455 =back
2456
2457 =head2 Platform Specific Changes and Fixes
2458
2459 =over 4
2460
2461 =item *
2462
2463 BSDI 4.*
2464
2465 Perl now works on post-4.0 BSD/OSes.
2466
2467 =item *
2468
2469 All BSDs
2470
2471 Setting C<$0> now works (as much as possible; see L<perlvar> for details).
2472
2473 =item *
2474
2475 Cygwin
2476
2477 Numerous updates; currently synchronised with Cygwin 1.3.10.
2478
2479 =item *
2480
2481 Previously DYNIX/ptx had problems in its Configure probe for non-blocking I/O.
2482
2483 =item *
2484
2485 EPOC
2486
2487 EPOC now better supported.  See README.epoc. [561]
2488
2489 =item *
2490
2491 FreeBSD 3.*
2492
2493 Perl now works on post-3.0 FreeBSDs.
2494
2495 =item *
2496
2497 HP-UX
2498
2499 README.hpux updated; C<Configure -Duse64bitall> now works;
2500 now uses HP-UX malloc instead of Perl malloc.
2501
2502 =item *
2503
2504 IRIX
2505
2506 Numerous compilation flag and hint enhancements; accidental mixing
2507 of 32-bit and 64-bit libraries (a doomed attempt) made much harder.
2508
2509 =item *
2510
2511 Linux
2512
2513 =over 8
2514
2515 =item *
2516
2517 Long doubles should now work (see INSTALL). [561]
2518
2519 =item *
2520
2521 Linux previously had problems related to sockaddrlen when using
2522 accept(), recvfrom() (in Perl: recv()), getpeername(), and
2523 getsockname().
2524
2525 =back
2526
2527 =item *
2528
2529 Mac OS Classic
2530
2531 Compilation of the standard Perl distribution in Mac OS Classic should
2532 now work if you have the Metrowerks development environment and the
2533 missing Mac-specific toolkit bits.  Contact the macperl mailing list
2534 for details.
2535
2536 =item *
2537
2538 MPE/iX
2539
2540 MPE/iX update after Perl 5.6.0.  See README.mpeix. [561]
2541
2542 =item *
2543
2544 NetBSD/threads: try installing the GNU pth (should be in the
2545 packages collection, or http://www.gnu.org/software/pth/),
2546 and Configure with -Duseithreads.
2547
2548 =item *
2549
2550 NetBSD/sparc
2551
2552 Perl now works on NetBSD/sparc.
2553
2554 =item *
2555
2556 OS/2
2557
2558 Now works with usethreads (see INSTALL). [561]
2559
2560 =item *
2561
2562 Solaris
2563
2564 64-bitness using the Sun Workshop compiler now works.
2565
2566 =item *
2567
2568 Stratus VOS
2569
2570 The native build method requires at least VOS Release 14.5.0
2571 and GNU C++/GNU Tools 2.0.1 or later.  The Perl pack function
2572 now maps overflowed values to +infinity and underflowed values
2573 to -infinity.
2574
2575 =item *
2576
2577 Tru64 (aka Digital UNIX, aka DEC OSF/1)
2578
2579 The operating system version letter now recorded in $Config{osvers}.
2580 Allow compiling with gcc (previously explicitly forbidden).  Compiling
2581 with gcc still not recommended because buggy code results, even with
2582 gcc 2.95.2.
2583
2584 =item *
2585
2586 Unicos
2587
2588 Fixed various alignment problems that lead into core dumps either
2589 during build or later; no longer dies on math errors at runtime;
2590 now using full quad integers (64 bits), previously was using
2591 only 46 bit integers for speed.
2592
2593 =item *
2594
2595 VMS
2596
2597 See L</"Socket Extension Dynamic in VMS"> and L</"IEEE-format Floating Point
2598 Default on OpenVMS Alpha"> for important changes not otherwise listed here.
2599
2600 chdir() now works better despite a CRT bug; now works with MULTIPLICITY
2601 (see INSTALL); now works with Perl's malloc.
2602
2603 The tainting of C<%ENV> elements via C<keys> or C<values> was previously
2604 unimplemented.  It now works as documented.
2605
2606 The C<waitpid> emulation has been improved.  The worst bug (now fixed)
2607 was that a pid of -1 would cause a wildcard search of all processes on
2608 the system.
2609
2610 POSIX-style signals are now emulated much better on VMS versions prior
2611 to 7.0.
2612
2613 The C<system> function and backticks operator have improved
2614 functionality and better error handling. [561]
2615
2616 File access tests now use current process privileges rather than the
2617 user's default privileges, which could sometimes result in a mismatch
2618 between reported access and actual access.  This improvement is only
2619 available on VMS v6.0 and later.
2620
2621 There is a new C<kill> implementation based on C<sys$sigprc> that allows
2622 older VMS systems (pre-7.0) to use C<kill> to send signals rather than
2623 simply force exit.  This implementation also allows later systems to
2624 call C<kill> from within a signal handler.
2625
2626 Iterative logical name translations are now limited to 10 iterations in
2627 imitation of SHOW LOGICAL and other OpenVMS facilities.
2628
2629 =item *
2630
2631 Windows
2632
2633 =over 8
2634
2635 =item *
2636
2637 Signal handling now works better than it used to.  It is now implemented
2638 using a Windows message loop, and is therefore less prone to random
2639 crashes.
2640
2641 =item *
2642
2643 fork() emulation is now more robust, but still continues to have a few
2644 esoteric bugs and caveats.  See L<perlfork> for details. [561+]
2645
2646 =item *
2647
2648 A failed (pseudo)fork now returns undef and sets errno to EAGAIN. [561]
2649
2650 =item *
2651
2652 The following modules now work on Windows:
2653
2654     ExtUtils::Embed         [561]
2655     IO::Pipe
2656     IO::Poll
2657     Net::Ping
2658
2659 =item *
2660
2661 IO::File::new_tmpfile() is no longer limited to 32767 invocations
2662 per-process.
2663
2664 =item *
2665
2666 Better chdir() return value for a non-existent directory.
2667
2668 =item *
2669
2670 Compiling perl using the 64-bit Platform SDK tools is now supported.
2671
2672 =item *
2673
2674 The Win32::SetChildShowWindow() builtin can be used to control the
2675 visibility of windows created by child processes.  See L<Win32> for
2676 details.
2677
2678 =item *
2679
2680 Non-blocking waits for child processes (or pseudo-processes) are
2681 supported via C<waitpid($pid, &POSIX::WNOHANG)>.
2682
2683 =item *
2684
2685 The behavior of system() with multiple arguments has been rationalized.
2686 Each unquoted argument will be automatically quoted to protect whitespace,
2687 and any existing whitespace in the arguments will be preserved.  This
2688 improves the portability of system(@args) by avoiding the need for
2689 Windows C<cmd> shell specific quoting in perl programs.
2690
2691 Note that this means that some scripts that may have relied on earlier
2692 buggy behavior may no longer work correctly.  For example,
2693 C<system("nmake /nologo", @args)> will now attempt to run the file
2694 C<nmake /nologo> and will fail when such a file isn't found.
2695 On the other hand, perl will now execute code such as
2696 C<system("c:/Program Files/MyApp/foo.exe", @args)> correctly.
2697
2698 =item *
2699
2700 The perl header files no longer suppress common warnings from the
2701 Microsoft Visual C++ compiler.  This means that additional warnings may
2702 now show up when compiling XS code.
2703
2704 =item *
2705
2706 Borland C++ v5.5 is now a supported compiler that can build Perl.
2707 However, the generated binaries continue to be incompatible with those
2708 generated by the other supported compilers (GCC and Visual C++). [561]
2709
2710 =item *
2711
2712 Duping socket handles with open(F, ">&MYSOCK") now works under Windows 9x.
2713 [561]
2714
2715 =item *
2716
2717 Current directory entries in %ENV are now correctly propagated to child
2718 processes. [561]
2719
2720 =item *
2721
2722 New %ENV entries now propagate to subprocesses. [561]
2723
2724 =item *
2725
2726 Win32::GetCwd() correctly returns C:\ instead of C: when at the drive root.
2727 Other bugs in chdir() and Cwd::cwd() have also been fixed. [561]
2728
2729 =item *
2730
2731 The makefiles now default to the features enabled in ActiveState ActivePerl
2732 (a popular Win32 binary distribution). [561]
2733
2734 =item *
2735
2736 HTML files will now be installed in c:\perl\html instead of
2737 c:\perl\lib\pod\html
2738
2739 =item *
2740
2741 REG_EXPAND_SZ keys are now allowed in registry settings used by perl. [561]
2742
2743 =item *
2744
2745 Can now send() from all threads, not just the first one. [561]
2746
2747 =item *
2748
2749 ExtUtils::MakeMaker now uses $ENV{LIB} to search for libraries. [561]
2750
2751 =item *
2752
2753 Less stack reserved per thread so that more threads can run
2754 concurrently. (Still 16M per thread.) [561]
2755
2756 =item *
2757
2758 C<< File::Spec->tmpdir() >> now prefers C:/temp over /tmp
2759 (works better when perl is running as service).
2760
2761 =item *
2762
2763 Better UNC path handling under ithreads. [561]
2764
2765 =item *
2766
2767 wait(), waitpid(), and backticks now return the correct exit status
2768 under Windows 9x. [561]
2769
2770 =item *
2771
2772 A socket handle leak in accept() has been fixed. [561]
2773
2774 =back
2775
2776 =back
2777
2778 =head1 New or Changed Diagnostics
2779
2780 =over 4
2781
2782 =item *
2783
2784 The lexical warnings category "deprecated" is no longer a sub-category
2785 of the "syntax" category. It is now a top-level category in its own
2786 right.
2787
2788 =item *
2789
2790 All regular expression compilation error messages are now hopefully
2791 easier to understand both because the error message now comes before
2792 the failed regex and because the point of failure is now clearly
2793 marked by a C<E<lt>-- HERE> marker.
2794
2795 =item *
2796
2797 The various "opened only for", "on closed", "never opened" warnings
2798 drop the C<main::> prefix for filehandles in the C<main> package,
2799 for example C<STDIN> instead of C<main::STDIN>.
2800
2801 =item *
2802
2803 The "Unrecognized escape" warning has been extended to include C<\8>,
2804 C<\9>, and C<\_>.  There is no need to escape any of the C<\w> characters.
2805
2806 =item *
2807
2808 Two new debugging options have been added: if you have compiled your
2809 Perl with debugging, you can use the -DT [561] and -DR options to trace
2810 tokenising and to add reference counts to displaying variables,
2811 respectively.
2812
2813 =item *
2814
2815 Several debugger fixes: exit code now reflects the script exit code,
2816 condition C<"0"> now treated correctly, the C<d> command now checks
2817 line number, C<$.> no longer gets corrupted, and all debugger output
2818 now goes correctly to the socket if RemotePort is set. [561]
2819
2820 =item *
2821
2822 The debugger (perl5db.pl) has been modified to present a more
2823 consistent commands interface, via (CommandSet=580).  perl5db.t was
2824 also added to test the changes, and as a placeholder for further tests.
2825
2826 See L<perldebug>.
2827
2828 =item *
2829
2830 The debugger has a new C<dumpDepth> option to control the maximum
2831 depth to which nested structures are dumped.  The C<x> command has
2832 been extended so that C<x N EXPR> dumps out the value of I<EXPR> to a
2833 depth of at most I<N> levels.
2834
2835 =item *
2836
2837 The debugger can now show lexical variables if you have the CPAN
2838 module PadWalker installed.
2839
2840 =item *
2841
2842 If an attempt to use a (non-blessed) reference as an array index
2843 is made, a warning is given.
2844
2845 =item *
2846
2847 C<push @a;> and C<unshift @a;> (with no values to push or unshift)
2848 now give a warning.  This may be a problem for generated and evaled
2849 code.
2850
2851 =item *
2852
2853 If you try to L<perlfunc/pack> a number less than 0 or larger than 255
2854 using the C<"C"> format you will get an optional warning.  Similarly
2855 for the C<"c"> format and a number less than -128 or more than 127.
2856
2857 =item *
2858
2859 Certain regex modifiers such as C<(?o)> make sense only if applied to
2860 the entire regex.  You will get an optional warning if you try to do
2861 otherwise.
2862
2863 =item *
2864
2865 Using arrays or hashes as references (e.g. C<< %foo->{bar} >>
2866 has been deprecated for a while.  Now you will get an optional warning.
2867
2868 =item *
2869
2870 Using C<sort> in scalar context now issues an optional warning.
2871 This didn't do anything useful, as the sort was not performed.
2872
2873 =back
2874
2875 =head1 Changed Internals
2876
2877 =over 4
2878
2879 =item *
2880
2881 perlapi.pod (a companion to perlguts) now attempts to document the
2882 internal API.
2883
2884 =item *
2885
2886 You can now build a really minimal perl called microperl.
2887 Building microperl does not require even running Configure;
2888 C<make -f Makefile.micro> should be enough.  Beware: microperl makes
2889 many assumptions, some of which may be too bold; the resulting
2890 executable may crash or otherwise misbehave in wondrous ways.
2891 For careful hackers only.
2892
2893 =item *
2894
2895 Added rsignal(), whichsig(), do_join(), op_clear, op_null,
2896 ptr_table_clear(), ptr_table_free(), sv_setref_uv(), and several UTF-8
2897 interfaces to the publicised API.  For the full list of the available
2898 APIs see L<perlapi>.
2899
2900 =item *
2901
2902 Made possible to propagate customised exceptions via croak()ing.
2903
2904 =item *
2905
2906 Now xsubs can have attributes just like subs.  (Well, at least the
2907 built-in attributes.)
2908
2909 =item *
2910
2911 dTHR and djSP have been obsoleted; the former removed (because it's
2912 a no-op) and the latter replaced with dSP.
2913
2914 =item *
2915
2916 PERL_OBJECT has been completely removed.
2917
2918 =item *
2919
2920 The MAGIC constants (e.g. C<'P'>) have been macrofied
2921 (e.g. C<PERL_MAGIC_TIED>) for better source code readability
2922 and maintainability.
2923
2924 =item *
2925
2926 The regex compiler now maintains a structure that identifies nodes in
2927 the compiled bytecode with the corresponding syntactic features of the
2928 original regex expression.  The information is attached to the new
2929 C<offsets> member of the C<struct regexp>. See L<perldebguts> for more
2930 complete information.
2931
2932 =item *
2933
2934 The C code has been made much more C<gcc -Wall> clean.  Some warning
2935 messages still remain in some platforms, so if you are compiling with
2936 gcc you may see some warnings about dubious practices.  The warnings
2937 are being worked on.
2938
2939 =item *
2940
2941 F<perly.c>, F<sv.c>, and F<sv.h> have now been extensively commented.
2942
2943 =item *
2944
2945 Documentation on how to use the Perl source repository has been added
2946 to F<Porting/repository.pod>.
2947
2948 =item *
2949
2950 There are now several profiling make targets.
2951
2952 =back
2953
2954 =head1 Security Vulnerability Closed [561]
2955
2956 (This change was already made in 5.7.0 but bears repeating here.)
2957 (5.7.0 came out before 5.6.1: the development branch 5.7 released
2958 sooner than the maintenance branch 5.6)
2959
2960 A potential security vulnerability in the optional suidperl component
2961 of Perl was identified in August 2000.  suidperl is neither built nor
2962 installed by default.  As of November 2001 the only known vulnerable
2963 platform is Linux, most likely all Linux distributions.  CERT and
2964 various vendors and distributors have been alerted about the vulnerability.
2965 See http://www.cpan.org/src/5.0/sperl-2000-08-05/sperl-2000-08-05.txt
2966 for more information.
2967
2968 The problem was caused by Perl trying to report a suspected security
2969 exploit attempt using an external program, /bin/mail.  On Linux
2970 platforms the /bin/mail program had an undocumented feature which
2971 when combined with suidperl gave access to a root shell, resulting in
2972 a serious compromise instead of reporting the exploit attempt.  If you
2973 don't have /bin/mail, or if you have 'safe setuid scripts', or if
2974 suidperl is not installed, you are safe.
2975
2976 The exploit attempt reporting feature has been completely removed from
2977 Perl 5.8.0 (and the maintenance release 5.6.1, and it was removed also
2978 from all the Perl 5.7 releases), so that particular vulnerability
2979 isn't there anymore.  However, further security vulnerabilities are,
2980 unfortunately, always possible.  The suidperl functionality is most
2981 probably going to be removed in Perl 5.10.  In any case, suidperl
2982 should only be used by security experts who know exactly what they are
2983 doing and why they are using suidperl instead of some other solution
2984 such as sudo ( see http://www.courtesan.com/sudo/ ).
2985
2986 =head1 New Tests
2987
2988 Several new tests have been added, especially for the F<lib> and F<ext>
2989 subsections.  There are now about 65 000 individual tests (spread over
2990 about 700 test scripts), in the regression suite (5.6.1 has about
2991 11700 tests, in 258 test scripts)  Many of the new tests are of course
2992 introduced by the new modules, but still in general Perl is now more
2993 thoroughly tested.
2994
2995 Because of the large number of tests, running the regression suite
2996 will take considerably longer time than it used to: expect the suite
2997 to take up to 4-5 times longer to run than in perl 5.6.  On a really
2998 fast machine you can hope to finish the suite in about 6-8 minutes
2999 (wallclock time).
3000
3001 The tests are now reported in a different order than in earlier Perls.
3002 (This happens because the test scripts from under t/lib have been moved
3003 to be closer to the library/extension they are testing.)
3004
3005 =head1 Known Problems
3006
3007 =head2 AIX
3008
3009 =over 4
3010
3011 =item *
3012
3013 If using the AIX native make command, instead of just "make" issue
3014 "make all".  In some setups the former has been known to spuriously
3015 also try to run "make install".  Alternatively, you may want to use
3016 GNU make.
3017
3018 =item *
3019
3020 In AIX 4.2, Perl extensions that use C++ functions that use statics
3021 may have problems in that the statics are not getting initialized.
3022 In newer AIX releases, this has been solved by linking Perl with
3023 the libC_r library, but unfortunately in AIX 4.2 the said library
3024 has an obscure bug where the various functions related to time
3025 (such as time() and gettimeofday()) return broken values, and
3026 therefore in AIX 4.2 Perl is not linked against libC_r.
3027
3028 =item *
3029
3030 vac 5.0.0.0 May Produce Buggy Code For Perl
3031
3032 The AIX C compiler vac version 5.0.0.0 may produce buggy code,
3033 resulting in a few random tests failing when run as part of "make
3034 test", but when the failing tests are run by hand, they succeed.
3035 We suggest upgrading to at least vac version 5.0.1.0, that has been
3036 known to compile Perl correctly.  "lslpp -L|grep vac.C" will tell
3037 you the vac version.  See README.aix.
3038
3039 =item *
3040
3041 If building threaded Perl, you may get compilation warning from pp_sys.c:
3042
3043   "pp_sys.c", line 4651.39: 1506-280 (W) Function argument assignment between types "unsigned char*" and "const void*" is not allowed.
3044
3045 This is harmless; it is caused by the getnetbyaddr() and getnetbyaddr_r()
3046 having slightly different types for their first argument.
3047
3048 =back
3049
3050 =head2 Alpha systems with old gccs fail several tests
3051
3052 If you see op/pack, op/pat, op/regexp, or ext/Storable tests failing
3053 in a Linux/alpha or *BSD/Alpha, it's probably time to upgrade your gcc.
3054 gccs prior to 2.95.3 are definitely not good enough, and gcc 3.1 may
3055 be even better.  (RedHat Linux/alpha with gcc 3.1 reported no problems,
3056 as did Linux 2.4.18 with gcc 2.95.4.)  (In Tru64, it is preferable to
3057 use the bundled C compiler.)
3058
3059 =head2 AmigaOS
3060
3061 Perl 5.8.0 doesn't build in AmigaOS.  It broke at some point during
3062 the ithreads work and we could not find Amiga experts to unbreak the
3063 problems.  Perl 5.6.1 still works for AmigaOS (as does the the 5.7.2
3064 development release).
3065
3066 =head2 BeOS
3067
3068 The following tests fail on 5.8.0 Perl in BeOS Personal 5.03:
3069
3070  t/op/lfs............................FAILED at test 17
3071  t/op/magic..........................FAILED at test 24
3072  ext/POSIX/t/sigaction...............FAILED at test 13
3073  ext/POSIX/t/waitpid.................FAILED at test 1
3074
3075 See L<perlbeos> (README.beos) for more details.
3076
3077 =head2 Cygwin "unable to remap"
3078
3079 For example when building the Tk extension for Cygwin,
3080 you may get an error message saying "unable to remap".
3081 This is known problem with Cygwin, and a workaround is
3082 detailed in here: http://sources.redhat.com/ml/cygwin/2001-12/msg00894.html
3083
3084 =head2 ext/threads/t/libc
3085
3086 If this test fails, it indicates that your libc (C library) is not
3087 threadsafe.  This particular test stress tests the localtime() call to
3088 find out whether it is threadsafe.  See L<perlthrtut> for more information.
3089
3090 =head2 FreeBSD built with ithreads coredumps reading large directories
3091
3092 This is a known bug in FreeBSD's readdir_r() (see L<perlfreebsd>
3093 (README.freebsd)), which hopefully will be fixed in FreeBSD 4.6.
3094
3095 =head2 FreeBSD Failing locale Test 117 For ISO 8859-15 Locales
3096
3097 The ISO 8859-15 locales may fail the locale test 117 in FreeBSD.
3098 This is caused by the characters \xFF (y with diaeresis) and \xBE
3099 (Y with diaeresis) not behaving correctly when being matched
3100 case-insensitively.  Apparently this problem has been fixed in
3101 the latest FreeBSD releases.
3102 ( http://www.freebsd.org/cgi/query-pr.cgi?pr=34308 )
3103
3104 =head2 IRIX fails ext/List/Util/t/shuffle.t
3105
3106 IRIX with MIPSpro 7.3.1.3m compiler may fail the said List::Util test
3107 by dumping core.  This seems to be a compiler error since if compiled
3108 with gcc no core dump ensues, and no failures on the said test on any
3109 other platform.
3110
3111 =head2 Modifying $_ Inside for(..)
3112
3113    for (1..5) { $_++ }
3114
3115 works without complaint.  It shouldn't.  (You should be able to
3116 modify only lvalue elements inside the loops.)  You can see the
3117 correct behaviour by replacing the 1..5 with 1, 2, 3, 4, 5.
3118
3119 =head2 mod_perl 1.26 Doesn't Build With Threaded Perl
3120
3121 Use mod_perl 1.27 or higher.
3122
3123 =head2 lib/ftmp-security tests warn 'system possibly insecure'
3124
3125 Don't panic.  Read the 'make test' section of INSTALL instead.
3126
3127 =head2 HP-UX lib/posix Subtest 9 Fails When LP64-Configured
3128
3129 If perl is configured with -Duse64bitall, the successful result of the
3130 subtest 10 of lib/posix may arrive before the successful result of the
3131 subtest 9, which confuses the test harness so much that it thinks the
3132 subtest 9 failed.
3133
3134 =head2 Linux with glibc 2.2.5 fails t/op/int subtest #6 with -Duse64bitint
3135
3136 This is a known bug in the glibc 2.2.5 with long long integers.
3137 ( http://bugzilla.redhat.com/bugzilla/show_bug.cgi?id=65612 )
3138
3139 =head2 Linux With Sfio Fails op/misc Test 48
3140
3141 No known fix.
3142
3143 =head2 libwww-perl (LWP) fails base/date #51
3144
3145 Use libwww-perl 5.65 or later.
3146
3147 =head2 Mac OS X
3148
3149 Please remember to set your environment variable LC_ALL to "C"
3150 (setenv LC_ALL C) before running "make test" to avoid a lot of
3151 warnings about the broken locales of Mac OS X.
3152
3153 The following tests are known to fail in Mac OS X 10.1.5 because of
3154 buggy (old) implementations of Berkeley DB included in Mac OS X:
3155
3156  Failed Test                 Stat Wstat Total Fail  Failed  List of Failed
3157  -------------------------------------------------------------------------
3158  ../ext/DB_File/t/db-btree.t    0    11    ??   ??       %  ??
3159  ../ext/DB_File/t/db-recno.t              149    3   2.01%  61 63 65
3160
3161 If you are building on a UFS partition, you will also probably see
3162 t/op/stat.t subtest #9 fail.  This is caused by Darwin's UFS not
3163 supporting inode change time.
3164
3165 Also the ext/POSIX/t/posix.t subtest #10 fails but it is skipped for
3166 now because the failure is Apple's fault, not Perl's (blocked signals
3167 are lost).
3168
3169 If you Configure with ithreads, ext/threads/t/libc.t will fail. Again,
3170 this is not Perl's fault-- the libc of Mac OS X is not threadsafe
3171 (in this particular test, the localtime() call is found to be
3172 threadunsafe.)
3173
3174 =head2 OS/2 Test Failures
3175
3176 The following tests are known to fail on OS/2 (for clarity
3177 only the failures are shown, not the full error messages):
3178
3179 t/io/utf8............................FAILED at test 19
3180 t/op/grent...........................FAILED at test 2
3181 t/op/pwent...........................FAILED at test 1
3182 t/lib/os2_base.......................FAILED at test 13
3183 t/lib/os2_process....................FAILED at test 10
3184 t/lib/os2_process_kid................FAILED at test 10
3185 t/lib/rx_cmprt.......................FAILED at test 16
3186 ext/DB_File/t/db-btree...............FAILED at test 0
3187 ext/DB_File/t/db-hash................FAILED at test 0
3188 ext/DB_File/t/db-recno...............FAILED at test 0
3189 lib/ExtUtils/t/basic.................FAILED at test 14
3190 lib/ExtUtils/t/Constant..............FAILED at test 4
3191 lib/Memoize/t/errors.................FAILED at test 4
3192
3193 =head2 op/sprintf tests 91, 129, and 130
3194
3195 The op/sprintf tests 91, 129, and 130 are known to fail on some platforms.
3196 Examples include any platform using sfio, and Compaq/Tandem's NonStop-UX.
3197
3198 Test 91 is known to fail on QNX6 (nto), because C<sprintf '%e',0>
3199 incorrectly produces C<0.000000e+0> instead of C<0.000000e+00>.
3200
3201 For tests 129 and 130, the failing platforms do not comply with
3202 the ANSI C Standard: lines 19ff on page 134 of ANSI X3.159 1989, to
3203 be exact.  (They produce something other than "1" and "-1" when
3204 formatting 0.6 and -0.6 using the printf format "%.0f"; most often,
3205 they produce "0" and "-0".)
3206
3207 =head2 Solaris 2.5
3208
3209 In case you are still using Solaris 2.5 (aka SunOS 5.5), you may
3210 experience failures (the test core dumping) in lib/locale.t.
3211 The suggested cure is to upgrade your Solaris.
3212
3213 =head2 Solaris x86 Fails Tests With -Duse64bitint
3214
3215 The following tests are known to fail in Solaris x86 with Perl
3216 configured to use 64 bit integers:
3217
3218  ext/Data/Dumper/t/dumper.............FAILED at test 268
3219  ext/Devel/Peek/Peek..................FAILED at test 7
3220
3221 =head2 SUPER-UX (NEC SX)
3222
3223 The following tests are known to fail on SUPER-UX:
3224
3225  op/64bitint...........................FAILED tests 29-30, 32-33, 35-36
3226  op/arith..............................FAILED tests 128-130
3227  op/pack...............................FAILED tests 25-5625
3228  op/pow................................
3229  op/taint..............................# msgsnd failed
3230  ../ext/IO/lib/IO/t/io_poll............FAILED tests 3-4
3231  ../ext/IPC/SysV/ipcsysv...............FAILED tests 2, 5-6
3232  ../ext/IPC/SysV/t/msg.................FAILED tests 2, 4-6
3233  ../ext/Socket/socketpair..............FAILED tests 12
3234  ../lib/IPC/SysV.......................FAILED tests 2, 5-6
3235  ../lib/warnings.......................FAILED tests 115-116, 118-119
3236
3237 The op/pack failure ("Cannot compress negative numbers at op/pack.t line 126")
3238 is serious but as of yet unsolved.  It points at some problems with the
3239 signedness handling of the C compiler, as do the 64bitint, arith, and pow
3240 failures.  Most of the rest point at problems with SysV IPC.
3241
3242 =head2 PDL failing some tests
3243
3244 Use PDL 2.3.4 or later.
3245
3246 =head2 Term::ReadKey not working on Win32
3247
3248 Use Term::ReadKey 2.20 or later.
3249
3250 =head2 Failure of Thread (5.005-style) tests
3251
3252 B<Note that support for 5.005-style threading is deprecated,
3253 experimental and practically unsupported.  In 5.10, it is expected
3254 to be removed.>
3255
3256 The following tests are known to fail due to fundamental problems in
3257 the 5.005 threading implementation. These are not new failures--Perl
3258 5.005_0x has the same bugs, but didn't have these tests.
3259
3260  ../ext/B/t/xref.t                  255 65280    14   12  85.71%  3-14
3261  ../ext/List/Util/t/first.t         255 65280     7    4  57.14%  2 5-7
3262  ../lib/English.t                     2   512    54    2   3.70%  2-3
3263  ../lib/ExtUtils/t/basic.t            1   256    17    1   5.88%  14
3264  ../lib/FileCache.t                               5    1  20.00%  5
3265  ../lib/Filter/Simple/t/data.t                    6    3  50.00%  1-3
3266  ../lib/Filter/Simple/t/filter_onl                9    3  33.33%  1-2 5
3267  ../lib/Tie/File/t/31_autodefer.t   255 65280    65   32  49.23%  34-65
3268  ../lib/autouse.t                                10    1  10.00%  4
3269  op/flip.t                                       15    1   6.67%  15
3270
3271 These failures are unlikely to get fixed as 5.005-style threads
3272 are considered fundamentally broken.  (Basically what happens is that
3273 competing threads can corrupt shared global state.)
3274
3275 =head2 Timing problems
3276
3277 The following tests may fail intermittently because of timing
3278 problems, for example if the system is heavily loaded.
3279
3280     t/op/alarm.t
3281     ext/Time/HiRes/HiRes.t
3282     lib/Benchmark.t
3283     lib/Memoize/t/expmod_t.t
3284     lib/Memoize/t/speed.t
3285
3286 In case of failure please try running them manually, for example
3287
3288     ./perl -Ilib ext/Time/HiRes/HiRes.t
3289
3290 =head2 Unicode in package/class and subroutine names does not work
3291
3292 One can have Unicode in identifier names, but not in package/class or
3293 subroutine names.  While some limited functionality towards this does
3294 exist as of Perl 5.8.0, that is more accidental than designed; use of
3295 Unicode for the said purposes is unsupported.
3296
3297 One reason of this unfinishedness is its (currently) inherent
3298 unportability: since both package names and subroutine names may
3299 need to be mapped to file and directory names, the Unicode capability
3300 of the filesystem becomes important-- and there unfortunately aren't
3301 portable answers.
3302
3303 =head2 UNICOS/mk
3304
3305 =over 4
3306
3307 =item *
3308
3309 During Configure, the test
3310
3311     Guessing which symbols your C compiler and preprocessor define...
3312
3313 will probably fail with error messages like
3314
3315     CC-20 cc: ERROR File = try.c, Line = 3
3316       The identifier "bad" is undefined.
3317
3318       bad switch yylook 79bad switch yylook 79bad switch yylook 79bad switch yylook 79#ifdef A29K
3319       ^
3320
3321     CC-65 cc: ERROR File = try.c, Line = 3
3322       A semicolon is expected at this point.
3323
3324 This is caused by a bug in the awk utility of UNICOS/mk.  You can ignore
3325 the error, but it does cause a slight problem: you cannot fully
3326 benefit from the h2ph utility (see L<h2ph>) that can be used to
3327 convert C headers to Perl libraries, mainly used to be able to access
3328 from Perl the constants defined using C preprocessor, cpp.  Because of
3329 the above error, parts of the converted headers will be invisible.
3330 Luckily, these days the need for h2ph is rare.
3331
3332 =item *
3333
3334 If building Perl with interpreter threads (ithreads), the
3335 getgrent(), getgrnam(), and getgrgid() functions cannot return the
3336 list of the group members due to a bug in the multithreaded support of
3337 UNICOS/mk.  What this means is that in list context the functions will
3338 return only three values, not four.
3339
3340 =back
3341
3342 =head2 UTS
3343
3344 There are a few known test failures, see L<perluts> (README.uts).
3345
3346 =head2 VOS (Stratus)
3347
3348 When Perl is built using the native build process on VOS Release
3349 14.5.0 and GNU C++/GNU Tools 2.0.1, all attempted tests either
3350 pass or result in TODO (ignored) failures.
3351
3352 =head2 VMS
3353
3354 There should be no reported test failures with a default configuration,
3355 though there are a number of tests marked TODO that point to areas
3356 needing further debugging and/or porting work.
3357
3358 =head2 Win32
3359
3360 In multi-CPU boxes, there are some problems with the I/O buffering:
3361 some output may appear twice.
3362
3363 =head2 XML::Parser not working
3364
3365 Use XML::Parser 2.31 or later.
3366
3367 =head2 z/OS (OS/390)
3368
3369 z/OS has rather many test failures but the situation is actually
3370 better than it was in 5.6.0; it's just that so many new modules and
3371 tests have been added.
3372
3373  Failed Test                   Stat Wstat Total Fail  Failed  List of Failed
3374  ---------------------------------------------------------------------------
3375  ../ext/Data/Dumper/t/dumper.t              357    8   2.24%  311 314 325 327
3376                                                               331 333 337 339
3377  ../ext/IO/lib/IO/t/io_unix.t                 5    4  80.00%  2-5
3378  ../ext/Storable/t/downgrade.t   12  3072   169   12   7.10%  14-15 46-47 78-79
3379                                                               110-111 150 161
3380  ../lib/ExtUtils/t/Constant.t   121 30976    48   48 100.00%  1-48
3381  ../lib/ExtUtils/t/Embed.t                    9    9 100.00%  1-9
3382  op/pat.t                                   910    7   0.77%  665 776 785 832-
3383                                                               834 845
3384  op/sprintf.t                               224    3   1.34%  98 100 136
3385  op/tr.t                                     97    5   5.15%  63 71-74
3386  uni/fold.t                                 780    6   0.77%  61 169 196 661
3387                                                               710-711
3388
3389 The failures in dumper.t and downgrade.t are problems in the tests,
3390 those in io_unix and sprintf are problems in the USS (UDP sockets
3391 and printf formats).  The pat, tr, and fold failures are genuine Perl
3392 problems caused by EBCDIC (and in the pat and fold cases, combining
3393 that with Unicode).  The Constant and Embed are probably problems
3394 in the tests (since they test Perl's ability to build extensions,
3395 and that seems to be working reasonably well.)
3396
3397 =head2 Localising Tied Arrays and Hashes Is Broken
3398
3399     local %tied_array;
3400
3401 doesn't work as one would expect: the old value is restored
3402 incorrectly.  This will be changed in a future release, but we don't
3403 know yet what the new semantics will exactly be.  In any case, the
3404 change will break existing code that relies on the current
3405 (ill-defined) semantics, so just avoid doing this in general.
3406
3407 =head2 Self-tying Problems
3408
3409 Self-tying of arrays and hashes is broken in rather deep and
3410 hard-to-fix ways.  As a stop-gap measure to avoid people from getting
3411 frustrated at the mysterious results (core dumps, most often), it is
3412 forbidden for now (you will get a fatal error even from an attempt).
3413
3414 A change to self-tying of globs has caused them to be recursively
3415 referenced (see: L<perlobj/"Two-Phased Garbage Collection">).  You
3416 will now need an explicit untie to destroy a self-tied glob.  This
3417 behaviour may be fixed at a later date.
3418
3419 Self-tying of scalars and IO thingies works.
3420
3421 =head2 Tied/Magical Array/Hash Elements Do Not Autovivify
3422
3423 For normal arrays C<$foo = \$bar[1]> will assign C<undef> to
3424 C<$bar[1]> (assuming that it didn't exist before), but for
3425 tied/magical arrays and hashes such autovivification does not happen
3426 because there is currently no way to catch the reference creation.
3427 The same problem affects slicing over non-existent indices/keys of
3428 a tied/magical array/hash.
3429
3430 =head2 Building Extensions Can Fail Because Of Largefiles
3431
3432 Some extensions like mod_perl are known to have issues with
3433 `largefiles', a change brought by Perl 5.6.0 in which file offsets
3434 default to 64 bits wide, where supported.  Modules may fail to compile
3435 at all, or they may compile and work incorrectly.  Currently, there
3436 is no good solution for the problem, but Configure now provides
3437 appropriate non-largefile ccflags, ldflags, libswanted, and libs
3438 in the %Config hash (e.g., $Config{ccflags_nolargefiles}) so the
3439 extensions that are having problems can try configuring themselves
3440 without the largefileness.  This is admittedly not a clean solution,
3441 and the solution may not even work at all.  One potential failure is
3442 whether one can (or, if one can, whether it's a good idea to) link
3443 together at all binaries with different ideas about file offsets;
3444 all this is platform-dependent.
3445
3446 =head2 Unicode Support on EBCDIC Still Spotty
3447
3448 Though mostly working, Unicode support still has problem spots on
3449 EBCDIC platforms.  One such known spot are the C<\p{}> and C<\P{}>
3450 regular expression constructs for code points less than 256: the
3451 C<pP> are testing for Unicode code points, not knowing about EBCDIC.
3452
3453 =head2 The Compiler Suite Is Still Very Experimental
3454
3455 The compiler suite is slowly getting better but it continues to be
3456 highly experimental.  Use in production environments is discouraged.
3457
3458 =head2 The Long Double Support Is Still Experimental
3459
3460 The ability to configure Perl's numbers to use "long doubles",
3461 floating point numbers of hopefully better accuracy, is still
3462 experimental.  The implementations of long doubles are not yet
3463 widespread and the existing implementations are not quite mature
3464 or standardised, therefore trying to support them is a rare
3465 and moving target.  The gain of more precision may also be offset
3466 by slowdown in computations (more bits to move around, and the
3467 operations are more likely to be executed by less optimised
3468 libraries).
3469
3470 =head2 Seen In Perl 5.7 But Gone Now
3471
3472 C<Time::Piece> (previously known as C<Time::Object>) was removed
3473 because it was felt that it didn't have enough value in it to be a
3474 core module.  It is still a useful module, though, and is available
3475 from the CPAN.
3476
3477 Perl 5.8 unfortunately does not build anymore on AmigaOS; this broke
3478 accidentally at some point.  Since there are not that many Amiga
3479 developers available, we could not get this fixed and tested in time
3480 for 5.8.0.  Perl 5.6.1 still works for AmigaOS (as does the the 5.7.2
3481 development release).
3482
3483 =head1 Reporting Bugs
3484
3485 If you find what you think is a bug, you might check the articles
3486 recently posted to the comp.lang.perl.misc newsgroup and the perl
3487 bug database at http://bugs.perl.org/ .  There may also be
3488 information at http://www.perl.com/ , the Perl Home Page.
3489
3490 If you believe you have an unreported bug, please run the B<perlbug>
3491 program included with your release.  Be sure to trim your bug down
3492 to a tiny but sufficient test case.  Your bug report, along with the
3493 output of C<perl -V>, will be sent off to perlbug@perl.org to be
3494 analysed by the Perl porting team.
3495
3496 =head1 SEE ALSO
3497
3498 The F<Changes> file for exhaustive details on what changed.
3499
3500 The F<INSTALL> file for how to build Perl.
3501
3502 The F<README> file for general stuff.
3503
3504 The F<Artistic> and F<Copying> files for copyright information.
3505
3506 =head1 HISTORY
3507
3508 Written by Jarkko Hietaniemi <F<jhi@iki.fi>>.
3509
3510 =cut