Small perldelta tweaks.
[p5sagit/p5-mst-13.2.git] / pod / perldelta.pod
1 =head1 NAME
2
3 perldelta - what is new for perl v5.8.0
4
5 =head1 DESCRIPTION
6
7 This document describes differences between the 5.6.0 release
8 and the 5.8.0 release.
9
10 Many of the bug fixes in 5.8.0 were already seen in the 5.6.1
11 maintenance release since the two releases were kept closely
12 coordinated.
13
14 If you are upgrading from Perl 5.005_03, you might also want
15 to read L<perl56delta>.
16
17 =head1 Highlights In 5.8.0
18
19 =over 4
20
21 =item *
22
23 Better Unicode support
24
25 =item *
26
27 New Thread Implementation
28
29 =item *
30
31 Many New Modules
32
33 =item *
34
35 Better Numeric Accuracy
36
37 =item *
38
39 Safe Signals
40
41 =item *
42
43 More Extensive Regression Testing
44
45 =back
46
47 =head1 Incompatible Changes
48
49 =head2 64-bit platforms and malloc
50
51 If your pointers are 64 bits wide, the Perl malloc is no longer being
52 used because it does not work well with 8-byte pointers.  Also,
53 usually the system mallocs on such platforms are much better optimized
54 for such large memory models than the Perl malloc.  Some memory-hungry
55 Perl applications like the PDL don't work well with Perl's malloc.
56 Finally, other applications than Perl (like modperl) tend to prefer
57 the system malloc.  Such platforms include Alpha and 64-bit HPPA,
58 MIPS, PPC, and Sparc.
59
60 =head2 AIX Dynaloading
61
62 The AIX dynaloading now uses in AIX releases 4.3 and newer the native
63 dlopen interface of AIX instead of the old emulated interface.  This
64 change will probably break backward compatibility with compiled
65 modules.  The change was made to make Perl more compliant with other
66 applications like modperl which are using the AIX native interface.
67
68 =head2 Attributes for C<my> variables now handled at run-time.
69
70 The C<my EXPR : ATTRS> syntax now applies variable attributes at
71 run-time.  (Subroutine and C<our> variables still get attributes applied
72 at compile-time.)  See L<attributes> for additional details.  In particular,
73 however, this allows variable attributes to be useful for C<tie> interfaces,
74 which was a deficiency of earlier releases.  Note that the new semantics
75 doesn't work with the Attribute::Handlers module (as of version 0.76).
76
77 =head2 Socket Extension Dynamic in VMS
78
79 The Socket extension is now dynamically loaded instead of being
80 statically built in.  This may or may not be a problem with ancient
81 TCP/IP stacks of VMS: we do not know since we weren't able to test
82 Perl in such configurations.
83
84 =head2 IEEE-format Floating Point Default on OpenVMS Alpha
85
86 Perl now uses IEEE format (T_FLOAT) as the default internal floating
87 point format on OpenVMS Alpha, potentially breaking binary compatibility
88 with external libraries or existing data.  G_FLOAT is still available as
89 a configuration option.  The default on VAX (D_FLOAT) has not changed.
90
91 =head2 New Unicode Properties
92
93 Unicode I<scripts> are now supported. Scripts are similar to (and superior
94 to) Unicode I<blocks>. The difference between scripts and blocks is that
95 scripts are the glyphs used by a language or a group of languages, while
96 the blocks are more artificial groupings of (mostly) 256 characters based
97 on the Unicode numbering.
98
99 In general, scripts are more inclusive, but not universally so. For
100 example, while the script C<Latin> includes all the Latin characters and
101 their various diacritic-adorned versions, it does not include the various
102 punctuation or digits (since they are not solely C<Latin>).
103
104 A number of other properties are now supported, including C<\p{L&}>,
105 C<\p{Any}> C<\p{Assigned}>, C<\p{Unassigned}>, C<\p{Blank}> and
106 C<\p{SpacePerl}> (along with their C<\P{...}> versions, of course).
107 See L<perlunicode> for details, and more additions.
108
109 The C<In> or C<Is> prefix to names used with the C<\p{...}> and C<\P{...}>
110 are now almost always optional. The only exception is that a C<In> prefix
111 is required to signify a Unicode block when a block name conflicts with a
112 script name. For example, C<\p{Tibetan}> refers to the script, while
113 C<\p{InTibetan}> refers to the block. When there is no name conflict, you
114 can omit the C<In> from the block name (e.g. C<\p{BraillePatterns}>), but
115 to be safe, it's probably best to always use the C<In>).
116
117 =head2 REF(...) Instead Of SCALAR(...)
118
119 A reference to a reference now stringifies as "REF(0x81485ec)" instead
120 of "SCALAR(0x81485ec)" in order to be more consistent with the return
121 value of ref().
122
123 =head2 pack/unpack D/F recycled
124
125 The undocumented pack/unpack template letters D/F have been recycled
126 for better use: now they stand for long double (if supported by the
127 platform) and NV (Perl internal floating point type).  (They used
128 to be aliases for d/f, but you never knew that.)
129
130 =head2 Deprecations
131
132 =over 4
133
134 =item *
135
136 The semantics of bless(REF, REF) were unclear and until someone proves
137 it to make some sense, it is forbidden.
138
139 =item *
140
141 The obsolete chat2 library that should never have been allowed
142 to escape the laboratory has been decommissioned.
143
144 =item *
145
146 The builtin dump() function has probably outlived most of its
147 usefulness.  The core-dumping functionality will remain in future
148 available as an explicit call to C<CORE::dump()>, but in future
149 releases the behaviour of an unqualified C<dump()> call may change.
150
151 =item *
152
153 The very dusty examples in the eg/ directory have been removed.
154 Suggestions for new shiny examples welcome but the main issue is that
155 the examples need to be documented, tested and (most importantly)
156 maintained.
157
158 =item *
159
160 The (bogus) escape sequences \8 and \9 now give an optional warning
161 ("Unrecognized escape passed through").  There is no need to \-escape
162 any C<\w> character.
163
164 =item *
165
166 The list of filenames from glob() (or <...>) is now by default sorted
167 alphabetically to be csh-compliant (which is what happened before
168 in most UNIX platforms).  (bsd_glob() does still sort platform
169 natively, ASCII or EBCDIC, unless GLOB_ALPHASORT is specified.)
170
171 =item *
172
173 Spurious syntax errors generated in certain situations, when glob()
174 caused File::Glob to be loaded for the first time, have been fixed.
175
176 =item *
177
178 Although "you shouldn't do that", it was possible to write code that
179 depends on Perl's hashed key order (Data::Dumper does this).  The new
180 algorithm "One-at-a-Time" produces a different hashed key order.
181 More details are in L</"Performance Enhancements">.
182
183 =item *
184
185 lstat(FILEHANDLE) now gives a warning because the operation makes no sense.
186 In future releases this may become a fatal error.
187
188 =item *
189
190 The C<package;> syntax (C<package> without an argument) has been
191 deprecated.  Its semantics were never that clear and its
192 implementation even less so.  If you have used that feature to
193 disallow all but fully qualified variables, C<use strict;> instead.
194
195 =item *
196
197 The unimplemented POSIX regex features [[.cc.]] and [[=c=]] are still
198 recognised but now cause fatal errors.  The previous behaviour of
199 ignoring them by default and warning if requested was unacceptable
200 since it, in a way, falsely promised that the features could be used.
201
202 =item *
203
204 The current user-visible implementation of pseudo-hashes (the weird
205 use of the first array element) is deprecated starting from Perl 5.8.0
206 and will be removed in Perl 5.10.0, and the feature will be
207 implemented differently.  Not only is the current interface rather
208 ugly, but the current implementation slows down normal array and hash
209 use quite noticeably. The C<fields> pragma interface will remain
210 available.  The I<restricted hashes> interface is expected to
211 be the replacement interface (see L<Hash::Util>).
212
213 =item *
214
215 The syntaxes C<< @a->[...] >> and  C<< %h->{...} >> have now been deprecated.
216
217 =item *
218
219 After years of trying the suidperl is considered to be too complex to
220 ever be considered truly secure.  The suidperl functionality is likely
221 to be removed in a future release.
222
223 =item *
224
225 The long deprecated uppercase aliases for the string comparison
226 operators (EQ, NE, LT, LE, GE, GT) have now been removed.
227
228 =item *
229
230 The tr///C and tr///U features have been removed and will not return;
231 the interface was a mistake.  Sorry about that.  For similar
232 functionality, see pack('U0', ...) and pack('C0', ...).
233
234 =item *
235
236 Earlier Perls treated "sub foo (@bar)" as equivalent to "sub foo (@)".
237 The prototypes are now checked at compile-time for invalid characters.
238 An optional warning is generated ("Illegal character in prototype...")
239 but this may be upgraded to a fatal error in a future release.
240
241 =back
242
243 =head1 Core Enhancements
244
245 =head2 PerlIO is Now The Default
246
247 =over 4
248
249 =item *
250
251 IO is now by default done via PerlIO rather than system's "stdio".
252 PerlIO allows "layers" to be "pushed" onto a file handle to alter the
253 handle's behaviour.  Layers can be specified at open time via 3-arg
254 form of open:
255
256    open($fh,'>:crlf :utf8', $path) || ...
257
258 or on already opened handles via extended C<binmode>:
259
260    binmode($fh,':encoding(iso-8859-7)');
261
262 The built-in layers are: unix (low level read/write), stdio (as in
263 previous Perls), perlio (re-implementation of stdio buffering in a
264 portable manner), crlf (does CRLF <=> "\n" translation as on Win32,
265 but available on any platform).  A mmap layer may be available if
266 platform supports it (mostly UNIXes).
267
268 Layers to be applied by default may be specified via the 'open' pragma.
269
270 See L</"Installation and Configuration Improvements"> for the effects
271 of PerlIO on your architecture name.
272
273 =item *
274
275 File handles can be marked as accepting Perl's internal encoding of Unicode
276 (UTF-8 or UTF-EBCDIC depending on platform) by a pseudo layer ":utf8" :
277
278    open($fh,">:utf8","Uni.txt");
279
280 Note for EBCDIC users: the pseudo layer ":utf8" is erroneously named
281 for you since it's not UTF-8 what you will be getting but instead
282 UTF-EBCDIC.  See L<perlunicode>, L<utf8>, and
283 http://www.unicode.org/unicode/reports/tr16/ for more information.
284 In future releases this naming may change.
285
286 =item *
287
288 File handles can translate character encodings from/to Perl's internal
289 Unicode form on read/write via the ":encoding()" layer.
290
291 =item *
292
293 File handles can be opened to "in memory" files held in Perl scalars via:
294
295    open($fh,'>', \$variable) || ...
296
297 =item *
298
299 Anonymous temporary files are available without need to
300 'use FileHandle' or other module via
301
302    open($fh,"+>", undef) || ...
303
304 That is a literal undef, not an undefined value.
305
306 =item *
307
308 The list form of C<open> is now implemented for pipes (at least on UNIX):
309
310    open($fh,"-|", 'cat', '/etc/motd')
311
312 creates a pipe, and runs the equivalent of exec('cat', '/etc/motd') in
313 the child process.
314
315 =item *
316
317 If your locale environment variables (LANGUAGE, LC_ALL, LC_CTYPE, LANG)
318 contain the strings 'UTF-8' or 'UTF8' (case-insensitive matching),
319 the default encoding of your STDIN, STDOUT, and STDERR, and of
320 B<any subsequent file open>, is UTF-8.
321
322 =item *
323
324 If your filesystem supports returning UTF-8 encoded filenames,
325 it is possible to make Perl to understand that the filenames
326 returned by readdir() and glob() are in Unicode.
327
328 =back
329
330 =head2 Safe Signals
331
332 Perl used to be fragile in that signals arriving at inopportune moments
333 could corrupt Perl's internal state.  Now Perl postpones handling of
334 signals until it's safe (between opcodes).
335
336 This change may have surprising side effects because signals no longer
337 interrupt Perl instantly.  Perl will now first finish whatever it was
338 doing, like finishing an internal operation (like sort()) or an
339 external operation (like an I/O operation), and only then look at any
340 arrived signals (and before starting the next operation).  No more corrupt
341 internal state since the current operation is always finished first,
342 but the signal may take more time to get heard.  Note that breaking
343 out from potentially blocking operations should still work, though.
344
345 =head2 Unicode Overhaul
346
347 Unicode in general should be now much more usable than in Perl 5.6.0
348 (or even in 5.6.1).  Unicode can be used in hash keys, Unicode in
349 regular expressions should work now, Unicode in tr/// should work now,
350 Unicode in I/O should work now.  See L<perluniintro> for introduction
351 and L<perlunicode> for details.
352
353 =over 4
354
355 =item *
356
357 The Unicode Character Database coming with Perl has been upgraded
358 to Unicode 3.2.0.  For more information, see http://www.unicode.org/ .
359
360 =item *
361
362 For developers interested in enhancing Perl's Unicode capabilities:
363 almost all the UCD files are included with the Perl distribution in
364 the F<lib/unicore subdirectory>.  The most notable omission, for space
365 considerations, is the Unihan database.
366
367 =item *
368
369 The properties \p{Blank} and \p{SpacePerl} have been added. "Blank" is like
370 C isblank(), that is, it contains only "horizontal whitespace" (the space
371 character is, the newline isn't), and the "SpacePerl" is the Unicode
372 equivalent of C<\s> (\p{Space} isn't, since that includes the vertical
373 tabulator character, whereas C<\s> doesn't.)
374
375 See "New Unicode Properties" earlier in this document for additional
376 information on changes with Unicode properties.
377
378 =back
379
380 =head2 Understanding of Numbers
381
382 In general a lot of fixing has happened in the area of Perl's
383 understanding of numbers, both integer and floating point.  Since in
384 many systems the standard number parsing functions like C<strtoul()>
385 and C<atof()> seem to have bugs, Perl tries to work around their
386 deficiencies.  This results hopefully in more accurate numbers.
387
388 Perl now tries internally to use integer values in numeric conversions
389 and basic arithmetics (+ - * /) if the arguments are integers, and
390 tries also to keep the results stored internally as integers.
391 This change leads to often slightly faster and always less lossy
392 arithmetics. (Previously Perl always preferred floating point numbers
393 in its math.)
394
395 =head2 Miscellaneous Changes
396
397 =over 4
398
399 =item *
400
401 AUTOLOAD is now lvaluable, meaning that you can add the :lvalue attribute
402 to AUTOLOAD subroutines and you can assign to the AUTOLOAD return value.
403
404 =item *
405
406 C<perl -d:Module=arg,arg,arg> now works (previously one couldn't pass
407 in multiple arguments.)
408
409 =item *
410
411 The builtin dump() now gives an optional warning
412 C<dump() better written as CORE::dump()>,
413 meaning that by default C<dump(...)> is resolved as the builtin 
414 dump() which dumps core and aborts, not as (possibly) user-defined
415 C<sub dump>.  To call the latter, qualify the call as C<&dump(...)>.
416 (The whole dump() feature is to considered deprecated, and possibly
417 removed/changed in future releases.)
418
419 =item *
420
421 chomp() and chop() are now overridable.  Note, however, that their
422 prototype (as given by C<prototype("CORE::chomp")> is undefined,
423 because it cannot be expressed and therefore one cannot really write
424 replacements to override these builtins.
425
426 =item *
427
428 END blocks are now run even if you exit/die in a BEGIN block.
429 Internally, the execution of END blocks is now controlled by 
430 PL_exit_flags & PERL_EXIT_DESTRUCT_END. This enables the new
431 behaviour for Perl embedders. This will default in 5.10. See
432 L<perlembed>.
433
434 =item *
435
436 Formats now support zero-padded decimal fields.
437
438 =item *
439
440 Lvalue subroutines can now return C<undef> in list context.
441 However, the lvalue subroutine feature still remains experimental.
442
443 =item *
444
445 A lost warning "Can't declare ... dereference in my" has been
446 restored (Perl had it earlier but it became lost in later releases.)
447
448 =item *
449
450 A new special regular expression variable has been introduced:
451 C<$^N>, which contains the most-recently closed group (submatch).
452
453 =item *
454
455 C<no Module;> now works even if there is no "sub unimport" in the Module.
456
457 =item *
458
459 The numerical comparison operators return C<undef> if either operand
460 is a NaN.  Previously the behaviour was unspecified.
461
462 =item *
463
464 The following builtin functions are now overridable: each(), keys(),
465 pop(), push(), shift(), splice(), unshift().
466
467 =item *
468
469 C<pack() / unpack()> now can group template letters with C<()> and then
470 apply repetition/count modifiers on the groups.
471
472 =item *
473
474 C<pack() / unpack()> can now process the Perl internal numeric types:
475 IVs, UVs, NVs-- and also long doubles, if supported by the platform.
476 The template letters are C<j>, C<J>, C<F>, and C<D>.
477
478 =item *
479
480 C<pack('U0a*', ...)> can now be used to force a string to UTF8.
481
482 =item *
483
484 my __PACKAGE__ $obj now works.
485
486 =item *
487
488 The printf() and sprintf() now support parameter reordering using the
489 C<%\d+\$> and C<*\d+\$> syntaxes.  For example
490
491     print "%2\$s %1\$s\n", "foo", "bar";
492
493 will print "bar foo\n".  This feature helps in writing
494 internationalised software, and in general when the order
495 of the parameters can vary.
496
497 =item *
498
499 prototype(\&) is now available.
500
501 =item *
502
503 prototype(\[$@%&]) is now available to implicitly create references
504 (useful for example if you want to emulate the tie() interface).
505
506 =item *
507
508 A new command-line option, C<-t> is available.  It is the
509 little brother of C<-T>: instead of dying on taint violations,
510 lexical warnings are given.  B<This is only meant as a temporary
511 debugging aid while securing the code of old legacy applications.
512 This is not a substitute for -T.>
513
514 =item *
515
516 In other taint news, the C<exec LIST> and C<system LIST> have now been
517 considered too risky (think C<exec @ARGV>: it can start any program
518 with any arguments), and now the said forms cause a warning.
519 You should carefully launder the arguments to guarantee their
520 validity.  In future releases of Perl the forms will become fatal
521 errors so consider starting laundering now.
522
523 =item *
524
525 If tr/// is just counting characters, it doesn't attempt to
526 modify its target.
527
528 =item *
529
530 untie() will now call an UNTIE() hook if it exists.  See L<perltie>
531 for details.
532
533 =item *
534
535 L<utime> now supports C<utime undef, undef, @files> to change the
536 file timestamps to the current time.
537
538 =item *
539
540 The rules for allowing underscores (underbars) in numeric constants
541 have been relaxed and simplified: now you can have an underscore
542 simply B<between digits>.
543
544 =item *
545
546 Rather than relying on C's argv[0] (which may not contain a full pathname)
547 where possible $^X is now set by asking the operating system.
548 (eg by reading F</proc/self/exe> on Linux, F</proc/curproc/file> on FreeBSD)
549
550 =item *
551
552 A new variable, C<${^TAINT}>, indicates whether taint mode is enabled.
553
554 =item *
555
556 You can now override the readline() builtin, and this overrides also
557 the <FILEHANDLE> angle bracket operator.
558
559 =item *
560
561 The command-line options -s and -F are now recognized on the shebang
562 (#!) line.
563
564 =item *
565
566 Use of the C</c> match modifier without an accompanying C</g> modifier
567 elicits a new warning: C<Use of /c modifier is meaningless without /g>.
568
569 Use of C</c> in substitutions, even with C</g>, elicits 
570 C<Use of /c modifier is meaningless in s///>.  
571
572 Use of C</g> with C<split> elicits C<Use of /g modifier is meaningless
573 in split>.
574
575 =back
576
577 =head1 Modules and Pragmata
578
579 =head2 New Modules and Pragmata
580
581 =over 4
582
583 =item *
584
585 C<Attribute::Handlers> allows a class to define attribute handlers.
586
587     package MyPack;
588     use Attribute::Handlers;
589     sub Wolf :ATTR(SCALAR) { print "howl!\n" }
590
591     # later, in some package using or inheriting from MyPack...
592
593     my MyPack $Fluffy : Wolf; # the attribute handler Wolf will be called
594
595 Both variables and routines can have attribute handlers.  Handlers can
596 be specific to type (SCALAR, ARRAY, HASH, or CODE), or specific to the
597 exact compilation phase (BEGIN, CHECK, INIT, or END).
598
599 =item *
600
601 B<B::Concise> is a new compiler backend for walking the Perl syntax
602 tree, printing concise info about ops, from Stephen McCamant.  The
603 output is highly customisable.  See L<B::Concise>.
604
605 =item *
606
607 The new bignum, bigint, and bigrat pragmas implement transparent
608 bignum support (using the Math::BigInt, Math::BigFloat, and
609 Math::BigRat backends), by Tels.
610
611 =item *
612
613 C<Class::ISA> for reporting the search path for a class's ISA tree,
614 by Sean Burke, has been added.  See L<Class::ISA>.
615
616 =item *
617
618 C<Cwd> has now a split personality: if possible, an XS extension is
619 used, (this will hopefully be faster, more secure, and more robust)
620 but if not possible, the familiar Perl implementation is used.
621
622 =item *
623
624 C<Devel::PPPort>, originally from Kenneth Albanowski and now
625 maintained by Paul Marquess, has been added.  It is primarily used
626 by C<h2xs> to enhance portability of XS modules between different
627 versions of Perl.
628
629 =item *
630
631 C<Digest>, frontend module for calculating digests (checksums), from
632 Gisle Aas, has been added.  See L<Digest>.
633
634 =item *
635
636 C<Digest::MD5> for calculating MD5 digests (checksums) as defined in
637 RFC 1321, from Gisle Aas, has been added.  See L<Digest::MD5>.
638
639     use Digest::MD5 'md5_hex';
640
641     $digest = md5_hex("Thirsty Camel");
642
643     print $digest, "\n"; # 01d19d9d2045e005c3f1b80e8b164de1
644
645 NOTE: the C<MD5> backward compatibility module is deliberately not
646 included since its further use is discouraged.
647
648 =item *
649
650 C<Encode>, orginally by Nick Ing-Simmons and now maintained by Dan
651 Kogai, provides a mechanism to translate between different character
652 encodings.  Support for Unicode, ISO-8859-1, and ASCII are compiled in
653 to the module.  Several other encodings (like the rest of the
654 ISO-8859, CP*/Win*, Mac, KOI8-R, three variants EBCDIC, Chinese,
655 Japanese, and Korean encodings) are included and can be loaded at
656 runtime.  (For space considerations, the largest Chinese encodings
657 have been separated into their own CPAN module, Encode::HanExtra,
658 which Encode will use if available).  See L<Encode>.
659
660 Any encoding supported by Encode module is also available to the
661 ":encoding()" layer if PerlIO is used.
662
663 =item *
664
665 C<Hash::Util> is the interface to the new I<restricted hashes>
666 feature.  A restricted hash is restricted to a certain set of keys,
667 no keys outside the set can be added.  Also individual keys can be
668 restricted so that the key cannot be deleted and the value cannot be
669 changed.  (Implemented by Jeffrey Friedl, Nick Ing-Simmons, and
670 Michael Schwern.)
671
672 =item *
673
674 C<I18N::Langinfo> can be use to query locale information.
675 See L<I18N::Langinfo>.
676
677 =item *
678
679 C<I18N::LangTags> has functions for dealing with RFC3066-style
680 language tags, by Sean Burke.  See L<I18N::LangTags>.
681
682 =item *
683
684 C<ExtUtils::Constant> is a new tool for extension writers for
685 generating XS code to import C header constants, by Nicholas Clark.
686 See L<ExtUtils::Constant>.
687
688 =item *
689
690 C<Filter::Simple> is an easy-to-use frontend to Filter::Util::Call,
691 from Damian Conway.  See L<Filter::Simple>.
692
693     # in MyFilter.pm:
694
695     package MyFilter;
696
697     use Filter::Simple sub {
698         while (my ($from, $to) = splice @_, 0, 2) {
699                 s/$from/$to/g;
700         }
701     };
702
703     1;
704
705     # in user's code:
706
707     use MyFilter qr/red/ => 'green';
708
709     print "red\n";   # this code is filtered, will print "green\n"
710     print "bored\n"; # this code is filtered, will print "bogreen\n"
711
712     no MyFilter;
713
714     print "red\n";   # this code is not filtered, will print "red\n"
715
716 =item *
717
718 C<File::Temp> allows one to create temporary files and directories in
719 an easy, portable, and secure way, by Tim Jenness.  See L<File::Temp>.
720
721 =item *
722
723 C<Filter::Util::Call> provides you with the framework to write
724 I<Source Filters> in Perl, from Paul Marquess.  For most uses the
725 frontend Filter::Simple is to be preferred.  See L<Filter::Util::Call>.
726
727 =item *
728
729 C<if> is a new pragma for conditional inclusion of modules, from
730 Ilya Zakharevich.
731
732 =item *
733
734 L<libnet> is a collection of perl5 modules related to network
735 programming, from Graham Barr.  See L<Net::FTP>, L<Net::NNTP>,
736 L<Net::Ping> (not part of libnet, but related), L<Net::POP3>,
737 L<Net::SMTP>, and L<Net::Time>.
738
739 Perl installation leaves libnet unconfigured, use F<libnetcfg> to configure.
740
741 =item *
742
743 C<List::Util> is a selection of general-utility list subroutines, like
744 sum(), min(), first(), and shuffle(), by Graham Barr.  See L<List::Util>.
745
746 =item *
747
748 C<Locale::Constants>, C<Locale::Country>, C<Locale::Currency>
749 C<Locale::Language>, and L<Locale::Script>, from Neil Bowers, have
750 been added.  They provide the codes for various locale standards, such
751 as "fr" for France, "usd" for US Dollar, and "jp" for Japanese.
752
753     use Locale::Country;
754
755     $country = code2country('jp');               # $country gets 'Japan'
756     $code    = country2code('Norway');           # $code gets 'no'
757
758 See L<Locale::Constants>, L<Locale::Country>, L<Locale::Currency>,
759 and L<Locale::Language>.
760
761 =item *
762
763 C<Locale::Maketext> is localization framework from Sean Burke.  See
764 L<Locale::Maketext>, and L<Locale::Maketext::TPJ13>.  The latter is an
765 article about software localization, originally published in The Perl
766 Journal #13, republished here with kind permission.
767
768 =item *
769
770 C<Math::BigRat> for big rational numbers, to accompany Math::BigInt and
771 Math::BigFloat, from Tels.
772
773 =item *
774
775 C<Memoize> can make your functions faster by trading space for time,
776 from Mark-Jason Dominus.  See L<Memoize>.
777
778 =item *
779
780 C<MIME::Base64> allows you to encode data in base64, from Gisle Aas,
781 as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
782 Extensions)>.
783
784     use MIME::Base64;
785
786     $encoded = encode_base64('Aladdin:open sesame');
787     $decoded = decode_base64($encoded);
788
789     print $encoded, "\n"; # "QWxhZGRpbjpvcGVuIHNlc2FtZQ=="
790
791 See L<MIME::Base64>.
792
793 =item *
794
795 C<MIME::QuotedPrint> allows you to encode data in quoted-printable
796 encoding, as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
797 Extensions)>, from Gisle Aas.
798
799     use MIME::QuotedPrint;
800
801     $encoded = encode_qp("Smiley in Unicode: \x{263a}");
802     $decoded = decode_qp($encoded);
803
804     print $encoded, "\n"; # "Smiley in Unicode: =263A"
805
806 MIME::QuotedPrint has been enhanced to provide the basic methods
807 necessary to use it with PerlIO::Via as in :
808
809     use MIME::QuotedPrint;
810     open($fh,">Via(MIME::QuotedPrint)",$path);
811
812 See L<MIME::QuotedPrint>.
813
814 =item *
815
816 C<NEXT> is pseudo-class for method redispatch, from Damian Conway.
817 See L<NEXT>.
818
819 =item *
820
821 C<open> is a new pragma for setting the default I/O disciplines
822 for open().
823
824 =item *
825
826 C<PerlIO::Scalar> provides the implementation of IO to "in memory"
827 Perl scalars as discussed above, from Nick Ing-Simmons.  It also
828 serves as an example of a loadable PerlIO layer.  Other future
829 possibilities include PerlIO::Array and PerlIO::Code.
830 See L<PerlIO::Scalar>.
831
832 =item *
833
834 C<PerlIO::Via> acts as a PerlIO layer and wraps PerlIO layer
835 functionality provided by a class (typically implemented in perl
836 code), from Nick Ing-Simmons.
837
838     use MIME::QuotedPrint;
839     open($fh,">Via(MIME::QuotedPrint)",$path);
840
841 This will automatically convert everything output to C<$fh>
842 to Quoted-Printable.  See L<PerlIO::Via>.
843
844 =item *
845
846 C<Pod::ParseLink>, by Russ Allbery, has been added,
847 to parse LZ<><> links in pods as described in the new
848 perlpodspec.
849
850 =item *
851
852 C<Pod::Text::Overstrike>, by Joe Smith, has been added.
853 It converts POD data to formatted overstrike text.
854 See L<Pod::Text::Overstrike>.
855
856 =item *
857
858 C<Scalar::Util> is a selection of general-utility scalar subroutines,
859 like blessed(), reftype(), and tainted().  See L<Scalar::Util>.
860
861 =item *
862
863 C<sort> is a new pragma for controlling the behaviour of sort().
864
865 =item *
866
867 C<Storable> gives persistence to Perl data structures by allowing the
868 storage and retrieval of Perl data to and from files in a fast and
869 compact binary format, from Raphael Manfredi.  See L<Storable>.
870
871 =item *
872
873 C<Switch>, from Damian Conway, has been added.  Just by saying
874
875     use Switch;
876
877 you have C<switch> and C<case> available in Perl.
878
879     use Switch;
880
881     switch ($val) {
882
883                 case 1          { print "number 1" }
884                 case "a"        { print "string a" }
885                 case [1..10,42] { print "number in list" }
886                 case (@array)   { print "number in list" }
887                 case /\w+/      { print "pattern" }
888                 case qr/\w+/    { print "pattern" }
889                 case (%hash)    { print "entry in hash" }
890                 case (\%hash)   { print "entry in hash" }
891                 case (\&sub)    { print "arg to subroutine" }
892                 else            { print "previous case not true" }
893     }
894
895 See L<Switch>.
896
897 =item *
898
899 C<Test::More> is yet another framework for writing test scripts,
900 more extensive than Test::Simple, by Michael Schwern.  See L<Test::More>.
901
902 =item *
903
904 C<Test::Simple> has basic utilities for writing tests, by Michael
905 Schwern.   See L<Test::Simple>.
906
907 =item *
908
909 C<Text::Balanced> has been added, for extracting delimited text
910 sequences from strings, from Damian Conway.
911
912     use Text::Balanced 'extract_delimited';
913
914     ($a, $b) = extract_delimited("'never say never', he never said", "'", '');
915
916 $a will be "'never say never'", $b will be ', he never said'.
917
918 In addition to extract_delimited() there are also extract_bracketed(),
919 extract_quotelike(), extract_codeblock(), extract_variable(),
920 extract_tagged(), extract_multiple(), gen_delimited_pat(), and
921 gen_extract_tagged().  With these you can implement rather advanced
922 parsing algorithms.  See L<Text::Balanced>.
923
924 =item *
925
926 C<threads> is an interface to interpreter threads, by Arthur Bergman.
927 Interpreter threads (ithreads) is the new thread model introduced in
928 Perl 5.6 but only available as an internal interface for extension
929 writers (and for Win32 Perl for C<fork()> emulation).  See L<threads>.
930
931 =item *
932
933 C<threads::shared> allows data sharing for interpreter threads, from
934 Arthur Bergman.  In the ithreads model any data sharing between
935 threads must be explicit, as opposed to the old 5.005 thread model
936 where data sharing was implicit.  See L<threads::shared>.
937
938 =item *
939
940 C<Tie::File>, by Mark-Jason Dominus, associates a Perl array with the
941 lines of a file.
942
943 =item *
944
945 C<Tie::Memoize>, by Ilya Zakharevich, provides on-demand loaded hashes.
946
947 =item *
948
949 C<Tie::RefHash::Nestable>, by Edward Avis, allows storing hash
950 references (unlike the standard Tie::RefHash)  The module is contained
951 within Tie::RefHash, see L<Tie::RefHash>.
952
953 =item *
954
955 C<Time::HiRes> provides high resolution timing (ualarm, usleep,
956 and gettimeofday), from Douglas E. Wegscheid.  See L<Time::HiRes>.
957
958 =item *
959
960 C<Unicode::UCD> offers a querying interface to the Unicode Character
961 Database.  See L<Unicode::UCD>.
962
963 =item *
964
965 C<Unicode::Collate> implements the UCA (Unicode Collation Algorithm)
966 for sorting Unicode strings, by SADAHIRO Tomoyuki.  See L<Unicode::Collate>.
967
968 =item *
969
970 C<Unicode::Normalize> implements the various Unicode normalization
971 forms, by SADAHIRO Tomoyuki.  See L<Unicode::Normalize>.
972
973 =item *
974
975 C<XS::Typemap>, by Tim Jenness, is a test extension that exercises XS
976 typemaps.  Nothing gets installed but for extension writers the code
977 is worth studying.
978
979 =back
980
981 =head2 Updated And Improved Modules and Pragmata
982
983 =over 4
984
985 =item *
986
987 The following independently supported modules have been updated to the
988 newest versions from CPAN: CGI, CPAN, DB_File, File::Spec, File::Temp,
989 Getopt::Long, Math::BigFloat, Math::BigInt, the podlators bundle
990 (Pod::Man, Pod::Text), Pod::LaTeX, Pod::Parser, Storable,
991 Term::ANSIColor, Test, Text-Tabs+Wrap.
992
993 =item *
994
995 The attributes::reftype() now works on tied arguments.
996
997 =item *
998
999 AutoLoader can now be disabled with C<no AutoLoader;>.
1000
1001 =item *
1002
1003 B::Deparse has been significantly enhanced.  It now can deparse almost
1004 all of the standard test suite (so that the tests still succeed).
1005 There is a make target "test.deparse" for trying this out.
1006
1007 =item *
1008
1009 Class::Struct can now define the classes in compile time.
1010
1011 =item *
1012
1013 Class::Struct now assigns the array/hash element if the accessor
1014 is called with an array/hash element as the B<sole> argument.
1015
1016 =item *
1017
1018 Data::Dumper has now an option to sort hashes.
1019
1020 =item *
1021
1022 Data::Dumper has now an option to dump code references
1023 using B::Deparse.
1024
1025 =item *
1026
1027 DB_File now supports newer Berkeley DB versions, among
1028 other improvements.
1029
1030 =item *
1031
1032 The English module can now be used without the infamous performance
1033 hit by saying
1034
1035         use English '-no_match_vars';
1036
1037 (Assuming, of course, that one doesn't need the troublesome variables
1038 C<$`>, C<$&>, or C<$'>.)  Also, introduced C<@LAST_MATCH_START> and
1039 C<@LAST_MATCH_END> English aliases for C<@-> and C<@+>.
1040
1041 =item *
1042
1043 Fcntl, Socket, and Sys::Syslog have been rewritten to use the
1044 new-style constant dispatch section (see L<ExtUtils::Constant>).
1045 This means that they will be more robust and hopefully faster.
1046
1047 =item *
1048
1049 File::Find now chdir()s correctly when chasing symbolic links.
1050
1051 =item *
1052
1053 File::Find now has pre- and post-processing callbacks.  It also
1054 correctly changes directories when chasing symbolic links.  Callbacks
1055 (naughtily) exiting with "next;" instead of "return;" now work.
1056
1057 =item *
1058
1059 File::Find is now (again) reentrant.  It also has been made
1060 more portable.
1061
1062 =item *
1063
1064 The warnings issued by File::Find now belong to their own category.
1065 You can enable/disable them with C<use/no warnings 'File::Find';>.
1066
1067 =item *
1068
1069 File::Glob::glob() renamed to File::Glob::bsd_glob() to avoid
1070 prototype mismatch with CORE::glob().
1071
1072 =item *
1073
1074 File::Glob now supports C<GLOB_LIMIT> constant to limit the size of
1075 the returned list of filenames.
1076
1077 =item *
1078
1079 Devel::Peek now has an interface for the Perl memory statistics
1080 (this works only if you are using perl's malloc, and if you have
1081 compiled with debugging).
1082
1083 =item *
1084
1085 IPC::Open3 now allows the use of numeric file descriptors.
1086
1087 =item *
1088
1089 IO::Socket has now atmark() method, which returns true if the socket
1090 is positioned at the out-of-band mark.  The method is also exportable
1091 as a sockatmark() function.
1092
1093 =item *
1094
1095 IO::Socket::INET has support for ReusePort option (if your platform
1096 supports it).  The Reuse option now has an alias, ReuseAddr.  For clarity
1097 you may want to prefer ReuseAddr.
1098
1099 =item *
1100
1101 IO::Socket::INET now supports C<LocalPort> of zero (usually meaning
1102 that the operating system will make one up.)
1103
1104 =item *
1105
1106 use lib now works identically to @INC.  Removing directories
1107 with 'no lib' now works.
1108
1109 =item *
1110
1111 ExtUtils::MakeMaker now uses File::Spec internally, which hopefully
1112 leads into better portability.
1113
1114 =item *
1115
1116 Math::BigFloat and Math::BigInt have undergone a full rewrite.
1117 They are now magnitudes faster, and they support various
1118 bignum libraries such as GMP and PARI as their backends.
1119
1120 =item *
1121
1122 Math::Complex handles inf, NaN etc., better.
1123
1124 =item *
1125
1126 Net::Ping has been muchly enhanced: multihoming is now supported,
1127 Win32 functionality is better, there is now time measuring
1128 functionality (optionally high-resolution using Time::HiRes),
1129 and there is now "external" protocol which uses Net::Ping::External
1130 module which runs your external ping utility and parses the output.
1131 A version of Net::Ping::External is available in CPAN.
1132
1133 Note that some of the Net::Ping tests are disabled when running
1134 under the Perl distribution since one cannot assume one or more
1135 of the following: enabled echo port at localhost, full Internet
1136 connectivity, or sympathetic firewalls.  You can set the environment
1137 variable PERL_TEST_Net_Ping to "1" (one) before running the Perl test
1138 suite to enable all the Net::Ping tests.
1139
1140 =item *
1141
1142 POSIX::sigaction() is now much more flexible and robust.
1143 You can now install coderef handlers, 'DEFAULT', and 'IGNORE'
1144 handlers, installing new handlers was not atomic.
1145
1146 =item *
1147
1148 In Safe the C<%INC> now localised in a Safe compartment so that
1149 use/require work.
1150
1151 =item *
1152
1153 In SDBM_File on dosish platforms, some keys went missing because of
1154 lack of support for files with "holes".  A workaround for the problem
1155 has been added.
1156
1157 =item *
1158
1159 In Search::Dict one can now have a pre-processing hook for the
1160 lines being searched.
1161
1162 =item *
1163
1164 The Shell module now has an OO interface.
1165
1166 =item *
1167
1168 In Sys::Syslog there is now a failover mechanism that will go
1169 through alternative connection mechanisms until the message
1170 is successfully logged.
1171
1172 =item *
1173
1174 The Test module has been significantly enhanced.
1175
1176 =item *
1177
1178 Time::Local::timelocal() does not handle fractional seconds anymore.
1179 The rationale is that neither does localtime(), and timelocal() and
1180 localtime() are supposed to be inverses of each other.
1181
1182 =item *
1183
1184 The vars pragma now supports declaring fully qualified variables.
1185 (Something that C<our()> does not and will not support.)
1186
1187 =item *
1188
1189 The C<utf8::> name space (as in the pragma) provides various
1190 Perl-callable functions to provide low level access to Perl's
1191 internal Unicode representation.  At the moment only length()
1192 has been implemented.
1193
1194 =back
1195
1196 =head1 Utility Changes
1197
1198 =over 4
1199
1200 =item *
1201
1202 Emacs perl mode (emacs/cperl-mode.el) has been updated to version
1203 4.31.
1204
1205 =item *
1206
1207 F<emacs/e2ctags.pl> is now much faster.
1208
1209 =item *
1210
1211 C<enc2xs> is a tool for people adding their own encodings to the
1212 Encode module.
1213
1214 =item *
1215
1216 C<h2ph> now supports C trigraphs.
1217
1218 =item *
1219
1220 C<h2xs> now produces a template README.
1221
1222 =item *
1223
1224 C<h2xs> now uses C<Devel::PPort> for better portability between
1225 different versions of Perl.
1226
1227 =item *
1228
1229 C<h2xs> uses the new L<ExtUtils::Constant> module which will affect
1230 newly created extensions that define constants.  Since the new code is
1231 more correct (if you have two constants where the first one is a
1232 prefix of the second one, the first constant B<never> gets defined),
1233 less lossy (it uses integers for integer constant, as opposed to the
1234 old code that used floating point numbers even for integer constants),
1235 and slightly faster, you might want to consider regenerating your
1236 extension code (the new scheme makes regenerating easy).
1237 L<h2xs> now also supports C trigraphs.
1238
1239 =item *
1240
1241 C<libnetcfg> has been added to configure the libnet.
1242
1243 =item *
1244
1245 C<perlbug> is now much more robust.  It also sends the bug report to
1246 perl.org, not perl.com.
1247
1248 =item *
1249
1250 C<perlcc> has been rewritten and its user interface (that is,
1251 command line) is much more like that of the UNIX C compiler, cc.
1252 (The perlbc tools has been removed.  Use C<perlcc -B> instead.)
1253
1254 =item *
1255
1256 C<perlivp> is a new Installation Verification Procedure utility
1257 for running any time after installing Perl.
1258
1259 =item *
1260
1261 C<piconv> is an implementation of the character conversion utility
1262 C<iconv>, demonstrating the new Encode module.
1263
1264 =item *
1265
1266 C<pod2html> now allows specifying a cache directory.
1267
1268 =item *
1269
1270 C<pod2html> now produces XHTML 1.0.
1271
1272 =item *
1273
1274 C<pod2html> now understands POD written using different line endings
1275 (PC-like CRLF versus UNIX-like LF versus MacClassic-like CR).
1276
1277 =item *
1278
1279 C<s2p> has been completely rewritten in Perl.  (It is in fact a full
1280 implementation of sed in Perl: you can use the sed functionality by
1281 using the C<psed> utility.)
1282
1283 =item *
1284
1285 C<xsubpp> now understands POD documentation embedded in the *.xs files.
1286
1287 =item *
1288
1289 C<xsubpp> now supports OUT keyword.
1290
1291 =back
1292
1293 =head1 New Documentation
1294
1295 =over 4
1296
1297 =item *
1298
1299 perl56delta details the changes between the 5.005 release and the
1300 5.6.0 release.
1301
1302 =item *
1303
1304 perlclib documents the internal replacements for standard C library
1305 functions.  (Interesting only for extension writers and Perl core
1306 hackers.)
1307
1308 =item *
1309
1310 perldebtut is a Perl debugging tutorial.
1311
1312 =item *
1313
1314 perlebcdic contains considerations for running Perl on EBCDIC platforms.
1315
1316 =item *
1317
1318 perlintro is a gentle introduction to Perl.
1319
1320 =item *
1321
1322 perliol documents the internals of PerlIO with layers.
1323
1324 =item *
1325
1326 perlmodstyle is a style guide for writing modules.
1327
1328 =item *
1329
1330 perlnewmod tells about writing and submitting a new module.
1331
1332 =item *
1333
1334 perlpacktut is a pack() tutorial.
1335
1336 =item *
1337
1338 perlpod has been rewritten to be clearer and to record the best
1339 practices gathered over the years.
1340
1341 =item *
1342
1343 perlpodspec is a more formal specification of the pod format,
1344 mainly of interest for writers of pod applications, not to
1345 people writing in pod.
1346
1347 =item *
1348
1349 perlretut is a regular expression tutorial.
1350
1351 =item *
1352
1353 perlrequick is a regular expressions quick-start guide.
1354 Yes, much quicker than perlretut.
1355
1356 =item *
1357
1358 perltodo has been updated.
1359
1360 =item *
1361
1362 perltootc has been renamed as perltooc (to not to conflict
1363 with perltoot in filesystems restricted to "8.3" names)
1364
1365 =item *
1366
1367 perluniintro is an introduction to using Unicode in Perl.
1368 (perlunicode is more of a detailed reference and background
1369 information)
1370
1371 =item *
1372
1373 perlutil explains the command line utilities packaged with the Perl
1374 distribution.
1375
1376 =back
1377
1378 The following platform-specific documents are available before
1379 the installation as README.I<platform>, and after the installation
1380 as perlI<platform>:
1381
1382     perlaix perlamiga perlapollo perlbeos perlbs2000
1383     perlce perlcygwin perldgux perldos perlepoc perlhpux
1384     perlhurd perlmachten perlmacos perlmint perlmpeix
1385     perlnetware perlos2 perlos390 perlplan9 perlqnx perlsolaris
1386     perltru64 perluts perlvmesa perlvms perlvos perlwin32
1387
1388 =over 4
1389
1390 =item *
1391
1392 The documentation for the POSIX-BC platform is called "BS2000", to avoid
1393 confusion with the Perl POSIX module.
1394
1395 =item *
1396
1397 The documentation for the WinCE platform is called perlce (README.ce
1398 in the source code kit), to avoid confusion with the perlwin32
1399 documentation on 8.3-restricted filesystems.
1400
1401 =back
1402
1403 =head1 Performance Enhancements
1404
1405 =over 4
1406
1407 =item *
1408
1409 map() could get pathologically slow when the result list it generates
1410 is larger than the source list.  The performance has been improved for
1411 common scenarios.
1412
1413 =item *
1414
1415 sort() has been changed to use primarily mergesort internally as
1416 opposed to the earlier quicksort.  For very small lists this may
1417 result in slightly slower sorting times, but in general the speedup
1418 should be at least 20%.  Additional bonuses are that the worst case
1419 behaviour of sort() is now better (in computer science terms it now
1420 runs in time O(N log N), as opposed to quicksort's Theta(N**2)
1421 worst-case run time behaviour), and that sort() is now stable
1422 (meaning that elements with identical keys will stay ordered as they
1423 were before the sort).  See the C<sort> pragma for information.
1424
1425 The story in more detail: suppose you want to serve yourself a little
1426 slice of Pi.
1427
1428     @digits = ( 3,1,4,1,5,9 );
1429
1430 A numerical sort of the digits will yield (1,1,3,4,5,9), as expected.
1431 Which C<1> comes first is hard to know, since one C<1> looks pretty
1432 much like any other.  You can regard this as totally trivial,
1433 or somewhat profound.  However, if you just want to sort the even
1434 digits ahead of the odd ones, then what will
1435
1436     sort { ($a % 2) <=> ($b % 2) } @digits;
1437
1438 yield?  The only even digit, C<4>, will come first.  But how about
1439 the odd numbers, which all compare equal?  With the quicksort algorithm
1440 used to implement Perl 5.6 and earlier, the order of ties is left up
1441 to the sort.  So, as you add more and more digits of Pi, the order
1442 in which the sorted even and odd digits appear will change.
1443 and, for sufficiently large slices of Pi, the quicksort algorithm
1444 in Perl 5.8 won't return the same results even if reinvoked with the
1445 same input.  The justification for this rests with quicksort's
1446 worst case behavior.  If you run
1447
1448    sort { $a <=> $b } ( 1 .. $N , 1 .. $N );
1449
1450 (something you might approximate if you wanted to merge two sorted
1451 arrays using sort), doubling $N doesn't just double the quicksort time,
1452 it I<quadruples> it.  Quicksort has a worst case run time that can
1453 grow like N**2, so-called I<quadratic> behaviour, and it can happen
1454 on patterns that may well arise in normal use.  You won't notice this
1455 for small arrays, but you I<will> notice it with larger arrays,
1456 and you may not live long enough for the sort to complete on arrays
1457 of a million elements.  So the 5.8 quicksort scrambles large arrays
1458 before sorting them, as a statistical defence against quadratic behaviour.
1459 But that means if you sort the same large array twice, ties may be
1460 broken in different ways.
1461
1462 Because of the unpredictability of tie-breaking order, and the quadratic
1463 worst-case behaviour, quicksort was I<almost> replaced completely with
1464 a stable mergesort.  I<Stable> means that ties are broken to preserve
1465 the original order of appearance in the input array.  So
1466
1467     sort { ($a % 2) <=> ($b % 2) } (3,1,4,1,5,9);
1468
1469 will yield (4,3,1,1,5,9), guaranteed.  The even and odd numbers
1470 appear in the output in the same order they appeared in the input.
1471 Mergesort has worst case O(NlogN) behaviour, the best value
1472 attainable.  And, ironically, this mergesort does particularly
1473 well where quicksort goes quadratic:  mergesort sorts (1..$N, 1..$N)
1474 in O(N) time.  But quicksort was rescued at the last moment because
1475 it is faster than mergesort on certain inputs and platforms.
1476 For example, if you really I<don't> care about the order of even
1477 and odd digits, quicksort will run in O(N) time; it's very good
1478 at sorting many repetitions of a small number of distinct elements.
1479 The quicksort divide and conquer strategy works well on platforms
1480 with relatively small, very fast, caches.  Eventually, the problem gets
1481 whittled down to one that fits in the cache, from which point it
1482 benefits from the increased memory speed.
1483
1484 Quicksort was rescued by implementing a sort pragma to control aspects
1485 of the sort.  The B<stable> subpragma forces stable behaviour,
1486 regardless of algorithm.  The B<_quicksort> and B<_mergesort>
1487 subpragmas are heavy-handed ways to select the underlying implementation.
1488 The leading C<_> is a reminder that these subpragmas may not survive
1489 beyond 5.8.  More appropriate mechanisms for selecting the implementation
1490 exist, but they wouldn't have arrived in time to save quicksort.
1491
1492 =item *
1493
1494 Hashes now use Bob Jenkins "One-at-a-Time" hashing key algorithm
1495 ( http://burtleburtle.net/bob/hash/doobs.html ).  This algorithm is
1496 reasonably fast while producing a much better spread of values than
1497 the old hashing algorithm (originally by Chris Torek, later tweaked by
1498 Ilya Zakharevich).  Hash values output from the algorithm on a hash of
1499 all 3-char printable ASCII keys comes much closer to passing the
1500 DIEHARD random number generation tests.  According to perlbench, this
1501 change has not affected the overall speed of Perl.
1502
1503 =item *
1504
1505 unshift() should now be noticeably faster.
1506
1507 =back
1508
1509 =head1 Installation and Configuration Improvements
1510
1511 =head2 Generic Improvements
1512
1513 =over 4
1514
1515 =item *
1516
1517 INSTALL now explains how you can configure Perl to use 64-bit
1518 integers even on non-64-bit platforms.
1519
1520 =item *
1521
1522 Policy.sh policy change: if you are reusing a Policy.sh file
1523 (see INSTALL) and you use Configure -Dprefix=/foo/bar and in the old
1524 Policy $prefix eq $siteprefix and $prefix eq $vendorprefix, all of
1525 them will now be changed to the new prefix, /foo/bar.  (Previously
1526 only $prefix changed.)  If you do not like this new behaviour,
1527 specify prefix, siteprefix, and vendorprefix explicitly.
1528
1529 =item *
1530
1531 A new optional location for Perl libraries, otherlibdirs, is available.
1532 It can be used for example for vendor add-ons without disturbing Perl's
1533 own library directories.
1534
1535 =item *
1536
1537 In many platforms the vendor-supplied 'cc' is too stripped-down to
1538 build Perl (basically, 'cc' doesn't do ANSI C).  If this seems
1539 to be the case and 'cc' does not seem to be the GNU C compiler
1540 'gcc', an automatic attempt is made to find and use 'gcc' instead.
1541
1542 =item *
1543
1544 gcc needs to closely track the operating system release to avoid
1545 build problems. If Configure finds that gcc was built for a different
1546 operating system release than is running, it now gives a clearly visible
1547 warning that there may be trouble ahead.
1548
1549 =item *
1550
1551 If binary compatibility with the 5.005 release is not wanted, Configure
1552 no longer suggests including the 5.005 modules in @INC.
1553
1554 =item *
1555
1556 Configure C<-S> can now run non-interactively.
1557
1558 =item *
1559
1560 Configure support for pdp11-style memory models has been removed due
1561 to obsolescence.
1562
1563 =item *
1564
1565 configure.gnu now works with options with whitespace in them.
1566
1567 =item *
1568
1569 installperl now outputs everything to STDERR.
1570
1571 =item *
1572
1573 $Config{byteorder} is now computed dynamically (this is more robust
1574 with "fat binaries" where an executable image contains binaries for
1575 more than one binary platform.)
1576
1577 =item *
1578
1579 Because PerlIO is now the default on most platforms, "-perlio" doesn't
1580 get appended to the $Config{archname} (also known as $^O) anymore.
1581 Instead, if you explicitly choose not to use perlio (Configure command
1582 line option -Uuseperlio), you will get "-stdio" appended.
1583
1584 =item *
1585
1586 Another change related to the architecture name is that "-64all"
1587 (-Duse64bitall, or "maximally 64-bit") is appended only if your
1588 pointers are 64 bits wide.  (To be exact, the use64bitall is ignored.)
1589
1590 =item *
1591
1592 In AFS installations one can configure the root of the AFS to be
1593 somewhere else than the default F</afs> by using the Configure
1594 parameter C<-Dafsroot=/some/where/else>.
1595
1596 =item *
1597
1598 APPLLIB_EXP, a less-know configuration-time definition, has been
1599 documented.  It can be used to prepend site-specific directories
1600 to Perl's default search path (@INC), see INSTALL for information.
1601
1602 =item *
1603
1604 The version of Berkeley DB used when the Perl (and, presumably, the
1605 DB_File extension) was built is now available as
1606 C<@Config{qw(db_version_major db_version_minor db_version_patch)}>
1607 from Perl and as C<DB_VERSION_MAJOR_CFG DB_VERSION_MINOR_CFG
1608 DB_VERSION_PATCH_CFG> from C.
1609
1610 =item *
1611
1612 Building Berkeley DB3 for compatibility modes for DB, NDBM, and ODBM
1613 has been documented in INSTALL.
1614
1615 =item *
1616
1617 If you have CPAN access (either network or a local copy such as a
1618 CD-ROM) you can during specify extra modules to Configure to build and
1619 install with Perl using the -Dextras=...  option.  See INSTALL for
1620 more details.
1621
1622 =item *
1623
1624 In addition to config.over a new override file, config.arch, is
1625 available.  That is supposed to be used by hints file writers for
1626 architecture-wide changes (as opposed to config.over which is for
1627 site-wide changes).
1628
1629 =item *
1630
1631 If your file system supports symbolic links you can build Perl outside
1632 of the source directory by
1633
1634         mkdir /tmp/perl/build/directory
1635         cd /tmp/perl/build/directory
1636         sh /path/to/perl/source/Configure -Dmksymlinks ...
1637
1638 This will create in /tmp/perl/build/directory a tree of symbolic links
1639 pointing to files in /path/to/perl/source.  The original files are left
1640 unaffected.  After Configure has finished you can just say
1641
1642         make all test
1643
1644 and Perl will be built and tested, all in /tmp/perl/build/directory.
1645
1646 =item *
1647
1648 For Perl developers several new make targets for profiling
1649 and debugging have been added, see L<perlhack>.
1650
1651 =over 8
1652
1653 =item *
1654
1655 Use of the F<gprof> tool to profile Perl has been documented in
1656 L<perlhack>.  There is a make target called "perl.gprof" for
1657 generating a gprofiled Perl executable.
1658
1659 =item *
1660
1661 If you have GCC 3, there is a make target called "perl.gcov" for
1662 creating a gcoved Perl executable for coverage analysis.  See
1663 L<perlhack>.
1664
1665 =item *
1666
1667 If you are on IRIX or Tru64 platforms, new profiling/debugging options
1668 have been added, see L<perlhack> for more information about pixie and
1669 Third Degree.
1670
1671 =back
1672
1673 =item *
1674
1675 Guidelines of how to construct minimal Perl installations have
1676 been added to INSTALL.
1677
1678 =item *
1679
1680 The Thread extension is now not built at all under ithreads
1681 (C<Configure -Duseithreads>) because it wouldn't work anyway (the
1682 Thread extension requires being Configured with C<-Duse5005threads>).
1683
1684 But note that the Thread.pm interface is now shared by both
1685 thread models.
1686
1687 =item *
1688
1689 The Gconvert macro ($Config{d_Gconvert}) used by perl for stringifying
1690 floating-point numbers is now more picky about using sprintf %.*g
1691 rules for the conversion.  Some platforms that used to use gcvt may
1692 now resort to the slower sprintf.
1693
1694 =back
1695
1696 =head2 New Or Improved Platforms
1697
1698 For the list of platforms known to support Perl,
1699 see L<perlport/"Supported Platforms">.
1700
1701 =over 4
1702
1703 =item *
1704
1705 AIX dynamic loading should be now better supported.
1706
1707 =item *
1708
1709 AIX should now work better with gcc, threads, and 64-bitness.  Also the
1710 long doubles support in AIX should be better now.  See L<perlaix>.
1711
1712 =item *
1713
1714 After a long pause, AmigaOS has been verified to be happy with Perl.
1715
1716 =item *
1717
1718 AtheOS ( http://www.atheos.cx/ ) is a new platform.
1719
1720 =item *
1721
1722 BeOS has been reclaimed.
1723
1724 =item *
1725
1726 DG/UX platform now supports the 5.005-style threads.  See L<perldgux>.
1727
1728 =item *
1729
1730 DYNIX/ptx platform (a.k.a. dynixptx) is supported at or near osvers 4.5.2.
1731
1732 =item *
1733
1734 EBCDIC platforms (z/OS, also known as OS/390, POSIX-BC, and VM/ESA)
1735 have been regained.  Many test suite tests still fail and the
1736 co-existence of Unicode and EBCDIC isn't quite settled, but the
1737 situation is much better than with Perl 5.6.  See L<perlos390>,
1738 L<perlbs2000> (for POSIX-BC), and L<perlvmesa> for more information.
1739
1740 =item *
1741
1742 Building perl with -Duseithreads or -Duse5005threads now works under
1743 HP-UX 10.20 (previously it only worked under 10.30 or later). You will
1744 need a thread library package installed. See README.hpux.
1745
1746 =item *
1747
1748 MacOS Classic (MacPerl has of course been available since
1749 perl 5.004 but now the source code bases of standard Perl
1750 and MacPerl have been synchronised)
1751
1752 =item *
1753
1754 MacOS X (or Darwin) should now be able to build Perl even on HFS+
1755 filesystems.  (The case-insensitivity confused the Perl build process.)
1756
1757 =item *
1758
1759 NCR MP-RAS is now supported.
1760
1761 =item *
1762
1763 All the NetBSD specific patches (except for the installation
1764 specific ones) have been merged back to the main distribution.
1765
1766 =item *
1767
1768 NetWare from Novell is now supported.  See L<perlnetware>.
1769
1770 =item *
1771
1772 NonStop-UX is now supported.
1773
1774 =item *
1775
1776 NEC SUPER-UX is now supported.
1777
1778 =item *
1779
1780 All the OpenBSD specific patches (except for the installation
1781 specific ones) have been merged back to the main distribution.
1782
1783 =item *
1784
1785 Perl has been tested with the GNU pth userlevel thread package
1786 ( http://www.gnu.org/software/pth/pth.html ) . All but one thread
1787 test worked, and that one failure was because of test results arriving
1788 in unexpected order.
1789
1790 =item *
1791
1792 Amdahl UTS UNIX mainframe platform is now supported.
1793
1794 =item *
1795
1796 WinCE is now supported.  See L<perlce>.
1797
1798 =item *
1799
1800 z/OS (formerly known as OS/390, formerly known as MVS OE) has now
1801 support for dynamic loading.  This is not selected by default,
1802 however, you must specify -Dusedl in the arguments of Configure.
1803
1804 =back
1805
1806 =head1 Selected Bug Fixes
1807
1808 Numerous memory leaks and uninitialized memory accesses have been
1809 hunted down.  Most importantly anonymous subs used to leak quite
1810 a bit.
1811
1812 =over 4
1813
1814 =item *
1815
1816 The autouse pragma didn't work for Multi::Part::Function::Names.
1817
1818 =item *
1819
1820 caller() could cause core dumps in certain situations.  Carp was sometimes
1821 affected by this problem.
1822
1823 =item *
1824
1825 chop(@list) in list context returned the characters chopped in
1826 reverse order.  This has been reversed to be in the right order.
1827
1828 =item *
1829
1830 Configure no longer includes the DBM libraries (dbm, gdbm, db, ndbm)
1831 when building the Perl binary.  The only exception to this is SunOS 4.x,
1832 which needs them.
1833
1834 =item *
1835
1836 The behaviour of non-decimal but numeric string constants such as
1837 "0x23" was platform-dependent: in some platforms that was seen as 35,
1838 in some as 0, in some as a floating point number (don't ask).  This
1839 was caused by Perl using the operating system libraries in a situation
1840 where the result of the string to number conversion is undefined: now
1841 Perl consistently handles such strings as zero in numeric contexts.
1842
1843 =item *
1844
1845 The order of DESTROYs has been made more predictable.
1846
1847 =item *
1848
1849 Several debugger fixes: exit code now reflects the script exit code,
1850 condition C<"0"> now treated correctly, the C<d> command now checks
1851 line number, the C<$.> no longer gets corrupted, all debugger output
1852 now goes correctly to the socket if RemotePort is set.
1853
1854 =item *
1855
1856 Perl 5.6.0 could emit spurious warnings about redefinition of dl_error()
1857 when statically building extensions into perl.  This has been corrected.
1858
1859 =item *
1860
1861 L<dprofpp> -R didn't work.
1862
1863 =item *
1864
1865 C<*foo{FORMAT}> now works.
1866 =item *
1867
1868 Infinity is now recognized as a number.
1869
1870 =item *
1871
1872 UNIVERSAL::isa no longer caches methods incorrectly.  (This broke
1873 the Tk extension with 5.6.0.)
1874
1875 =item *
1876
1877 Lexicals I: lexicals outside an eval "" weren't resolved
1878 correctly inside a subroutine definition inside the eval "" if they
1879 were not already referenced in the top level of the eval""ed code.
1880
1881 =item *
1882
1883 Lexicals II: lexicals leaked at file scope into subroutines that
1884 were declared before the lexicals.
1885
1886 =item *
1887
1888 Lexical warnings now propagating correctly between scopes
1889 and into C<eval "...">.
1890
1891 =item *
1892
1893 C<use warnings qw(FATAL all)> did not work as intended.  This has been
1894 corrected.
1895
1896 =item *
1897
1898 warnings::enabled() now reports the state of $^W correctly if the caller
1899 isn't using lexical warnings.
1900
1901 =item *
1902
1903 Line renumbering with eval and C<#line> now works.
1904
1905 =item *
1906
1907 Fixed numerous memory leaks, especially in eval "".
1908
1909 =item *
1910
1911 mkdir() now ignores trailing slashes in the directory name,
1912 as mandated by POSIX.
1913
1914 =item *
1915
1916 Some versions of glibc have a broken modfl().  This affects builds
1917 with C<-Duselongdouble>.  This version of Perl detects this brokenness
1918 and has a workaround for it.  The glibc release 2.2.2 is known to have
1919 fixed the modfl() bug.
1920
1921 =item *
1922
1923 Modulus of unsigned numbers now works (4063328477 % 65535 used to
1924 return 27406, instead of 27047).
1925
1926 =item *
1927
1928 Some "not a number" warnings introduced in 5.6.0 eliminated to be
1929 more compatible with 5.005.  Infinity is now recognised as a number.
1930
1931 =item *
1932
1933 Numeric conversions did not recognize changes in the string value
1934 properly in certain circumstances.
1935
1936 =item *
1937
1938 Attributes (like :shared) didn't work with our().
1939
1940 =item *
1941
1942 our() variables will not cause "will not stay shared" warnings.
1943
1944 =item *
1945
1946 "our" variables of the same name declared in two sibling blocks
1947 resulted in bogus warnings about "redeclaration" of the variables.
1948 The problem has been corrected.
1949
1950 =item *
1951
1952 pack "Z" now correctly terminates the string with "\0".
1953
1954 =item *
1955
1956 Fix password routines which in some shadow password platforms
1957 (e.g. HP-UX) caused getpwent() to return every other entry.
1958
1959 =item *
1960
1961 The PERL5OPT environment variable (for passing command line arguments
1962 to Perl) didn't work for more than a single group of options.
1963
1964 =item *
1965
1966 PERL5OPT with embedded spaces didn't work.
1967
1968 =item *
1969
1970 printf() no longer resets the numeric locale to "C".
1971
1972 =item *
1973
1974 C<qw(a\\b)> now parses correctly as C<'a\\b'>.
1975
1976 =item *
1977
1978 pos() did not return the correct value within s///ge in earlier
1979 versions.  This is now handled correctly.
1980
1981 =item *
1982
1983 Printing quads (64-bit integers) with printf/sprintf now works
1984 without the q L ll prefixes (assuming you are on a quad-capable platform).
1985
1986 =item *
1987
1988 Regular expressions on references and overloaded scalars now work.
1989
1990 =item *
1991
1992 Right-hand side magic (GMAGIC) could in many cases such as string
1993 concatenation be invoked too many times.
1994
1995 =item *
1996
1997 scalar() now forces scalar context even when used in void context.
1998
1999 =item *
2000
2001 SOCKS support is now much more robust.
2002
2003 =item *
2004
2005 sort() arguments are now compiled in the right wantarray context
2006 (they were accidentally using the context of the sort() itself).
2007 The comparison block is now run in scalar context, and the arguments
2008 to be sorted are always provided list context.
2009
2010 =item *
2011
2012 Changed the POSIX character class C<[[:space:]]> to include the (very
2013 rarely used) vertical tab character.  Added a new POSIX-ish character
2014 class C<[[:blank:]]> which stands for horizontal whitespace
2015 (currently, the space and the tab).
2016
2017 =item *
2018
2019 The tainting behaviour of sprintf() has been rationalized.  It does
2020 not taint the result of floating point formats anymore, making the
2021 behaviour consistent with that of string interpolation.
2022
2023 =item *
2024
2025 Some cases of inconsistent taint propagation (such as within hash
2026 values) have been fixed.
2027
2028 =item *
2029
2030 The RE engine found in Perl 5.6.0 accidentally pessimised certain kinds
2031 of simple pattern matches.  These are now handled better.
2032
2033 =item *
2034
2035 Regular expression debug output (whether through C<use re 'debug'>
2036 or via C<-Dr>) now looks better.
2037
2038 =item *
2039
2040 Multi-line matches like C<"a\nxb\n" =~ /(?!\A)x/m> were flawed.  The
2041 bug has been fixed.
2042
2043 =item *
2044
2045 Use of $& could trigger a core dump under some situations.  This
2046 is now avoided.
2047
2048 =item *
2049
2050 The regular expression captured submatches ($1, $2, ...) are now
2051 more consistently unset if the match fails, instead of leaving false
2052 data lying around in them.
2053
2054 =item *
2055
2056 readline() on files opened in "slurp" mode could return an extra "" at
2057 the end in certain situations.  This has been corrected.
2058
2059 =item *
2060
2061 Autovivification of symbolic references of special variables described
2062 in L<perlvar> (as in C<${$num}>) was accidentally disabled.  This works
2063 again now.
2064
2065 =item *
2066
2067 Sys::Syslog ignored the C<LOG_AUTH> constant.
2068
2069 =item *
2070
2071 All but the first argument of the IO syswrite() method are now optional.
2072
2073 =item *
2074
2075 $AUTOLOAD, sort(), lock(), and spawning subprocesses
2076 in multiple threads simultaneously are now thread-safe.
2077
2078 =item *
2079
2080 Tie::ARRAY SPLICE method was broken.
2081
2082 =item *
2083
2084 Allow read-only string on left hand side of non-modifying tr///.
2085
2086 =item *
2087
2088 If C<STDERR> is tied, warnings caused by C<warn> and C<die> now
2089 correctly pass to it.
2090
2091 =item *
2092
2093 Several Unicode fixes.
2094
2095 =over 8
2096
2097 =item *
2098
2099 BOMs (byte order marks) in the beginning of Perl files
2100 (scripts, modules) should now be transparently skipped.
2101 UTF-16 (UCS-2) encoded Perl files should now be read correctly.
2102
2103 =item *
2104
2105 The character tables have been updated to Unicode 3.1.1.
2106
2107 =item *
2108
2109 Comparing with utf8 data does not magically upgrade non-utf8 data
2110 into utf8.  (This was a problem for example if you were mixing data
2111 from I/O and Unicode data: your output might have got magically encoded
2112 as UTF-8.)
2113
2114 =item *
2115
2116 Generating illegal Unicode code points like U+FFFE, or the UTF-16
2117 surrogates, now also generates an optional warning.
2118
2119 =item *
2120
2121 C<IsAlnum>, C<IsAlpha>, and C<IsWord> now match titlecase.
2122
2123 =item *
2124
2125 Concatenation with the C<.> operator or via variable interpolation,
2126 C<eq>, C<substr>, C<reverse>, C<quotemeta>, the C<x> operator,
2127 substitution with C<s///>, single-quoted UTF8, should now work.
2128
2129 =item *
2130
2131 The C<tr///> operator now works.  Note that the C<tr///CU>
2132 functionality has been removed (but see pack('U0', ...)).
2133
2134 =item *
2135
2136 C<eval "v200"> now works.
2137
2138 =item *
2139
2140 Perl 5.6.0 parsed m/\x{ab}/ incorrectly, leading to spurious warnings.
2141 This has been corrected.
2142
2143 =item *
2144
2145 Zero entries were missing from the Unicode classes like C<IsDigit>.
2146
2147 =back
2148
2149 =item *
2150
2151 Large unsigned numbers (those above 2**31) could sometimes lose their
2152 unsignedness, causing bogus results in arithmetic operations.
2153
2154 =back
2155
2156 =head2 Platform Specific Changes and Fixes
2157
2158 =over 4
2159
2160 =item *
2161
2162 BSDI 4.*
2163
2164 Perl now works on post-4.0 BSD/OSes.
2165
2166 =item *
2167
2168 All BSDs
2169
2170 Setting C<$0> now works (as much as possible; see L<perlvar> for details).
2171
2172 =item *
2173
2174 Cygwin
2175
2176 Numerous updates; currently synchronised with Cygwin 1.3.10.
2177
2178 =item *
2179
2180 Previously DYNIX/ptx had problems in its Configure probe for non-blocking I/O.
2181
2182 =item *
2183
2184 EPOC
2185
2186 EPOC update after Perl 5.6.0.  See README.epoc.
2187
2188 =item *
2189
2190 FreeBSD 3.*
2191
2192 Perl now works on post-3.0 FreeBSDs.
2193
2194 =item *
2195
2196 HP-UX
2197
2198 README.hpux updated; C<Configure -Duse64bitall> now works.
2199
2200 =item *
2201
2202 IRIX
2203
2204 Numerous compilation flag and hint enhancements; accidental mixing
2205 of 32-bit and 64-bit libraries (a doomed attempt) made much harder.
2206
2207 =item *
2208
2209 Linux
2210
2211 =over 8
2212
2213 =item *
2214
2215 Long doubles should now work (see INSTALL).
2216
2217 =item *
2218
2219 Linux previously had problems related to sockaddrlen when using
2220 accept(), revcfrom() (in Perl: recv()), getpeername(), and getsockname().
2221
2222 =back
2223
2224 =item *
2225
2226 MacOS Classic
2227
2228 Compilation of the standard Perl distribution in MacOS Classic should
2229 now work if you have the Metrowerks development environment and
2230 the missing Mac-specific toolkit bits.  Contact the macperl mailing
2231 list for details.
2232
2233 =item *
2234
2235 MPE/iX
2236
2237 MPE/iX update after Perl 5.6.0.  See README.mpeix.
2238
2239 =item *
2240
2241 NetBSD/sparc
2242
2243 Perl now works on NetBSD/sparc.
2244
2245 =item *
2246
2247 OS/2
2248
2249 Now works with usethreads (see INSTALL).
2250
2251 =item *
2252
2253 Solaris
2254
2255 64-bitness using the Sun Workshop compiler now works.
2256
2257 =item *
2258
2259 Tru64 (aka Digital UNIX, aka DEC OSF/1)
2260
2261 The operating system version letter now recorded in $Config{osvers}.
2262 Allow compiling with gcc (previously explicitly forbidden).  Compiling
2263 with gcc still not recommended because buggy code results, even with
2264 gcc 2.95.2.
2265
2266 =item *
2267
2268 Unicos
2269
2270 Fixed various alignment problems that lead into core dumps either
2271 during build or later; no longer dies on math errors at runtime;
2272 now using full quad integers (64 bits), previously was using 
2273 only 46 bit integers for speed.
2274
2275 =item *
2276
2277 VMS
2278
2279 chdir() now works better despite a CRT bug; now works with MULTIPLICITY
2280 (see INSTALL); now works with Perl's malloc.
2281
2282 The tainting of C<%ENV> elements via C<keys> or C<values> was previously
2283 unimplemented.  It now works as documented.
2284
2285 The C<waitpid> emulation has been improved.  The worst bug (now fixed)
2286 was that a pid of -1 would cause a wildcard search of all processes on
2287 the system.  The most significant enhancement is that we can now
2288 usually get the completion status of a terminated process.
2289
2290 POSIX-style signals are now emulated much better on VMS versions prior
2291 to 7.0.
2292
2293 The C<system> function and backticks operator have improved
2294 functionality and better error handling.
2295
2296 File access tests now use current process privileges rather than the
2297 user's default privileges, which could sometimes result in a mismatch
2298 between reported access and actual access.
2299
2300 =item *
2301
2302 Windows
2303
2304 =over 8
2305
2306 =item *
2307
2308 accept() no longer leaks memory.
2309
2310 =item *
2311
2312 Borland C++ v5.5 is now a supported compiler that can build Perl.
2313 However, the generated binaries continue to be incompatible with those
2314 generated by the other supported compilers (GCC and Visual C++).
2315
2316 =item *
2317
2318 Better chdir() return value for a non-existent directory.
2319
2320 =item *
2321
2322 Duping socket handles with open(F, ">&MYSOCK") now works under Windows 9x.
2323
2324 =item *
2325
2326 New %ENV entries now propagate to subprocesses.
2327
2328 =item *
2329
2330 Current directory entries in %ENV are now correctly propagated to child
2331 processes.
2332
2333 =item *
2334
2335 $ENV{LIB} now used to search for libs under Visual C.
2336
2337 =item *
2338
2339 fork() emulation has been improved in various ways, but still continues
2340 to be experimental.  See L<perlfork> for known bugs and caveats.
2341
2342 =item *
2343
2344 A failed (pseudo)fork now returns undef and sets errno to EAGAIN.
2345
2346 =item *
2347
2348 Win32::GetCwd() correctly returns C:\ instead of C: when at the drive root.
2349 Other bugs in chdir() and Cwd::cwd() have also been fixed.
2350
2351 =item *
2352
2353 HTML files will be installed in c:\perl\html instead of c:\perl\lib\pod\html
2354
2355 =item *
2356
2357 The makefiles now provide a single switch to bulk-enable all the features
2358 enabled in ActiveState ActivePerl (a popular Win32 binary distribution).
2359
2360 =item *
2361
2362 Allow REG_EXPAND_SZ keys in the registry.
2363
2364 =item *
2365
2366 Can now send() from all threads, not just the first one.
2367
2368 =item *
2369
2370 Fake signal handling reenabled, bugs and all.
2371
2372 =item *
2373
2374 %SIG has been enabled under USE_ITHREADS, but its use is completely
2375 unsupported under all configurations.
2376
2377 =item *
2378
2379 Less stack reserved per thread so that more threads can run
2380 concurrently. (Still 16M per thread.)
2381
2382 =item *
2383
2384 C<File::Spec-&gt;tmpdir()> now prefers C:/temp over /tmp
2385 (works better when perl is running as service).
2386
2387 =item *
2388
2389 Better UNC path handling under ithreads.
2390
2391 =item *
2392
2393 wait(), waitpid() and backticks now return the correct exit status under
2394 Windows 9x.
2395
2396 =item *
2397
2398 winsock handle leak fixed.
2399
2400 =item *
2401
2402 The Perl parser has been stress tested using both random input and
2403 Markov chain input and the few found crashes and lockups have been
2404 fixed.
2405
2406 =back
2407
2408 =back
2409
2410 =head1 New or Changed Diagnostics
2411
2412 =over 4
2413
2414 =item *
2415
2416 The lexical warnings category "deprecated" is no longer a sub-category
2417 of the "syntax" category. It is now a top-level category in its own
2418 right.
2419
2420 =item *
2421
2422 All regular expression compilation error messages are now hopefully
2423 easier to understand both because the error message now comes before
2424 the failed regex and because the point of failure is now clearly
2425 marked by a C<E<lt>-- HERE> marker.
2426
2427 =item *
2428
2429 The various "opened only for", "on closed", "never opened" warnings
2430 drop the C<main::> prefix for filehandles in the C<main> package,
2431 for example C<STDIN> instead of C<main::STDIN>. 
2432
2433 =item *
2434
2435 The "Unrecognized escape" warning has been extended to include C<\8>,
2436 C<\9>, and C<\_>.  There is no need to escape any of the C<\w> characters.
2437
2438 =item *
2439
2440 Two new debugging options have been added: if you have compiled your
2441 Perl with debugging, you can use the -DT and -DR options to trace
2442 tokenising and to add reference counts to displaying variables,
2443 respectively.
2444
2445 =item *
2446
2447 The debugger (perl5db.pl) has been modified to present a more
2448 consistent commands interface, via (CommandSet=580).  perl5db.t was
2449 also added to test the changes, and as a placeholder for further tests.
2450
2451 See L<perldebug>.
2452
2453 =item *
2454
2455 The debugger has a new C<dumpDepth> option to control the maximum
2456 depth to which nested structures are dumped.  The C<x> command has
2457 been extended so that C<x N EXPR> dumps out the value of I<EXPR> to a
2458 depth of at most I<N> levels.
2459
2460 =item *
2461
2462 The debugger can now show lexical variables if you have the CPAN
2463 module PadWalker installed.
2464
2465 =item *
2466
2467 If an attempt to use a (non-blessed) reference as an array index
2468 is made, a warning is given.
2469
2470 =item *
2471
2472 C<push @a;> and C<unshift @a;> (with no values to push or unshift)
2473 now give a warning.  This may be a problem for generated and evaled
2474 code.
2475
2476 =item *
2477
2478 If you try to L<perlfunc/pack> a number less than 0 or larger than 255
2479 using the C<"C"> format you will get an optional warning.  Similarly
2480 for the C<"c"> format and a number less than -128 or more than 127.
2481
2482 =item *
2483
2484 Certain regex modifiers such as C<(?o)> make sense only if applied to
2485 the entire regex.  You will get an optional warning if you try to do
2486 otherwise. 
2487
2488 =item *
2489
2490 Using arrays or hashes as references (e.g. C<< %foo->{bar} >>
2491 has been deprecated for a while.  Now you will get an optional warning.
2492
2493 =item *
2494
2495 Using C<sort> in scalar context now issues an optional warning.
2496 This didn't do anything useful, as the sort was not performed.
2497
2498 =back
2499
2500 =head1 Changed Internals
2501
2502 =over 4
2503
2504 =item *
2505
2506 perlapi.pod (a companion to perlguts) now attempts to document the
2507 internal API.
2508
2509 =item *
2510
2511 You can now build a really minimal perl called microperl.
2512 Building microperl does not require even running Configure;
2513 C<make -f Makefile.micro> should be enough.  Beware: microperl makes
2514 many assumptions, some of which may be too bold; the resulting
2515 executable may crash or otherwise misbehave in wondrous ways.
2516 For careful hackers only.
2517
2518 =item *
2519
2520 Added rsignal(), whichsig(), do_join(), op_clear, op_null,
2521 ptr_table_clear(), ptr_table_free(), sv_setref_uv(), and several UTF-8
2522 interfaces to the publicised API.  For the full list of the available
2523 APIs see L<perlapi>.
2524
2525 =item *
2526
2527 Made possible to propagate customised exceptions via croak()ing.
2528
2529 =item *
2530
2531 Now xsubs can have attributes just like subs.  (Well, at least the
2532 built-in attributes.)
2533
2534 =item *
2535
2536 dTHR and djSP have been obsoleted; the former removed (because it's
2537 a no-op) and the latter replaced with dSP.
2538
2539 =item *
2540
2541 PERL_OBJECT has been completely removed.
2542
2543 =item *
2544
2545 The MAGIC constants (e.g. C<'P'>) have been macrofied
2546 (e.g. C<PERL_MAGIC_TIED>) for better source code readability
2547 and maintainability.
2548
2549 =item *
2550
2551 The regex compiler now maintains a structure that identifies nodes in
2552 the compiled bytecode with the corresponding syntactic features of the
2553 original regex expression.  The information is attached to the new
2554 C<offsets> member of the C<struct regexp>. See L<perldebguts> for more
2555 complete information.
2556
2557 =item *
2558
2559 The C code has been made much more C<gcc -Wall> clean.  Some warning
2560 messages still remain in some platforms, so if you are compiling with
2561 gcc you may see some warnings about dubious practices.  The warnings
2562 are being worked on.
2563
2564 =item *
2565
2566 F<perly.c>, F<sv.c>, and F<sv.h> have now been extensively commented.
2567
2568 =item *
2569
2570 Documentation on how to use the Perl source repository has been added
2571 to F<Porting/repository.pod>.
2572
2573 =item *
2574
2575 There are now several profiling make targets.
2576
2577 =back
2578
2579 =head1 Security Vulnerability Closed
2580
2581 (This change was already made in 5.7.0 but bears repeating here.)
2582
2583 A potential security vulnerability in the optional suidperl component
2584 of Perl was identified in August 2000.  suidperl is neither built nor
2585 installed by default.  As of November 2001 the only known vulnerable
2586 platform is Linux, most likely all Linux distributions.  CERT and
2587 various vendors and distributors have been alerted about the vulnerability.
2588 See http://www.cpan.org/src/5.0/sperl-2000-08-05/sperl-2000-08-05.txt
2589 for more information.
2590
2591 The problem was caused by Perl trying to report a suspected security
2592 exploit attempt using an external program, /bin/mail.  On Linux
2593 platforms the /bin/mail program had an undocumented feature which
2594 when combined with suidperl gave access to a root shell, resulting in
2595 a serious compromise instead of reporting the exploit attempt.  If you
2596 don't have /bin/mail, or if you have 'safe setuid scripts', or if
2597 suidperl is not installed, you are safe.
2598
2599 The exploit attempt reporting feature has been completely removed from
2600 Perl 5.8.0 (and the maintenance release 5.6.1, and it was removed also
2601 from all the Perl 5.7 releases), so that particular vulnerability
2602 isn't there anymore.  However, further security vulnerabilities are,
2603 unfortunately, always possible.  The suidperl functionality is most
2604 probably going to be removed in Perl 5.10.  In any case, suidperl
2605 should only be used by security experts who know exactly what they are
2606 doing and why they are using suidperl instead of some other solution
2607 such as sudo ( see http://www.courtesan.com/sudo/ ).
2608
2609 =head1 New Tests
2610
2611 Several new tests have been added, especially for the F<lib>
2612 subsection.  There are now about 56 000 individual tests (spread over
2613 about 620 test scripts), in the regression suite (5.6.1 has about
2614 11700 tests, in 258 test scripts) Many of the new tests are introduced
2615 by the new modules, but still in general Perl is now more thoroughly
2616 tested.
2617
2618 Because of the large number of tests, running the regression suite
2619 will take considerably longer time than it used to: expect the suite
2620 to take up to 4-5 times longer to run than in perl 5.6.  In a really
2621 fast machine you can hope to finish the suite in about 6-8 minutes
2622 (wallclock time).
2623
2624 The tests are now reported in a different order than in earlier Perls.
2625 (This happens because the test scripts from under t/lib have been moved
2626 to be closer to the library/extension they are testing.)
2627
2628 =head1 Known Problems
2629
2630 =head2 AIX
2631
2632 =over 4
2633
2634 =item *
2635
2636 In AIX 4.2 Perl extensions that use C++ functions that use statics
2637 may have problems in that the statics are not getting initialized.
2638 In newer AIX releases this has been solved by linking Perl with
2639 the libC_r library, but unfortunately in AIX 4.2 the said library
2640 has an obscure bug where the various functions related to time
2641 (such as time() and gettimeofday()) return broken values, and
2642 therefore in AIX 4.2 Perl is not linked against the libC_r.
2643
2644 =item *
2645
2646 vac 5.0.0.0 May Produce Buggy Code For Perl
2647
2648 The AIX C compiler vac version 5.0.0.0 may produce buggy code,
2649 resulting in few random tests failing, but when the failing tests
2650 are run by hand, they succeed.  We suggest upgrading to at least
2651 vac version 5.0.1.0, that has been known to compile Perl correctly.
2652 "lslpp -L|grep vac.C" will tell you the vac version. See README.aix.
2653
2654 =item *
2655
2656 If building threaded Perl, you may get compilation warning from pp_sys.c:
2657
2658   "pp_sys.c", line 4651.39: 1506-280 (W) Function argument assignment between types "unsigned char*" and "const void*" is not allowed.
2659
2660 This is harmless; it is caused by the getnetbyaddr() and getnetbyaddr_r()
2661 having slightly different types for their first argument.
2662
2663 =back
2664
2665 =head2 Amiga Perl Invoking Mystery
2666
2667 One cannot call Perl using the C<volume:> syntax, that is, C<perl -v>
2668 works, but for example C<bin:perl -v> doesn't.  The exact reason isn't
2669 known but the current suspect is the F<ixemul> library.
2670
2671 =head2 FreeBSD Failing locale Test 117 For ISO8859-15 Locales
2672
2673 The ISO8859-15 locales may fail the locale test 117 in FreeBSD.
2674 This is caused by the characters \xFF (y with diaeresis) and \xBE
2675 (Y with diaeresis) not behaving correctly when being matched
2676 case-insensitively.
2677
2678 =head2 mod_perl 1.26 Doesn't Build With Threaded Perl
2679
2680 Use mod_perl 1.27 or higher.
2681
2682 =head2 lib/ftmp-security tests warn 'system possibly insecure'
2683
2684 Don't panic.  Read INSTALL 'make test' section instead.
2685
2686 =head2  HP-UX lib/posix Subtest 9 Fails When LP64-Configured
2687
2688 If perl is configured with -Duse64bitall, the successful result of the
2689 subtest 10 of lib/posix may arrive before the successful result of the
2690 subtest 9, which confuses the test harness so much that it thinks the
2691 subtest 9 failed.
2692
2693 =head2 Linux With Sfio Fails op/misc Test 48
2694
2695 No known fix.
2696
2697 =head2 Mac OS X
2698
2699 Please remember to set your environment variable LC_ALL to "C"
2700 (setenv LC_ALL C) before running "make test" to avoid a lot of
2701 warnings about the broken locales of Mac OS X.
2702
2703 The following tests are known to fail:
2704
2705  Failed Test                 Stat Wstat Total Fail  Failed  List of Failed
2706  -------------------------------------------------------------------------
2707  ../ext/DB_File/t/db-btree.t    0    11    ??   ??       %  ??
2708  ../ext/DB_File/t/db-recno.t              149    3   2.01%  61 63 65
2709  ../ext/POSIX/t/posix.t                    31    1   3.23%  10
2710
2711 If you are building on a UFS partition, you will also probably see
2712 t/op/stat.t subtest #9 fail.  This is caused by Darwin's UFS not
2713 supporting inode change time.
2714
2715 =head2 op/sprintf tests 91, 129, and 130
2716
2717 The op/sprintf tests 91, 129, and 130 are known to fail on some platforms.
2718 Examples include any platform using sfio, and Compaq/Tandem's NonStop-UX.
2719
2720 The test 91 is known to fail at QNX6 (nto), because C<sprintf '%e',0>
2721 incorrectly produces C<0.000000e+0> instead of C<0.000000e+00>.
2722
2723 For the tests 129 and 130 the failing platforms do not comply with
2724 the ANSI C Standard, line 19ff on page 134 of ANSI X3.159 1989 to
2725 be exact.  (They produce something other than "1" and "-1" when
2726 formatting 0.6 and -0.6 using the printf format "%.0f", most often
2727 they produce "0" and "-0".)
2728
2729 =head2 Failure of Thread (5.005-style) tests
2730
2731 B<Note that support for 5.005-style threading remains experimental
2732 and practically unsupported.>
2733
2734 The following tests are known to fail due to fundamental problems in
2735 the 5.005 threading implementation. These are not new failures--Perl
2736 5.005_0x has the same bugs, but didn't have these tests.
2737
2738  ../ext/List/Util/t/first.t         255 65280     7    4  57.14%  2 5-7
2739  ../lib/English.t                     2   512    54    2   3.70%  2-3
2740  ../lib/Filter/Simple/t/data.t                    6    3  50.00%  1-3
2741  ../lib/Filter/Simple/t/filter_onl                9    3  33.33%  1-2 5
2742  ../lib/autouse.t                                10    1  10.00%  4
2743  op/flip.t                                       15    1   6.67%  15
2744
2745 These failures are unlikely to get fixed as the 5.005-style
2746 threads are considered fundamentally broken.
2747
2748 =head2 UNICOS
2749
2750  Failed Test                 Stat Wstat Total Fail  Failed  List of Failed
2751  -------------------------------------------------------------------------
2752  ../ext/Socket/socketpair.t    1   256    45    1   2.22%  12
2753  ../lib/Math/Trig.t                       26    1   3.85%  25
2754  ../lib/warnings.t                       460    1   0.22%  425
2755  io/fs.t                                  36    1   2.78%  31
2756  op/numconvert.t                        1440   13   0.90%  208 509-510
2757  657-658 665-666 829-830 989-990 1149-1150
2758
2759 =head2 UNICOS and UNICOS/mk
2760
2761 The io/fs test #31 is failing because in UNICOS and UNICOS/mk the Perl
2762 truncate() cannot be used to grow the size of filehandles, only to
2763 reduce the size.  The workaround is to truncate files instead of
2764 filehandles.
2765
2766 =head2 UNICOS/mk
2767
2768 =over 4
2769
2770 =item *
2771
2772 During Configure the test
2773
2774     Guessing which symbols your C compiler and preprocessor define...
2775
2776 will probably fail with error messages like
2777
2778     CC-20 cc: ERROR File = try.c, Line = 3
2779       The identifier "bad" is undefined.
2780
2781       bad switch yylook 79bad switch yylook 79bad switch yylook 79bad switch yylook 79#ifdef A29K
2782       ^
2783
2784     CC-65 cc: ERROR File = try.c, Line = 3
2785       A semicolon is expected at this point.
2786
2787 This is caused by a bug in awk utility of UNICOS/mk.  You can ignore
2788 the error, but it does cause a slight problem: you cannot fully
2789 benefit from the h2ph utility (see L<h2ph>) that can be used to
2790 convert C headers to Perl libraries, mainly used to be able to access
2791 from Perl the constants defined using C preprocessor, cpp.  Because of
2792 the above error parts of the converted headers will be invisible.
2793 Luckily, these days the need for h2ph is rare.
2794
2795 =item *
2796
2797 If building Perl with the interpreter threads (ithreads), the
2798 getgrent(), getgrnam(), and getgrgid() functions cannot return the
2799 list of the group members due to a bug in the multithreaded support of
2800 UNICOS/mk.  What this means that in list context the functions will
2801 return only three values, not four.
2802
2803 =back
2804
2805 =head2 UTS
2806
2807 There are a few known test failures, see L<perluts>.
2808
2809 =head2 VMS
2810
2811 There should be no reported test failures with a default configuration,
2812 though there are a number of tests marked TODO that point to areas
2813 needing further debugging and/or porting work.
2814
2815 =head2 Win32
2816
2817 In multi-CPU boxes there are some problems with the I/O buffering:
2818 some output may appear twice.  The following Win32 failures are known
2819 as of 5.7.3:
2820
2821  Failed Test                 Stat Wstat Total Fail  Failed  List of Failed
2822  -------------------------------------------------------------------------
2823   ..\ext/threads/t/end.t                6    4  66.67%  3-6
2824
2825 =head2 XML::Parser not working
2826
2827 Use XML::Parser 2.31 or later.
2828
2829 =head2 Localising a Tied Variable Leaks Memory
2830
2831     use Tie::Hash;
2832     tie my %tie_hash => 'Tie::StdHash';
2833
2834     ...
2835
2836     local($tie_hash{Foo}) = 1; # leaks
2837
2838 Code like the above is known to leak memory every time the local()
2839 is executed.
2840
2841 =head2 z/OS (OS/390)
2842
2843 z/OS has rather many test failures but the situation is actually
2844 better than it was in 5.6.0, it's just that so many new modules and
2845 tests have been added.
2846
2847  Failed Test                 Stat Wstat Total Fail  Failed  List of Failed
2848  -------------------------------------------------------------------------
2849  ../ext/Data/Dumper/t/dumper.t              321    2   0.62%  311 314
2850  ../ext/IO/lib/IO/t/io_unix.t                 5    4  80.00%  2-5
2851  ../lib/utf8.t                               94   13  13.83%  27 30-31 43 46 73
2852                                                               76 79 82 85 88 91
2853                                                               94
2854  ../lib/Benchmark.t               1   256   159    1   0.63%  75
2855  ../lib/ExtUtils/t/Constant.t                27   19  70.37%  5-23
2856  ../lib/ExtUtils/t/Embed.t                    9    9 100.00%  1-9
2857  op/pat.t                                   864    9   1.04%  242-243 665 776
2858                                                               785 832-834 845
2859  op/sprintf.t                               224    3   1.34%  98 100 136
2860  op/tr.t                                     97    5   5.15%  63 71-74
2861  uni/fold.t                                 780    6   0.77%  61 169 196 661
2862                                                               710-711
2863
2864 =head2 Localising Tied Arrays and Hashes Is Broken
2865
2866     local %tied_array;
2867
2868 doesn't work as one would expect: the old value is restored
2869 incorrectly.
2870
2871 =head2 Self-tying of Arrays and Hashes Is Forbidden
2872
2873 Self-tying of arrays and hashes is broken in rather deep and
2874 hard-to-fix ways.  As a stop-gap measure to avoid people from getting
2875 frustrated at the mysterious results (core dumps, most often) it is
2876 for now forbidden (you will get a fatal error even from an attempt).
2877
2878 =head2 Building Extensions Can Fail Because Of Largefiles
2879
2880 Some extensions like mod_perl are known to have issues with
2881 `largefiles', a change brought by Perl 5.6.0 in which file offsets
2882 default to 64 bits wide, where supported.  Modules may fail to compile
2883 at all or compile and work incorrectly.  Currently there is no good
2884 solution for the problem, but Configure now provides appropriate
2885 non-largefile ccflags, ldflags, libswanted, and libs in the %Config
2886 hash (e.g., $Config{ccflags_nolargefiles}) so the extensions that are
2887 having problems can try configuring themselves without the
2888 largefileness.  This is admittedly not a clean solution, and the
2889 solution may not even work at all.  One potential failure is whether
2890 one can (or, if one can, whether it's a good idea) link together at
2891 all binaries with different ideas about file offsets, all this is
2892 platform-dependent.
2893
2894 =head2 Unicode Support on EBCDIC Still Spotty
2895
2896 Though mostly working, Unicode support still has problem spots on
2897 EBCDIC platforms.  One such known spot are the C<\p{}> and C<\P{}>
2898 regular expression constructs for code points less than 256: the
2899 pP are testing for Unicode code points, not knowing about EBCDIC.
2900
2901 =head2 The Compiler Suite Is Still Experimental
2902
2903 The compiler suite is slowly getting better but it continues to be
2904 highly experimental.  Use in production environments is discouraged.
2905
2906 =head2 The Long Double Support Is Still Experimental
2907
2908 The ability to configure Perl's numbers to use "long doubles",
2909 floating point numbers of hopefully better accuracy, is still
2910 experimental.  The implementations of long doubles are not yet
2911 widespread and the existing implementations are not quite mature
2912 or standardised, therefore trying to support them is a rare
2913 and moving target.  The gain of more precision may also be offset
2914 by slowdown in computations (more bits to move around, and the
2915 operations are more likely to be executed by less optimised
2916 libraries).
2917
2918 =head2 Seen In Perl 5.7 But Gone Now
2919
2920 C<Time::Piece> (previously known as C<Time::Object>) was removed
2921 because it was felt that it didn't have enough value in it to be a
2922 core module.  It is still a useful module, though, and is available
2923 from the CPAN.
2924
2925 =head1 Reporting Bugs
2926
2927 If you find what you think is a bug, you might check the articles
2928 recently posted to the comp.lang.perl.misc newsgroup and the perl
2929 bug database at http://bugs.perl.org/  There may also be
2930 information at http://www.perl.com/ , the Perl Home Page.
2931
2932 If you believe you have an unreported bug, please run the B<perlbug>
2933 program included with your release.  Be sure to trim your bug down
2934 to a tiny but sufficient test case.  Your bug report, along with the
2935 output of C<perl -V>, will be sent off to perlbug@perl.org to be
2936 analysed by the Perl porting team.
2937
2938 =head1 SEE ALSO
2939
2940 The F<Changes> file for exhaustive details on what changed.
2941
2942 The F<INSTALL> file for how to build Perl.
2943
2944 The F<README> file for general stuff.
2945
2946 The F<Artistic> and F<Copying> files for copyright information.
2947
2948 =head1 HISTORY
2949
2950 Written by Jarkko Hietaniemi <F<jhi@iki.fi>>.
2951
2952 =cut