If it looks like UTF-8 (either nl_langinfo or locale variables),
[p5sagit/p5-mst-13.2.git] / pod / perldelta.pod
1 =head1 NAME
2
3 perldelta - what is new for perl v5.8.0
4
5 =head1 DESCRIPTION
6
7 This document describes differences between the 5.6.0 release
8 and the 5.8.0 release.
9
10 Many of the bug fixes in 5.8.0 were already seen in the 5.6.1
11 maintenance release since the two releases were kept closely
12 coordinated.
13
14 If you are upgrading from Perl 5.005_03, you might also want
15 to read L<perl56delta>.
16
17 =head1 Highlights In 5.8.0
18
19 =over 4
20
21 =item *
22
23 Better Unicode support
24
25 =item *
26
27 New Thread Implementation
28
29 =item *
30
31 Many New Modules
32
33 =item *
34
35 Better Numeric Accuracy
36
37 =item *
38
39 Safe Signals
40
41 =item *
42
43 More Extensive Regression Testing
44
45 =back
46
47 =head1 Incompatible Changes
48
49 =head2 64-bit platforms and malloc
50
51 If your pointers are 64 bits wide, the Perl malloc is no longer being
52 used because it does not work well with 8-byte pointers.  Also,
53 usually the system mallocs on such platforms are much better optimized
54 for such large memory models than the Perl malloc.  Some memory-hungry
55 Perl applications like the PDL don't work well with Perl's malloc.
56 Finally, other applications than Perl (like modperl) tend to prefer
57 the system malloc.  Such platforms include Alpha and 64-bit HPPA,
58 MIPS, PPC, and Sparc.
59
60 =head2 AIX Dynaloading
61
62 The AIX dynaloading now uses in AIX releases 4.3 and newer the native
63 dlopen interface of AIX instead of the old emulated interface.  This
64 change will probably break backward compatibility with compiled
65 modules.  The change was made to make Perl more compliant with other
66 applications like modperl which are using the AIX native interface.
67
68 =head2 Attributes for C<my> variables now handled at run-time.
69
70 The C<my EXPR : ATTRS> syntax now applies variable attributes at
71 run-time.  (Subroutine and C<our> variables still get attributes applied
72 at compile-time.)  See L<attributes> for additional details.  In particular,
73 however, this allows variable attributes to be useful for C<tie> interfaces,
74 which was a deficiency of earlier releases.  Note that the new semantics
75 doesn't work with the Attribute::Handlers module (as of version 0.76).
76
77 =head2 Socket Extension Dynamic in VMS
78
79 The Socket extension is now dynamically loaded instead of being
80 statically built in.  This may or may not be a problem with ancient
81 TCP/IP stacks of VMS: we do not know since we weren't able to test
82 Perl in such configurations.
83
84 =head2 IEEE-format Floating Point Default on OpenVMS Alpha
85
86 Perl now uses IEEE format (T_FLOAT) as the default internal floating
87 point format on OpenVMS Alpha, potentially breaking binary compatibility
88 with external libraries or existing data.  G_FLOAT is still available as
89 a configuration option.  The default on VAX (D_FLOAT) has not changed.
90
91 =head2 New Unicode Properties
92
93 Unicode I<scripts> are now supported. Scripts are similar to (and superior
94 to) Unicode I<blocks>. The difference between scripts and blocks is that
95 scripts are the glyphs used by a language or a group of languages, while
96 the blocks are more artificial groupings of (mostly) 256 characters based
97 on the Unicode numbering.
98
99 In general, scripts are more inclusive, but not universally so. For
100 example, while the script C<Latin> includes all the Latin characters and
101 their various diacritic-adorned versions, it does not include the various
102 punctuation or digits (since they are not solely C<Latin>).
103
104 A number of other properties are now supported, including C<\p{L&}>,
105 C<\p{Any}> C<\p{Assigned}>, C<\p{Unassigned}>, C<\p{Blank}> and
106 C<\p{SpacePerl}> (along with their C<\P{...}> versions, of course).
107 See L<perlunicode> for details, and more additions.
108
109 The C<In> or C<Is> prefix to names used with the C<\p{...}> and C<\P{...}>
110 are now almost always optional. The only exception is that a C<In> prefix
111 is required to signify a Unicode block when a block name conflicts with a
112 script name. For example, C<\p{Tibetan}> refers to the script, while
113 C<\p{InTibetan}> refers to the block. When there is no name conflict, you
114 can omit the C<In> from the block name (e.g. C<\p{BraillePatterns}>), but
115 to be safe, it's probably best to always use the C<In>).
116
117 =head2 REF(...) Instead Of SCALAR(...)
118
119 A reference to a reference now stringifies as "REF(0x81485ec)" instead
120 of "SCALAR(0x81485ec)" in order to be more consistent with the return
121 value of ref().
122
123 =head2 pack/unpack D/F recycled
124
125 The undocumented pack/unpack template letters D/F have been recycled
126 for better use: now they stand for long double (if supported by the
127 platform) and NV (Perl internal floating point type).  (They used
128 to be aliases for d/f, but you never knew that.)
129
130 =head2 Deprecations
131
132 =over 4
133
134 =item *
135
136 The semantics of bless(REF, REF) were unclear and until someone proves
137 it to make some sense, it is forbidden.
138
139 =item *
140
141 The obsolete chat2 library that should never have been allowed
142 to escape the laboratory has been decommissioned.
143
144 =item *
145
146 The builtin dump() function has probably outlived most of its
147 usefulness.  The core-dumping functionality will remain in future
148 available as an explicit call to C<CORE::dump()>, but in future
149 releases the behaviour of an unqualified C<dump()> call may change.
150
151 =item *
152
153 The very dusty examples in the eg/ directory have been removed.
154 Suggestions for new shiny examples welcome but the main issue is that
155 the examples need to be documented, tested and (most importantly)
156 maintained.
157
158 =item *
159
160 The (bogus) escape sequences \8 and \9 now give an optional warning
161 ("Unrecognized escape passed through").  There is no need to \-escape
162 any C<\w> character.
163
164 =item *
165
166 The list of filenames from glob() (or <...>) is now by default sorted
167 alphabetically to be csh-compliant (which is what happened before
168 in most UNIX platforms).  (bsd_glob() does still sort platform
169 natively, ASCII or EBCDIC, unless GLOB_ALPHASORT is specified.)
170
171 =item *
172
173 Spurious syntax errors generated in certain situations, when glob()
174 caused File::Glob to be loaded for the first time, have been fixed.
175
176 =item *
177
178 Although "you shouldn't do that", it was possible to write code that
179 depends on Perl's hashed key order (Data::Dumper does this).  The new
180 algorithm "One-at-a-Time" produces a different hashed key order.
181 More details are in L</"Performance Enhancements">.
182
183 =item *
184
185 lstat(FILEHANDLE) now gives a warning because the operation makes no sense.
186 In future releases this may become a fatal error.
187
188 =item *
189
190 The C<package;> syntax (C<package> without an argument) has been
191 deprecated.  Its semantics were never that clear and its
192 implementation even less so.  If you have used that feature to
193 disallow all but fully qualified variables, C<use strict;> instead.
194
195 =item *
196
197 The unimplemented POSIX regex features [[.cc.]] and [[=c=]] are still
198 recognised but now cause fatal errors.  The previous behaviour of
199 ignoring them by default and warning if requested was unacceptable
200 since it, in a way, falsely promised that the features could be used.
201
202 =item *
203
204 The current user-visible implementation of pseudo-hashes (the weird
205 use of the first array element) is deprecated starting from Perl 5.8.0
206 and will be removed in Perl 5.10.0, and the feature will be
207 implemented differently.  Not only is the current interface rather
208 ugly, but the current implementation slows down normal array and hash
209 use quite noticeably. The C<fields> pragma interface will remain
210 available.  The I<restricted hashes> interface is expected to
211 be the replacement interface (see L<Hash::Util>).
212
213 =item *
214
215 The syntaxes C<< @a->[...] >> and  C<< %h->{...} >> have now been deprecated.
216
217 =item *
218
219 After years of trying the suidperl is considered to be too complex to
220 ever be considered truly secure.  The suidperl functionality is likely
221 to be removed in a future release.
222
223 =item *
224
225 The long deprecated uppercase aliases for the string comparison
226 operators (EQ, NE, LT, LE, GE, GT) have now been removed.
227
228 =item *
229
230 The tr///C and tr///U features have been removed and will not return;
231 the interface was a mistake.  Sorry about that.  For similar
232 functionality, see pack('U0', ...) and pack('C0', ...).
233
234 =item *
235
236 Earlier Perls treated "sub foo (@bar)" as equivalent to "sub foo (@)".
237 The prototypes are now checked at compile-time for invalid characters.
238 An optional warning is generated ("Illegal character in prototype...")
239 but this may be upgraded to a fatal error in a future release.
240
241 =back
242
243 =head1 Core Enhancements
244
245 =head2 PerlIO is Now The Default
246
247 =over 4
248
249 =item *
250
251 IO is now by default done via PerlIO rather than system's "stdio".
252 PerlIO allows "layers" to be "pushed" onto a file handle to alter the
253 handle's behaviour.  Layers can be specified at open time via 3-arg
254 form of open:
255
256    open($fh,'>:crlf :utf8', $path) || ...
257
258 or on already opened handles via extended C<binmode>:
259
260    binmode($fh,':encoding(iso-8859-7)');
261
262 The built-in layers are: unix (low level read/write), stdio (as in
263 previous Perls), perlio (re-implementation of stdio buffering in a
264 portable manner), crlf (does CRLF <=> "\n" translation as on Win32,
265 but available on any platform).  A mmap layer may be available if
266 platform supports it (mostly UNIXes).
267
268 Layers to be applied by default may be specified via the 'open' pragma.
269
270 See L</"Installation and Configuration Improvements"> for the effects
271 of PerlIO on your architecture name.
272
273 =item *
274
275 File handles can be marked as accepting Perl's internal encoding of Unicode
276 (UTF-8 or UTF-EBCDIC depending on platform) by a pseudo layer ":utf8" :
277
278    open($fh,">:utf8","Uni.txt");
279
280 Note for EBCDIC users: the pseudo layer ":utf8" is erroneously named
281 for you since it's not UTF-8 what you will be getting but instead
282 UTF-EBCDIC.  See L<perlunicode>, L<utf8>, and
283 http://www.unicode.org/unicode/reports/tr16/ for more information.
284 In future releases this naming may change.
285
286 =item *
287
288 File handles can translate character encodings from/to Perl's internal
289 Unicode form on read/write via the ":encoding()" layer.
290
291 =item *
292
293 File handles can be opened to "in memory" files held in Perl scalars via:
294
295    open($fh,'>', \$variable) || ...
296
297 =item *
298
299 Anonymous temporary files are available without need to
300 'use FileHandle' or other module via
301
302    open($fh,"+>", undef) || ...
303
304 That is a literal undef, not an undefined value.
305
306 =item *
307
308 The list form of C<open> is now implemented for pipes (at least on UNIX):
309
310    open($fh,"-|", 'cat', '/etc/motd')
311
312 creates a pipe, and runs the equivalent of exec('cat', '/etc/motd') in
313 the child process.
314
315 =item *
316
317 If your locale environment variables (LANGUAGE, LC_ALL, LC_CTYPE, LANG)
318 contain the strings 'UTF-8' or 'UTF8' (case-insensitive matching),
319 the default encoding of your STDIN, STDOUT, and STDERR, and of
320 B<any subsequent file open>, is UTF-8.
321
322 =back
323
324 =head2 Safe Signals
325
326 Perl used to be fragile in that signals arriving at inopportune moments
327 could corrupt Perl's internal state.  Now Perl postpones handling of
328 signals until it's safe (between opcodes).
329
330 This change may have surprising side effects because signals no longer
331 interrupt Perl instantly.  Perl will now first finish whatever it was
332 doing, like finishing an internal operation (like sort()) or an
333 external operation (like an I/O operation), and only then look at any
334 arrived signals (and before starting the next operation).  No more corrupt
335 internal state since the current operation is always finished first,
336 but the signal may take more time to get heard.  Note that breaking
337 out from potentially blocking operations should still work, though.
338
339 =head2 Unicode Overhaul
340
341 Unicode in general should be now much more usable than in Perl 5.6.0
342 (or even in 5.6.1).  Unicode can be used in hash keys, Unicode in
343 regular expressions should work now, Unicode in tr/// should work now,
344 Unicode in I/O should work now.  See L<perluniintro> for introduction
345 and L<perlunicode> for details.
346
347 =over 4
348
349 =item *
350
351 The Unicode Character Database coming with Perl has been upgraded
352 to Unicode 3.1.1.  For more information, see http://www.unicode.org/.
353
354 =item *
355
356 For developers interested in enhancing Perl's Unicode capabilities:
357 almost all the UCD files are included with the Perl distribution in
358 the F<lib/unicore subdirectory>.  The most notable omission, for space
359 considerations, is the Unihan database.
360
361 =item *
362
363 The properties \p{Blank} and \p{SpacePerl} have been added. "Blank" is like
364 C isblank(), that is, it contains only "horizontal whitespace" (the space
365 character is, the newline isn't), and the "SpacePerl" is the Unicode
366 equivalent of C<\s> (\p{Space} isn't, since that includes the vertical
367 tabulator character, whereas C<\s> doesn't.)
368
369 See "New Unicode Properties" earlier in this document for additional
370 information on changes with Unicode properties.
371
372 =back
373
374 =head2 Understanding of Numbers
375
376 In general a lot of fixing has happened in the area of Perl's
377 understanding of numbers, both integer and floating point.  Since in
378 many systems the standard number parsing functions like C<strtoul()>
379 and C<atof()> seem to have bugs, Perl tries to work around their
380 deficiencies.  This results hopefully in more accurate numbers.
381
382 Perl now tries internally to use integer values in numeric conversions
383 and basic arithmetics (+ - * /) if the arguments are integers, and
384 tries also to keep the results stored internally as integers.
385 This change leads to often slightly faster and always less lossy
386 arithmetics. (Previously Perl always preferred floating point numbers
387 in its math.)
388
389 =head2 Miscellaneous Changes
390
391 =over 4
392
393 =item *
394
395 AUTOLOAD is now lvaluable, meaning that you can add the :lvalue attribute
396 to AUTOLOAD subroutines and you can assign to the AUTOLOAD return value.
397
398 =item *
399
400 C<perl -d:Module=arg,arg,arg> now works (previously one couldn't pass
401 in multiple arguments.)
402
403 =item *
404
405 The builtin dump() now gives an optional warning
406 C<dump() better written as CORE::dump()>,
407 meaning that by default C<dump(...)> is resolved as the builtin 
408 dump() which dumps core and aborts, not as (possibly) user-defined
409 C<sub dump>.  To call the latter, qualify the call as C<&dump(...)>.
410 (The whole dump() feature is to considered deprecated, and possibly
411 removed/changed in future releases.)
412
413 =item *
414
415 chomp() and chop() are now overridable.  Note, however, that their
416 prototype (as given by C<prototype("CORE::chomp")> is undefined,
417 because it cannot be expressed and therefore one cannot really write
418 replacements to override these builtins.
419
420 =item *
421
422 END blocks are now run even if you exit/die in a BEGIN block.
423 Internally, the execution of END blocks is now controlled by 
424 PL_exit_flags & PERL_EXIT_DESTRUCT_END. This enables the new
425 behaviour for Perl embedders. This will default in 5.10. See
426 L<perlembed>.
427
428 =item *
429
430 Formats now support zero-padded decimal fields.
431
432 =item *
433
434 Lvalue subroutines can now return C<undef> in list context.
435 However, the lvalue subroutine feature still remains experimental.
436
437 =item *
438
439 A lost warning "Can't declare ... dereference in my" has been
440 restored (Perl had it earlier but it became lost in later releases.)
441
442 =item *
443
444 A new special regular expression variable has been introduced:
445 C<$^N>, which contains the most-recently closed group (submatch).
446
447 =item *
448
449 C<no Module;> now works even if there is no "sub unimport" in the Module.
450
451 =item *
452
453 The numerical comparison operators return C<undef> if either operand
454 is a NaN.  Previously the behaviour was unspecified.
455
456 =item *
457
458 The following builtin functions are now overridable: each(), keys(),
459 pop(), push(), shift(), splice(), unshift().
460
461 =item *
462
463 C<pack() / unpack()> now can group template letters with C<()> and then
464 apply repetition/count modifiers on the groups.
465
466 =item *
467
468 C<pack() / unpack()> can now process the Perl internal numeric types:
469 IVs, UVs, NVs-- and also long doubles, if supported by the platform.
470 The template letters are C<j>, C<J>, C<F>, and C<D>.
471
472 =item *
473
474 C<pack('U0a*', ...)> can now be used to force a string to UTF8.
475
476 =item *
477
478 my __PACKAGE__ $obj now works.
479
480 =item *
481
482 The printf() and sprintf() now support parameter reordering using the
483 C<%\d+\$> and C<*\d+\$> syntaxes.  For example
484
485     print "%2\$s %1\$s\n", "foo", "bar";
486
487 will print "bar foo\n".  This feature helps in writing
488 internationalised software, and in general when the order
489 of the parameters can vary.
490
491 =item *
492
493 prototype(\&) is now available.
494
495 =item *
496
497 prototype(\[$@%&]) is now available to implicitly create references
498 (useful for example if you want to emulate the tie() interface).
499
500 =item *
501
502 A new command-line option, C<-t> is available.  It is the
503 little brother of C<-T>: instead of dieing on taint violations,
504 lexical warnings are given.  B<This is only meant as a temporary
505 debugging aid while securing the code of old legacy applications.
506 This is not a substitute for -T.>
507
508 =item *
509
510 In other taint news, the C<exec LIST> and C<system LIST> have now been
511 considered too risky (think C<exec @ARGV>: it can start any program
512 with any arguments), and now the said forms cause a warning.
513 You should carefully launder the arguments to guarantee their
514 validity.  In future releases of Perl the forms will become fatal
515 errors so consider starting laundering now.
516
517 =item *
518
519 If tr/// is just counting characters, it doesn't attempt to
520 modify its target.
521
522 =item *
523
524 untie() will now call an UNTIE() hook if it exists.  See L<perltie>
525 for details.
526
527 =item *
528
529 L<utime> now supports C<utime undef, undef, @files> to change the
530 file timestamps to the current time.
531
532 =item *
533
534 The rules for allowing underscores (underbars) in numeric constants
535 have been relaxed and simplified: now you can have an underscore
536 simply B<between digits>.
537
538 =item *
539
540 Rather than relying on C's argv[0] (which may not contain a full pathname)
541 where possible $^X is now set by asking the operating system.
542 (eg by reading F</proc/self/exe> on Linux, F</proc/curproc/file> on FreeBSD)
543
544 =item *
545
546 A new variable, C<${^TAINT}>, indicates whether taint mode is enabled.
547
548 =item *
549
550 You can now override the readline() builtin, and this overrides also
551 the <FILEHANDLE> angle bracket operator.
552
553 =item *
554
555 The command-line options -s and -F are now recognized on the shebang
556 (#!) line.
557
558 =back
559
560 =head1 Modules and Pragmata
561
562 =head2 New Modules and Pragmata
563
564 =over 4
565
566 =item *
567
568 C<Attribute::Handlers> allows a class to define attribute handlers.
569
570     package MyPack;
571     use Attribute::Handlers;
572     sub Wolf :ATTR(SCALAR) { print "howl!\n" }
573
574     # later, in some package using or inheriting from MyPack...
575
576     my MyPack $Fluffy : Wolf; # the attribute handler Wolf will be called
577
578 Both variables and routines can have attribute handlers.  Handlers can
579 be specific to type (SCALAR, ARRAY, HASH, or CODE), or specific to the
580 exact compilation phase (BEGIN, CHECK, INIT, or END).
581
582 =item *
583
584 B<B::Concise> is a new compiler backend for walking the Perl syntax
585 tree, printing concise info about ops, from Stephen McCamant.  The
586 output is highly customisable.  See L<B::Concise>.
587
588 =item *
589
590 C<Class::ISA> for reporting the search path for a class's ISA tree,
591 by Sean Burke, has been added.  See L<Class::ISA>.
592
593 =item *
594
595 C<Cwd> has now a split personality: if possible, an XS extension is
596 used, (this will hopefully be faster, more secure, and more robust)
597 but if not possible, the familiar Perl implementation is used.
598
599 =item *
600
601 C<Devel::PPPort>, originally from Kenneth Albanowski and now
602 maintained by Paul Marquess, has been added.  It is primarily used
603 by C<h2xs> to enhance portability of XS modules between different
604 versions of Perl.
605
606 =item *
607
608 C<Digest>, frontend module for calculating digests (checksums), from
609 Gisle Aas, has been added.  See L<Digest>.
610
611 =item *
612
613 C<Digest::MD5> for calculating MD5 digests (checksums) as defined in
614 RFC 1321, from Gisle Aas, has been added.  See L<Digest::MD5>.
615
616     use Digest::MD5 'md5_hex';
617
618     $digest = md5_hex("Thirsty Camel");
619
620     print $digest, "\n"; # 01d19d9d2045e005c3f1b80e8b164de1
621
622 NOTE: the C<MD5> backward compatibility module is deliberately not
623 included since its further use is discouraged.
624
625 =item *
626
627 C<Encode>, by Nick Ing-Simmons, provides a mechanism to translate
628 between different character encodings.  Support for Unicode,
629 ISO-8859-*, ASCII, CP*, KOI8-R, and three variants of EBCDIC are
630 compiled in to the module.  Several other encodings (like Japanese,
631 Chinese, and MacIntosh encodings) are included and will be loaded at
632 runtime.  See L<Encode>.
633
634 Any encoding supported by Encode module is also available to the
635 ":encoding()" layer if PerlIO is used.
636
637 =item *
638
639 C<Hash::Util> is the interface to the new I<restricted hashes>
640 feature.  A restricted hash is restricted to a certain set of keys,
641 no keys outside the set can be added.  Also individual keys can be
642 restricted so that the key cannot be deleted and the value cannot be
643 changed.  (Implemented by Jeffrey Friedl, Nick Ing-Simmons, and
644 Michael Schwern.)
645
646 =item *
647
648 C<I18N::Langinfo> can be use to query locale information.
649 See L<I18N::Langinfo>.
650
651 =item *
652
653 C<I18N::LangTags> has functions for dealing with RFC3066-style
654 language tags, by Sean Burke.  See L<I18N::LangTags>.
655
656 =item *
657
658 C<ExtUtils::Constant> is a new tool for extension writers for
659 generating XS code to import C header constants, by Nicholas Clark.
660 See L<ExtUtils::Constant>.
661
662 =item *
663
664 C<Filter::Simple> is an easy-to-use frontend to Filter::Util::Call,
665 from Damian Conway.  See L<Filter::Simple>.
666
667     # in MyFilter.pm:
668
669     package MyFilter;
670
671     use Filter::Simple sub {
672         while (my ($from, $to) = splice @_, 0, 2) {
673                 s/$from/$to/g;
674         }
675     };
676
677     1;
678
679     # in user's code:
680
681     use MyFilter qr/red/ => 'green';
682
683     print "red\n";   # this code is filtered, will print "green\n"
684     print "bored\n"; # this code is filtered, will print "bogreen\n"
685
686     no MyFilter;
687
688     print "red\n";   # this code is not filtered, will print "red\n"
689
690 =item *
691
692 C<File::Temp> allows one to create temporary files and directories in
693 an easy, portable, and secure way, by Tim Jenness.  See L<File::Temp>.
694
695 =item *
696
697 C<Filter::Util::Call> provides you with the framework to write
698 I<Source Filters> in Perl, from Paul Marquess.  For most uses the
699 frontend Filter::Simple is to be preferred.  See L<Filter::Util::Call>.
700
701 =item *
702
703 C<if> is a new pragma for conditional inclusion of modules, from
704 Ilya Zakharevich.
705
706 =item *
707
708 L<libnet> is a collection of perl5 modules related to network
709 programming, from Graham Barr.  See L<Net::FTP>, L<Net::NNTP>,
710 L<Net::Ping>, L<Net::POP3>, L<Net::SMTP>, and L<Net::Time>.
711
712 Perl installation leaves libnet unconfigured, use F<libnetcfg> to configure.
713
714 =item *
715
716 C<List::Util> is a selection of general-utility list subroutines, like
717 sum(), min(), first(), and shuffle(), by Graham Barr.  See L<List::Util>.
718
719 =item *
720
721 C<Locale::Constants>, C<Locale::Country>, C<Locale::Currency>, and
722 C<Locale::Language>, from Neil Bowers, have been added.  They provide the
723 codes for various locale standards, such as "fr" for France, "usd" for
724 US Dollar, and "jp" for Japanese.
725
726     use Locale::Country;
727
728     $country = code2country('jp');               # $country gets 'Japan'
729     $code    = country2code('Norway');           # $code gets 'no'
730
731 See L<Locale::Constants>, L<Locale::Country>, L<Locale::Currency>,
732 and L<Locale::Language>.
733
734 =item *
735
736 C<Locale::Maketext> is localization framework from Sean Burke.  See
737 L<Locale::Maketext>, and L<Locale::Maketext::TPJ13>.  The latter is an
738 article about software localization, originally published in The Perl
739 Journal #13, republished here with kind permission.
740
741 =item *
742
743 C<Memoize> can make your functions faster by trading space for time,
744 from Mark-Jason Dominus.  See L<Memoize>.
745
746 =item *
747
748 C<MIME::Base64> allows you to encode data in base64, from Gisle Aas,
749 as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
750 Extensions)>.
751
752     use MIME::Base64;
753
754     $encoded = encode_base64('Aladdin:open sesame');
755     $decoded = decode_base64($encoded);
756
757     print $encoded, "\n"; # "QWxhZGRpbjpvcGVuIHNlc2FtZQ=="
758
759 See L<MIME::Base64>.
760
761 =item *
762
763 C<MIME::QuotedPrint> allows you to encode data in quoted-printable
764 encoding, as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
765 Extensions)>, from Gisle Aas.
766
767     use MIME::QuotedPrint;
768
769     $encoded = encode_qp("Smiley in Unicode: \x{263a}");
770     $decoded = decode_qp($encoded);
771
772     print $encoded, "\n"; # "Smiley in Unicode: =263A"
773
774 MIME::QuotedPrint has been enhanced to provide the basic methods
775 necessary to use it with PerlIO::Via as in :
776
777     use MIME::QuotedPrint;
778     open($fh,">Via(MIME::QuotedPrint)",$path);
779
780 See L<MIME::QuotedPrint>.
781
782 =item *
783
784 C<NEXT> is pseudo-class for method redispatch, from Damian Conway.
785 See L<NEXT>.
786
787 =item *
788
789 C<open> is a new pragma for setting the default I/O disciplines
790 for open().
791
792 =item *
793
794 C<PerlIO::Scalar> provides the implementation of IO to "in memory"
795 Perl scalars as discussed above, from Nick Ing-Simmons.  It also
796 serves as an example of a loadable PerlIO layer.  Other future
797 possibilities include PerlIO::Array and PerlIO::Code.
798 See L<PerlIO::Scalar>.
799
800 =item *
801
802 C<PerlIO::Via> acts as a PerlIO layer and wraps PerlIO layer
803 functionality provided by a class (typically implemented in perl
804 code), from Nick Ing-Simmons.
805
806     use MIME::QuotedPrint;
807     open($fh,">Via(MIME::QuotedPrint)",$path);
808
809 This will automatically convert everything output to C<$fh>
810 to Quoted-Printable.  See L<PerlIO::Via>.
811
812 =item *
813
814 C<Pod::ParseLink>, by Russ Allbery, has been added,
815 to parse LZ<><> links in pods as described in the new
816 perlpodspec.
817
818 =item *
819
820 C<Pod::Text::Overstrike>, by Joe Smith, has been added.
821 It converts POD data to formatted overstrike text.
822 See L<Pod::Text::Overstrike>.
823
824 =item *
825
826 C<Scalar::Util> is a selection of general-utility scalar subroutines,
827 like blessed(), reftype(), and tainted().  See L<Scalar::Util>.
828
829 =item *
830
831 C<sort> is a new pragma for controlling the behaviour of sort().
832
833 =item *
834
835 C<Storable> gives persistence to Perl data structures by allowing the
836 storage and retrieval of Perl data to and from files in a fast and
837 compact binary format, from Raphael Manfredi.  See L<Storable>.
838
839 =item *
840
841 C<Switch>, from Damian Conway, has been added.  Just by saying
842
843     use Switch;
844
845 you have C<switch> and C<case> available in Perl.
846
847     use Switch;
848
849     switch ($val) {
850
851                 case 1          { print "number 1" }
852                 case "a"        { print "string a" }
853                 case [1..10,42] { print "number in list" }
854                 case (@array)   { print "number in list" }
855                 case /\w+/      { print "pattern" }
856                 case qr/\w+/    { print "pattern" }
857                 case (%hash)    { print "entry in hash" }
858                 case (\%hash)   { print "entry in hash" }
859                 case (\&sub)    { print "arg to subroutine" }
860                 else            { print "previous case not true" }
861     }
862
863 See L<Switch>.
864
865 =item *
866
867 C<Test::More> is yet another framework for writing test scripts,
868 more extensive than Test::Simple, by Michael Schwern.  See L<Test::More>.
869
870 =item *
871
872 C<Test::Simple> has basic utilities for writing tests, by Michael
873 Schwern.   See L<Test::Simple>.
874
875 =item *
876
877 C<Text::Balanced> has been added, for extracting delimited text
878 sequences from strings, from Damian Conway.
879
880     use Text::Balanced 'extract_delimited';
881
882     ($a, $b) = extract_delimited("'never say never', he never said", "'", '');
883
884 $a will be "'never say never'", $b will be ', he never said'.
885
886 In addition to extract_delimited() there are also extract_bracketed(),
887 extract_quotelike(), extract_codeblock(), extract_variable(),
888 extract_tagged(), extract_multiple(), gen_delimited_pat(), and
889 gen_extract_tagged().  With these you can implement rather advanced
890 parsing algorithms.  See L<Text::Balanced>.
891
892 =item *
893
894 C<threads> is an interface to interpreter threads, by Arthur Bergman.
895 Interpreter threads (ithreads) is the new thread model introduced in
896 Perl 5.6 but only available as an internal interface for extension
897 writers (and for Win32 Perl for C<fork()> emulation).  See L<threads>.
898
899 =item *
900
901 C<threads::shared> allows data sharing for interpreter threads, from
902 Arthur Bergman.  In the ithreads model any data sharing between
903 threads must be explicit, as opposed to the old 5.005 thread model
904 where data sharing was implicit.  See L<threads::shared>.
905
906 =item *
907
908 C<Tie::File>, by Mark-Jason Dominus, associates a Perl array with the
909 lines of a file.
910
911 =item *
912
913 C<Tie::Memoize>, by Ilya Zakharevich, provides on-demand loaded hashes.
914
915 =item *
916
917 C<Tie::RefHash::Nestable>, by Edward Avis, allows storing hash
918 references (unlike the standard Tie::RefHash)  The module is contained
919 within Tie::RefHash, see L<Tie::RefHash>.
920
921 =item *
922
923 C<Time::HiRes> provides high resolution timing (ualarm, usleep,
924 and gettimeofday), from Douglas E. Wegscheid.  See L<Time::HiRes>.
925
926 =item *
927
928 C<Unicode::UCD> offers a querying interface to the Unicode Character
929 Database.  See L<Unicode::UCD>.
930
931 =item *
932
933 C<Unicode::Collate> implements the UCA (Unicode Collation Algorithm)
934 for sorting Unicode strings, by SADAHIRO Tomoyuki.  See L<Unicode::Collate>.
935
936 =item *
937
938 C<Unicode::Normalize> implements the various Unicode normalization
939 forms, by SADAHIRO Tomoyuki.  See L<Unicode::Normalize>.
940
941 =item *
942
943 C<XS::Typemap>, by Tim Jenness, is a test extension that exercises XS
944 typemaps.  Nothing gets installed but for extension writers the code
945 is worth studying.
946
947 =back
948
949 =head2 Updated And Improved Modules and Pragmata
950
951 =over 4
952
953 =item *
954
955 The following independently supported modules have been updated to the
956 newest versions from CPAN: CGI, CPAN, DB_File, File::Spec, File::Temp,
957 Getopt::Long, Math::BigFloat, Math::BigInt, the podlators bundle
958 (Pod::Man, Pod::Text), Pod::LaTeX, Pod::Parser, Storable,
959 Term::ANSIColor, Test, Text-Tabs+Wrap.
960
961 =item *
962
963 The attributes::reftype() now works on tied arguments.
964
965 =item *
966
967 AutoLoader can now be disabled with C<no AutoLoader;>.
968
969 =item *
970
971 B::Deparse has been significantly enhanced.  It now can deparse almost
972 all of the standard test suite (so that the tests still succeed).
973 There is a make target "test.deparse" for trying this out.
974
975 =item *
976
977 Class::Struct can now define the classes in compile time.
978
979 =item *
980
981 Class::Struct now assigns the array/hash element if the accessor
982 is called with an array/hash element as the B<sole> argument.
983
984 =item *
985
986 Data::Dumper has now an option to sort hashes.
987
988 =item *
989
990 Data::Dumper has now an option to dump code references
991 using B::Deparse.
992
993 =item *
994
995 DB_File now supports newer Berkeley DB versions, among
996 other improvements.
997
998 =item *
999
1000 The English module can now be used without the infamous performance
1001 hit by saying
1002
1003         use English '-no_match_vars';
1004
1005 (Assuming, of course, that one doesn't need the troublesome variables
1006 C<$`>, C<$&>, or C<$'>.)  Also, introduced C<@LAST_MATCH_START> and
1007 C<@LAST_MATCH_END> English aliases for C<@-> and C<@+>.
1008
1009 =item *
1010
1011 Fcntl, Socket, and Sys::Syslog have been rewritten to use the
1012 new-style constant dispatch section (see L<ExtUtils::Constant>).
1013 This means that they will be more robust and hopefully faster.
1014
1015 =item *
1016
1017 File::Find now chdir()s correctly when chasing symbolic links.
1018
1019 =item *
1020
1021 File::Find now has pre- and post-processing callbacks.  It also
1022 correctly changes directories when chasing symbolic links.  Callbacks
1023 (naughtily) exiting with "next;" instead of "return;" now work.
1024
1025 =item *
1026
1027 File::Find is now (again) reentrant.  It also has been made
1028 more portable.
1029
1030 =item *
1031
1032 The warnings issued by File::Find now belong to their own category.
1033 You can enable/disable them with C<use/no warnings 'File::Find';>.
1034
1035 =item *
1036
1037 File::Glob::glob() renamed to File::Glob::bsd_glob() to avoid
1038 prototype mismatch with CORE::glob().
1039
1040 =item *
1041
1042 File::Glob now supports C<GLOB_LIMIT> constant to limit the size of
1043 the returned list of filenames.
1044
1045 =item *
1046
1047 Devel::Peek now has an interface for the Perl memory statistics
1048 (this works only if you are using perl's malloc, and if you have
1049 compiled with debugging).
1050
1051 =item *
1052
1053 IPC::Open3 now allows the use of numeric file descriptors.
1054
1055 =item *
1056
1057 IO::Socket has now atmark() method, which returns true if the socket
1058 is positioned at the out-of-band mark.  The method is also exportable
1059 as a sockatmark() function.
1060
1061 =item *
1062
1063 IO::Socket::INET has support for ReusePort option (if your platform
1064 supports it).  The Reuse option now has an alias, ReuseAddr.  For clarity
1065 you may want to prefer ReuseAddr.
1066
1067 =item *
1068
1069 IO::Socket::INET now supports C<LocalPort> of zero (usually meaning
1070 that the operating system will make one up.)
1071
1072 =item *
1073
1074 use lib now works identically to @INC.  Removing directories
1075 with 'no lib' now works.
1076
1077 =item *
1078
1079 ExtUtils::MakeMaker now uses File::Spec internally, which hopefully
1080 leads into better portability.
1081
1082 =item *
1083
1084 Math::BigFloat and Math::BigInt have undergone a full rewrite.
1085 They are now magnitudes faster, and they support various
1086 bignum libraries such as GMP and PARI as their backends.
1087
1088 =item *
1089
1090 Math::Complex handles inf, NaN etc., better.
1091
1092 =item *
1093
1094 Net::Ping has been muchly enhanced.  Multihoming is now supported.
1095 There is now "external" protocol which uses Net::Ping::External module
1096 which runs external ping(1) and parses the output.  A version of
1097 Net::Ping::External is available in CPAN.
1098
1099 =item *
1100
1101 POSIX::sigaction() is now much more flexible and robust.
1102 You can now install coderef handlers, 'DEFAULT', and 'IGNORE'
1103 handlers, installing new handlers was not atomic.
1104
1105 =item *
1106
1107 In Safe the C<%INC> now localised in a Safe compartment so that
1108 use/require work.
1109
1110 =item *
1111
1112 In SDBM_File on dosish platforms, some keys went missing because of
1113 lack of support for files with "holes".  A workaround for the problem
1114 has been added.
1115
1116 =item *
1117
1118 In Search::Dict one can now have a pre-processing hook for the
1119 lines being searched.
1120
1121 =item *
1122
1123 The Shell module now has an OO interface.
1124
1125 =item *
1126
1127 The Test module has been significantly enhanced.
1128
1129 =item *
1130
1131 Time::Local::timelocal() does not handle fractional seconds anymore.
1132 The rationale is that neither does localtime(), and timelocal() and
1133 localtime() are supposed to be inverses of each other.
1134
1135 =item *
1136
1137 The vars pragma now supports declaring fully qualified variables.
1138 (Something that C<our()> does not and will not support.)
1139
1140 =item *
1141
1142 The C<utf8::> name space (as in the pragma) provides various
1143 Perl-callable functions to provide low level access to Perl's
1144 internal Unicode representation.  At the moment only length()
1145 has been implemented.
1146
1147 =back
1148
1149 =head1 Utility Changes
1150
1151 =over 4
1152
1153 =item *
1154
1155 Emacs perl mode (emacs/cperl-mode.el) has been updated to version
1156 4.31.
1157
1158 =item *
1159
1160 F<emacs/e2ctags.pl> is now much faster.
1161
1162 =item *
1163
1164 C<h2ph> now supports C trigraphs.
1165
1166 =item *
1167
1168 C<h2xs> now produces a template README.
1169
1170 =item *
1171
1172 C<h2xs> now uses C<Devel::PPort> for better portability between
1173 different versions of Perl.
1174
1175 =item *
1176
1177 C<h2xs> uses the new L<ExtUtils::Constant> module which will affect
1178 newly created extensions that define constants.  Since the new code is
1179 more correct (if you have two constants where the first one is a
1180 prefix of the second one, the first constant B<never> gets defined),
1181 less lossy (it uses integers for integer constant, as opposed to the
1182 old code that used floating point numbers even for integer constants),
1183 and slightly faster, you might want to consider regenerating your
1184 extension code (the new scheme makes regenerating easy).
1185 L<h2xs> now also supports C trigraphs.
1186
1187 =item *
1188
1189 C<libnetcfg> has been added to configure the libnet.
1190
1191 =item *
1192
1193 C<perlbug> is now much more robust.  It also sends the bug report to
1194 perl.org, not perl.com.
1195
1196 =item *
1197
1198 C<perlcc> has been rewritten and its user interface (that is,
1199 command line) is much more like that of the UNIX C compiler, cc.
1200 (The perlbc tools has been removed.  Use C<perlcc -B> instead.)
1201
1202 =item *
1203
1204 C<perlivp> is a new Installation Verification Procedure utility
1205 for running any time after installing Perl.
1206
1207 =item *
1208
1209 C<pod2html> now allows specifying a cache directory.
1210
1211 =item *
1212
1213 C<s2p> has been completely rewritten in Perl.  (It is in fact a full
1214 implementation of sed in Perl: you can use the sed functionality by
1215 using the C<psed> utility.)
1216
1217 =item *
1218
1219 C<xsubpp> now understands POD documentation embedded in the *.xs files.
1220
1221 =item *
1222
1223 C<xsubpp> now supports OUT keyword.
1224
1225 =back
1226
1227 =head1 New Documentation
1228
1229 =over 4
1230
1231 =item *
1232
1233 perl56delta details the changes between the 5.005 release and the
1234 5.6.0 release.
1235
1236 =item *
1237
1238 perlclib documents the internal replacements for standard C library
1239 functions.  (Interesting only for extension writers and Perl core
1240 hackers.)
1241
1242 =item *
1243
1244 perldebtut is a Perl debugging tutorial.
1245
1246 =item *
1247
1248 perlebcdic contains considerations for running Perl on EBCDIC platforms.
1249
1250 =item *
1251
1252 perlintro is a gentle introduction to Perl.
1253
1254 =item *
1255
1256 perliol documents the internals of PerlIO with layers.
1257
1258 =item *
1259
1260 perlmodstyle is a style guide for writing modules.
1261
1262 =item *
1263
1264 perlnewmod tells about writing and submitting a new module.
1265
1266 =item *
1267
1268 perlpacktut is a pack() tutorial.
1269
1270 =item *
1271
1272 perlpod has been rewritten to be clearer and to record the best
1273 practices gathered over the years.
1274
1275 =item *
1276
1277 perlpodspec is a more formal specification of the pod format,
1278 mainly of interest for writers of pod applications, not to
1279 people writing in pod.
1280
1281 =item *
1282
1283 perlretut is a regular expression tutorial.
1284
1285 =item *
1286
1287 perlrequick is a regular expressions quick-start guide.
1288 Yes, much quicker than perlretut.
1289
1290 =item *
1291
1292 perltodo has been updated.
1293
1294 =item *
1295
1296 perltootc has been renamed as perltooc (to not to conflict
1297 with perltoot in filesystems restricted to "8.3" names)
1298
1299 =item *
1300
1301 perluniintro is an introduction to using Unicode in Perl.
1302 (perlunicode is more of a detailed reference and background
1303 information)
1304
1305 =item *
1306
1307 perlutil explains the command line utilities packaged with the Perl
1308 distribution.
1309
1310 =back
1311
1312 The following platform-specific documents are available before
1313 the installation as README.I<platform>, and after the installation
1314 as perlI<platform>:
1315
1316     perlaix perlamiga perlapollo perlbeos perlbs2000
1317     perlce perlcygwin perldgux perldos perlepoc perlhpux
1318     perlhurd perlmachten perlmacos perlmint perlmpeix
1319     perlnetware perlos2 perlos390 perlplan9 perlqnx perlsolaris
1320     perltru64 perluts perlvmesa perlvms perlvos perlwin32
1321
1322 =over 4
1323
1324 =item *
1325
1326 The documentation for the POSIX-BC platform is called "BS2000", to avoid
1327 confusion with the Perl POSIX module.
1328
1329 =item *
1330
1331 The documentation for the WinCE platform is called "CE", to avoid
1332 confusion with the perlwin32 documentation on 8.3-restricted filesystems.
1333
1334 =back
1335
1336 =head1 Performance Enhancements
1337
1338 =over 4
1339
1340 =item *
1341
1342 map() could get pathologically slow when the result list it generates
1343 is larger than the source list.  The performance has been improved for
1344 common scenarios.
1345
1346 =item *
1347
1348 sort() has been changed to use primarily mergesort internally as
1349 opposed to the earlier quicksort.  For very small lists this may
1350 result in slightly slower sorting times, but in general the speedup
1351 should be at least 20%.  Additional bonuses are that the worst case
1352 behaviour of sort() is now better (in computer science terms it now
1353 runs in time O(N log N), as opposed to quicksort's Theta(N**2)
1354 worst-case run time behaviour), and that sort() is now stable
1355 (meaning that elements with identical keys will stay ordered as they
1356 were before the sort).  See the C<sort> pragma for information.
1357
1358 The story in more detail: suppose you want to serve yourself a little
1359 slice of Pi.
1360
1361     @digits = ( 3,1,4,1,5,9 );
1362
1363 A numerical sort of the digits will yield (1,1,3,4,5,9), as expected.
1364 Which C<1> comes first is hard to know, since one C<1> looks pretty
1365 much like any other.  You can regard this as totally trivial,
1366 or somewhat profound.  However, if you just want to sort the even
1367 digits ahead of the odd ones, then what will
1368
1369     sort { ($a % 2) <=> ($b % 2) } @digits;
1370
1371 yield?  The only even digit, C<4>, will come first.  But how about
1372 the odd numbers, which all compare equal?  With the quicksort algorithm
1373 used to implement Perl 5.6 and earlier, the order of ties is left up
1374 to the sort.  So, as you add more and more digits of Pi, the order
1375 in which the sorted even and odd digits appear will change.
1376 and, for sufficiently large slices of Pi, the quicksort algorithm
1377 in Perl 5.8 won't return the same results even if reinvoked with the
1378 same input.  The justification for this rests with quicksort's
1379 worst case behavior.  If you run
1380
1381    sort { $a <=> $b } ( 1 .. $N , 1 .. $N );
1382
1383 (something you might approximate if you wanted to merge two sorted
1384 arrays using sort), doubling $N doesn't just double the quicksort time,
1385 it I<quadruples> it.  Quicksort has a worst case run time that can
1386 grow like N**2, so-called I<quadratic> behaviour, and it can happen
1387 on patterns that may well arise in normal use.  You won't notice this
1388 for small arrays, but you I<will> notice it with larger arrays,
1389 and you may not live long enough for the sort to complete on arrays
1390 of a million elements.  So the 5.8 quicksort scrambles large arrays
1391 before sorting them, as a statistical defence against quadratic behaviour.
1392 But that means if you sort the same large array twice, ties may be
1393 broken in different ways.
1394
1395 Because of the unpredictability of tie-breaking order, and the quadratic
1396 worst-case behaviour, quicksort was I<almost> replaced completely with
1397 a stable mergesort.  I<Stable> means that ties are broken to preserve
1398 the original order of appearance in the input array.  So
1399
1400     sort { ($a % 2) <=> ($b % 2) } (3,1,4,1,5,9);
1401
1402 will yield (4,3,1,1,5,9), guaranteed.  The even and odd numbers
1403 appear in the output in the same order they appeared in the input.
1404 Mergesort has worst case O(NlogN) behaviour, the best value
1405 attainable.  And, ironically, this mergesort does particularly
1406 well where quicksort goes quadratic:  mergesort sorts (1..$N, 1..$N)
1407 in O(N) time.  But quicksort was rescued at the last moment because
1408 it is faster than mergesort on certain inputs and platforms.
1409 For example, if you really I<don't> care about the order of even
1410 and odd digits, quicksort will run in O(N) time; it's very good
1411 at sorting many repetitions of a small number of distinct elements.
1412 The quicksort divide and conquer strategy works well on platforms
1413 with relatively small, very fast, caches.  Eventually, the problem gets
1414 whittled down to one that fits in the cache, from which point it
1415 benefits from the increased memory speed.
1416
1417 Quicksort was rescued by implementing a sort pragma to control aspects
1418 of the sort.  The B<stable> subpragma forces stable behaviour,
1419 regardless of algorithm.  The B<_quicksort> and B<_mergesort>
1420 subpragmas are heavy-handed ways to select the underlying implementation.
1421 The leading C<_> is a reminder that these subpragmas may not survive
1422 beyond 5.8.  More appropriate mechanisms for selecting the implementation
1423 exist, but they wouldn't have arrived in time to save quicksort.
1424
1425 =item *
1426
1427 Hashes now use Bob Jenkins "One-at-a-Time" hashing key algorithm
1428 (http://burtleburtle.net/bob/hash/doobs.html).  This algorithm is
1429 reasonably fast while producing a much better spread of values than
1430 the old hashing algorithm (originally by Chris Torek, later tweaked by
1431 Ilya Zakharevich).  Hash values output from the algorithm on a hash of
1432 all 3-char printable ASCII keys comes much closer to passing the
1433 DIEHARD random number generation tests.  According to perlbench, this
1434 change has not affected the overall speed of Perl.
1435
1436 =item *
1437
1438 unshift() should now be noticeably faster.
1439
1440 =back
1441
1442 =head1 Installation and Configuration Improvements
1443
1444 =head2 Generic Improvements
1445
1446 =over 4
1447
1448 =item *
1449
1450 INSTALL now explains how you can configure Perl to use 64-bit
1451 integers even on non-64-bit platforms.
1452
1453 =item *
1454
1455 Policy.sh policy change: if you are reusing a Policy.sh file
1456 (see INSTALL) and you use Configure -Dprefix=/foo/bar and in the old
1457 Policy $prefix eq $siteprefix and $prefix eq $vendorprefix, all of
1458 them will now be changed to the new prefix, /foo/bar.  (Previously
1459 only $prefix changed.)  If you do not like this new behaviour,
1460 specify prefix, siteprefix, and vendorprefix explicitly.
1461
1462 =item *
1463
1464 A new optional location for Perl libraries, otherlibdirs, is available.
1465 It can be used for example for vendor add-ons without disturbing Perl's
1466 own library directories.
1467
1468 =item *
1469
1470 In many platforms the vendor-supplied 'cc' is too stripped-down to
1471 build Perl (basically, 'cc' doesn't do ANSI C).  If this seems
1472 to be the case and 'cc' does not seem to be the GNU C compiler
1473 'gcc', an automatic attempt is made to find and use 'gcc' instead.
1474
1475 =item *
1476
1477 gcc needs to closely track the operating system release to avoid
1478 build problems. If Configure finds that gcc was built for a different
1479 operating system release than is running, it now gives a clearly visible
1480 warning that there may be trouble ahead.
1481
1482 =item *
1483
1484 If binary compatibility with the 5.005 release is not wanted, Configure
1485 no longer suggests including the 5.005 modules in @INC.
1486
1487 =item *
1488
1489 Configure C<-S> can now run non-interactively.
1490
1491 =item *
1492
1493 Configure support for pdp11-style memory models has been removed due
1494 to obsolescence.
1495
1496 =item *
1497
1498 configure.gnu now works with options with whitespace in them.
1499
1500 =item *
1501
1502 installperl now outputs everything to STDERR.
1503
1504 =item *
1505
1506 $Config{byteorder} is now computed dynamically (this is more robust
1507 with "fat binaries" where an executable image contains binaries for
1508 more than one binary platform.)
1509
1510 =item *
1511
1512 Because PerlIO is now the default on most platforms, "-perlio" doesn't
1513 get appended to the $Config{archname} (also known as $^O) anymore.
1514 Instead, if you explicitly choose not to use perlio (Configure command
1515 line option -Uuseperlio), you will get "-stdio" appended.
1516
1517 =item *
1518
1519 Another change related to the architecture name is that "-64all"
1520 (-Duse64bitall, or "maximally 64-bit") is appended only if your
1521 pointers are 64 bits wide.  (To be exact, the use64bitall is ignored.)
1522
1523 =item *
1524
1525 In AFS installations one can configure the root of the AFS to be
1526 somewhere else than the default F</afs> by using the Configure
1527 parameter C<-Dafsroot=/some/where/else>.
1528
1529 =item *
1530
1531 APPLLIB_EXP, a less-know configuration-time definition, has been
1532 documented.  It can be used to prepend site-specific directories
1533 to Perl's default search path (@INC), see INSTALL for information.
1534
1535 =item *
1536
1537 The version of Berkeley DB used when the Perl (and, presumably, the
1538 DB_File extension) was built is now available as
1539 C<@Config{qw(db_version_major db_version_minor db_version_patch)}>
1540 from Perl and as C<DB_VERSION_MAJOR_CFG DB_VERSION_MINOR_CFG
1541 DB_VERSION_PATCH_CFG> from C.
1542
1543 =item *
1544
1545 Building Berkeley DB3 for compatibility modes for DB, NDBM, and ODBM
1546 has been documented in INSTALL.
1547
1548 =item *
1549
1550 If you have CPAN access (either network or a local copy such as a
1551 CD-ROM) you can during specify extra modules to Configure to build and
1552 install with Perl using the -Dextras=...  option.  See INSTALL for
1553 more details.
1554
1555 =item *
1556
1557 In addition to config.over a new override file, config.arch, is
1558 available.  That is supposed to be used by hints file writers for
1559 architecture-wide changes (as opposed to config.over which is for
1560 site-wide changes).
1561
1562 =item *
1563
1564 If your file system supports symbolic links you can build Perl outside
1565 of the source directory by
1566
1567         mkdir /tmp/perl/build/directory
1568         cd /tmp/perl/build/directory
1569         sh /path/to/perl/source/Configure -Dmksymlinks ...
1570
1571 This will create in /tmp/perl/build/directory a tree of symbolic links
1572 pointing to files in /path/to/perl/source.  The original files are left
1573 unaffected.  After Configure has finished you can just say
1574
1575         make all test
1576
1577 and Perl will be built and tested, all in /tmp/perl/build/directory.
1578
1579 =item *
1580
1581 For Perl developers several new make targets for profiling
1582 and debugging have been added, see L<perlhack>.
1583
1584 =over 8
1585
1586 =item *
1587
1588 Use of the F<gprof> tool to profile Perl has been documented in
1589 L<perlhack>.  There is a make target called "perl.gprof" for
1590 generating a gprofiled Perl executable.
1591
1592 =item *
1593
1594 If you have GCC 3, there is a make target called "perl.gcov" for
1595 creating a gcoved Perl executable for coverage analysis.  See
1596 L<perlhack>.
1597
1598 =item *
1599
1600 If you are on IRIX or Tru64 platforms, new profiling/debugging options
1601 have been added, see L<perlhack> for more information about pixie and
1602 Third Degree.
1603
1604 =back
1605
1606 =item *
1607
1608 Guidelines of how to construct minimal Perl installations have
1609 been added to INSTALL.
1610
1611 =item *
1612
1613 The Thread extension is now not built at all under ithreads
1614 (C<Configure -Duseithreads>) because it wouldn't work anyway (the
1615 Thread extension requires being Configured with C<-Duse5005threads>).
1616
1617 But note that the Thread.pm interface is now shared by both
1618 thread models.
1619
1620 =item *
1621
1622 The Gconvert macro ($Config{d_Gconvert}) used by perl for stringifying
1623 floating-point numbers is now more picky about using sprintf %.*g
1624 rules for the conversion.  Some platforms that used to use gcvt may
1625 now resort to the slower sprintf.
1626
1627 =back
1628
1629 =head2 New Or Improved Platforms
1630
1631 For the list of platforms known to support Perl,
1632 see L<perlport/"Supported Platforms">.
1633
1634 =over 4
1635
1636 =item *
1637
1638 AIX dynamic loading should be now better supported.
1639
1640 =item *
1641
1642 AIX should now work better with gcc, threads, and 64-bitness.  Also the
1643 long doubles support in AIX should be better now.  See L<perlaix>.
1644
1645 =item *
1646
1647 After a long pause, AmigaOS has been verified to be happy with Perl.
1648
1649 =item *
1650
1651 AtheOS (http://www.atheos.cx/) is a new platform.
1652
1653 =item *
1654
1655 BeOS has been reclaimed.
1656
1657 =item *
1658
1659 DG/UX platform now supports the 5.005-style threads.  See L<perldgux>.
1660
1661 =item *
1662
1663 DYNIX/ptx platform (a.k.a. dynixptx) is supported at or near osvers 4.5.2.
1664
1665 =item *
1666
1667 EBCDIC platforms (z/OS, also known as OS/390, POSIX-BC, and VM/ESA)
1668 have been regained.  Many test suite tests still fail and the
1669 co-existence of Unicode and EBCDIC isn't quite settled, but the
1670 situation is much better than with Perl 5.6.  See L<perlos390>,
1671 L<perlbs2000> (for POSIX-BC), and L<perlvmesa> for more information.
1672
1673 =item *
1674
1675 Building perl with -Duseithreads or -Duse5005threads now works under
1676 HP-UX 10.20 (previously it only worked under 10.30 or later). You will
1677 need a thread library package installed. See README.hpux.
1678
1679 =item *
1680
1681 MacOS Classic (MacPerl has of course been available since
1682 perl 5.004 but now the source code bases of standard Perl
1683 and MacPerl have been synchronised)
1684
1685 =item *
1686
1687 MacOS X (or Darwin) should now be able to build Perl even on HFS+
1688 filesystems.  (The case-insensitivity confused the Perl build process.)
1689
1690 =item *
1691
1692 NCR MP-RAS is now supported.
1693
1694 =item *
1695
1696 All the NetBSD specific patches (except for the installation
1697 specific ones) have been merged back to the main distribution.
1698
1699 =item *
1700
1701 NetWare from Novell is now supported.  See L<perlnetware>.
1702
1703 =item *
1704
1705 NonStop-UX is now supported.
1706
1707 =item *
1708
1709 NEC SUPER-UX is now supported.
1710
1711 =item *
1712
1713 All the OpenBSD specific patches (except for the installation
1714 specific ones) have been merged back to the main distribution.
1715
1716 =item *
1717
1718 Perl has been tested with the GNU pth userlevel thread package
1719 ( http://www.gnu.org/software/pth/pth.html ) . All but one thread
1720 test worked, and that one failure was because of test results arriving
1721 in unexpected order.
1722
1723 =item *
1724
1725 Amdahl UTS UNIX mainframe platform is now supported.
1726
1727 =item *
1728
1729 WinCE is now supported.  See L<perlce>.
1730
1731 =item *
1732
1733 z/OS (formerly known as OS/390, formerly known as MVS OE) has now
1734 support for dynamic loading.  This is not selected by default,
1735 however, you must specify -Dusedl in the arguments of Configure.
1736
1737 =back
1738
1739 =head1 Selected Bug Fixes
1740
1741 Numerous memory leaks and uninitialized memory accesses have been
1742 hunted down.  Most importantly anonymous subs used to leak quite
1743 a bit.
1744
1745 =over 4
1746
1747 =item *
1748
1749 The autouse pragma didn't work for Multi::Part::Function::Names.
1750
1751 =item *
1752
1753 caller() could cause core dumps in certain situations.  Carp was sometimes
1754 affected by this problem.
1755
1756 =item *
1757
1758 chop(@list) in list context returned the characters chopped in
1759 reverse order.  This has been reversed to be in the right order.
1760
1761 =item *
1762
1763 Configure no longer includes the DBM libraries (dbm, gdbm, db, ndbm)
1764 when building the Perl binary.  The only exception to this is SunOS 4.x,
1765 which needs them.
1766
1767 =item *
1768
1769 The behaviour of non-decimal but numeric string constants such as
1770 "0x23" was platform-dependent: in some platforms that was seen as 35,
1771 in some as 0, in some as a floating point number (don't ask).  This
1772 was caused by Perl using the operating system libraries in a situation
1773 where the result of the string to number conversion is undefined: now
1774 Perl consistently handles such strings as zero in numeric contexts.
1775
1776 =item *
1777
1778 The order of DESTROYs has been made more predictable.
1779
1780 =item *
1781
1782 Several debugger fixes: exit code now reflects the script exit code,
1783 condition C<"0"> now treated correctly, the C<d> command now checks
1784 line number, the C<$.> no longer gets corrupted, all debugger output
1785 now goes correctly to the socket if RemotePort is set.
1786
1787 =item *
1788
1789 Perl 5.6.0 could emit spurious warnings about redefinition of dl_error()
1790 when statically building extensions into perl.  This has been corrected.
1791
1792 =item *
1793
1794 L<dprofpp> -R didn't work.
1795
1796 =item *
1797
1798 C<*foo{FORMAT}> now works.
1799 =item *
1800
1801 Infinity is now recognized as a number.
1802
1803 =item *
1804
1805 UNIVERSAL::isa no longer caches methods incorrectly.  (This broke
1806 the Tk extension with 5.6.0.)
1807
1808 =item *
1809
1810 Lexicals I: lexicals outside an eval "" weren't resolved
1811 correctly inside a subroutine definition inside the eval "" if they
1812 were not already referenced in the top level of the eval""ed code.
1813
1814 =item *
1815
1816 Lexicals II: lexicals leaked at file scope into subroutines that
1817 were declared before the lexicals.
1818
1819 =item *
1820
1821 Lexical warnings now propagating correctly between scopes
1822 and into C<eval "...">.
1823
1824 =item *
1825
1826 C<use warnings qw(FATAL all)> did not work as intended.  This has been
1827 corrected.
1828
1829 =item *
1830
1831 warnings::enabled() now reports the state of $^W correctly if the caller
1832 isn't using lexical warnings.
1833
1834 =item *
1835
1836 Line renumbering with eval and C<#line> now works.
1837
1838 =item *
1839
1840 Fixed numerous memory leaks, especially in eval "".
1841
1842 =item *
1843
1844 mkdir() now ignores trailing slashes in the directory name,
1845 as mandated by POSIX.
1846
1847 =item *
1848
1849 Some versions of glibc have a broken modfl().  This affects builds
1850 with C<-Duselongdouble>.  This version of Perl detects this brokenness
1851 and has a workaround for it.  The glibc release 2.2.2 is known to have
1852 fixed the modfl() bug.
1853
1854 =item *
1855
1856 Modulus of unsigned numbers now works (4063328477 % 65535 used to
1857 return 27406, instead of 27047).
1858
1859 =item *
1860
1861 Some "not a number" warnings introduced in 5.6.0 eliminated to be
1862 more compatible with 5.005.  Infinity is now recognised as a number.
1863
1864 =item *
1865
1866 Numeric conversions did not recognize changes in the string value
1867 properly in certain circumstances.
1868
1869 =item *
1870
1871 Attributes (like :shared) didn't work with our().
1872
1873 =item *
1874
1875 our() variables will not cause "will not stay shared" warnings.
1876
1877 =item *
1878
1879 "our" variables of the same name declared in two sibling blocks
1880 resulted in bogus warnings about "redeclaration" of the variables.
1881 The problem has been corrected.
1882
1883 =item *
1884
1885 pack "Z" now correctly terminates the string with "\0".
1886
1887 =item *
1888
1889 Fix password routines which in some shadow password platforms
1890 (e.g. HP-UX) caused getpwent() to return every other entry.
1891
1892 =item *
1893
1894 The PERL5OPT environment variable (for passing command line arguments
1895 to Perl) didn't work for more than a single group of options.
1896
1897 =item *
1898
1899 PERL5OPT with embedded spaces didn't work.
1900
1901 =item *
1902
1903 printf() no longer resets the numeric locale to "C".
1904
1905 =item *
1906
1907 C<qw(a\\b)> now parses correctly as C<'a\\b'>.
1908
1909 =item *
1910
1911 pos() did not return the correct value within s///ge in earlier
1912 versions.  This is now handled correctly.
1913
1914 =item *
1915
1916 Printing quads (64-bit integers) with printf/sprintf now works
1917 without the q L ll prefixes (assuming you are on a quad-capable platform).
1918
1919 =item *
1920
1921 Regular expressions on references and overloaded scalars now work.
1922
1923 =item *
1924
1925 Right-hand side magic (GMAGIC) could in many cases such as string
1926 concatenation be invoked too many times.
1927
1928 =item *
1929
1930 scalar() now forces scalar context even when used in void context.
1931
1932 =item *
1933
1934 SOCKS support is now much more robust.
1935
1936 =item *
1937
1938 sort() arguments are now compiled in the right wantarray context
1939 (they were accidentally using the context of the sort() itself).
1940 The comparison block is now run in scalar context, and the arguments
1941 to be sorted are always provided list context.
1942
1943 =item *
1944
1945 Changed the POSIX character class C<[[:space:]]> to include the (very
1946 rarely used) vertical tab character.  Added a new POSIX-ish character
1947 class C<[[:blank:]]> which stands for horizontal whitespace
1948 (currently, the space and the tab).
1949
1950 =item *
1951
1952 The tainting behaviour of sprintf() has been rationalized.  It does
1953 not taint the result of floating point formats anymore, making the
1954 behaviour consistent with that of string interpolation.
1955
1956 =item *
1957
1958 Some cases of inconsistent taint propagation (such as within hash
1959 values) have been fixed.
1960
1961 =item *
1962
1963 The RE engine found in Perl 5.6.0 accidentally pessimised certain kinds
1964 of simple pattern matches.  These are now handled better.
1965
1966 =item *
1967
1968 Regular expression debug output (whether through C<use re 'debug'>
1969 or via C<-Dr>) now looks better.
1970
1971 =item *
1972
1973 Multi-line matches like C<"a\nxb\n" =~ /(?!\A)x/m> were flawed.  The
1974 bug has been fixed.
1975
1976 =item *
1977
1978 Use of $& could trigger a core dump under some situations.  This
1979 is now avoided.
1980
1981 =item *
1982
1983 The regular expression captured submatches ($1, $2, ...) are now
1984 more consistently unset if the match fails, instead of leaving false
1985 data lying around in them.
1986
1987 =item *
1988
1989 readline() on files opened in "slurp" mode could return an extra "" at
1990 the end in certain situations.  This has been corrected.
1991
1992 =item *
1993
1994 Autovivification of symbolic references of special variables described
1995 in L<perlvar> (as in C<${$num}>) was accidentally disabled.  This works
1996 again now.
1997
1998 =item *
1999
2000 Sys::Syslog ignored the C<LOG_AUTH> constant.
2001
2002 =item *
2003
2004 All but the first argument of the IO syswrite() method are now optional.
2005
2006 =item *
2007
2008 $AUTOLOAD, sort(), lock(), and spawning subprocesses
2009 in multiple threads simultaneously are now thread-safe.
2010
2011 =item *
2012
2013 Tie::ARRAY SPLICE method was broken.
2014
2015 =item *
2016
2017 Allow read-only string on left hand side of non-modifying tr///.
2018
2019 =item *
2020
2021 If C<STDERR> is tied, warnings caused by C<warn> and C<die> now
2022 correctly pass to it.
2023
2024 =item *
2025
2026 Several Unicode fixes.
2027
2028 =over 8
2029
2030 =item *
2031
2032 BOMs (byte order marks) in the beginning of Perl files
2033 (scripts, modules) should now be transparently skipped.
2034 UTF-16 (UCS-2) encoded Perl files should now be read correctly.
2035
2036 =item *
2037
2038 The character tables have been updated to Unicode 3.1.1.
2039
2040 =item *
2041
2042 Comparing with utf8 data does not magically upgrade non-utf8 data
2043 into utf8.  (This was a problem for example if you were mixing data
2044 from I/O and Unicode data: your output might have got magically encoded
2045 as UTF-8.)
2046
2047 =item *
2048
2049 Generating illegal Unicode code points like U+FFFE, or the UTF-16
2050 surrogates, now also generates an optional warning.
2051
2052 =item *
2053
2054 C<IsAlnum>, C<IsAlpha>, and C<IsWord> now match titlecase.
2055
2056 =item *
2057
2058 Concatenation with the C<.> operator or via variable interpolation,
2059 C<eq>, C<substr>, C<reverse>, C<quotemeta>, the C<x> operator,
2060 substitution with C<s///>, single-quoted UTF8, should now work.
2061
2062 =item *
2063
2064 The C<tr///> operator now works.  Note that the C<tr///CU>
2065 functionality has been removed (but see pack('U0', ...)).
2066
2067 =item *
2068
2069 C<eval "v200"> now works.
2070
2071 =item *
2072
2073 Perl 5.6.0 parsed m/\x{ab}/ incorrectly, leading to spurious warnings.
2074 This has been corrected.
2075
2076 =item *
2077
2078 Zero entries were missing from the Unicode classes like C<IsDigit>.
2079
2080 =back
2081
2082 =item *
2083
2084 Large unsigned numbers (those above 2**31) could sometimes lose their
2085 unsignedness, causing bogus results in arithmetic operations.
2086
2087 =back
2088
2089 =head2 Platform Specific Changes and Fixes
2090
2091 =over 4
2092
2093 =item *
2094
2095 BSDI 4.*
2096
2097 Perl now works on post-4.0 BSD/OSes.
2098
2099 =item *
2100
2101 All BSDs
2102
2103 Setting C<$0> now works (as much as possible; see L<perlvar> for details).
2104
2105 =item *
2106
2107 Cygwin
2108
2109 Numerous updates; currently synchronised with Cygwin 1.3.10.
2110
2111 =item *
2112
2113 Previously DYNIX/ptx had problems in its Configure probe for non-blocking I/O.
2114
2115 =item *
2116
2117 EPOC
2118
2119 EPOC update after Perl 5.6.0.  See README.epoc.
2120
2121 =item *
2122
2123 FreeBSD 3.*
2124
2125 Perl now works on post-3.0 FreeBSDs.
2126
2127 =item *
2128
2129 HP-UX
2130
2131 README.hpux updated; C<Configure -Duse64bitall> now works.
2132
2133 =item *
2134
2135 IRIX
2136
2137 Numerous compilation flag and hint enhancements; accidental mixing
2138 of 32-bit and 64-bit libraries (a doomed attempt) made much harder.
2139
2140 =item *
2141
2142 Linux
2143
2144 =over 8
2145
2146 =item *
2147
2148 Long doubles should now work (see INSTALL).
2149
2150 =item *
2151
2152 Linux previously had problems related to sockaddrlen when using
2153 accept(), revcfrom() (in Perl: recv()), getpeername(), and getsockname().
2154
2155 =back
2156
2157 =item *
2158
2159 MacOS Classic
2160
2161 Compilation of the standard Perl distribution in MacOS Classic should
2162 now work if you have the Metrowerks development environment and
2163 the missing Mac-specific toolkit bits.  Contact the macperl mailing
2164 list for details.
2165
2166 =item *
2167
2168 MPE/iX
2169
2170 MPE/iX update after Perl 5.6.0.  See README.mpeix.
2171
2172 =item *
2173
2174 NetBSD/sparc
2175
2176 Perl now works on NetBSD/sparc.
2177
2178 =item *
2179
2180 OS/2
2181
2182 Now works with usethreads (see INSTALL).
2183
2184 =item *
2185
2186 Solaris
2187
2188 64-bitness using the Sun Workshop compiler now works.
2189
2190 =item *
2191
2192 Tru64 (aka Digital UNIX, aka DEC OSF/1)
2193
2194 The operating system version letter now recorded in $Config{osvers}.
2195 Allow compiling with gcc (previously explicitly forbidden).  Compiling
2196 with gcc still not recommended because buggy code results, even with
2197 gcc 2.95.2.
2198
2199 =item *
2200
2201 Unicos
2202
2203 Fixed various alignment problems that lead into core dumps either
2204 during build or later; no longer dies on math errors at runtime;
2205 now using full quad integers (64 bits), previously was using 
2206 only 46 bit integers for speed.
2207
2208 =item *
2209
2210 VMS
2211
2212 chdir() now works better despite a CRT bug; now works with MULTIPLICITY
2213 (see INSTALL); now works with Perl's malloc.
2214
2215 The tainting of C<%ENV> elements via C<keys> or C<values> was previously
2216 unimplemented.  It now works as documented.
2217
2218 The C<waitpid> emulation has been improved.  The worst bug (now fixed)
2219 was that a pid of -1 would cause a wildcard search of all processes on
2220 the system.  The most significant enhancement is that we can now
2221 usually get the completion status of a terminated process.
2222
2223 POSIX-style signals are now emulated much better on VMS versions prior
2224 to 7.0.
2225
2226 The C<system> function and backticks operator have improved
2227 functionality and better error handling.
2228
2229 File access tests now use current process privileges rather than the
2230 user's default privileges, which could sometimes result in a mismatch
2231 between reported access and actual access.
2232
2233 =item *
2234
2235 Windows
2236
2237 =over 8
2238
2239 =item *
2240
2241 accept() no longer leaks memory.
2242
2243 =item *
2244
2245 Borland C++ v5.5 is now a supported compiler that can build Perl.
2246 However, the generated binaries continue to be incompatible with those
2247 generated by the other supported compilers (GCC and Visual C++).
2248
2249 =item *
2250
2251 Better chdir() return value for a non-existent directory.
2252
2253 =item *
2254
2255 Duping socket handles with open(F, ">&MYSOCK") now works under Windows 9x.
2256
2257 =item *
2258
2259 New %ENV entries now propagate to subprocesses.
2260
2261 =item *
2262
2263 Current directory entries in %ENV are now correctly propagated to child
2264 processes.
2265
2266 =item *
2267
2268 $ENV{LIB} now used to search for libs under Visual C.
2269
2270 =item *
2271
2272 fork() emulation has been improved in various ways, but still continues
2273 to be experimental.  See L<perlfork> for known bugs and caveats.
2274
2275 =item *
2276
2277 A failed (pseudo)fork now returns undef and sets errno to EAGAIN.
2278
2279 =item *
2280
2281 Win32::GetCwd() correctly returns C:\ instead of C: when at the drive root.
2282 Other bugs in chdir() and Cwd::cwd() have also been fixed.
2283
2284 =item *
2285
2286 HTML files will be installed in c:\perl\html instead of c:\perl\lib\pod\html
2287
2288 =item *
2289
2290 The makefiles now provide a single switch to bulk-enable all the features
2291 enabled in ActiveState ActivePerl (a popular Win32 binary distribution).
2292
2293 =item *
2294
2295 Allow REG_EXPAND_SZ keys in the registry.
2296
2297 =item *
2298
2299 Can now send() from all threads, not just the first one.
2300
2301 =item *
2302
2303 Fake signal handling reenabled, bugs and all.
2304
2305 =item *
2306
2307 %SIG has been enabled under USE_ITHREADS, but its use is completely
2308 unsupported under all configurations.
2309
2310 =item *
2311
2312 Less stack reserved per thread so that more threads can run
2313 concurrently. (Still 16M per thread.)
2314
2315 =item *
2316
2317 C<File::Spec-&gt;tmpdir()> now prefers C:/temp over /tmp
2318 (works better when perl is running as service).
2319
2320 =item *
2321
2322 Better UNC path handling under ithreads.
2323
2324 =item *
2325
2326 wait(), waitpid() and backticks now return the correct exit status under
2327 Windows 9x.
2328
2329 =item *
2330
2331 winsock handle leak fixed.
2332
2333 =item *
2334
2335 The Perl parser has been stress tested using both random input and
2336 Markov chain input and the few found crashes and lockups have been
2337 fixed.
2338
2339 =back
2340
2341 =back
2342
2343 =head1 New or Changed Diagnostics
2344
2345 =over 4
2346
2347 =item *
2348
2349 The lexical warnings category "deprecated" is no longer a sub-category
2350 of the "syntax" category. It is now a top-level category in its own
2351 right.
2352
2353 =item *
2354
2355 All regular expression compilation error messages are now hopefully
2356 easier to understand both because the error message now comes before
2357 the failed regex and because the point of failure is now clearly
2358 marked by a C<E<lt>-- HERE> marker.
2359
2360 =item *
2361
2362 The various "opened only for", "on closed", "never opened" warnings
2363 drop the C<main::> prefix for filehandles in the C<main> package,
2364 for example C<STDIN> instead of C<main::STDIN>. 
2365
2366 =item *
2367
2368 The "Unrecognized escape" warning has been extended to include C<\8>,
2369 C<\9>, and C<\_>.  There is no need to escape any of the C<\w> characters.
2370
2371 =item *
2372
2373 Two new debugging options have been added: if you have compiled your
2374 Perl with debugging, you can use the -DT and -DR options to trace
2375 tokenising and to add reference counts to displaying variables,
2376 respectively.
2377
2378 =item *
2379
2380 perl5db.pl has been modified to present a more consistent commands
2381 interface, via (CommandSet=580).  perl5db.t was also added to test the
2382 changes, and as a placeholder for further tests.
2383
2384 See L<perldebug>
2385
2386 =item *
2387
2388 The debugger has a new C<dumpDepth> option to control the maximum
2389 depth to which nested structures are dumped.  The C<x> command has
2390 been extended so that C<x N EXPR> dumps out the value of I<EXPR> to a
2391 depth of at most I<N> levels.
2392
2393 =item *
2394
2395 If an attempt to use a (non-blessed) reference as an array index
2396 is made, a warning is given.
2397
2398 =item *
2399
2400 C<push @a;> and C<unshift @a;> (with no values to push or unshift)
2401 now give a warning.  This may be a problem for generated and evaled
2402 code.
2403
2404 =item *
2405
2406 If you try to L<perlfunc/pack> a number less than 0 or larger than 255
2407 using the C<"C"> format you will get an optional warning.  Similarly
2408 for the C<"c"> format and a number less than -128 or more than 127.
2409
2410 =item *
2411
2412 Certain regex modifiers such as C<(?o)> make sense only if applied to
2413 the entire regex.  You will get an optional warning if you try to do
2414 otherwise. 
2415
2416 =item *
2417
2418 Using arrays or hashes as references (e.g. C<< %foo->{bar} >>
2419 has been deprecated for a while.  Now you will get an optional warning.
2420
2421 =item *
2422
2423 Using C<sort> in scalar context now issues an optional warning.
2424 This didn't do anything useful, as the sort was not performed.
2425
2426 =back
2427
2428 =head1 Changed Internals
2429
2430 =over 4
2431
2432 =item *
2433
2434 perlapi.pod (a companion to perlguts) now attempts to document the
2435 internal API.
2436
2437 =item *
2438
2439 You can now build a really minimal perl called microperl.
2440 Building microperl does not require even running Configure;
2441 C<make -f Makefile.micro> should be enough.  Beware: microperl makes
2442 many assumptions, some of which may be too bold; the resulting
2443 executable may crash or otherwise misbehave in wondrous ways.
2444 For careful hackers only.
2445
2446 =item *
2447
2448 Added rsignal(), whichsig(), do_join(), op_clear, op_null,
2449 ptr_table_clear(), ptr_table_free(), sv_setref_uv(), and several UTF-8
2450 interfaces to the publicised API.  For the full list of the available
2451 APIs see L<perlapi>.
2452
2453 =item *
2454
2455 Made possible to propagate customised exceptions via croak()ing.
2456
2457 =item *
2458
2459 Now xsubs can have attributes just like subs.  (Well, at least the
2460 built-in attributes.)
2461
2462 =item *
2463
2464 dTHR and djSP have been obsoleted; the former removed (because it's
2465 a no-op) and the latter replaced with dSP.
2466
2467 =item *
2468
2469 PERL_OBJECT has been completely removed.
2470
2471 =item *
2472
2473 The MAGIC constants (e.g. C<'P'>) have been macrofied
2474 (e.g. C<PERL_MAGIC_TIED>) for better source code readability
2475 and maintainability.
2476
2477 =item *
2478
2479 The regex compiler now maintains a structure that identifies nodes in
2480 the compiled bytecode with the corresponding syntactic features of the
2481 original regex expression.  The information is attached to the new
2482 C<offsets> member of the C<struct regexp>. See L<perldebguts> for more
2483 complete information.
2484
2485 =item *
2486
2487 The C code has been made much more C<gcc -Wall> clean.  Some warning
2488 messages still remain in some platforms, so if you are compiling with
2489 gcc you may see some warnings about dubious practices.  The warnings
2490 are being worked on.
2491
2492 =item *
2493
2494 F<perly.c>, F<sv.c>, and F<sv.h> have now been extensively commented.
2495
2496 =item *
2497
2498 Documentation on how to use the Perl source repository has been added
2499 to F<Porting/repository.pod>.
2500
2501 =item *
2502
2503 There are now several profiling make targets.
2504
2505 =back
2506
2507 =head1 Security Vulnerability Closed
2508
2509 (This change was already made in 5.7.0 but bears repeating here.)
2510
2511 A potential security vulnerability in the optional suidperl component
2512 of Perl was identified in August 2000.  suidperl is neither built nor
2513 installed by default.  As of November 2001 the only known vulnerable
2514 platform is Linux, most likely all Linux distributions.  CERT and
2515 various vendors and distributors have been alerted about the vulnerability.
2516 See http://www.cpan.org/src/5.0/sperl-2000-08-05/sperl-2000-08-05.txt
2517 for more information.
2518
2519 The problem was caused by Perl trying to report a suspected security
2520 exploit attempt using an external program, /bin/mail.  On Linux
2521 platforms the /bin/mail program had an undocumented feature which
2522 when combined with suidperl gave access to a root shell, resulting in
2523 a serious compromise instead of reporting the exploit attempt.  If you
2524 don't have /bin/mail, or if you have 'safe setuid scripts', or if
2525 suidperl is not installed, you are safe.
2526
2527 The exploit attempt reporting feature has been completely removed from
2528 Perl 5.8.0 (and the maintenance release 5.6.1, and it was removed also
2529 from all the Perl 5.7 releases), so that particular vulnerability
2530 isn't there anymore.  However, further security vulnerabilities are,
2531 unfortunately, always possible.  The suidperl functionality is most
2532 probably going to be removed in Perl 5.10.  In any case, suidperl
2533 should only be used by security experts who know exactly what they are
2534 doing and why they are using suidperl instead of some other solution
2535 such as sudo (see http://www.courtesan.com/sudo/).
2536
2537 =head1 New Tests
2538
2539 Several new tests have been added, especially for the F<lib>
2540 subsection.  There are now about 56 000 individual tests (spread over
2541 about 620 test scripts), in the regression suite (5.6.1 has about
2542 11700 tests, in 258 test scripts) Many of the new tests are introduced
2543 by the new modules, but still in general Perl is now more thoroughly
2544 tested.
2545
2546 Because of the large number of tests, running the regression suite
2547 will take considerably longer time than it used to: expect the suite
2548 to take up to 4-5 times longer to run than in perl 5.6.  In a really
2549 fast machine you can hope to finish the suite in about 6-8 minutes
2550 (wallclock time).
2551
2552 The tests are now reported in a different order than in earlier Perls.
2553 (This happens because the test scripts from under t/lib have been moved
2554 to be closer to the library/extension they are testing.)
2555
2556 =head1 Known Problems
2557
2558 =head2 AIX
2559
2560 =over 4
2561
2562 =item *
2563
2564 In AIX 4.2 Perl extensions that use C++ functions that use statics
2565 may have problems in that the statics are not getting initialized.
2566 In newer AIX releases this has been solved by linking Perl with
2567 the libC_r library, but unfortunately in AIX 4.2 the said library
2568 has an obscure bug where the various functions related to time
2569 (such as time() and gettimeofday()) return broken values, and
2570 therefore in AIX 4.2 Perl is not linked against the libC_r.
2571
2572 =item *
2573
2574 vac 5.0.0.0 May Produce Buggy Code For Perl
2575
2576 The AIX C compiler vac version 5.0.0.0 may produce buggy code,
2577 resulting in few random tests failing, but when the failing tests
2578 are run by hand, they succeed.  We suggest upgrading to at least
2579 vac version 5.0.1.0, that has been known to compile Perl correctly.
2580 "lslpp -L|grep vac.C" will tell you the vac version. See README.aix.
2581
2582 =back
2583
2584 =head2 Amiga Perl Invoking Mystery
2585
2586 One cannot call Perl using the C<volume:> syntax, that is, C<perl -v>
2587 works, but for example C<bin:perl -v> doesn't.  The exact reason isn't
2588 known but the current suspect is the F<ixemul> library.
2589
2590 =head2 lib/ftmp-security tests warn 'system possibly insecure'
2591
2592 Don't panic.  Read INSTALL 'make test' section instead.
2593
2594 =head2  HP-UX lib/posix Subtest 9 Fails When LP64-Configured
2595
2596 If perl is configured with -Duse64bitall, the successful result of the
2597 subtest 10 of lib/posix may arrive before the successful result of the
2598 subtest 9, which confuses the test harness so much that it thinks the
2599 subtest 9 failed.
2600
2601 =head2 Linux With Sfio Fails op/misc Test 48
2602
2603 No known fix.
2604
2605 =head2 Mac OS X
2606
2607 The following tests are known to fail:
2608
2609  Failed Test                 Stat Wstat Total Fail  Failed  List of Failed
2610  -------------------------------------------------------------------------
2611  ../ext/DB_File/t/db-btree.t    0    11    ??   ??       %  ??
2612  ../ext/DB_File/t/db-recno.t              149    3   2.01%  61 63 65
2613  ../ext/POSIX/t/posix.t                    31    1   3.23%  10
2614
2615 If you are building on a UFS partition, you will also probably see
2616 t/op/stat.t subtest #9 fail.  This is caused by Darwin's UFS not
2617 supporting inode change time.
2618
2619 =head2 OS/390
2620
2621 OS/390 has rather many test failures but the situation is actually
2622 better than it was in 5.6.0, it's just that so many new modules and
2623 tests have been added.
2624
2625  ../ext/B/t/deparse.t                        17    1   5.88%  14
2626  ../ext/Data/Dumper/t/dumper.t              321    2   0.62%  311 314
2627  ../ext/IO/lib/IO/t/io_unix.t                 5    4  80.00%  2-5
2628  ../lib/utf8.t                               94   13  13.83%  27 30-31 43 46 73
2629                                                               76 79 82 85 88 91
2630                                                               94
2631  ../lib/Benchmark.t               1   256   159    1   0.63%  75
2632  ../lib/ExtUtils/t/Embed.t                    9    9 100.00%  1-9
2633  ../lib/ExtUtils/t/ExtUtils.t                27   19  70.37%  5-23
2634  op/pat.t                                   864    9   1.04%  242-243 665 776
2635                                                               785 832-834 845
2636  op/sprintf.t                               224    3   1.34%  98 100 136
2637  op/tr.t                                     97    5   5.15%  63 71-74
2638  uni/fold.t                                 767    8   1.04%  25-26 62 169 196
2639                                                               648 697-698
2640  60 tests and 384 subtests skipped.
2641
2642 =head2 op/sprintf tests 129 and 130
2643
2644 The op/sprintf tests 129 and 130 are known to fail on some platforms.
2645 Examples include any platform using sfio, and Compaq/Tandem's NonStop-UX.
2646 The failing platforms do not comply with the ANSI C Standard, line
2647 19ff on page 134 of ANSI X3.159 1989 to be exact.  (They produce
2648 something other than "1" and "-1" when formatting 0.6 and -0.6 using
2649 the printf format "%.0f", most often they produce "0" and "-0".)
2650
2651 =head2  Failure of Thread tests
2652
2653 B<Note that support for 5.005-style threading remains experimental
2654 and practically unsupported.>
2655
2656 The following tests are known to fail due to fundamental problems in
2657 the 5.005 threading implementation. These are not new failures--Perl
2658 5.005_0x has the same bugs, but didn't have these tests.
2659
2660  ../ext/List/Util/t/first.t         255 65280     7    4  57.14%  2 5-7
2661  ../lib/English.t                     2   512    54    2   3.70%  2-3
2662  ../lib/Filter/Simple/t/data.t                    6    3  50.00%  1-3
2663  ../lib/Filter/Simple/t/filter_onl                9    3  33.33%  1-2 5
2664  ../lib/autouse.t                                10    1  10.00%  4
2665  op/flip.t                                       15    1   6.67%  15
2666
2667 These failures are unlikely to get fixed as the 5.005-style
2668 threads are considered fundamentally broken.
2669
2670 =head2 UNICOS
2671
2672  ../ext/Socket/socketpair.t    1   256    45    1   2.22%  12
2673  ../lib/Math/Trig.t                       26    1   3.85%  25
2674  ../lib/warnings.t                       460    1   0.22%  425
2675  io/fs.t                                  36    1   2.78%  31
2676  op/numconvert.t                        1440   13   0.90%  208 509-510
2677  657-658 665-666 829-830 989-990 1149-1150
2678
2679 =head2 UNICOS and UNICOS/mk
2680
2681 The io/fs test #31 is failing because in UNICOS and UNICOS/mk
2682 truncate() cannot be used to grow the size of filehandles, only
2683 to reduce the size.  The workaround is to truncate files instead
2684 of filehandles.
2685
2686 =head2 UTS
2687
2688 There are a few known test failures, see L<perluts>.
2689
2690 =head2 VMS
2691
2692 There should be no reported test failures with a default configuration,
2693 though there are a number of tests marked TODO that point to areas
2694 needing further debugging and/or porting work.
2695
2696 =head2 Win32
2697
2698 In multi-CPU boxes there are some problems with the I/O buffering:
2699 some output may appear twice.  The Win32 following failures are known
2700 as of 5.7.3:
2701
2702   ..\ext/Encode/t/JP.t      4  1024    22    4  18.18%  9 14 18 21
2703   ..\ext/threads/t/end.t                6    4  66.67%  3-6
2704   ..\lib/blib.t             3   768     7    3  42.86%  1 4-5
2705
2706 =head2 Localising a Tied Variable Leaks Memory
2707
2708     use Tie::Hash;
2709     tie my %tie_hash => 'Tie::StdHash';
2710
2711     ...
2712
2713     local($tie_hash{Foo}) = 1; # leaks
2714
2715 Code like the above is known to leak memory every time the local()
2716 is executed.
2717
2718 =head2 Localising Tied Arrays and Hashes Is Broken
2719
2720     local %tied_array;
2721
2722 doesn't work as one would expect: the old value is restored
2723 incorrectly.
2724
2725 =head2 Self-tying of Arrays and Hashes Is Forbidden
2726
2727 Self-tying of arrays and hashes is broken in rather deep and
2728 hard-to-fix ways.  As a stop-gap measure to avoid people from getting
2729 frustrated at the mysterious results (core dumps, most often) it is
2730 for now forbidden (you will get a fatal error even from an attempt).
2731
2732 =head2 Building Extensions Can Fail Because Of Largefiles
2733
2734 Some extensions like mod_perl are known to have issues with
2735 `largefiles', a change brought by Perl 5.6.0 in which file offsets
2736 default to 64 bits wide, where supported.  Modules may fail to compile
2737 at all or compile and work incorrectly.  Currently there is no good
2738 solution for the problem, but Configure now provides appropriate
2739 non-largefile ccflags, ldflags, libswanted, and libs in the %Config
2740 hash (e.g., $Config{ccflags_nolargefiles}) so the extensions that are
2741 having problems can try configuring themselves without the
2742 largefileness.  This is admittedly not a clean solution, and the
2743 solution may not even work at all.  One potential failure is whether
2744 one can (or, if one can, whether it's a good idea) link together at
2745 all binaries with different ideas about file offsets, all this is
2746 platform-dependent.
2747
2748 =head2 Unicode Support on EBCDIC Still Spotty
2749
2750 Though mostly working, Unicode support still has problem spots on
2751 EBCDIC platforms.  One such known spot are the C<\p{}> and C<\P{}>
2752 regular expression constructs for code points less than 256: the
2753 pP are testing for Unicode code points, not knowing about EBCDIC.
2754
2755 =head2 The Compiler Suite Is Still Experimental
2756
2757 The compiler suite is slowly getting better but it continues to be
2758 highly experimental.  Use in production environments is discouraged.
2759
2760 =head2 The Long Double Support Is Still Experimental
2761
2762 The ability to configure Perl's numbers to use "long doubles",
2763 floating point numbers of hopefully better accuracy, is still
2764 experimental.  The implementations of long doubles are not yet
2765 widespread and the existing implementations are not quite mature
2766 or standardised, therefore trying to support them is a rare
2767 and moving target.  The gain of more precision may also be offset
2768 by slowdown in computations (more bits to move around, and the
2769 operations are more likely to be executed by less optimised
2770 libraries).
2771
2772 =head2 Seen In Perl 5.7 But Gone Now
2773
2774 C<Time::Piece> (previously known as C<Time::Object>) was removed
2775 because it was felt that it didn't have enough value in it to be a
2776 core module.  It is still a useful module, though, and is available
2777 from the CPAN.
2778
2779 =head1 Reporting Bugs
2780
2781 If you find what you think is a bug, you might check the articles
2782 recently posted to the comp.lang.perl.misc newsgroup and the perl
2783 bug database at http://bugs.perl.org.  There may also be
2784 information at http://www.perl.com/, the Perl Home Page.
2785
2786 If you believe you have an unreported bug, please run the B<perlbug>
2787 program included with your release.  Be sure to trim your bug down
2788 to a tiny but sufficient test case.  Your bug report, along with the
2789 output of C<perl -V>, will be sent off to perlbug@perl.org to be
2790 analysed by the Perl porting team.
2791
2792 =head1 SEE ALSO
2793
2794 The F<Changes> file for exhaustive details on what changed.
2795
2796 The F<INSTALL> file for how to build Perl.
2797
2798 The F<README> file for general stuff.
2799
2800 The F<Artistic> and F<Copying> files for copyright information.
2801
2802 =head1 HISTORY
2803
2804 Written by Jarkko Hietaniemi <F<jhi@iki.fi>>.
2805
2806 =cut