consistent commands for perl5db.pl etc.
[p5sagit/p5-mst-13.2.git] / pod / perldelta.pod
1 =head1 NAME
2
3 perldelta - what is new for perl v5.8.0
4
5 =head1 DESCRIPTION
6
7 This document describes differences between the 5.6.0 release
8 and the 5.8.0 release.
9
10 Many of the bug fixes in 5.8.0 were already seen in the 5.6.1
11 maintenance release since the two releases were kept closely
12 coordinated.
13
14 If you are upgrading from Perl 5.005_03, you might also want
15 to read L<perl56delta>.
16
17 =head1 Highlights In 5.8.0
18
19 =over 4
20
21 =item *
22
23 Better Unicode support
24
25 =item *
26
27 New Thread Implementation
28
29 =item *
30
31 Many New Modules
32
33 =item *
34
35 Better Numeric Accuracy
36
37 =item *
38
39 Safe Signals
40
41 =item *
42
43 More Extensive Regression Testing
44
45 =back
46
47 =head1 Incompatible Changes
48
49 =head2 64-bit platforms and malloc
50
51 If your pointers are 64 bits wide, the Perl malloc is no longer being
52 used because it does not work well with 8-byte pointers.  Also,
53 usually the system mallocs on such platforms are much better optimized
54 for such large memory models than the Perl malloc.  Some memory-hungry
55 Perl applications like the PDL don't work well with Perl's malloc.
56 Finally, other applications than Perl (like modperl) tend to prefer
57 the system malloc.  Such platforms include Alpha and 64-bit HPPA,
58 MIPS, PPC, and Sparc.
59
60 =head2 AIX Dynaloading
61
62 The AIX dynaloading now uses in AIX releases 4.3 and newer the native
63 dlopen interface of AIX instead of the old emulated interface.  This
64 change will probably break backward compatibility with compiled
65 modules.  The change was made to make Perl more compliant with other
66 applications like modperl which are using the AIX native interface.
67
68 =head2 Attributes for C<my> variables now handled at run-time.
69
70 The C<my EXPR : ATTRS> syntax now applies variable attributes at
71 run-time.  (Subroutine and C<our> variables still get attributes applied
72 at compile-time.)  See L<attributes> for additional details.  In particular,
73 however, this allows variable attributes to be useful for C<tie> interfaces,
74 which was a deficiency of earlier releases.  Note that the new semantics
75 doesn't work with the Attribute::Handlers module (as of version 0.76).
76
77 =head2 Socket Extension Dynamic in VMS
78
79 The Socket extension is now dynamically loaded instead of being
80 statically built in.  This may or may not be a problem with ancient
81 TCP/IP stacks of VMS: we do not know since we weren't able to test
82 Perl in such configurations.
83
84 =head2 IEEE-format Floating Point Default on OpenVMS Alpha
85
86 Perl now uses IEEE format (T_FLOAT) as the default internal floating
87 point format on OpenVMS Alpha, potentially breaking binary compatibility
88 with external libraries or existing data.  G_FLOAT is still available as
89 a configuration option.  The default on VAX (D_FLOAT) has not changed.
90
91 =head2 New Unicode Properties
92
93 Unicode I<scripts> are now supported. Scripts are similar to (and superior
94 to) Unicode I<blocks>. The difference between scripts and blocks is that
95 scripts are the glyphs used by a language or a group of languages, while
96 the blocks are more artificial groupings of (mostly) 256 characters based
97 on the Unicode numbering.
98
99 In general, scripts are more inclusive, but not universally so. For
100 example, while the script C<Latin> includes all the Latin characters and
101 their various diacritic-adorned versions, it does not include the various
102 punctuation or digits (since they are not solely C<Latin>).
103
104 A number of other properties are now supported, including C<\p{L&}>,
105 C<\p{Any}> C<\p{Assigned}>, C<\p{Unassigned}>, C<\p{Blank}> and
106 C<\p{SpacePerl}> (along with their C<\P{...}> versions, of course).
107 See L<perlunicode> for details, and more additions.
108
109 The C<In> or C<Is> prefix to names used with the C<\p{...}> and C<\P{...}>
110 are now almost always optional. The only exception is that a C<In> prefix
111 is required to signify a Unicode block when a block name conflicts with a
112 script name. For example, C<\p{Tibetan}> refers to the script, while
113 C<\p{InTibetan}> refers to the block. When there is no name conflict, you
114 can omit the C<In> from the block name (e.g. C<\p{BraillePatterns}>), but
115 to be safe, it's probably best to always use the C<In>).
116
117 =head2 Perl Parser Stress Tested
118
119 The Perl parser has been stress tested using both random input and
120 Markov chain input and the few found crashes and lockups have been
121 fixed.
122
123 =head2 REF(...) Instead Of SCALAR(...)
124
125 A reference to a reference now stringifies as "REF(0x81485ec)" instead
126 of "SCALAR(0x81485ec)" in order to be more consistent with the return
127 value of ref().
128
129 =head2 Deprecations
130
131 =over 4
132
133 =item *
134
135 The semantics of bless(REF, REF) were unclear and until someone proves
136 it to make some sense, it is forbidden.
137
138 =item *
139
140 The obsolete chat2 library that should never have been allowed
141 to escape the laboratory has been decommissioned.
142
143 =item *
144
145 The builtin dump() function has probably outlived most of its
146 usefulness.  The core-dumping functionality will remain in future
147 available as an explicit call to C<CORE::dump()>, but in future
148 releases the behaviour of an unqualified C<dump()> call may change.
149
150 =item *
151
152 The very dusty examples in the eg/ directory have been removed.
153 Suggestions for new shiny examples welcome but the main issue is that
154 the examples need to be documented, tested and (most importantly)
155 maintained.
156
157 =item *
158
159 The (bogus) escape sequences \8 and \9 now give an optional warning
160 ("Unrecognized escape passed through").  There is no need to \-escape
161 any C<\w> character.
162
163 =item *
164
165 The list of filenames from glob() (or <...>) is now by default sorted
166 alphabetically to be csh-compliant (which is what happened before
167 in most UNIX platforms).  (bsd_glob() does still sort platform
168 natively, ASCII or EBCDIC, unless GLOB_ALPHASORT is specified.)
169
170 =item *
171
172 Spurious syntax errors generated in certain situations, when glob()
173 caused File::Glob to be loaded for the first time, have been fixed.
174
175 =item *
176
177 Although "you shouldn't do that", it was possible to write code that
178 depends on Perl's hashed key order (Data::Dumper does this).  The new
179 algorithm "One-at-a-Time" produces a different hashed key order.
180 More details are in L</"Performance Enhancements">.
181
182 =item *
183
184 lstat(FILEHANDLE) now gives a warning because the operation makes no sense.
185 In future releases this may become a fatal error.
186
187 =item *
188
189 The C<package;> syntax (C<package> without an argument) has been
190 deprecated.  Its semantics were never that clear and its
191 implementation even less so.  If you have used that feature to
192 disallow all but fully qualified variables, C<use strict;> instead.
193
194 =item *
195
196 The unimplemented POSIX regex features [[.cc.]] and [[=c=]] are still
197 recognised but now cause fatal errors.  The previous behaviour of
198 ignoring them by default and warning if requested was unacceptable
199 since it, in a way, falsely promised that the features could be used.
200
201 =item *
202
203 The current user-visible implementation of pseudo-hashes (the weird
204 use of the first array element) is deprecated starting from Perl 5.8.0
205 and will be removed in Perl 5.10.0, and the feature will be
206 implemented differently.  Not only is the current interface rather
207 ugly, but the current implementation slows down normal array and hash
208 use quite noticeably. The C<fields> pragma interface will remain
209 available.
210
211 =item *
212
213 The syntaxes C<< @a->[...] >> and  C<< %h->{...} >> have now been deprecated.
214
215 =item *
216
217 After years of trying the suidperl is considered to be too complex to
218 ever be considered truly secure.  The suidperl functionality is likely
219 to be removed in a future release.
220
221 =item *
222
223 The long deprecated uppercase aliases for the string comparison
224 operators (EQ, NE, LT, LE, GE, GT) have now been removed.
225
226 =item *
227
228 The tr///C and tr///U features have been removed and will not return;
229 the interface was a mistake.  Sorry about that.  For similar
230 functionality, see pack('U0', ...) and pack('C0', ...).
231
232 =item *
233
234 Earlier Perls treated "sub foo (@bar)" as equivalent to "sub foo (@)".
235 The prototypes are now checked at compile-time for invalid characters.
236 An optional warning is generated ("Illegal character in prototype...")
237 but this may be upgraded to a fatal error in a future release.
238
239 =back
240
241 =head1 Core Enhancements
242
243 =head2 PerlIO is Now The Default
244
245 =over 4
246
247 =item *
248
249 IO is now by default done via PerlIO rather than system's "stdio".
250 PerlIO allows "layers" to be "pushed" onto a file handle to alter the
251 handle's behaviour.  Layers can be specified at open time via 3-arg
252 form of open:
253
254    open($fh,'>:crlf :utf8', $path) || ...
255
256 or on already opened handles via extended C<binmode>:
257
258    binmode($fh,':encoding(iso-8859-7)');
259
260 The built-in layers are: unix (low level read/write), stdio (as in
261 previous Perls), perlio (re-implementation of stdio buffering in a
262 portable manner), crlf (does CRLF <=> "\n" translation as on Win32,
263 but available on any platform).  A mmap layer may be available if
264 platform supports it (mostly UNIXes).
265
266 Layers to be applied by default may be specified via the 'open' pragma.
267
268 See L</"Installation and Configuration Improvements"> for the effects
269 of PerlIO on your architecture name.
270
271 =item *
272
273 File handles can be marked as accepting Perl's internal encoding of Unicode
274 (UTF-8 or UTF-EBCDIC depending on platform) by a pseudo layer ":utf8" :
275
276    open($fh,">:utf8","Uni.txt");
277
278 Note for EBCDIC users: the pseudo layer ":utf8" is erroneously named
279 for you since it's not UTF-8 what you will be getting but instead
280 UTF-EBCDIC.  See L<perlunicode>, L<utf8>, and
281 http://www.unicode.org/unicode/reports/tr16/ for more information.
282 In future releases this naming may change.
283
284 =item *
285
286 File handles can translate character encodings from/to Perl's internal
287 Unicode form on read/write via the ":encoding()" layer.
288
289 =item *
290
291 File handles can be opened to "in memory" files held in Perl scalars via:
292
293    open($fh,'>', \$variable) || ...
294
295 =item *
296
297 Anonymous temporary files are available without need to
298 'use FileHandle' or other module via
299
300    open($fh,"+>", undef) || ...
301
302 That is a literal undef, not an undefined value.
303
304 =item *
305
306 The list form of C<open> is now implemented for pipes (at least on UNIX):
307
308    open($fh,"-|", 'cat', '/etc/motd')
309
310 creates a pipe, and runs the equivalent of exec('cat', '/etc/motd') in
311 the child process.
312
313 =back
314
315 =head2 Safe Signals
316
317 Perl used to be fragile in that signals arriving at inopportune moments
318 could corrupt Perl's internal state.  Now Perl postpones handling of
319 signals until it's safe (between opcodes).
320
321 This change may have surprising side effects because signals no longer
322 interrupt Perl instantly.  Perl will now first finish whatever it was
323 doing, like finishing an internal operation (like sort()) or an
324 external operation (like an I/O operation), and only then look at any
325 arrived signals (and before starting the next operation).  No more corrupt
326 internal state since the current operation is always finished first,
327 but the signal may take more time to get heard.
328
329 =head2 Unicode Overhaul
330
331 Unicode in general should be now much more usable than in Perl 5.6.0
332 (or even in 5.6.1).  Unicode can be used in hash keys, Unicode in
333 regular expressions should work now, Unicode in tr/// should work now,
334 Unicode in I/O should work now.
335
336 =over 4
337
338 =item *
339
340 The Unicode Character Database coming with Perl has been upgraded
341 to Unicode 3.1.1.  For more information, see http://www.unicode.org/.
342
343 =item *
344
345 For developers interested in enhancing Perl's Unicode capabilities:
346 almost all the UCD files are included with the Perl distribution in
347 the F<lib/unicore subdirectory>.  The most notable omission, for space
348 considerations, is the Unihan database.
349
350 =item *
351
352 The properties \p{Blank} and \p{SpacePerl} have been added. "Blank" is like
353 C isblank(), that is, it contains only "horizontal whitespace" (the space
354 character is, the newline isn't), and the "SpacePerl" is the Unicode
355 equivalent of C<\s> (\p{Space} isn't, since that includes the vertical
356 tabulator character, whereas C<\s> doesn't.)
357
358 See "New Unicode Properties" earlier in this document for additional
359 information on changes with Unicode properties.
360
361 =back
362
363 =head2 Understanding of Numbers
364
365 In general a lot of fixing has happened in the area of Perl's
366 understanding of numbers, both integer and floating point.  Since in
367 many systems the standard number parsing functions like C<strtoul()>
368 and C<atof()> seem to have bugs, Perl tries to work around their
369 deficiencies.  This results hopefully in more accurate numbers.
370
371 Perl now tries internally to use integer values in numeric conversions
372 and basic arithmetics (+ - * /) if the arguments are integers, and
373 tries also to keep the results stored internally as integers.
374 This change leads to often slightly faster and always less lossy
375 arithmetics. (Previously Perl always preferred floating point numbers
376 in its math.)
377
378 =head2 Miscellaneous Changes
379
380 =over 4
381
382 =item *
383
384 AUTOLOAD is now lvaluable, meaning that you can add the :lvalue attribute
385 to AUTOLOAD subroutines and you can assign to the AUTOLOAD return value.
386
387 =item *
388
389 C<perl -d:Module=arg,arg,arg> now works (previously one couldn't pass
390 in multiple arguments.)
391
392 =item *
393
394 The builtin dump() now gives an optional warning
395 C<Ambiguous call resolved as CORE::dump(), qualify as such or use &>
396 meaning that by default C<dump(...)> is resolved as the builtin 
397 dump() which dumps core and aborts, not as (possibly) user-defined
398 C<sub dump>.  To call the latter, qualify the call as C<&dump(...)>.
399 (The whole dump() feature is to considered deprecated, and possibly
400 removed/changed in future releases.)
401
402 =item *
403
404 chomp() and chop() have been demoted back to I<not> being overrideable
405 because they cannot really be overridden-- the problem is that their
406 prototype cannot be expressed and therefore one really cannot write
407 replacements to override these builtins.
408
409 =item *
410
411 END blocks are now run even if you exit/die in a BEGIN block.
412 Internally, the execution of END blocks is now controlled by 
413 PL_exit_flags & PERL_EXIT_DESTRUCT_END. This enables the new
414 behaviour for Perl embedders. This will default in 5.10. See
415 L<perlembed>.
416
417 =item *
418
419 Formats now support zero-padded decimal fields.
420
421 =item *
422
423 Lvalue subroutines can now return C<undef> in list context.
424 However, the lvalue subroutine feature still remains experimental.
425
426 =item *
427
428 A lost warning "Can't declare ... dereference in my" has been
429 restored (Perl had it earlier but it became lost in later releases.)
430
431 =item *
432
433 A new special regular expression variable has been introduced:
434 C<$^N>, which contains the most-recently closed group (submatch).
435
436 =item *
437
438 C<no Module;> now works even if there is no "sub unimport" in the Module.
439
440 =item *
441
442 The numerical comparison operators return C<undef> if either operand
443 is a NaN.  Previously the behaviour was unspecified.
444
445 =item *
446
447 The following builtin functions are now overridable: each(), keys(),
448 pop(), push(), shift(), splice(), unshift().
449
450 =item *
451
452 C<pack('U0a*', ...)> can now be used to force a string to UTF8.
453
454 =item *
455
456 my __PACKAGE__ $obj now works.
457
458 =item *
459
460 The printf() and sprintf() now support parameter reordering using the
461 C<%\d+\$> and C<*\d+\$> syntaxes.  For example
462
463     print "%2\$s %1\$s\n", "foo", "bar";
464
465 will print "bar foo\n".  This feature helps in writing
466 internationalised software, and in general when the order
467 of the parameters can vary.
468
469 =item *
470
471 prototype(\&) is now available.
472
473 =item *
474
475 prototype(\[$@%&]) is now available to implicitly create references
476 (useful for example if you want to emulate the tie() interface).
477
478 =item *
479
480 A new command-line option, C<-t> is available.  It is the
481 little brother of C<-T>: instead of dieing on taint violations,
482 lexical warnings are given.  B<This is only meant as a temporary
483 debugging aid while securing the code of old legacy applications.
484 This is not a substitute for -T.>
485
486 =item *
487
488 In other taint news, the C<exec LIST> and C<system LIST> have now been
489 considered too risky (think C<exec @ARGV>: it can start any program
490 with any arguments), and now the said forms cause a warning.
491 You should carefully launder the arguments to guarantee their
492 validity.  In future releases of Perl the forms will become fatal
493 errors so consider starting laundering now.
494
495 =item *
496
497 If tr/// is just counting characters, it doesn't attempt to
498 modify its target.
499
500 =item *
501
502 untie() will now call an UNTIE() hook if it exists.  See L<perltie>
503 for details.
504
505 =item *
506
507 L<utime> now supports C<utime undef, undef, @files> to change the
508 file timestamps to the current time.
509
510 =item *
511
512 The rules for allowing underscores (underbars) in numeric constants
513 have been relaxed and simplified: now you can have an underscore
514 simply B<between digits>.
515
516 =back
517
518 =head1 Modules and Pragmata
519
520 =head2 New Modules and Pragmata
521
522 =over 4
523
524 =item *
525
526 C<Attribute::Handlers> allows a class to define attribute handlers.
527
528     package MyPack;
529     use Attribute::Handlers;
530     sub Wolf :ATTR(SCALAR) { print "howl!\n" }
531
532     # later, in some package using or inheriting from MyPack...
533
534     my MyPack $Fluffy : Wolf; # the attribute handler Wolf will be called
535
536 Both variables and routines can have attribute handlers.  Handlers can
537 be specific to type (SCALAR, ARRAY, HASH, or CODE), or specific to the
538 exact compilation phase (BEGIN, CHECK, INIT, or END).
539
540 =item *
541
542 B<B::Concise> is a new compiler backend for walking the Perl syntax
543 tree, printing concise info about ops, from Stephen McCamant.  The
544 output is highly customisable.  See L<B::Concise>.
545
546 =item *
547
548 C<Class::ISA> for reporting the search path for a class's ISA tree,
549 by Sean Burke, has been added.  See L<Class::ISA>.
550
551 =item *
552
553 C<Cwd> has now a split personality: if possible, an XS extension is
554 used, (this will hopefully be faster, more secure, and more robust)
555 but if not possible, the familiar Perl implementation is used.
556
557 =item *
558
559 C<Devel::PPPort>, originally from Kenneth Albanowski and now
560 maintained by Paul Marquess, has been added.  It is primarily used
561 by C<h2xs> to enhance portability of of XS modules between different
562 versions of Perl.
563
564 =item *
565
566 C<Digest>, frontend module for calculating digests (checksums), from
567 Gisle Aas, has been added.  See L<Digest>.
568
569 =item *
570
571 C<Digest::MD5> for calculating MD5 digests (checksums) as defined in
572 RFC 1321, from Gisle Aas, has been added.  See L<Digest::MD5>.
573
574     use Digest::MD5 'md5_hex';
575
576     $digest = md5_hex("Thirsty Camel");
577
578     print $digest, "\n"; # 01d19d9d2045e005c3f1b80e8b164de1
579
580 NOTE: the C<MD5> backward compatibility module is deliberately not
581 included since its further use is discouraged.
582
583 =item *
584
585 C<Encode>, by Nick Ing-Simmons, provides a mechanism to translate
586 between different character encodings.  Support for Unicode,
587 ISO-8859-*, ASCII, CP*, KOI8-R, and three variants of EBCDIC are
588 compiled in to the module.  Several other encodings (like Japanese,
589 Chinese, and MacIntosh encodings) are included and will be loaded at
590 runtime.  See L<Encode>.
591
592 Any encoding supported by Encode module is also available to the
593 ":encoding()" layer if PerlIO is used.
594
595 =item *
596
597 C<I18N::Langinfo> can be use to query locale information.
598 See L<I18N::Langinfo>.
599
600 =item *
601
602 C<I18N::LangTags> has functions for dealing with RFC3066-style
603 language tags, by Sean Burke.  See L<I18N::LangTags>.
604
605 =item *
606
607 C<ExtUtils::Constant> is a new tool for extension writers for
608 generating XS code to import C header constants, by Nicholas Clark.
609 See L<ExtUtils::Constant>.
610
611 =item *
612
613 C<Filter::Simple> is an easy-to-use frontend to Filter::Util::Call,
614 from Damian Conway.  See L<Filter::Simple>.
615
616     # in MyFilter.pm:
617
618     package MyFilter;
619
620     use Filter::Simple sub {
621         while (my ($from, $to) = splice @_, 0, 2) {
622                 s/$from/$to/g;
623         }
624     };
625
626     1;
627
628     # in user's code:
629
630     use MyFilter qr/red/ => 'green';
631
632     print "red\n";   # this code is filtered, will print "green\n"
633     print "bored\n"; # this code is filtered, will print "bogreen\n"
634
635     no MyFilter;
636
637     print "red\n";   # this code is not filtered, will print "red\n"
638
639 =item *
640
641 C<File::Temp> allows one to create temporary files and directories in
642 an easy, portable, and secure way, by Tim Jenness.  See L<File::Temp>.
643
644 =item *
645
646 C<Filter::Util::Call> provides you with the framework to write
647 I<Source Filters> in Perl, from Paul Marquess.  For most uses the
648 frontend Filter::Simple is to be preferred.  See L<Filter::Util::Call>.
649
650 =item *
651
652 L<libnet> is a collection of perl5 modules related to network
653 programming, from Graham Barr.  See L<Net::FTP>, L<Net::NNTP>,
654 L<Net::Ping>, L<Net::POP3>, L<Net::SMTP>, and L<Net::Time>.
655
656 Perl installation leaves libnet unconfigured, use F<libnetcfg> to configure.
657
658 =item *
659
660 C<List::Util> is a selection of general-utility list subroutines, like
661 sum(), min(), first(), and shuffle(), by Graham Barr.  See L<List::Util>.
662
663 =item *
664
665 C<Locale::Constants>, C<Locale::Country>, C<Locale::Currency>, and
666 C<Locale::Language>, from Neil Bowers, have been added.  They provide the
667 codes for various locale standards, such as "fr" for France, "usd" for
668 US Dollar, and "jp" for Japanese.
669
670     use Locale::Country;
671
672     $country = code2country('jp');               # $country gets 'Japan'
673     $code    = country2code('Norway');           # $code gets 'no'
674
675 See L<Locale::Constants>, L<Locale::Country>, L<Locale::Currency>,
676 and L<Locale::Language>.
677
678 =item *
679
680 C<Locale::Maketext> is localization framework from Sean Burke.  See
681 L<Locale::Maketext>, and L<Locale::Maketext::TPJ13>.  The latter is an
682 article about software localization, originally published in The Perl
683 Journal #13, republished here with kind permission.
684
685 =item *
686
687 C<Memoize> can make your functions faster by trading space for time,
688 from Mark-Jason Dominus.  See L<Memoize>.
689
690 =item *
691
692 C<MIME::Base64> allows you to encode data in base64, from Gisle Aas,
693 as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
694 Extensions)>.
695
696     use MIME::Base64;
697
698     $encoded = encode_base64('Aladdin:open sesame');
699     $decoded = decode_base64($encoded);
700
701     print $encoded, "\n"; # "QWxhZGRpbjpvcGVuIHNlc2FtZQ=="
702
703 See L<MIME::Base64>.
704
705 =item *
706
707 C<MIME::QuotedPrint> allows you to encode data in quoted-printable
708 encoding, as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
709 Extensions)>, from Gisle Aas.
710
711     use MIME::QuotedPrint;
712
713     $encoded = encode_qp("Smiley in Unicode: \x{263a}");
714     $decoded = decode_qp($encoded);
715
716     print $encoded, "\n"; # "Smiley in Unicode: =263A"
717
718 MIME::QuotedPrint has been enhanced to provide the basic methods
719 necessary to use it with PerlIO::Via as in :
720
721     use MIME::QuotedPrint;
722     open($fh,">Via(MIME::QuotedPrint)",$path);
723
724 See L<MIME::QuotedPrint>.
725
726 =item *
727
728 C<NEXT> is pseudo-class for method redispatch, from Damian Conway.
729 See L<NEXT>.
730
731 =item *
732
733 C<open> is a new pragma for setting the default I/O disciplines
734 for open().
735
736 =item *
737
738 C<PerlIO::Scalar> provides the implementation of IO to "in memory"
739 Perl scalars as discussed above, from Nick Ing-Simmons.  It also
740 serves as an example of a loadable PerlIO layer.  Other future
741 possibilities include PerlIO::Array and PerlIO::Code.
742 See L<PerlIO::Scalar>.
743
744 =item *
745
746 C<PerlIO::Via> acts as a PerlIO layer and wraps PerlIO layer
747 functionality provided by a class (typically implemented in perl
748 code), from Nick Ing-Simmons.
749
750     use MIME::QuotedPrint;
751     open($fh,">Via(MIME::QuotedPrint)",$path);
752
753 This will automatically convert everything output to C<$fh>
754 to Quoted-Printable.  See L<PerlIO::Via>.
755
756 =item *
757
758 C<Pod::ParseLink>, by Russ Allbery, has been added,
759 to parse LZ<><> links in pods as described in the new
760 perlpodspec.
761
762 =item *
763
764 C<Pod::Text::Overstrike>, by Joe Smith, has been added.
765 It converts POD data to formatted overstrike text.
766 See L<Pod::Text::Overstrike>.
767
768 =item *
769
770 C<Scalar::Util> is a selection of general-utility scalar subroutines,
771 like blessed(), reftype(), and tainted().  See L<Scalar::Util>.
772
773 =item *
774
775 C<sort> is a new pragma for controlling the behaviour of sort().
776
777 =item *
778
779 C<Storable> gives persistence to Perl data structures by allowing the
780 storage and retrieval of Perl data to and from files in a fast and
781 compact binary format, from Raphael Manfredi.  See L<Storable>.
782
783 =item *
784
785 C<Switch>, from Damian Conway, has been added.  Just by saying
786
787     use Switch;
788
789 you have C<switch> and C<case> available in Perl.
790
791     use Switch;
792
793     switch ($val) {
794
795                 case 1          { print "number 1" }
796                 case "a"        { print "string a" }
797                 case [1..10,42] { print "number in list" }
798                 case (@array)   { print "number in list" }
799                 case /\w+/      { print "pattern" }
800                 case qr/\w+/    { print "pattern" }
801                 case (%hash)    { print "entry in hash" }
802                 case (\%hash)   { print "entry in hash" }
803                 case (\&sub)    { print "arg to subroutine" }
804                 else            { print "previous case not true" }
805     }
806
807 See L<Switch>.
808
809 =item *
810
811 C<Test::More> is yet another framework for writing test scripts,
812 more extensive than Test::Simple, by Michael Schwern.  See L<Test::More>.
813
814 =item *
815
816 C<Test::Simple> has basic utilities for writing tests, by Michael
817 Schwern.   See L<Test::Simple>.
818
819 =item *
820
821 C<Text::Balanced> has been added, for extracting delimited text
822 sequences from strings, from Damian Conway.
823
824     use Text::Balanced 'extract_delimited';
825
826     ($a, $b) = extract_delimited("'never say never', he never said", "'", '');
827
828 $a will be "'never say never'", $b will be ', he never said'.
829
830 In addition to extract_delimited() there are also extract_bracketed(),
831 extract_quotelike(), extract_codeblock(), extract_variable(),
832 extract_tagged(), extract_multiple(), gen_delimited_pat(), and
833 gen_extract_tagged().  With these you can implement rather advanced
834 parsing algorithms.  See L<Text::Balanced>.
835
836 =item *
837
838 C<threads> is an interface to interpreter threads, by Arthur Bergman.
839 Interpreter threads (ithreads) is the new thread model introduced in
840 Perl 5.6 but only available as an internal interface for extension
841 writers (and for Win32 Perl for C<fork()> emulation).  See L<threads>.
842
843 =item *
844
845 C<threads::shared> allows data sharing for interpreter threads, from
846 Arthur Bergman.  In the ithreads model any data sharing between
847 threads must be explicit, as opposed to the old 5.005 thread model
848 where data sharing was implicit.  See L<threads::shared>.
849
850 =item *
851
852 C<Tie::RefHash::Nestable>, by Edward Avis, allows storing hash
853 references (unlike the standard Tie::RefHash)  The module is contained
854 within Tie::RefHash, see L<Tie::RefHash>.
855
856 =item *
857
858 C<Time::HiRes> provides high resolution timing (ualarm, usleep,
859 and gettimeofday), from Douglas E. Wegscheid.  See L<Time::HiRes>.
860
861 =item *
862
863 C<Unicode::UCD> offers a querying interface to the Unicode Character
864 Database.  See L<Unicode::UCD>.
865
866 =item *
867
868 C<Unicode::Collate> implements the UCA (Unicode Collation Algorithm)
869 for sorting Unicode strings, by SADAHIRO Tomoyuki.  See L<Unicode::Collate>.
870
871 =item *
872
873 C<Unicode::Normalize> implements the various Unicode normalization
874 forms, by SADAHIRO Tomoyuki.  See L<Unicode::Normalize>.
875
876 =item *
877
878 C<XS::Typemap>, by Tim Jenness, is a test extension that exercises XS
879 typemaps.  Nothing gets installed but for extension writers the code
880 is worth studying.
881
882 =back
883
884 =head2 Updated And Improved Modules and Pragmata
885
886 =over 4
887
888 =item *
889
890 The following independently supported modules have been updated to the
891 newest versions from CPAN: CGI, CPAN, DB_File, File::Spec, File::Temp,
892 Getopt::Long, Math::BigFloat, Math::BigInt, the podlators bundle
893 (Pod::Man, Pod::Text), Pod::LaTeX, Pod::Parser, Storable,
894 Term::ANSIColor, Test, Text-Tabs+Wrap.
895
896 =item *
897
898 The attributes::reftype() now works on tied arguments.
899
900 =item *
901
902 AutoLoader can now be disabled with C<no AutoLoader;>.
903
904 =item *
905
906 B::Deparse has been significantly enhanced.  It now can deparse almost
907 all of the standard test suite (so that the tests still succeed).
908 There is a make target "test.deparse" for trying this out.
909
910 =item *
911
912 Class::Struct can now define the classes in compile time.
913
914 =item *
915
916 Class::Struct now assigns the array/hash element if the accessor
917 is called with an array/hash element as the B<sole> argument.
918
919 =item *
920
921 Data::Dumper has now an option to sort hashes.
922
923 =item *
924
925 Data::Dumper has now an option to dump code references
926 using B::Deparse.
927
928 =item *
929
930 DB_File now supports newer Berkeley DB versions, among
931 other improvements.
932
933 =item *
934
935 The English module can now be used without the infamous performance
936 hit by saying
937
938         use English '-no_performance_hit';
939
940 (Assuming, of course, that one doesn't need the troublesome variables
941 C<$`>, C<$&>, or C<$'>.)  Also, introduced C<@LAST_MATCH_START> and
942 C<@LAST_MATCH_END> English aliases for C<@-> and C<@+>.
943
944 =item *
945
946 Fcntl, Socket, and Sys::Syslog have been rewritten to use the
947 new-style constant dispatch section (see L<ExtUtils::Constant>).
948 This means that they will be more robust and hopefully faster.
949
950 =item *
951
952 File::Find now chdir()s correctly when chasing symbolic links.
953
954 =item *
955
956 File::Find now has pre- and post-processing callbacks.  It also
957 correctly changes directories when chasing symbolic links.  Callbacks
958 (naughtily) exiting with "next;" instead of "return;" now work.
959
960 =item *
961
962 File::Find is now (again) reentrant.  It also has been made
963 more portable.
964
965 =item *
966
967 File::Glob::glob() renamed to File::Glob::bsd_glob() to avoid
968 prototype mismatch with CORE::glob().
969
970 =item *
971
972 File::Glob now supports C<GLOB_LIMIT> constant to limit the size of
973 the returned list of filenames.
974
975 =item *
976
977 Devel::Peek now has an interface for the Perl memory statistics
978 (this works only if you are using perl's malloc, and if you have
979 compiled with debugging).
980
981 =item *
982
983 IPC::Open3 now allows the use of numeric file descriptors.
984
985 =item *
986
987 IO::Socket has now atmark() method, which returns true if the socket
988 is positioned at the out-of-band mark.  The method is also exportable
989 as a sockatmark() function.
990
991 =item *
992
993 IO::Socket::INET has support for ReusePort option (if your platform
994 supports it).  The Reuse option now has an alias, ReuseAddr.  For clarity
995 you may want to prefer ReuseAddr.
996
997 =item *
998
999 IO::Socket::INET now supports C<LocalPort> of zero (usually meaning
1000 that the operating system will make one up.)
1001
1002 =item *
1003
1004 use lib now works identically to @INC.  Removing directories
1005 with 'no lib' now works.
1006
1007 =item *
1008
1009 ExtUtils::MakeMaker now uses File::Spec internally, which hopefully
1010 leads into better portability.
1011
1012 =item *
1013
1014 Math::BigFloat and Math::BigInt have undergone a full rewrite.
1015 They are now magnitudes faster, and they support various
1016 bignum libraries such as GMP and PARI as their backends.
1017
1018 =item *
1019
1020 Math::Complex handles inf, NaN etc., better.
1021
1022 =item *
1023
1024 Net::Ping has been muchly enhanced.  Multihoming is now supported.
1025 There is now "external" protocol which uses Net::Ping::External module
1026 which runs external ping(1) and parses the output.  A version of
1027 Net::Ping::External is available in CPAN.
1028
1029 =item *
1030
1031 POSIX::sigaction() is now much more flexible and robust.
1032 You can now install coderef handlers, 'DEFAULT', and 'IGNORE'
1033 handlers, installing new handlers was not atomic.
1034
1035 =item *
1036
1037 In Safe the C<%INC> now localised in a Safe compartment so that
1038 use/require work.
1039
1040 =item *
1041
1042 In SDBM_File on dosish platforms, some keys went missing because of
1043 lack of support for files with "holes".  A workaround for the problem
1044 has been added.
1045
1046 =item *
1047
1048 In Search::Dict one can now have a pre-processing hook for the
1049 lines being searched.
1050
1051 =item *
1052
1053 The Shell module now has an OO interface.
1054
1055 =item *
1056
1057 The Test module has been significantly enhanced.
1058
1059 =item *
1060
1061 The vars pragma now supports declaring fully qualified variables.
1062 (Something that C<our()> does not and will not support.)
1063
1064 =item *
1065
1066 The C<utf8::> name space (as in the pragma) provides various
1067 Perl-callable functions to provide low level access to Perl's
1068 internal Unicode representation.  At the moment only length()
1069 has been implemented.
1070
1071 =back
1072
1073 =head1 Utility Changes
1074
1075 =over 4
1076
1077 =item *
1078
1079 Emacs perl mode (emacs/cperl-mode.el) has been updated to version
1080 4.31.
1081
1082 =item *
1083
1084 F<emacs/e2ctags.pl> is now much faster.
1085
1086 =item *
1087
1088 C<h2ph> now supports C trigraphs.
1089
1090 =item *
1091
1092 C<h2xs> now produces a template README.
1093
1094 =item *
1095
1096 C<h2xs> now uses C<Devel::PPort> for better portability between
1097 different versions of Perl.
1098
1099 =item *
1100
1101 C<h2xs> uses the new L<ExtUtils::Constant> module which will affect
1102 newly created extensions that define constants.  Since the new code is
1103 more correct (if you have two constants where the first one is a
1104 prefix of the second one, the first constant B<never> gets defined),
1105 less lossy (it uses integers for integer constant, as opposed to the
1106 old code that used floating point numbers even for integer constants),
1107 and slightly faster, you might want to consider regenerating your
1108 extension code (the new scheme makes regenerating easy).
1109 L<h2xs> now also supports C trigraphs.
1110
1111 =item *
1112
1113 C<libnetcfg> has been added to configure the libnet.
1114
1115 =item *
1116
1117 C<perlbug> is now much more robust.  It also sends the bug report to
1118 perl.org, not perl.com.
1119
1120 =item *
1121
1122 C<perlcc> has been rewritten and its user interface (that is,
1123 command line) is much more like that of the UNIX C compiler, cc.
1124 (The perlbc tools has been removed.  Use C<perlcc -B> instead.)
1125
1126 =item *
1127
1128 C<perlivp> is a new Installation Verification Procedure utility
1129 for running any time after installing Perl.
1130
1131 =item *
1132
1133 C<pod2html> now allows specifying a cache directory.
1134
1135 =item *
1136
1137 C<s2p> has been completely rewritten in Perl.  (It is in fact a full
1138 implementation of sed in Perl: you can use the sed functionality by
1139 using the C<psed> utility.)
1140
1141 =item *
1142
1143 C<xsubpp> now understands POD documentation embedded in the *.xs files.
1144
1145 =item *
1146
1147 C<xsubpp> now supports OUT keyword.
1148
1149 =back
1150
1151 =head1 New Documentation
1152
1153 =over 4
1154
1155 =item *
1156
1157 perl56delta details the changes between the 5.005 release and the
1158 5.6.0 release.
1159
1160 =item *
1161
1162 perlclib documents the internal replacements for standard C library
1163 functions.  (Interesting only for extension writers and Perl core
1164 hackers.)
1165
1166 =item *
1167
1168 perldebtut is a Perl debugging tutorial.
1169
1170 =item *
1171
1172 perlebcdic contains considerations for running Perl on EBCDIC platforms.
1173
1174 =item *
1175
1176 perlintro is a gentle introduction to Perl.
1177
1178 =item *
1179
1180 perliol documents the internals of PerlIO with layers.
1181
1182 =item *
1183
1184 perlmodstyle is a style guide for writing modules.
1185
1186 =item *
1187
1188 perlnewmod tells about writing and submitting a new module.
1189
1190 =item *
1191
1192 perlpacktut is a pack() tutorial.
1193
1194 =item *
1195
1196 perlpod has been rewritten to be clearer and to record the best
1197 practices gathered over the years.
1198
1199 =item *
1200
1201 perlpodspec is a more formal specification of the pod format,
1202 mainly of interest for writers of pod applications, not to
1203 people writing in pod.
1204
1205 =item *
1206
1207 perlretut is a regular expression tutorial.
1208
1209 =item *
1210
1211 perlrequick is a regular expressions quick-start guide.
1212 Yes, much quicker than perlretut.
1213
1214 =item *
1215
1216 perltodo has been updated.
1217
1218 =item *
1219
1220 perltootc has been renamed as perltooc (to not to conflict
1221 with perltoot in filesystems restricted to "8.3" names)
1222
1223 =item *
1224
1225 perluniintro is an introduction to using Unicode in Perl.
1226 (perlunicode is more of a detailed reference and background
1227 information)
1228
1229 =item *
1230
1231 perlutil explains the command line utilities packaged with the Perl
1232 distribution.
1233
1234 =back
1235
1236 The following platform-specific documents are available before
1237 the installation as README.I<platform>, and after the installation
1238 as perlI<platform>:
1239
1240     perlaix perlamiga perlapollo perlbeos perlbs2000
1241     perlce perlcygwin perldgux perldos perlepoc perlhpux
1242     perlhurd perlmachten perlmacos perlmint perlmpeix
1243     perlnetware perlos2 perlos390 perlplan9 perlqnx perlsolaris
1244     perltru64 perluts perlvmesa perlvms perlvos perlwin32
1245
1246 =over 4
1247
1248 =item *
1249
1250 The documentation for the POSIX-BC platform is called "BS2000", to avoid
1251 confusion with the Perl POSIX module.
1252
1253 =item *
1254
1255 The documentation for the WinCE platform is called "CE", to avoid
1256 confusion with the perlwin32 documentation on 8.3-restricted filesystems.
1257
1258 =back
1259
1260 =head1 Performance Enhancements
1261
1262 =over 4
1263
1264 =item *
1265
1266 map() could get pathologically slow when the result list it generates
1267 is larger than the source list.  The performance has been improved for
1268 common scenarios.
1269
1270 =item *
1271
1272 sort() has been changed to use primarily mergesort internally as
1273 opposed to the earlier quicksort.  For very small lists this may
1274 result in slightly slower sorting times, but in general the speedup
1275 should be at least 20%.  Additional bonuses are that the worst case
1276 behaviour of sort() is now better (in computer science terms it now
1277 runs in time O(N log N), as opposed to quicksort's Theta(N**2)
1278 worst-case run time behaviour), and that sort() is now stable
1279 (meaning that elements with identical keys will stay ordered as they
1280 were before the sort).  See the C<sort> pragma for information.
1281
1282 The story in more detail: suppose you want to serve yourself a little
1283 slice of Pi.
1284
1285     @digits = ( 3,1,4,1,5,9 );
1286
1287 A numerical sort of the digits will yield (1,1,3,4,5,9), as expected.
1288 Which C<1> comes first is hard to know, since one C<1> looks pretty
1289 much like any other.  You can regard this as totally trivial,
1290 or somewhat profound.  However, if you just want to sort the even
1291 digits ahead of the odd ones, then what will
1292
1293     sort { ($a % 2) <=> ($b % 2) } @digits;
1294
1295 yield?  The only even digit, C<4>, will come first.  But how about
1296 the odd numbers, which all compare equal?  With the quicksort algorithm
1297 used to implement Perl 5.6 and earlier, the order of ties is left up
1298 to the sort.  So, as you add more and more digits of Pi, the order
1299 in which the sorted even and odd digits appear will change.
1300 and, for sufficiently large slices of Pi, the quicksort algorithm
1301 in Perl 5.8 won't return the same results even if reinvoked with the
1302 same input.  The justification for this rests with quicksort's
1303 worst case behavior.  If you run
1304
1305    sort { $a <=> $b } ( 1 .. $N , 1 .. $N );
1306
1307 (something you might approximate if you wanted to merge two sorted
1308 arrays using sort), doubling $N doesn't just double the quicksort time,
1309 it I<quadruples> it.  Quicksort has a worst case run time that can
1310 grow like N**2, so-called I<quadratic> behaviour, and it can happen
1311 on patterns that may well arise in normal use.  You won't notice this
1312 for small arrays, but you I<will> notice it with larger arrays,
1313 and you may not live long enough for the sort to complete on arrays
1314 of a million elements.  So the 5.8 quicksort scrambles large arrays
1315 before sorting them, as a statistical defence against quadratic behaviour.
1316 But that means if you sort the same large array twice, ties may be
1317 broken in different ways.
1318
1319 Because of the unpredictability of tie-breaking order, and the quadratic
1320 worst-case behaviour, quicksort was I<almost> replaced completely with
1321 a stable mergesort.  I<Stable> means that ties are broken to preserve
1322 the original order of appearance in the input array.  So
1323
1324     sort { ($a % 2) <=> ($b % 2) } (3,1,4,1,5,9);
1325
1326 will yield (4,3,1,1,5,9), guaranteed.  The even and odd numbers
1327 appear in the output in the same order they appeared in the input.
1328 Mergesort has worst case O(NlogN) behaviour, the best value
1329 attainable.  And, ironically, this mergesort does particularly
1330 well where quicksort goes quadratic:  mergesort sorts (1..$N, 1..$N)
1331 in O(N) time.  But quicksort was rescued at the last moment because
1332 it is faster than mergesort on certain inputs and platforms.
1333 For example, if you really I<don't> care about the order of even
1334 and odd digits, quicksort will run in O(N) time; it's very good
1335 at sorting many repetitions of a small number of distinct elements.
1336 The quicksort divide and conquer strategy works well on platforms
1337 with relatively small, very fast, caches.  Eventually, the problem gets
1338 whittled down to one that fits in the cache, from which point it
1339 benefits from the increased memory speed.
1340
1341 Quicksort was rescued by implementing a sort pragma to control aspects
1342 of the sort.  The B<stable> subpragma forces stable behaviour,
1343 regardless of algorithm.  The B<_quicksort> and B<_mergesort>
1344 subpragmas are heavy-handed ways to select the underlying implementation.
1345 The leading C<_> is a reminder that these subpragmas may not survive
1346 beyond 5.8.  More appropriate mechanisms for selecting the implementation
1347 exist, but they wouldn't have arrived in time to save quicksort.
1348
1349 =item *
1350
1351 Hashes now use Bob Jenkins "One-at-a-Time" hashing key algorithm
1352 (http://burtleburtle.net/bob/hash/doobs.html).  This algorithm is
1353 reasonably fast while producing a much better spread of values than
1354 the old hashing algorithm (originally by Chris Torek, later tweaked by
1355 Ilya Zakharevich).  Hash values output from the algorithm on a hash of
1356 all 3-char printable ASCII keys comes much closer to passing the
1357 DIEHARD random number generation tests.  According to perlbench, this
1358 change has not affected the overall speed of Perl.
1359
1360 =item *
1361
1362 unshift() should now be noticeably faster.
1363
1364 =back
1365
1366 =head1 Installation and Configuration Improvements
1367
1368 =head2 Generic Improvements
1369
1370 =over 4
1371
1372 =item *
1373
1374 INSTALL now explains how you can configure Perl to use 64-bit
1375 integers even on non-64-bit platforms.
1376
1377 =item *
1378
1379 Policy.sh policy change: if you are reusing a Policy.sh file
1380 (see INSTALL) and you use Configure -Dprefix=/foo/bar and in the old
1381 Policy $prefix eq $siteprefix and $prefix eq $vendorprefix, all of
1382 them will now be changed to the new prefix, /foo/bar.  (Previously
1383 only $prefix changed.)  If you do not like this new behaviour,
1384 specify prefix, siteprefix, and vendorprefix explicitly.
1385
1386 =item *
1387
1388 A new optional location for Perl libraries, otherlibdirs, is available.
1389 It can be used for example for vendor add-ons without disturbing Perl's
1390 own library directories.
1391
1392 =item *
1393
1394 In many platforms the vendor-supplied 'cc' is too stripped-down to
1395 build Perl (basically, 'cc' doesn't do ANSI C).  If this seems
1396 to be the case and 'cc' does not seem to be the GNU C compiler
1397 'gcc', an automatic attempt is made to find and use 'gcc' instead.
1398
1399 =item *
1400
1401 gcc needs to closely track the operating system release to avoid
1402 build problems. If Configure finds that gcc was built for a different
1403 operating system release than is running, it now gives a clearly visible
1404 warning that there may be trouble ahead.
1405
1406 =item *
1407
1408 If binary compatibility with the 5.005 release is not wanted, Configure
1409 no longer suggests including the 5.005 modules in @INC.
1410
1411 =item *
1412
1413 Configure C<-S> can now run non-interactively.
1414
1415 =item *
1416
1417 Configure support for pdp11-style memory models has been removed due
1418 to obsolescence.
1419
1420 =item *
1421
1422 configure.gnu now works with options with whitespace in them.
1423
1424 =item *
1425
1426 installperl now outputs everything to STDERR.
1427
1428 =item *
1429
1430 $Config{byteorder} is now computed dynamically (this is more robust
1431 with "fat binaries" where an executable image contains binaries for
1432 more than one binary platform.)
1433
1434 =item *
1435
1436 Because PerlIO is now the default on most platforms, "-perlio" doesn't
1437 get appended to the $Config{archname} (also known as $^O) anymore.
1438 Instead, if you explicitly choose not to use perlio (Configure command
1439 line option -Uuseperlio), you will get "-stdio" appended.
1440
1441 =item *
1442
1443 Another change related to the architecture name is that "-64all"
1444 (-Duse64bitall, or "maximally 64-bit") is appended only if your
1445 pointers are 64 bits wide.  (To be exact, the use64bitall is ignored.)
1446
1447 =item *
1448
1449 In AFS installations one can configure the root of the AFS to be
1450 somewhere else than the default F</afs> by using the Configure
1451 parameter C<-Dafsroot=/some/where/else>.
1452
1453 =item *
1454
1455 APPLLIB_EXP, a less-know configuration-time definition, has been
1456 documented.  It can be used to prepend site-specific directories
1457 to Perl's default search path (@INC), see INSTALL for information.
1458
1459 =item *
1460
1461 The version of Berkeley DB used when the Perl (and, presumably, the
1462 DB_File extension) was built is now available as
1463 C<@Config{qw(db_version_major db_version_minor db_version_patch)}>
1464 from Perl and as C<DB_VERSION_MAJOR_CFG DB_VERSION_MINOR_CFG
1465 DB_VERSION_PATCH_CFG> from C.
1466
1467 =item *
1468
1469 Building Berkeley DB3 for compatibility modes for DB, NDBM, and ODBM
1470 has been documented in INSTALL.
1471
1472 =item *
1473
1474 If you have CPAN access (either network or a local copy such as a
1475 CD-ROM) you can during specify extra modules to Configure to build and
1476 install with Perl using the -Dextras=...  option.  See INSTALL for
1477 more details.
1478
1479 =item *
1480
1481 In addition to config.over a new override file, config.arch, is
1482 available.  That is supposed to be used by hints file writers for
1483 architecture-wide changes (as opposed to config.over which is for
1484 site-wide changes).
1485
1486 =item *
1487
1488 If your file system supports symbolic links you can build Perl outside
1489 of the source directory by
1490
1491         mkdir /tmp/perl/build/directory
1492         cd /tmp/perl/build/directory
1493         sh /path/to/perl/source/Configure -Dmksymlinks ...
1494
1495 This will create in /tmp/perl/build/directory a tree of symbolic links
1496 pointing to files in /path/to/perl/source.  The original files are left
1497 unaffected.  After Configure has finished you can just say
1498
1499         make all test
1500
1501 and Perl will be built and tested, all in /tmp/perl/build/directory.
1502
1503 =item *
1504
1505 For Perl developers several new make targets for profiling
1506 and debugging have been added, see L<perlhack>.
1507
1508 =over 8
1509
1510 =item *
1511
1512 Use of the F<gprof> tool to profile Perl has been documented in
1513 L<perlhack>.  There is a make target called "perl.gprof" for
1514 generating a gprofiled Perl executable.
1515
1516 =item *
1517
1518 If you have GCC 3, there is a make target called "perl.gcov" for
1519 creating a gcoved Perl executable for coverage analysis.  See
1520 L<perlhack>.
1521
1522 =item *
1523
1524 If you are on IRIX or Tru64 platforms, new profiling/debugging options
1525 have been added, see L<perlhack> for more information about pixie and
1526 Third Degree.
1527
1528 =back
1529
1530 =item *
1531
1532 Guidelines of how to construct minimal Perl installations have
1533 been added to INSTALL.
1534
1535 =item *
1536
1537 The Thread extension is now not built at all under ithreads
1538 (C<Configure -Duseithreads>) because it wouldn't work anyway (the
1539 Thread extension requires being Configured with C<-Duse5005threads>).
1540
1541 But note that the Thread.pm interface is now shared by both
1542 thread models.
1543
1544 =back
1545
1546 =head2 New Or Improved Platforms
1547
1548 For the list of platforms known to support Perl,
1549 see L<perlport/"Supported Platforms">.
1550
1551 =over 4
1552
1553 =item *
1554
1555 AIX dynamic loading should be now better supported.
1556
1557 =item *
1558
1559 AIX should now work better with gcc, threads, and 64-bitness.  Also the
1560 long doubles support in AIX should be better now.  See L<perlaix>.
1561
1562 =item *
1563
1564 After a long pause, AmigaOS has been verified to be happy with Perl.
1565
1566 =item *
1567
1568 AtheOS (http://www.atheos.cx/) is a new platform.
1569
1570 =item *
1571
1572 BeOS has been reclaimed.
1573
1574 =item *
1575
1576 DG/UX platform now supports the 5.005-style threads.  See L<perldgux>.
1577
1578 =item *
1579
1580 DYNIX/ptx platform (a.k.a. dynixptx) is supported at or near osvers 4.5.2.
1581
1582 =item *
1583
1584 EBCDIC platforms (z/OS, also known as OS/390, POSIX-BC, and VM/ESA)
1585 have been regained.  Many test suite tests still fail and the
1586 co-existence of Unicode and EBCDIC isn't quite settled, but the
1587 situation is much better than with Perl 5.6.  See L<perlos390>,
1588 L<perlbs2000> (for POSIX-BC), and L<perlvmesa> for more information.
1589
1590 =item *
1591
1592 Building perl with -Duseithreads or -Duse5005threads now works under
1593 HP-UX 10.20 (previously it only worked under 10.30 or later). You will
1594 need a thread library package installed. See README.hpux.
1595
1596 =item *
1597
1598 MacOS Classic (MacPerl has of course been available since
1599 perl 5.004 but now the source code bases of standard Perl
1600 and MacPerl have been synchronised)
1601
1602 =item *
1603
1604 MacOS X (or Darwin) should now be able to build Perl even on HFS+
1605 filesystems.  (The case-insensitivity confused the Perl build process.)
1606
1607 =item *
1608
1609 NCR MP-RAS is now supported.
1610
1611 =item *
1612
1613 All the NetBSD specific patches (except for the installation
1614 specific ones) have been merged back to the main distribution.
1615
1616 =item *
1617
1618 NetWare from Novell is now supported.  See L<perlnetware>.
1619
1620 =item *
1621
1622 NonStop-UX is now supported.
1623
1624 =item *
1625
1626 NEC SUPER-UX is now supported.
1627
1628 =item *
1629
1630 All the OpenBSD specific patches (except for the installation
1631 specific ones) have been merged back to the main distribution.
1632
1633 =item *
1634
1635 Perl has been tested with the GNU pth userlevel thread package
1636 ( http://www.gnu.org/software/pth/pth.html ) . All but one thread
1637 test worked, and that one failure was because of test results arriving
1638 in unexpected order.
1639
1640 =item *
1641
1642 Amdahl UTS UNIX mainframe platform is now supported.
1643
1644 =item *
1645
1646 WinCE is now supported.  See L<perlce>.
1647
1648 =item *
1649
1650 z/OS (formerly known as OS/390, formerly known as MVS OE) has now
1651 support for dynamic loading.  This is not selected by default,
1652 however, you must specify -Dusedl in the arguments of Configure.
1653
1654 =back
1655
1656 =head1 Selected Bug Fixes
1657
1658 Numerous memory leaks and uninitialized memory accesses have been
1659 hunted down.  Most importantly anonymous subs used to leak quite
1660 a bit.
1661
1662 =over 4
1663
1664 =item *
1665
1666 The autouse pragma didn't work for Multi::Part::Function::Names.
1667
1668 =item *
1669
1670 caller() could cause core dumps in certain situations.  Carp was sometimes
1671 affected by this problem.
1672
1673 =item *
1674
1675 chop(@list) in list context returned the characters chopped in
1676 reverse order.  This has been reversed to be in the right order.
1677
1678 =item *
1679
1680 Configure no longer includes the DBM libraries (dbm, gdbm, db, ndbm)
1681 when building the Perl binary.  The only exception to this is SunOS 4.x,
1682 which needs them.
1683
1684 =item *
1685
1686 The behaviour of non-decimal but numeric string constants such as
1687 "0x23" was platform-dependent: in some platforms that was seen as 35,
1688 in some as 0, in some as a floating point number (don't ask).  This
1689 was caused by Perl using the operating system libraries in a situation
1690 where the result of the string to number conversion is undefined: now
1691 Perl consistently handles such strings as zero in numeric contexts.
1692
1693 =item *
1694
1695 The order of DESTROYs has been made more predictable.
1696
1697 =item *
1698
1699 Several debugger fixes: exit code now reflects the script exit code,
1700 condition C<"0"> now treated correctly, the C<d> command now checks
1701 line number, the C<$.> no longer gets corrupted, all debugger output
1702 now goes correctly to the socket if RemotePort is set.
1703
1704 =item *
1705
1706 Perl 5.6.0 could emit spurious warnings about redefinition of dl_error()
1707 when statically building extensions into perl.  This has been corrected.
1708
1709 =item *
1710
1711 L<dprofpp> -R didn't work.
1712
1713 =item *
1714
1715 C<*foo{FORMAT}> now works.
1716 =item *
1717
1718 Infinity is now recognized as a number.
1719
1720 =item *
1721
1722 UNIVERSAL::isa no longer caches methods incorrectly.  (This broke
1723 the Tk extension with 5.6.0.)
1724
1725 =item *
1726
1727 Lexicals I: lexicals outside an eval "" weren't resolved
1728 correctly inside a subroutine definition inside the eval "" if they
1729 were not already referenced in the top level of the eval""ed code.
1730
1731 =item *
1732
1733 Lexicals II: lexicals leaked at file scope into subroutines that
1734 were declared before the lexicals.
1735
1736 =item *
1737
1738 Lexical warnings now propagating correctly between scopes
1739 and into C<eval "...">.
1740
1741 =item *
1742
1743 C<use warnings qw(FATAL all)> did not work as intended.  This has been
1744 corrected.
1745
1746 =item *
1747
1748 warnings::enabled() now reports the state of $^W correctly if the caller
1749 isn't using lexical warnings.
1750
1751 =item *
1752
1753 Line renumbering with eval and C<#line> now works.
1754
1755 =item *
1756
1757 Fixed numerous memory leaks, especially in eval "".
1758
1759 =item *
1760
1761 mkdir() now ignores trailing slashes in the directory name,
1762 as mandated by POSIX.
1763
1764 =item *
1765
1766 Some versions of glibc have a broken modfl().  This affects builds
1767 with C<-Duselongdouble>.  This version of Perl detects this brokenness
1768 and has a workaround for it.  The glibc release 2.2.2 is known to have
1769 fixed the modfl() bug.
1770
1771 =item *
1772
1773 Modulus of unsigned numbers now works (4063328477 % 65535 used to
1774 return 27406, instead of 27047).
1775
1776 =item *
1777
1778 Some "not a number" warnings introduced in 5.6.0 eliminated to be
1779 more compatible with 5.005.  Infinity is now recognised as a number.
1780
1781 =item *
1782
1783 Numeric conversions did not recognize changes in the string value
1784 properly in certain circumstances.
1785
1786 =item *
1787
1788 Attributes (like :shared) didn't work with our().
1789
1790 =item *
1791
1792 our() variables will not cause "will not stay shared" warnings.
1793
1794 =item *
1795
1796 "our" variables of the same name declared in two sibling blocks
1797 resulted in bogus warnings about "redeclaration" of the variables.
1798 The problem has been corrected.
1799
1800 =item *
1801
1802 pack "Z" now correctly terminates the string with "\0".
1803
1804 =item *
1805
1806 Fix password routines which in some shadow password platforms
1807 (e.g. HP-UX) caused getpwent() to return every other entry.
1808
1809 =item *
1810
1811 The PERL5OPT environment variable (for passing command line arguments
1812 to Perl) didn't work for more than a single group of options.
1813
1814 =item *
1815
1816 PERL5OPT with embedded spaces didn't work.
1817
1818 =item *
1819
1820 printf() no longer resets the numeric locale to "C".
1821
1822 =item *
1823
1824 C<qw(a\\b)> now parses correctly as C<'a\\b'>.
1825
1826 =item *
1827
1828 pos() did not return the correct value within s///ge in earlier
1829 versions.  This is now handled correctly.
1830
1831 =item *
1832
1833 Printing quads (64-bit integers) with printf/sprintf now works
1834 without the q L ll prefixes (assuming you are on a quad-capable platform).
1835
1836 =item *
1837
1838 Regular expressions on references and overloaded scalars now work.
1839
1840 =item *
1841
1842 Right-hand side magic (GMAGIC) could in many cases such as string
1843 concatenation be invoked too many times.
1844
1845 =item *
1846
1847 scalar() now forces scalar context even when used in void context.
1848
1849 =item *
1850
1851 SOCKS support is now much more robust.
1852
1853 =item *
1854
1855 sort() arguments are now compiled in the right wantarray context
1856 (they were accidentally using the context of the sort() itself).
1857 The comparison block is now run in scalar context, and the arguments
1858 to be sorted are always provided list context.
1859
1860 =item *
1861
1862 Changed the POSIX character class C<[[:space:]]> to include the (very
1863 rarely used) vertical tab character.  Added a new POSIX-ish character
1864 class C<[[:blank:]]> which stands for horizontal whitespace
1865 (currently, the space and the tab).
1866
1867 =item *
1868
1869 The tainting behaviour of sprintf() has been rationalized.  It does
1870 not taint the result of floating point formats anymore, making the
1871 behaviour consistent with that of string interpolation.
1872
1873 =item *
1874
1875 Some cases of inconsistent taint propagation (such as within hash
1876 values) have been fixed.
1877
1878 =item *
1879
1880 The RE engine found in Perl 5.6.0 accidentally pessimised certain kinds
1881 of simple pattern matches.  These are now handled better.
1882
1883 =item *
1884
1885 Regular expression debug output (whether through C<use re 'debug'>
1886 or via C<-Dr>) now looks better.
1887
1888 =item *
1889
1890 Multi-line matches like C<"a\nxb\n" =~ /(?!\A)x/m> were flawed.  The
1891 bug has been fixed.
1892
1893 =item *
1894
1895 Use of $& could trigger a core dump under some situations.  This
1896 is now avoided.
1897
1898 =item *
1899
1900 The regular expression captured submatches ($1, $2, ...) are now
1901 more consistently unset if the match fails, instead of leaving false
1902 data lying around in them.
1903
1904 =item *
1905
1906 readline() on files opened in "slurp" mode could return an extra "" at
1907 the end in certain situations.  This has been corrected.
1908
1909 =item *
1910
1911 Autovivification of symbolic references of special variables described
1912 in L<perlvar> (as in C<${$num}>) was accidentally disabled.  This works
1913 again now.
1914
1915 =item *
1916
1917 Sys::Syslog ignored the C<LOG_AUTH> constant.
1918
1919 =item *
1920
1921 All but the first argument of the IO syswrite() method are now optional.
1922
1923 =item *
1924
1925 $AUTOLOAD, sort(), lock(), and spawning subprocesses
1926 in multiple threads simultaneously are now thread-safe.
1927
1928 =item *
1929
1930 Tie::ARRAY SPLICE method was broken.
1931
1932 =item *
1933
1934 Allow read-only string on left hand side of non-modifying tr///.
1935
1936 =item *
1937
1938 Several Unicode fixes.
1939
1940 =over 8
1941
1942 =item *
1943
1944 BOMs (byte order marks) in the beginning of Perl files
1945 (scripts, modules) should now be transparently skipped.
1946 UTF-16 (UCS-2) encoded Perl files should now be read correctly.
1947
1948 =item *
1949
1950 The character tables have been updated to Unicode 3.1.1.
1951
1952 =item *
1953
1954 Comparing with utf8 data does not magically upgrade non-utf8 data
1955 into utf8.  (This was a problem for example if you were mixing data
1956 from I/O and Unicode data: your output might have got magically encoded
1957 as UTF-8.)
1958
1959 =item *
1960
1961 Generating illegal Unicode code points like U+FFFE, or the UTF-16
1962 surrogates, now also generates an optional warning.
1963
1964 =item *
1965
1966 C<IsAlnum>, C<IsAlpha>, and C<IsWord> now match titlecase.
1967
1968 =item *
1969
1970 Concatenation with the C<.> operator or via variable interpolation,
1971 C<eq>, C<substr>, C<reverse>, C<quotemeta>, the C<x> operator,
1972 substitution with C<s///>, single-quoted UTF8, should now work.
1973
1974 =item *
1975
1976 The C<tr///> operator now works.  Note that the C<tr///CU>
1977 functionality has been removed (but see pack('U0', ...)).
1978
1979 =item *
1980
1981 C<eval "v200"> now works.
1982
1983 =item *
1984
1985 Perl 5.6.0 parsed m/\x{ab}/ incorrectly, leading to spurious warnings.
1986 This has been corrected.
1987
1988 =item *
1989
1990 Zero entries were missing from the Unicode classes like C<IsDigit>.
1991
1992 =back
1993
1994 =item *
1995
1996 Large unsigned numbers (those above 2**31) could sometimes lose their
1997 unsignedness, causing bogus results in arithmetic operations.
1998
1999 =back
2000
2001 =head2 Platform Specific Changes and Fixes
2002
2003 =over 4
2004
2005 =item *
2006
2007 BSDI 4.*
2008
2009 Perl now works on post-4.0 BSD/OSes.
2010
2011 =item *
2012
2013 All BSDs
2014
2015 Setting C<$0> now works (as much as possible; see L<perlvar> for details).
2016
2017 =item *
2018
2019 Cygwin
2020
2021 Numerous updates; currently synchronised with Cygwin 1.1.4.
2022
2023 =item *
2024
2025 Previously DYNIX/ptx had problems in its Configure probe for non-blocking I/O.
2026
2027 =item *
2028
2029 EPOC
2030
2031 EPOC update after Perl 5.6.0.  See README.epoc.
2032
2033 =item *
2034
2035 FreeBSD 3.*
2036
2037 Perl now works on post-3.0 FreeBSDs.
2038
2039 =item *
2040
2041 HP-UX
2042
2043 README.hpux updated; C<Configure -Duse64bitall> now almost works.
2044
2045 =item *
2046
2047 IRIX
2048
2049 Numerous compilation flag and hint enhancements; accidental mixing
2050 of 32-bit and 64-bit libraries (a doomed attempt) made much harder.
2051
2052 =item *
2053
2054 Linux
2055
2056 =over 8
2057
2058 =item *
2059
2060 Long doubles should now work (see INSTALL).
2061
2062 =item *
2063
2064 Linux previously had problems related to sockaddrlen when using
2065 accept(), revcfrom() (in Perl: recv()), getpeername(), and getsockname().
2066
2067 =back
2068
2069 =item *
2070
2071 MacOS Classic
2072
2073 Compilation of the standard Perl distribution in MacOS Classic should
2074 now work if you have the Metrowerks development environment and
2075 the missing Mac-specific toolkit bits.  Contact the macperl mailing
2076 list for details.
2077
2078 =item *
2079
2080 MPE/iX
2081
2082 MPE/iX update after Perl 5.6.0.  See README.mpeix.
2083
2084 =item *
2085
2086 NetBSD/sparc
2087
2088 Perl now works on NetBSD/sparc.
2089
2090 =item *
2091
2092 OS/2
2093
2094 Now works with usethreads (see INSTALL).
2095
2096 =item *
2097
2098 Solaris
2099
2100 64-bitness using the Sun Workshop compiler now works.
2101
2102 =item *
2103
2104 Tru64 (aka Digital UNIX, aka DEC OSF/1)
2105
2106 The operating system version letter now recorded in $Config{osvers}.
2107 Allow compiling with gcc (previously explicitly forbidden).  Compiling
2108 with gcc still not recommended because buggy code results, even with
2109 gcc 2.95.2.
2110
2111 =item *
2112
2113 Unicos
2114
2115 Fixed various alignment problems that lead into core dumps either
2116 during build or later; no longer dies on math errors at runtime;
2117 now using full quad integers (64 bits), previously was using 
2118 only 46 bit integers for speed.
2119
2120 =item *
2121
2122 VMS
2123
2124 chdir() now works better despite a CRT bug; now works with MULTIPLICITY
2125 (see INSTALL); now works with Perl's malloc.
2126
2127 The tainting of C<%ENV> elements via C<keys> or C<values> was previously
2128 unimplemented.  It now works as documented.
2129
2130 The C<waitpid> emulation has been improved.  The worst bug (now fixed)
2131 was that a pid of -1 would cause a wildcard search of all processes on
2132 the system.  The most significant enhancement is that we can now
2133 usually get the completion status of a terminated process.
2134
2135 POSIX-style signals are now emulated much better on VMS versions prior
2136 to 7.0.
2137
2138 The C<system> function and backticks operator have improved
2139 functionality and better error handling.
2140
2141 =item *
2142
2143 Windows
2144
2145 =over 8
2146
2147 =item *
2148
2149 accept() no longer leaks memory.
2150
2151 =item *
2152
2153 Borland C++ v5.5 is now a supported compiler that can build Perl.
2154 However, the generated binaries continue to be incompatible with those
2155 generated by the other supported compilers (GCC and Visual C++).
2156
2157 =item *
2158
2159 Better chdir() return value for a non-existent directory.
2160
2161 =item *
2162
2163 Duping socket handles with open(F, ">&MYSOCK") now works under Windows 9x.
2164
2165 =item *
2166
2167 New %ENV entries now propagate to subprocesses.
2168
2169 =item *
2170
2171 Current directory entries in %ENV are now correctly propagated to child
2172 processes.
2173
2174 =item *
2175
2176 $ENV{LIB} now used to search for libs under Visual C.
2177
2178 =item *
2179
2180 fork() emulation has been improved in various ways, but still continues
2181 to be experimental.  See L<perlfork> for known bugs and caveats.
2182
2183 =item *
2184
2185 A failed (pseudo)fork now returns undef and sets errno to EAGAIN.
2186
2187 =item *
2188
2189 Win32::GetCwd() correctly returns C:\ instead of C: when at the drive root.
2190 Other bugs in chdir() and Cwd::cwd() have also been fixed.
2191
2192 =item *
2193
2194 HTML files will be installed in c:\perl\html instead of c:\perl\lib\pod\html
2195
2196 =item *
2197
2198 The makefiles now provide a single switch to bulk-enable all the features
2199 enabled in ActiveState ActivePerl (a popular Win32 binary distribution).
2200
2201 =item *
2202
2203 Allow REG_EXPAND_SZ keys in the registry.
2204
2205 =item *
2206
2207 Can now send() from all threads, not just the first one.
2208
2209 =item *
2210
2211 Fake signal handling reenabled, bugs and all.
2212
2213 =item *
2214
2215 %SIG has been enabled under USE_ITHREADS, but its use is completely
2216 unsupported under all configurations.
2217
2218 =item *
2219
2220 Less stack reserved per thread so that more threads can run
2221 concurrently. (Still 16M per thread.)
2222
2223 =item *
2224
2225 C<File::Spec-&gt;tmpdir()> now prefers C:/temp over /tmp
2226 (works better when perl is running as service).
2227
2228 =item *
2229
2230 Better UNC path handling under ithreads.
2231
2232 =item *
2233
2234 wait(), waitpid() and backticks now return the correct exit status under
2235 Windows 9x.
2236
2237 =item *
2238
2239 winsock handle leak fixed.
2240
2241 =back
2242
2243 =back
2244
2245 =head1 New or Changed Diagnostics
2246
2247 =over 4
2248
2249 =item *
2250
2251 All regular expression compilation error messages are now hopefully
2252 easier to understand both because the error message now comes before
2253 the failed regex and because the point of failure is now clearly
2254 marked by a C<E<lt>-- HERE> marker.
2255
2256 =item *
2257
2258 The various "opened only for", "on closed", "never opened" warnings
2259 drop the C<main::> prefix for filehandles in the C<main> package,
2260 for example C<STDIN> instead of C<main::STDIN>. 
2261
2262 =item *
2263
2264 The "Unrecognized escape" warning has been extended to include C<\8>,
2265 C<\9>, and C<\_>.  There is no need to escape any of the C<\w> characters.
2266
2267 =item *
2268
2269 Two new debugging options have been added: if you have compiled your
2270 Perl with debugging, you can use the -DT and -DR options to trace
2271 tokenising and to add reference counts to displaying variables,
2272 respectively.
2273
2274 =item *
2275
2276 perl5db.pl has been modified to present a more consistent commands
2277 interface, via (CommandSet=580).  perl5db.t was also added to test the
2278 changes, and as a placeholder for further tests.
2279
2280 See L<perldebug>
2281
2282 =item *
2283
2284 If an attempt to use a (non-blessed) reference as an array index
2285 is made, a warning is given.
2286
2287 =item *
2288
2289 C<push @a;> and C<unshift @a;> (with no values to push or unshift)
2290 now give a warning.  This may be a problem for generated and evaled
2291 code.
2292
2293 =item *
2294
2295 If you try to L<perlfunc/pack> a number less than 0 or larger than 255
2296 using the C<"C"> format you will get an optional warning.  Similarly
2297 for the C<"c"> format and a number less than -128 or more than 127.
2298
2299 =item *
2300
2301 Certain regex modifiers such as C<(?o)> make sense only if applied to
2302 the entire regex.  You will an optional warning if you try to do otherwise.
2303
2304 =item *
2305
2306 Using arrays or hashes as references (e.g. C<< %foo-&gt;{bar} >>
2307 has been deprecated for a while.  Now you will get an optional warning.
2308
2309 =back
2310
2311 =head1 Changed Internals
2312
2313 =over 4
2314
2315 =item *
2316
2317 perlapi.pod (a companion to perlguts) now attempts to document the
2318 internal API.
2319
2320 =item *
2321
2322 You can now build a really minimal perl called microperl.
2323 Building microperl does not require even running Configure;
2324 C<make -f Makefile.micro> should be enough.  Beware: microperl makes
2325 many assumptions, some of which may be too bold; the resulting
2326 executable may crash or otherwise misbehave in wondrous ways.
2327 For careful hackers only.
2328
2329 =item *
2330
2331 Added rsignal(), whichsig(), do_join(), op_clear, op_null,
2332 ptr_table_clear(), ptr_table_free(), sv_setref_uv(), and several UTF-8
2333 interfaces to the publicised API.  For the full list of the available
2334 APIs see L<perlapi>.
2335
2336 =item *
2337
2338 Made possible to propagate customised exceptions via croak()ing.
2339
2340 =item *
2341
2342 Now xsubs can have attributes just like subs.  (Well, at least the
2343 built-in attributes.)
2344
2345 =item *
2346
2347 dTHR and djSP have been obsoleted; the former removed (because it's
2348 a no-op) and the latter replaced with dSP.
2349
2350 =item *
2351
2352 PERL_OBJECT has been completely removed.
2353
2354 =item *
2355
2356 The MAGIC constants (e.g. C<'P'>) have been macrofied
2357 (e.g. C<PERL_MAGIC_TIED>) for better source code readability
2358 and maintainability.
2359
2360 =item *
2361
2362 The regex compiler now maintains a structure that identifies nodes in
2363 the compiled bytecode with the corresponding syntactic features of the
2364 original regex expression.  The information is attached to the new
2365 C<offsets> member of the C<struct regexp>. See L<perldebguts> for more
2366 complete information.
2367
2368 =item *
2369
2370 The C code has been made much more C<gcc -Wall> clean.  Some warning
2371 messages still remain in some platforms, so if you are compiling with
2372 gcc you may see some warnings about dubious practices.  The warnings
2373 are being worked on.
2374
2375 =item *
2376
2377 F<perly.c>, F<sv.c>, and F<sv.h> have now been extensively commented.
2378
2379 =item *
2380
2381 Documentation on how to use the Perl source repository has been added
2382 to F<Porting/repository.pod>.
2383
2384 =item *
2385
2386 There are now several profiling make targets.
2387
2388 =back
2389
2390 =head1 Security Vulnerability Closed
2391
2392 (This change was already made in 5.7.0 but bears repeating here.)
2393
2394 A potential security vulnerability in the optional suidperl component
2395 of Perl was identified in August 2000.  suidperl is neither built nor
2396 installed by default.  As of November 2001 the only known vulnerable
2397 platform is Linux, most likely all Linux distributions.  CERT and
2398 various vendors and distributors have been alerted about the vulnerability.
2399 See http://www.cpan.org/src/5.0/sperl-2000-08-05/sperl-2000-08-05.txt
2400 for more information.
2401
2402 The problem was caused by Perl trying to report a suspected security
2403 exploit attempt using an external program, /bin/mail.  On Linux
2404 platforms the /bin/mail program had an undocumented feature which
2405 when combined with suidperl gave access to a root shell, resulting in
2406 a serious compromise instead of reporting the exploit attempt.  If you
2407 don't have /bin/mail, or if you have 'safe setuid scripts', or if
2408 suidperl is not installed, you are safe.
2409
2410 The exploit attempt reporting feature has been completely removed from
2411 Perl 5.8.0 (and the maintenance release 5.6.1, and it was removed also
2412 from all the Perl 5.7 releases), so that particular vulnerability
2413 isn't there anymore.  However, further security vulnerabilities are,
2414 unfortunately, always possible.  The suidperl functionality is most
2415 probably going to be removed in Perl 5.10.  In any case, suidperl
2416 should only be used by security experts who know exactly what they are
2417 doing and why they are using suidperl instead of some other solution
2418 such as sudo (see http://www.courtesan.com/sudo/).
2419
2420 =head1 New Tests
2421
2422 Several new tests have been added, especially for the F<lib>
2423 subsection.  There are now about 34 000 individual tests (spread over
2424 about 530 test scripts), in the regression suite (5.6.1 has about
2425 11700 tests, in 258 test scripts) Many of the new tests are introduced
2426 by the new modules, but still in general Perl is now more thoroughly
2427 tested.
2428
2429 Because of the large number of tests, running the regression suite
2430 will take considerably longer time than it used to: expect the suite
2431 to take up to 4-5 times longer to run than in perl 5.6.  In a really
2432 fast machine you can hope to finish the suite in about 5 minutes
2433 (wallclock time).
2434
2435 The tests are now reported in a different order than in earlier Perls.
2436 (This happens because the test scripts from under t/lib have been moved
2437 to be closer to the library/extension they are testing.)
2438
2439 =head1 Known Problems
2440
2441 =head2 AIX
2442
2443 =over 4
2444
2445 =item *
2446
2447 In AIX 4.2 Perl extensions that use C++ functions that use statics
2448 may have problems in that the statics are not getting initialized.
2449 In newer AIX releases this has been solved by linking Perl with
2450 the libC_r library, but unfortunately in AIX 4.2 the said library
2451 has an obscure bug where the various functions related to time
2452 (such as time() and gettimeofday()) return broken values, and
2453 therefore in AIX 4.2 Perl is not linked against the libC_r.
2454
2455 =item *
2456
2457 vac 5.0.0.0 May Produce Buggy Code For Perl
2458
2459 The AIX C compiler vac version 5.0.0.0 may produce buggy code,
2460 resulting in few random tests failing, but when the failing tests
2461 are run by hand, they succeed.  We suggest upgrading to at least
2462 vac version 5.0.1.0, that has been known to compile Perl correctly.
2463 "lslpp -L|grep vac.C" will tell you the vac version.
2464
2465 =back
2466
2467 =head2 Amiga Perl Invoking Mystery
2468
2469 One cannot call Perl using the C<volume:> syntax, that is, C<perl -v>
2470 works, but for example C<bin:perl -v> doesn't.  The exact reason isn't
2471 known but the current suspect is the F<ixemul> library.
2472
2473 =head2 lib/ftmp-security tests warn 'system possibly insecure'
2474
2475 Don't panic.  Read INSTALL 'make test' section instead.
2476
2477 =head2 Cygwin intermittent failures of lib/Memoize/t/expire_file 11 and 12
2478
2479 The subtests 11 and 12 sometimes fail and sometimes work.
2480
2481 =head2 HP-UX lib/io_multihomed Fails When LP64-Configured
2482
2483 The lib/io_multihomed test may hang in HP-UX if Perl has been
2484 configured to be 64-bit. Because other 64-bit platforms do not hang in
2485 this test, HP-UX is suspect. All other tests pass in 64-bit HP-UX. The
2486 test attempts to create and connect to "multihomed" sockets (sockets
2487 which have multiple IP addresses).
2488
2489 =head2  HP-UX lib/posix Subtest 9 Fails When LP64-Configured
2490
2491 If perl is configured with -Duse64bitall, the successful result of the
2492 subtest 10 of lib/posix may arrive before the successful result of the
2493 subtest 9, which confuses the test harness so much that it thinks the
2494 subtest 9 failed.
2495
2496 =head2 Linux With Sfio Fails op/misc Test 48
2497
2498 No known fix.
2499
2500 =head2 Mac OS X
2501
2502 The following tests are known to fail:
2503
2504  Failed Test                 Stat Wstat Total Fail  Failed  List of Failed
2505  -------------------------------------------------------------------------
2506  ../ext/DB_File/t/db-btree.t    0    11    ??   ??       %  ??
2507  ../ext/DB_File/t/db-recno.t              149    3   2.01%  61 63 65
2508  ../ext/POSIX/t/posix.t                    31    1   3.23%  10
2509  ../lib/warnings.t                        450    1   0.22%  316
2510
2511 =head2 OS/390
2512
2513 OS/390 has rather many test failures but the situation is actually
2514 better than it was in 5.6.0, it's just that so many new modules and
2515 tests have been added.
2516
2517  Failed Test                     Stat Wstat Total Fail  Failed  List of Failed
2518  -----------------------------------------------------------------------------
2519  ../ext/B/Deparse.t                            14    1   7.14%  14
2520  ../ext/B/Showlex.t                             1    1 100.00%  1
2521  ../ext/Encode/Encode/Tcl.t                   610   13   2.13%  592 594 596 598
2522                                                                 600 602 604-610
2523  ../ext/IO/lib/IO/t/io_unix.t     113 28928     5    3  60.00%  3-5
2524  ../ext/POSIX/POSIX.t                          29    1   3.45%  14
2525  ../ext/Storable/t/lock.t         255 65280     5    3  60.00%  3-5
2526  ../lib/locale.t                  129 33024   117   19  16.24%  99-117
2527  ../lib/warnings.t                            434    1   0.23%  75
2528  ../lib/ExtUtils.t                             27    1   3.70%  25
2529  ../lib/Math/BigInt/t/bigintpm.t             1190    1   0.08%  1145
2530  ../lib/Unicode/UCD.t                          81   48  59.26%  1-16 49-64 66-81
2531  ../lib/User/pwent.t                            9    1  11.11%  4
2532  op/pat.t                                     660    6   0.91%  242-243 424-425
2533                                                                 626-627
2534  op/split.t                         0     9    ??   ??       %  ??
2535  op/taint.t                                   174    3   1.72%  156 162 168
2536  op/tr.t                                       70    3   4.29%  50 58-59
2537  Failed 16/422 test scripts, 96.21% okay. 105/23251 subtests failed, 99.55% okay.
2538
2539 =head2 op/sprintf tests 129 and 130
2540
2541 The op/sprintf tests 129 and 130 are known to fail on some platforms.
2542 Examples include any platform using sfio, and Compaq/Tandem's NonStop-UX.
2543 The failing platforms do not comply with the ANSI C Standard, line
2544 19ff on page 134 of ANSI X3.159 1989 to be exact.  (They produce
2545 something other than "1" and "-1" when formatting 0.6 and -0.6 using
2546 the printf format "%.0f", most often they produce "0" and "-0".)
2547
2548 =head2  Failure of Thread tests
2549
2550 B<Note that support for 5.005-style threading remains experimental
2551 and practically unsupported.>
2552
2553 The following tests are known to fail due to fundamental problems in
2554 the 5.005 threading implementation. These are not new failures--Perl
2555 5.005_0x has the same bugs, but didn't have these tests.
2556
2557   ext/List/Util/t/first         2
2558   lib/autouse                   4
2559   ext/Thread/thr5005            19-20
2560
2561 These failures are unlikely to get fixed.
2562
2563 =head2 UNICOS
2564
2565 =over 4
2566
2567 =item *
2568
2569 ext/POSIX/sigaction subtests 6 and 13 may fail.
2570
2571 =item *
2572
2573 lib/ExtUtils may spuriously claim that subtest 28 failed,
2574 which is interesting since the test only has 27 tests.
2575
2576 =item *
2577
2578 Numerous numerical test failures
2579
2580   op/numconvert                 209,210,217,218
2581   op/override                   7
2582   ext/Time/HiRes/HiRes          9
2583   lib/Math/BigInt/t/bigintpm    1145
2584   lib/Math/Trig                 25
2585
2586 These tests fail because of yet unresolved floating point inaccuracies.
2587
2588 =back
2589
2590 =head2 UNICOS/mk
2591
2592 The io/fs test #31 is failing because in UNICOS/mk truncate() cannot
2593 be used to grow the size of filehandles, only to reduce the size.
2594 The workaround is to truncate files instead of filehandles.
2595
2596 =head2 UTS
2597
2598 There are a few known test failures, see L<perluts>.
2599
2600 =head2 VMS
2601
2602 There is one known test failure with a default configuration:
2603
2604   [.run]switches..........................FAILED on test 1
2605
2606 =head2 Win32
2607
2608 In multi-CPU boxes there are some problems with the I/O buffering:
2609 some output may appear twice.
2610
2611 =head2 Localising a Tied Variable Leaks Memory
2612
2613     use Tie::Hash;
2614     tie my %tie_hash => 'Tie::StdHash';
2615
2616     ...
2617
2618     local($tie_hash{Foo}) = 1; # leaks
2619
2620 Code like the above is known to leak memory every time the local()
2621 is executed.
2622
2623 =head2 Localising Tied Arrays and Hashes Is Broken
2624
2625     local %tied_array;
2626
2627 doesn't work as one would expect: the old value is restored
2628 incorrectly.
2629
2630 =head2 Self-tying of Arrays and Hashes Is Forbidden
2631
2632 Self-tying of arrays and hashes is broken in rather deep and
2633 hard-to-fix ways.  As a stop-gap measure to avoid people from getting
2634 frustrated at the mysterious results (core dumps, most often) it is
2635 for now forbidden (you will get a fatal error even from an attempt).
2636
2637 =head2 Building Extensions Can Fail Because Of Largefiles
2638
2639 Some extensions like mod_perl are known to have issues with
2640 `largefiles', a change brought by Perl 5.6.0 in which file offsets
2641 default to 64 bits wide, where supported.  Modules may fail to compile
2642 at all or compile and work incorrectly.  Currently there is no good
2643 solution for the problem, but Configure now provides appropriate
2644 non-largefile ccflags, ldflags, libswanted, and libs in the %Config
2645 hash (e.g., $Config{ccflags_nolargefiles}) so the extensions that are
2646 having problems can try configuring themselves without the
2647 largefileness.  This is admittedly not a clean solution, and the
2648 solution may not even work at all.  One potential failure is whether
2649 one can (or, if one can, whether it's a good idea) link together at
2650 all binaries with different ideas about file offsets, all this is
2651 platform-dependent.
2652
2653 =head2 Unicode Support on EBCDIC Still Spotty
2654
2655 Though mostly working, Unicode support still has problem spots on
2656 EBCDIC platforms.  One such known spot are the C<\p{}> and C<\P{}>
2657 regular expression constructs for code points less than 256: the
2658 pP are testing for Unicode code points, not knowing about EBCDIC.
2659
2660 =head2 The Compiler Suite Is Still Experimental
2661
2662 The compiler suite is slowly getting better but it continues to be
2663 highly experimental.  Use in production environments is discouraged.
2664
2665 =head2 The Long Double Support Is Still Experimental
2666
2667 The ability to configure Perl's numbers to use "long doubles",
2668 floating point numbers of hopefully better accuracy, is still
2669 experimental.  The implementations of long doubles are not yet
2670 widespread and the existing implementations are not quite mature
2671 or standardised, therefore trying to support them is a rare
2672 and moving target.  The gain of more precision may also be offset
2673 by slowdown in computations (more bits to move around, and the
2674 operations are more likely to be executed by less optimised
2675 libraries).
2676
2677 =head2 Seen In Perl 5.7 But Gone Now
2678
2679 C<Time::Piece> (previously known as C<Time::Object>) was removed
2680 because it was felt that it didn't have enough value in it to be a
2681 core module.  It is still a useful module, though, and is available
2682 from the CPAN.
2683
2684 =head1 Reporting Bugs
2685
2686 If you find what you think is a bug, you might check the articles
2687 recently posted to the comp.lang.perl.misc newsgroup and the perl
2688 bug database at http://bugs.perl.org.  There may also be
2689 information at http://www.perl.com/, the Perl Home Page.
2690
2691 If you believe you have an unreported bug, please run the B<perlbug>
2692 program included with your release.  Be sure to trim your bug down
2693 to a tiny but sufficient test case.  Your bug report, along with the
2694 output of C<perl -V>, will be sent off to perlbug@perl.org to be
2695 analysed by the Perl porting team.
2696
2697 =head1 SEE ALSO
2698
2699 The F<Changes> file for exhaustive details on what changed.
2700
2701 The F<INSTALL> file for how to build Perl.
2702
2703 The F<README> file for general stuff.
2704
2705 The F<Artistic> and F<Copying> files for copyright information.
2706
2707 =head1 HISTORY
2708
2709 Written by Jarkko Hietaniemi <F<jhi@iki.fi>>.
2710
2711 =cut