26027e96f2b775f522485a118c7204e3a7e6e3ef
[p5sagit/p5-mst-13.2.git] / pod / perldelta.pod
1 =head1 NAME
2
3 perldelta - what is new for perl v5.8.0
4
5 =head1 DESCRIPTION
6
7 This document describes differences between the 5.6.0 release
8 and the 5.8.0 release.
9
10 Many of the bug fixes in 5.8.0 were already seen in the 5.6.1
11 maintenance release since the two releases were kept closely
12 coordinated.
13
14 If you are upgrading from Perl 5.005_03, you might also want
15 to read L<perl56delta>.
16
17 =head1 Highlights In 5.8.0
18
19 =over 4
20
21 =item *
22
23 Better Unicode support
24
25 =item *
26
27 New Thread Implementation
28
29 =item *
30
31 Many New Modules
32
33 =item *
34
35 Better Numeric Accuracy
36
37 =item *
38
39 Safe Signals
40
41 =item *
42
43 More Extensive Regression Testing
44
45 =back
46
47 =head1 Incompatible Changes
48
49 =head2 64-bit platforms and malloc
50
51 If your pointers are 64 bits wide, the Perl malloc is no longer being
52 used because it does not work well with 8-byte pointers.  Also,
53 usually the system mallocs on such platforms are much better optimized
54 for such large memory models than the Perl malloc.  Some memory-hungry
55 Perl applications like the PDL don't work well with Perl's malloc.
56 Finally, other applications than Perl (like modperl) tend to prefer
57 the system malloc.  Such platforms include Alpha and 64-bit HPPA,
58 MIPS, PPC, and Sparc.
59
60 =head2 AIX Dynaloading
61
62 The AIX dynaloading now uses in AIX releases 4.3 and newer the native
63 dlopen interface of AIX instead of the old emulated interface.  This
64 change will probably break backward compatibility with compiled
65 modules.  The change was made to make Perl more compliant with other
66 applications like modperl which are using the AIX native interface.
67
68 =head2 Attributes for C<my> variables now handled at run-time.
69
70 The C<my EXPR : ATTRS> syntax now applies variable attributes at
71 run-time.  (Subroutine and C<our> variables still get attributes applied
72 at compile-time.)  See L<attributes> for additional details.  In particular,
73 however, this allows variable attributes to be useful for C<tie> interfaces,
74 which was a deficiency of earlier releases.  Note that the new semantics
75 doesn't work with the Attribute::Handlers module (as of version 0.76).
76
77 =head2 Socket Extension Dynamic in VMS
78
79 The Socket extension is now dynamically loaded instead of being
80 statically built in.  This may or may not be a problem with ancient
81 TCP/IP stacks of VMS: we do not know since we weren't able to test
82 Perl in such configurations.
83
84 =head2 IEEE-format Floating Point Default on OpenVMS Alpha
85
86 Perl now uses IEEE format (T_FLOAT) as the default internal floating
87 point format on OpenVMS Alpha, potentially breaking binary compatibility
88 with external libraries or existing data.  G_FLOAT is still available as
89 a configuration option.  The default on VAX (D_FLOAT) has not changed.
90
91 =head2 New Unicode Properties
92
93 Unicode I<scripts> are now supported. Scripts are similar to (and superior
94 to) Unicode I<blocks>. The difference between scripts and blocks is that
95 scripts are the glyphs used by a language or a group of languages, while
96 the blocks are more artificial groupings of (mostly) 256 characters based
97 on the Unicode numbering.
98
99 In general, scripts are more inclusive, but not universally so. For
100 example, while the script C<Latin> includes all the Latin characters and
101 their various diacritic-adorned versions, it does not include the various
102 punctuation or digits (since they are not solely C<Latin>).
103
104 A number of other properties are now supported, including C<\p{L&}>,
105 C<\p{Any}> C<\p{Assigned}>, C<\p{Unassigned}>, C<\p{Blank}> and
106 C<\p{SpacePerl}> (along with their C<\P{...}> versions, of course).
107 See L<perlunicode> for details, and more additions.
108
109 The C<In> or C<Is> prefix to names used with the C<\p{...}> and C<\P{...}>
110 are now almost always optional. The only exception is that a C<In> prefix
111 is required to signify a Unicode block when a block name conflicts with a
112 script name. For example, C<\p{Tibetan}> refers to the script, while
113 C<\p{InTibetan}> refers to the block. When there is no name conflict, you
114 can omit the C<In> from the block name (e.g. C<\p{BraillePatterns}>), but
115 to be safe, it's probably best to always use the C<In>).
116
117 =head2 Perl Parser Stress Tested
118
119 The Perl parser has been stress tested using both random input and
120 Markov chain input and the few found crashes and lockups have been
121 fixed.
122
123 =head2 REF(...) Instead Of SCALAR(...)
124
125 A reference to a reference now stringifies as "REF(0x81485ec)" instead
126 of "SCALAR(0x81485ec)" in order to be more consistent with the return
127 value of ref().
128
129 =head2 pack/unpack D/F recycled
130
131 The undocumented pack/unpack template letters D/F have been recycled
132 for better use: now they stand for long double (if supported by the
133 platform) and NV (Perl internal floating point type).  (They used
134 to be aliases for f/d, but you never knew that.)
135
136 =head2 Deprecations
137
138 =over 4
139
140 =item *
141
142 The semantics of bless(REF, REF) were unclear and until someone proves
143 it to make some sense, it is forbidden.
144
145 =item *
146
147 The obsolete chat2 library that should never have been allowed
148 to escape the laboratory has been decommissioned.
149
150 =item *
151
152 The builtin dump() function has probably outlived most of its
153 usefulness.  The core-dumping functionality will remain in future
154 available as an explicit call to C<CORE::dump()>, but in future
155 releases the behaviour of an unqualified C<dump()> call may change.
156
157 =item *
158
159 The very dusty examples in the eg/ directory have been removed.
160 Suggestions for new shiny examples welcome but the main issue is that
161 the examples need to be documented, tested and (most importantly)
162 maintained.
163
164 =item *
165
166 The (bogus) escape sequences \8 and \9 now give an optional warning
167 ("Unrecognized escape passed through").  There is no need to \-escape
168 any C<\w> character.
169
170 =item *
171
172 The list of filenames from glob() (or <...>) is now by default sorted
173 alphabetically to be csh-compliant (which is what happened before
174 in most UNIX platforms).  (bsd_glob() does still sort platform
175 natively, ASCII or EBCDIC, unless GLOB_ALPHASORT is specified.)
176
177 =item *
178
179 Spurious syntax errors generated in certain situations, when glob()
180 caused File::Glob to be loaded for the first time, have been fixed.
181
182 =item *
183
184 Although "you shouldn't do that", it was possible to write code that
185 depends on Perl's hashed key order (Data::Dumper does this).  The new
186 algorithm "One-at-a-Time" produces a different hashed key order.
187 More details are in L</"Performance Enhancements">.
188
189 =item *
190
191 lstat(FILEHANDLE) now gives a warning because the operation makes no sense.
192 In future releases this may become a fatal error.
193
194 =item *
195
196 The C<package;> syntax (C<package> without an argument) has been
197 deprecated.  Its semantics were never that clear and its
198 implementation even less so.  If you have used that feature to
199 disallow all but fully qualified variables, C<use strict;> instead.
200
201 =item *
202
203 The unimplemented POSIX regex features [[.cc.]] and [[=c=]] are still
204 recognised but now cause fatal errors.  The previous behaviour of
205 ignoring them by default and warning if requested was unacceptable
206 since it, in a way, falsely promised that the features could be used.
207
208 =item *
209
210 The current user-visible implementation of pseudo-hashes (the weird
211 use of the first array element) is deprecated starting from Perl 5.8.0
212 and will be removed in Perl 5.10.0, and the feature will be
213 implemented differently.  Not only is the current interface rather
214 ugly, but the current implementation slows down normal array and hash
215 use quite noticeably. The C<fields> pragma interface will remain
216 available.
217
218 =item *
219
220 The syntaxes C<< @a->[...] >> and  C<< %h->{...} >> have now been deprecated.
221
222 =item *
223
224 After years of trying the suidperl is considered to be too complex to
225 ever be considered truly secure.  The suidperl functionality is likely
226 to be removed in a future release.
227
228 =item *
229
230 The long deprecated uppercase aliases for the string comparison
231 operators (EQ, NE, LT, LE, GE, GT) have now been removed.
232
233 =item *
234
235 The tr///C and tr///U features have been removed and will not return;
236 the interface was a mistake.  Sorry about that.  For similar
237 functionality, see pack('U0', ...) and pack('C0', ...).
238
239 =item *
240
241 Earlier Perls treated "sub foo (@bar)" as equivalent to "sub foo (@)".
242 The prototypes are now checked at compile-time for invalid characters.
243 An optional warning is generated ("Illegal character in prototype...")
244 but this may be upgraded to a fatal error in a future release.
245
246 =back
247
248 =head1 Core Enhancements
249
250 =head2 PerlIO is Now The Default
251
252 =over 4
253
254 =item *
255
256 IO is now by default done via PerlIO rather than system's "stdio".
257 PerlIO allows "layers" to be "pushed" onto a file handle to alter the
258 handle's behaviour.  Layers can be specified at open time via 3-arg
259 form of open:
260
261    open($fh,'>:crlf :utf8', $path) || ...
262
263 or on already opened handles via extended C<binmode>:
264
265    binmode($fh,':encoding(iso-8859-7)');
266
267 The built-in layers are: unix (low level read/write), stdio (as in
268 previous Perls), perlio (re-implementation of stdio buffering in a
269 portable manner), crlf (does CRLF <=> "\n" translation as on Win32,
270 but available on any platform).  A mmap layer may be available if
271 platform supports it (mostly UNIXes).
272
273 Layers to be applied by default may be specified via the 'open' pragma.
274
275 See L</"Installation and Configuration Improvements"> for the effects
276 of PerlIO on your architecture name.
277
278 =item *
279
280 File handles can be marked as accepting Perl's internal encoding of Unicode
281 (UTF-8 or UTF-EBCDIC depending on platform) by a pseudo layer ":utf8" :
282
283    open($fh,">:utf8","Uni.txt");
284
285 Note for EBCDIC users: the pseudo layer ":utf8" is erroneously named
286 for you since it's not UTF-8 what you will be getting but instead
287 UTF-EBCDIC.  See L<perlunicode>, L<utf8>, and
288 http://www.unicode.org/unicode/reports/tr16/ for more information.
289 In future releases this naming may change.
290
291 =item *
292
293 File handles can translate character encodings from/to Perl's internal
294 Unicode form on read/write via the ":encoding()" layer.
295
296 =item *
297
298 File handles can be opened to "in memory" files held in Perl scalars via:
299
300    open($fh,'>', \$variable) || ...
301
302 =item *
303
304 Anonymous temporary files are available without need to
305 'use FileHandle' or other module via
306
307    open($fh,"+>", undef) || ...
308
309 That is a literal undef, not an undefined value.
310
311 =item *
312
313 The list form of C<open> is now implemented for pipes (at least on UNIX):
314
315    open($fh,"-|", 'cat', '/etc/motd')
316
317 creates a pipe, and runs the equivalent of exec('cat', '/etc/motd') in
318 the child process.
319
320 =back
321
322 =head2 Safe Signals
323
324 Perl used to be fragile in that signals arriving at inopportune moments
325 could corrupt Perl's internal state.  Now Perl postpones handling of
326 signals until it's safe (between opcodes).
327
328 This change may have surprising side effects because signals no longer
329 interrupt Perl instantly.  Perl will now first finish whatever it was
330 doing, like finishing an internal operation (like sort()) or an
331 external operation (like an I/O operation), and only then look at any
332 arrived signals (and before starting the next operation).  No more corrupt
333 internal state since the current operation is always finished first,
334 but the signal may take more time to get heard.
335
336 =head2 Unicode Overhaul
337
338 Unicode in general should be now much more usable than in Perl 5.6.0
339 (or even in 5.6.1).  Unicode can be used in hash keys, Unicode in
340 regular expressions should work now, Unicode in tr/// should work now,
341 Unicode in I/O should work now.
342
343 =over 4
344
345 =item *
346
347 The Unicode Character Database coming with Perl has been upgraded
348 to Unicode 3.1.1.  For more information, see http://www.unicode.org/.
349
350 =item *
351
352 For developers interested in enhancing Perl's Unicode capabilities:
353 almost all the UCD files are included with the Perl distribution in
354 the F<lib/unicore subdirectory>.  The most notable omission, for space
355 considerations, is the Unihan database.
356
357 =item *
358
359 The properties \p{Blank} and \p{SpacePerl} have been added. "Blank" is like
360 C isblank(), that is, it contains only "horizontal whitespace" (the space
361 character is, the newline isn't), and the "SpacePerl" is the Unicode
362 equivalent of C<\s> (\p{Space} isn't, since that includes the vertical
363 tabulator character, whereas C<\s> doesn't.)
364
365 See "New Unicode Properties" earlier in this document for additional
366 information on changes with Unicode properties.
367
368 =back
369
370 =head2 Understanding of Numbers
371
372 In general a lot of fixing has happened in the area of Perl's
373 understanding of numbers, both integer and floating point.  Since in
374 many systems the standard number parsing functions like C<strtoul()>
375 and C<atof()> seem to have bugs, Perl tries to work around their
376 deficiencies.  This results hopefully in more accurate numbers.
377
378 Perl now tries internally to use integer values in numeric conversions
379 and basic arithmetics (+ - * /) if the arguments are integers, and
380 tries also to keep the results stored internally as integers.
381 This change leads to often slightly faster and always less lossy
382 arithmetics. (Previously Perl always preferred floating point numbers
383 in its math.)
384
385 =head2 Miscellaneous Changes
386
387 =over 4
388
389 =item *
390
391 AUTOLOAD is now lvaluable, meaning that you can add the :lvalue attribute
392 to AUTOLOAD subroutines and you can assign to the AUTOLOAD return value.
393
394 =item *
395
396 C<perl -d:Module=arg,arg,arg> now works (previously one couldn't pass
397 in multiple arguments.)
398
399 =item *
400
401 The builtin dump() now gives an optional warning
402 C<dump() better written as CORE::dump()>,
403 meaning that by default C<dump(...)> is resolved as the builtin 
404 dump() which dumps core and aborts, not as (possibly) user-defined
405 C<sub dump>.  To call the latter, qualify the call as C<&dump(...)>.
406 (The whole dump() feature is to considered deprecated, and possibly
407 removed/changed in future releases.)
408
409 =item *
410
411 chomp() and chop() have been demoted back to I<not> being overridable
412 because they cannot really be overridden-- the problem is that their
413 prototype cannot be expressed and therefore one really cannot write
414 replacements to override these builtins.
415
416 =item *
417
418 END blocks are now run even if you exit/die in a BEGIN block.
419 Internally, the execution of END blocks is now controlled by 
420 PL_exit_flags & PERL_EXIT_DESTRUCT_END. This enables the new
421 behaviour for Perl embedders. This will default in 5.10. See
422 L<perlembed>.
423
424 =item *
425
426 Formats now support zero-padded decimal fields.
427
428 =item *
429
430 Lvalue subroutines can now return C<undef> in list context.
431 However, the lvalue subroutine feature still remains experimental.
432
433 =item *
434
435 A lost warning "Can't declare ... dereference in my" has been
436 restored (Perl had it earlier but it became lost in later releases.)
437
438 =item *
439
440 A new special regular expression variable has been introduced:
441 C<$^N>, which contains the most-recently closed group (submatch).
442
443 =item *
444
445 C<no Module;> now works even if there is no "sub unimport" in the Module.
446
447 =item *
448
449 The numerical comparison operators return C<undef> if either operand
450 is a NaN.  Previously the behaviour was unspecified.
451
452 =item *
453
454 The following builtin functions are now overridable: each(), keys(),
455 pop(), push(), shift(), splice(), unshift().
456
457 =item *
458
459 C<pack() / unpack()> now can group template letters with C<()> and then
460 apply repetition/count modifiers on the groups.
461
462 =item *
463
464 C<pack() / unpack()> can now process the Perl internal numeric types:
465 IVs, UVs, NVs-- and also long doubles, if supported by the platform.
466 The template letters are C<j>, C<J>, C<F>, and C<D>.
467
468 =item *
469
470 C<pack('U0a*', ...)> can now be used to force a string to UTF8.
471
472 =item *
473
474 my __PACKAGE__ $obj now works.
475
476 =item *
477
478 The printf() and sprintf() now support parameter reordering using the
479 C<%\d+\$> and C<*\d+\$> syntaxes.  For example
480
481     print "%2\$s %1\$s\n", "foo", "bar";
482
483 will print "bar foo\n".  This feature helps in writing
484 internationalised software, and in general when the order
485 of the parameters can vary.
486
487 =item *
488
489 prototype(\&) is now available.
490
491 =item *
492
493 prototype(\[$@%&]) is now available to implicitly create references
494 (useful for example if you want to emulate the tie() interface).
495
496 =item *
497
498 A new command-line option, C<-t> is available.  It is the
499 little brother of C<-T>: instead of dieing on taint violations,
500 lexical warnings are given.  B<This is only meant as a temporary
501 debugging aid while securing the code of old legacy applications.
502 This is not a substitute for -T.>
503
504 =item *
505
506 In other taint news, the C<exec LIST> and C<system LIST> have now been
507 considered too risky (think C<exec @ARGV>: it can start any program
508 with any arguments), and now the said forms cause a warning.
509 You should carefully launder the arguments to guarantee their
510 validity.  In future releases of Perl the forms will become fatal
511 errors so consider starting laundering now.
512
513 =item *
514
515 If tr/// is just counting characters, it doesn't attempt to
516 modify its target.
517
518 =item *
519
520 untie() will now call an UNTIE() hook if it exists.  See L<perltie>
521 for details.
522
523 =item *
524
525 L<utime> now supports C<utime undef, undef, @files> to change the
526 file timestamps to the current time.
527
528 =item *
529
530 The rules for allowing underscores (underbars) in numeric constants
531 have been relaxed and simplified: now you can have an underscore
532 simply B<between digits>.
533
534 =item *
535
536 Rather than relying on C's argv[0] (which may not contain a full pathname)
537 where possible $^X is now set by asking the operating system.
538 (eg by reading F</proc/self/exe> on Linux, F</proc/curproc/file> on FreeBSD)
539
540 =back
541
542 =head1 Modules and Pragmata
543
544 =head2 New Modules and Pragmata
545
546 =over 4
547
548 =item *
549
550 C<Attribute::Handlers> allows a class to define attribute handlers.
551
552     package MyPack;
553     use Attribute::Handlers;
554     sub Wolf :ATTR(SCALAR) { print "howl!\n" }
555
556     # later, in some package using or inheriting from MyPack...
557
558     my MyPack $Fluffy : Wolf; # the attribute handler Wolf will be called
559
560 Both variables and routines can have attribute handlers.  Handlers can
561 be specific to type (SCALAR, ARRAY, HASH, or CODE), or specific to the
562 exact compilation phase (BEGIN, CHECK, INIT, or END).
563
564 =item *
565
566 B<B::Concise> is a new compiler backend for walking the Perl syntax
567 tree, printing concise info about ops, from Stephen McCamant.  The
568 output is highly customisable.  See L<B::Concise>.
569
570 =item *
571
572 C<Class::ISA> for reporting the search path for a class's ISA tree,
573 by Sean Burke, has been added.  See L<Class::ISA>.
574
575 =item *
576
577 C<Cwd> has now a split personality: if possible, an XS extension is
578 used, (this will hopefully be faster, more secure, and more robust)
579 but if not possible, the familiar Perl implementation is used.
580
581 =item *
582
583 C<Devel::PPPort>, originally from Kenneth Albanowski and now
584 maintained by Paul Marquess, has been added.  It is primarily used
585 by C<h2xs> to enhance portability of XS modules between different
586 versions of Perl.
587
588 =item *
589
590 C<Digest>, frontend module for calculating digests (checksums), from
591 Gisle Aas, has been added.  See L<Digest>.
592
593 =item *
594
595 C<Digest::MD5> for calculating MD5 digests (checksums) as defined in
596 RFC 1321, from Gisle Aas, has been added.  See L<Digest::MD5>.
597
598     use Digest::MD5 'md5_hex';
599
600     $digest = md5_hex("Thirsty Camel");
601
602     print $digest, "\n"; # 01d19d9d2045e005c3f1b80e8b164de1
603
604 NOTE: the C<MD5> backward compatibility module is deliberately not
605 included since its further use is discouraged.
606
607 =item *
608
609 C<Encode>, by Nick Ing-Simmons, provides a mechanism to translate
610 between different character encodings.  Support for Unicode,
611 ISO-8859-*, ASCII, CP*, KOI8-R, and three variants of EBCDIC are
612 compiled in to the module.  Several other encodings (like Japanese,
613 Chinese, and MacIntosh encodings) are included and will be loaded at
614 runtime.  See L<Encode>.
615
616 Any encoding supported by Encode module is also available to the
617 ":encoding()" layer if PerlIO is used.
618
619 =item *
620
621 C<I18N::Langinfo> can be use to query locale information.
622 See L<I18N::Langinfo>.
623
624 =item *
625
626 C<I18N::LangTags> has functions for dealing with RFC3066-style
627 language tags, by Sean Burke.  See L<I18N::LangTags>.
628
629 =item *
630
631 C<ExtUtils::Constant> is a new tool for extension writers for
632 generating XS code to import C header constants, by Nicholas Clark.
633 See L<ExtUtils::Constant>.
634
635 =item *
636
637 C<Filter::Simple> is an easy-to-use frontend to Filter::Util::Call,
638 from Damian Conway.  See L<Filter::Simple>.
639
640     # in MyFilter.pm:
641
642     package MyFilter;
643
644     use Filter::Simple sub {
645         while (my ($from, $to) = splice @_, 0, 2) {
646                 s/$from/$to/g;
647         }
648     };
649
650     1;
651
652     # in user's code:
653
654     use MyFilter qr/red/ => 'green';
655
656     print "red\n";   # this code is filtered, will print "green\n"
657     print "bored\n"; # this code is filtered, will print "bogreen\n"
658
659     no MyFilter;
660
661     print "red\n";   # this code is not filtered, will print "red\n"
662
663 =item *
664
665 C<File::Temp> allows one to create temporary files and directories in
666 an easy, portable, and secure way, by Tim Jenness.  See L<File::Temp>.
667
668 =item *
669
670 C<Filter::Util::Call> provides you with the framework to write
671 I<Source Filters> in Perl, from Paul Marquess.  For most uses the
672 frontend Filter::Simple is to be preferred.  See L<Filter::Util::Call>.
673
674 =item *
675
676 C<if> is a new pragma for conditional inclusion of modules, from
677 Ilya Zakharevich.
678
679 =item *
680
681 L<libnet> is a collection of perl5 modules related to network
682 programming, from Graham Barr.  See L<Net::FTP>, L<Net::NNTP>,
683 L<Net::Ping>, L<Net::POP3>, L<Net::SMTP>, and L<Net::Time>.
684
685 Perl installation leaves libnet unconfigured, use F<libnetcfg> to configure.
686
687 =item *
688
689 C<List::Util> is a selection of general-utility list subroutines, like
690 sum(), min(), first(), and shuffle(), by Graham Barr.  See L<List::Util>.
691
692 =item *
693
694 C<Locale::Constants>, C<Locale::Country>, C<Locale::Currency>, and
695 C<Locale::Language>, from Neil Bowers, have been added.  They provide the
696 codes for various locale standards, such as "fr" for France, "usd" for
697 US Dollar, and "jp" for Japanese.
698
699     use Locale::Country;
700
701     $country = code2country('jp');               # $country gets 'Japan'
702     $code    = country2code('Norway');           # $code gets 'no'
703
704 See L<Locale::Constants>, L<Locale::Country>, L<Locale::Currency>,
705 and L<Locale::Language>.
706
707 =item *
708
709 C<Locale::Maketext> is localization framework from Sean Burke.  See
710 L<Locale::Maketext>, and L<Locale::Maketext::TPJ13>.  The latter is an
711 article about software localization, originally published in The Perl
712 Journal #13, republished here with kind permission.
713
714 =item *
715
716 C<Memoize> can make your functions faster by trading space for time,
717 from Mark-Jason Dominus.  See L<Memoize>.
718
719 =item *
720
721 C<MIME::Base64> allows you to encode data in base64, from Gisle Aas,
722 as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
723 Extensions)>.
724
725     use MIME::Base64;
726
727     $encoded = encode_base64('Aladdin:open sesame');
728     $decoded = decode_base64($encoded);
729
730     print $encoded, "\n"; # "QWxhZGRpbjpvcGVuIHNlc2FtZQ=="
731
732 See L<MIME::Base64>.
733
734 =item *
735
736 C<MIME::QuotedPrint> allows you to encode data in quoted-printable
737 encoding, as defined in RFC 2045 - I<MIME (Multipurpose Internet Mail
738 Extensions)>, from Gisle Aas.
739
740     use MIME::QuotedPrint;
741
742     $encoded = encode_qp("Smiley in Unicode: \x{263a}");
743     $decoded = decode_qp($encoded);
744
745     print $encoded, "\n"; # "Smiley in Unicode: =263A"
746
747 MIME::QuotedPrint has been enhanced to provide the basic methods
748 necessary to use it with PerlIO::Via as in :
749
750     use MIME::QuotedPrint;
751     open($fh,">Via(MIME::QuotedPrint)",$path);
752
753 See L<MIME::QuotedPrint>.
754
755 =item *
756
757 C<NEXT> is pseudo-class for method redispatch, from Damian Conway.
758 See L<NEXT>.
759
760 =item *
761
762 C<open> is a new pragma for setting the default I/O disciplines
763 for open().
764
765 =item *
766
767 C<PerlIO::Scalar> provides the implementation of IO to "in memory"
768 Perl scalars as discussed above, from Nick Ing-Simmons.  It also
769 serves as an example of a loadable PerlIO layer.  Other future
770 possibilities include PerlIO::Array and PerlIO::Code.
771 See L<PerlIO::Scalar>.
772
773 =item *
774
775 C<PerlIO::Via> acts as a PerlIO layer and wraps PerlIO layer
776 functionality provided by a class (typically implemented in perl
777 code), from Nick Ing-Simmons.
778
779     use MIME::QuotedPrint;
780     open($fh,">Via(MIME::QuotedPrint)",$path);
781
782 This will automatically convert everything output to C<$fh>
783 to Quoted-Printable.  See L<PerlIO::Via>.
784
785 =item *
786
787 C<Pod::ParseLink>, by Russ Allbery, has been added,
788 to parse LZ<><> links in pods as described in the new
789 perlpodspec.
790
791 =item *
792
793 C<Pod::Text::Overstrike>, by Joe Smith, has been added.
794 It converts POD data to formatted overstrike text.
795 See L<Pod::Text::Overstrike>.
796
797 =item *
798
799 C<Scalar::Util> is a selection of general-utility scalar subroutines,
800 like blessed(), reftype(), and tainted().  See L<Scalar::Util>.
801
802 =item *
803
804 C<sort> is a new pragma for controlling the behaviour of sort().
805
806 =item *
807
808 C<Storable> gives persistence to Perl data structures by allowing the
809 storage and retrieval of Perl data to and from files in a fast and
810 compact binary format, from Raphael Manfredi.  See L<Storable>.
811
812 =item *
813
814 C<Switch>, from Damian Conway, has been added.  Just by saying
815
816     use Switch;
817
818 you have C<switch> and C<case> available in Perl.
819
820     use Switch;
821
822     switch ($val) {
823
824                 case 1          { print "number 1" }
825                 case "a"        { print "string a" }
826                 case [1..10,42] { print "number in list" }
827                 case (@array)   { print "number in list" }
828                 case /\w+/      { print "pattern" }
829                 case qr/\w+/    { print "pattern" }
830                 case (%hash)    { print "entry in hash" }
831                 case (\%hash)   { print "entry in hash" }
832                 case (\&sub)    { print "arg to subroutine" }
833                 else            { print "previous case not true" }
834     }
835
836 See L<Switch>.
837
838 =item *
839
840 C<Test::More> is yet another framework for writing test scripts,
841 more extensive than Test::Simple, by Michael Schwern.  See L<Test::More>.
842
843 =item *
844
845 C<Test::Simple> has basic utilities for writing tests, by Michael
846 Schwern.   See L<Test::Simple>.
847
848 =item *
849
850 C<Text::Balanced> has been added, for extracting delimited text
851 sequences from strings, from Damian Conway.
852
853     use Text::Balanced 'extract_delimited';
854
855     ($a, $b) = extract_delimited("'never say never', he never said", "'", '');
856
857 $a will be "'never say never'", $b will be ', he never said'.
858
859 In addition to extract_delimited() there are also extract_bracketed(),
860 extract_quotelike(), extract_codeblock(), extract_variable(),
861 extract_tagged(), extract_multiple(), gen_delimited_pat(), and
862 gen_extract_tagged().  With these you can implement rather advanced
863 parsing algorithms.  See L<Text::Balanced>.
864
865 =item *
866
867 C<threads> is an interface to interpreter threads, by Arthur Bergman.
868 Interpreter threads (ithreads) is the new thread model introduced in
869 Perl 5.6 but only available as an internal interface for extension
870 writers (and for Win32 Perl for C<fork()> emulation).  See L<threads>.
871
872 =item *
873
874 C<threads::shared> allows data sharing for interpreter threads, from
875 Arthur Bergman.  In the ithreads model any data sharing between
876 threads must be explicit, as opposed to the old 5.005 thread model
877 where data sharing was implicit.  See L<threads::shared>.
878
879 =item *
880
881 C<Tie::File>, by Mark-Jason Dominus, associates a Perl array with the
882 lines of a file.
883
884 =item *
885
886 C<Tie::Memoize>, by Ilya Zakharevich, provides on-demand loaded hashes.
887
888 =item *
889
890 C<Tie::RefHash::Nestable>, by Edward Avis, allows storing hash
891 references (unlike the standard Tie::RefHash)  The module is contained
892 within Tie::RefHash, see L<Tie::RefHash>.
893
894 =item *
895
896 C<Time::HiRes> provides high resolution timing (ualarm, usleep,
897 and gettimeofday), from Douglas E. Wegscheid.  See L<Time::HiRes>.
898
899 =item *
900
901 C<Unicode::UCD> offers a querying interface to the Unicode Character
902 Database.  See L<Unicode::UCD>.
903
904 =item *
905
906 C<Unicode::Collate> implements the UCA (Unicode Collation Algorithm)
907 for sorting Unicode strings, by SADAHIRO Tomoyuki.  See L<Unicode::Collate>.
908
909 =item *
910
911 C<Unicode::Normalize> implements the various Unicode normalization
912 forms, by SADAHIRO Tomoyuki.  See L<Unicode::Normalize>.
913
914 =item *
915
916 C<XS::Typemap>, by Tim Jenness, is a test extension that exercises XS
917 typemaps.  Nothing gets installed but for extension writers the code
918 is worth studying.
919
920 =back
921
922 =head2 Updated And Improved Modules and Pragmata
923
924 =over 4
925
926 =item *
927
928 The following independently supported modules have been updated to the
929 newest versions from CPAN: CGI, CPAN, DB_File, File::Spec, File::Temp,
930 Getopt::Long, Math::BigFloat, Math::BigInt, the podlators bundle
931 (Pod::Man, Pod::Text), Pod::LaTeX, Pod::Parser, Storable,
932 Term::ANSIColor, Test, Text-Tabs+Wrap.
933
934 =item *
935
936 The attributes::reftype() now works on tied arguments.
937
938 =item *
939
940 AutoLoader can now be disabled with C<no AutoLoader;>.
941
942 =item *
943
944 B::Deparse has been significantly enhanced.  It now can deparse almost
945 all of the standard test suite (so that the tests still succeed).
946 There is a make target "test.deparse" for trying this out.
947
948 =item *
949
950 Class::Struct can now define the classes in compile time.
951
952 =item *
953
954 Class::Struct now assigns the array/hash element if the accessor
955 is called with an array/hash element as the B<sole> argument.
956
957 =item *
958
959 Data::Dumper has now an option to sort hashes.
960
961 =item *
962
963 Data::Dumper has now an option to dump code references
964 using B::Deparse.
965
966 =item *
967
968 DB_File now supports newer Berkeley DB versions, among
969 other improvements.
970
971 =item *
972
973 The English module can now be used without the infamous performance
974 hit by saying
975
976         use English '-no_match_vars';
977
978 (Assuming, of course, that one doesn't need the troublesome variables
979 C<$`>, C<$&>, or C<$'>.)  Also, introduced C<@LAST_MATCH_START> and
980 C<@LAST_MATCH_END> English aliases for C<@-> and C<@+>.
981
982 =item *
983
984 Fcntl, Socket, and Sys::Syslog have been rewritten to use the
985 new-style constant dispatch section (see L<ExtUtils::Constant>).
986 This means that they will be more robust and hopefully faster.
987
988 =item *
989
990 File::Find now chdir()s correctly when chasing symbolic links.
991
992 =item *
993
994 File::Find now has pre- and post-processing callbacks.  It also
995 correctly changes directories when chasing symbolic links.  Callbacks
996 (naughtily) exiting with "next;" instead of "return;" now work.
997
998 =item *
999
1000 File::Find is now (again) reentrant.  It also has been made
1001 more portable.
1002
1003 =item *
1004
1005 File::Glob::glob() renamed to File::Glob::bsd_glob() to avoid
1006 prototype mismatch with CORE::glob().
1007
1008 =item *
1009
1010 File::Glob now supports C<GLOB_LIMIT> constant to limit the size of
1011 the returned list of filenames.
1012
1013 =item *
1014
1015 Devel::Peek now has an interface for the Perl memory statistics
1016 (this works only if you are using perl's malloc, and if you have
1017 compiled with debugging).
1018
1019 =item *
1020
1021 IPC::Open3 now allows the use of numeric file descriptors.
1022
1023 =item *
1024
1025 IO::Socket has now atmark() method, which returns true if the socket
1026 is positioned at the out-of-band mark.  The method is also exportable
1027 as a sockatmark() function.
1028
1029 =item *
1030
1031 IO::Socket::INET has support for ReusePort option (if your platform
1032 supports it).  The Reuse option now has an alias, ReuseAddr.  For clarity
1033 you may want to prefer ReuseAddr.
1034
1035 =item *
1036
1037 IO::Socket::INET now supports C<LocalPort> of zero (usually meaning
1038 that the operating system will make one up.)
1039
1040 =item *
1041
1042 use lib now works identically to @INC.  Removing directories
1043 with 'no lib' now works.
1044
1045 =item *
1046
1047 ExtUtils::MakeMaker now uses File::Spec internally, which hopefully
1048 leads into better portability.
1049
1050 =item *
1051
1052 Math::BigFloat and Math::BigInt have undergone a full rewrite.
1053 They are now magnitudes faster, and they support various
1054 bignum libraries such as GMP and PARI as their backends.
1055
1056 =item *
1057
1058 Math::Complex handles inf, NaN etc., better.
1059
1060 =item *
1061
1062 Net::Ping has been muchly enhanced.  Multihoming is now supported.
1063 There is now "external" protocol which uses Net::Ping::External module
1064 which runs external ping(1) and parses the output.  A version of
1065 Net::Ping::External is available in CPAN.
1066
1067 =item *
1068
1069 POSIX::sigaction() is now much more flexible and robust.
1070 You can now install coderef handlers, 'DEFAULT', and 'IGNORE'
1071 handlers, installing new handlers was not atomic.
1072
1073 =item *
1074
1075 In Safe the C<%INC> now localised in a Safe compartment so that
1076 use/require work.
1077
1078 =item *
1079
1080 In SDBM_File on dosish platforms, some keys went missing because of
1081 lack of support for files with "holes".  A workaround for the problem
1082 has been added.
1083
1084 =item *
1085
1086 In Search::Dict one can now have a pre-processing hook for the
1087 lines being searched.
1088
1089 =item *
1090
1091 The Shell module now has an OO interface.
1092
1093 =item *
1094
1095 The Test module has been significantly enhanced.
1096
1097 =item *
1098
1099 The vars pragma now supports declaring fully qualified variables.
1100 (Something that C<our()> does not and will not support.)
1101
1102 =item *
1103
1104 The C<utf8::> name space (as in the pragma) provides various
1105 Perl-callable functions to provide low level access to Perl's
1106 internal Unicode representation.  At the moment only length()
1107 has been implemented.
1108
1109 =back
1110
1111 =head1 Utility Changes
1112
1113 =over 4
1114
1115 =item *
1116
1117 Emacs perl mode (emacs/cperl-mode.el) has been updated to version
1118 4.31.
1119
1120 =item *
1121
1122 F<emacs/e2ctags.pl> is now much faster.
1123
1124 =item *
1125
1126 C<h2ph> now supports C trigraphs.
1127
1128 =item *
1129
1130 C<h2xs> now produces a template README.
1131
1132 =item *
1133
1134 C<h2xs> now uses C<Devel::PPort> for better portability between
1135 different versions of Perl.
1136
1137 =item *
1138
1139 C<h2xs> uses the new L<ExtUtils::Constant> module which will affect
1140 newly created extensions that define constants.  Since the new code is
1141 more correct (if you have two constants where the first one is a
1142 prefix of the second one, the first constant B<never> gets defined),
1143 less lossy (it uses integers for integer constant, as opposed to the
1144 old code that used floating point numbers even for integer constants),
1145 and slightly faster, you might want to consider regenerating your
1146 extension code (the new scheme makes regenerating easy).
1147 L<h2xs> now also supports C trigraphs.
1148
1149 =item *
1150
1151 C<libnetcfg> has been added to configure the libnet.
1152
1153 =item *
1154
1155 C<perlbug> is now much more robust.  It also sends the bug report to
1156 perl.org, not perl.com.
1157
1158 =item *
1159
1160 C<perlcc> has been rewritten and its user interface (that is,
1161 command line) is much more like that of the UNIX C compiler, cc.
1162 (The perlbc tools has been removed.  Use C<perlcc -B> instead.)
1163
1164 =item *
1165
1166 C<perlivp> is a new Installation Verification Procedure utility
1167 for running any time after installing Perl.
1168
1169 =item *
1170
1171 C<pod2html> now allows specifying a cache directory.
1172
1173 =item *
1174
1175 C<s2p> has been completely rewritten in Perl.  (It is in fact a full
1176 implementation of sed in Perl: you can use the sed functionality by
1177 using the C<psed> utility.)
1178
1179 =item *
1180
1181 C<xsubpp> now understands POD documentation embedded in the *.xs files.
1182
1183 =item *
1184
1185 C<xsubpp> now supports OUT keyword.
1186
1187 =back
1188
1189 =head1 New Documentation
1190
1191 =over 4
1192
1193 =item *
1194
1195 perl56delta details the changes between the 5.005 release and the
1196 5.6.0 release.
1197
1198 =item *
1199
1200 perlclib documents the internal replacements for standard C library
1201 functions.  (Interesting only for extension writers and Perl core
1202 hackers.)
1203
1204 =item *
1205
1206 perldebtut is a Perl debugging tutorial.
1207
1208 =item *
1209
1210 perlebcdic contains considerations for running Perl on EBCDIC platforms.
1211
1212 =item *
1213
1214 perlintro is a gentle introduction to Perl.
1215
1216 =item *
1217
1218 perliol documents the internals of PerlIO with layers.
1219
1220 =item *
1221
1222 perlmodstyle is a style guide for writing modules.
1223
1224 =item *
1225
1226 perlnewmod tells about writing and submitting a new module.
1227
1228 =item *
1229
1230 perlpacktut is a pack() tutorial.
1231
1232 =item *
1233
1234 perlpod has been rewritten to be clearer and to record the best
1235 practices gathered over the years.
1236
1237 =item *
1238
1239 perlpodspec is a more formal specification of the pod format,
1240 mainly of interest for writers of pod applications, not to
1241 people writing in pod.
1242
1243 =item *
1244
1245 perlretut is a regular expression tutorial.
1246
1247 =item *
1248
1249 perlrequick is a regular expressions quick-start guide.
1250 Yes, much quicker than perlretut.
1251
1252 =item *
1253
1254 perltodo has been updated.
1255
1256 =item *
1257
1258 perltootc has been renamed as perltooc (to not to conflict
1259 with perltoot in filesystems restricted to "8.3" names)
1260
1261 =item *
1262
1263 perluniintro is an introduction to using Unicode in Perl.
1264 (perlunicode is more of a detailed reference and background
1265 information)
1266
1267 =item *
1268
1269 perlutil explains the command line utilities packaged with the Perl
1270 distribution.
1271
1272 =back
1273
1274 The following platform-specific documents are available before
1275 the installation as README.I<platform>, and after the installation
1276 as perlI<platform>:
1277
1278     perlaix perlamiga perlapollo perlbeos perlbs2000
1279     perlce perlcygwin perldgux perldos perlepoc perlhpux
1280     perlhurd perlmachten perlmacos perlmint perlmpeix
1281     perlnetware perlos2 perlos390 perlplan9 perlqnx perlsolaris
1282     perltru64 perluts perlvmesa perlvms perlvos perlwin32
1283
1284 =over 4
1285
1286 =item *
1287
1288 The documentation for the POSIX-BC platform is called "BS2000", to avoid
1289 confusion with the Perl POSIX module.
1290
1291 =item *
1292
1293 The documentation for the WinCE platform is called "CE", to avoid
1294 confusion with the perlwin32 documentation on 8.3-restricted filesystems.
1295
1296 =back
1297
1298 =head1 Performance Enhancements
1299
1300 =over 4
1301
1302 =item *
1303
1304 map() could get pathologically slow when the result list it generates
1305 is larger than the source list.  The performance has been improved for
1306 common scenarios.
1307
1308 =item *
1309
1310 sort() has been changed to use primarily mergesort internally as
1311 opposed to the earlier quicksort.  For very small lists this may
1312 result in slightly slower sorting times, but in general the speedup
1313 should be at least 20%.  Additional bonuses are that the worst case
1314 behaviour of sort() is now better (in computer science terms it now
1315 runs in time O(N log N), as opposed to quicksort's Theta(N**2)
1316 worst-case run time behaviour), and that sort() is now stable
1317 (meaning that elements with identical keys will stay ordered as they
1318 were before the sort).  See the C<sort> pragma for information.
1319
1320 The story in more detail: suppose you want to serve yourself a little
1321 slice of Pi.
1322
1323     @digits = ( 3,1,4,1,5,9 );
1324
1325 A numerical sort of the digits will yield (1,1,3,4,5,9), as expected.
1326 Which C<1> comes first is hard to know, since one C<1> looks pretty
1327 much like any other.  You can regard this as totally trivial,
1328 or somewhat profound.  However, if you just want to sort the even
1329 digits ahead of the odd ones, then what will
1330
1331     sort { ($a % 2) <=> ($b % 2) } @digits;
1332
1333 yield?  The only even digit, C<4>, will come first.  But how about
1334 the odd numbers, which all compare equal?  With the quicksort algorithm
1335 used to implement Perl 5.6 and earlier, the order of ties is left up
1336 to the sort.  So, as you add more and more digits of Pi, the order
1337 in which the sorted even and odd digits appear will change.
1338 and, for sufficiently large slices of Pi, the quicksort algorithm
1339 in Perl 5.8 won't return the same results even if reinvoked with the
1340 same input.  The justification for this rests with quicksort's
1341 worst case behavior.  If you run
1342
1343    sort { $a <=> $b } ( 1 .. $N , 1 .. $N );
1344
1345 (something you might approximate if you wanted to merge two sorted
1346 arrays using sort), doubling $N doesn't just double the quicksort time,
1347 it I<quadruples> it.  Quicksort has a worst case run time that can
1348 grow like N**2, so-called I<quadratic> behaviour, and it can happen
1349 on patterns that may well arise in normal use.  You won't notice this
1350 for small arrays, but you I<will> notice it with larger arrays,
1351 and you may not live long enough for the sort to complete on arrays
1352 of a million elements.  So the 5.8 quicksort scrambles large arrays
1353 before sorting them, as a statistical defence against quadratic behaviour.
1354 But that means if you sort the same large array twice, ties may be
1355 broken in different ways.
1356
1357 Because of the unpredictability of tie-breaking order, and the quadratic
1358 worst-case behaviour, quicksort was I<almost> replaced completely with
1359 a stable mergesort.  I<Stable> means that ties are broken to preserve
1360 the original order of appearance in the input array.  So
1361
1362     sort { ($a % 2) <=> ($b % 2) } (3,1,4,1,5,9);
1363
1364 will yield (4,3,1,1,5,9), guaranteed.  The even and odd numbers
1365 appear in the output in the same order they appeared in the input.
1366 Mergesort has worst case O(NlogN) behaviour, the best value
1367 attainable.  And, ironically, this mergesort does particularly
1368 well where quicksort goes quadratic:  mergesort sorts (1..$N, 1..$N)
1369 in O(N) time.  But quicksort was rescued at the last moment because
1370 it is faster than mergesort on certain inputs and platforms.
1371 For example, if you really I<don't> care about the order of even
1372 and odd digits, quicksort will run in O(N) time; it's very good
1373 at sorting many repetitions of a small number of distinct elements.
1374 The quicksort divide and conquer strategy works well on platforms
1375 with relatively small, very fast, caches.  Eventually, the problem gets
1376 whittled down to one that fits in the cache, from which point it
1377 benefits from the increased memory speed.
1378
1379 Quicksort was rescued by implementing a sort pragma to control aspects
1380 of the sort.  The B<stable> subpragma forces stable behaviour,
1381 regardless of algorithm.  The B<_quicksort> and B<_mergesort>
1382 subpragmas are heavy-handed ways to select the underlying implementation.
1383 The leading C<_> is a reminder that these subpragmas may not survive
1384 beyond 5.8.  More appropriate mechanisms for selecting the implementation
1385 exist, but they wouldn't have arrived in time to save quicksort.
1386
1387 =item *
1388
1389 Hashes now use Bob Jenkins "One-at-a-Time" hashing key algorithm
1390 (http://burtleburtle.net/bob/hash/doobs.html).  This algorithm is
1391 reasonably fast while producing a much better spread of values than
1392 the old hashing algorithm (originally by Chris Torek, later tweaked by
1393 Ilya Zakharevich).  Hash values output from the algorithm on a hash of
1394 all 3-char printable ASCII keys comes much closer to passing the
1395 DIEHARD random number generation tests.  According to perlbench, this
1396 change has not affected the overall speed of Perl.
1397
1398 =item *
1399
1400 unshift() should now be noticeably faster.
1401
1402 =back
1403
1404 =head1 Installation and Configuration Improvements
1405
1406 =head2 Generic Improvements
1407
1408 =over 4
1409
1410 =item *
1411
1412 INSTALL now explains how you can configure Perl to use 64-bit
1413 integers even on non-64-bit platforms.
1414
1415 =item *
1416
1417 Policy.sh policy change: if you are reusing a Policy.sh file
1418 (see INSTALL) and you use Configure -Dprefix=/foo/bar and in the old
1419 Policy $prefix eq $siteprefix and $prefix eq $vendorprefix, all of
1420 them will now be changed to the new prefix, /foo/bar.  (Previously
1421 only $prefix changed.)  If you do not like this new behaviour,
1422 specify prefix, siteprefix, and vendorprefix explicitly.
1423
1424 =item *
1425
1426 A new optional location for Perl libraries, otherlibdirs, is available.
1427 It can be used for example for vendor add-ons without disturbing Perl's
1428 own library directories.
1429
1430 =item *
1431
1432 In many platforms the vendor-supplied 'cc' is too stripped-down to
1433 build Perl (basically, 'cc' doesn't do ANSI C).  If this seems
1434 to be the case and 'cc' does not seem to be the GNU C compiler
1435 'gcc', an automatic attempt is made to find and use 'gcc' instead.
1436
1437 =item *
1438
1439 gcc needs to closely track the operating system release to avoid
1440 build problems. If Configure finds that gcc was built for a different
1441 operating system release than is running, it now gives a clearly visible
1442 warning that there may be trouble ahead.
1443
1444 =item *
1445
1446 If binary compatibility with the 5.005 release is not wanted, Configure
1447 no longer suggests including the 5.005 modules in @INC.
1448
1449 =item *
1450
1451 Configure C<-S> can now run non-interactively.
1452
1453 =item *
1454
1455 Configure support for pdp11-style memory models has been removed due
1456 to obsolescence.
1457
1458 =item *
1459
1460 configure.gnu now works with options with whitespace in them.
1461
1462 =item *
1463
1464 installperl now outputs everything to STDERR.
1465
1466 =item *
1467
1468 $Config{byteorder} is now computed dynamically (this is more robust
1469 with "fat binaries" where an executable image contains binaries for
1470 more than one binary platform.)
1471
1472 =item *
1473
1474 Because PerlIO is now the default on most platforms, "-perlio" doesn't
1475 get appended to the $Config{archname} (also known as $^O) anymore.
1476 Instead, if you explicitly choose not to use perlio (Configure command
1477 line option -Uuseperlio), you will get "-stdio" appended.
1478
1479 =item *
1480
1481 Another change related to the architecture name is that "-64all"
1482 (-Duse64bitall, or "maximally 64-bit") is appended only if your
1483 pointers are 64 bits wide.  (To be exact, the use64bitall is ignored.)
1484
1485 =item *
1486
1487 In AFS installations one can configure the root of the AFS to be
1488 somewhere else than the default F</afs> by using the Configure
1489 parameter C<-Dafsroot=/some/where/else>.
1490
1491 =item *
1492
1493 APPLLIB_EXP, a less-know configuration-time definition, has been
1494 documented.  It can be used to prepend site-specific directories
1495 to Perl's default search path (@INC), see INSTALL for information.
1496
1497 =item *
1498
1499 The version of Berkeley DB used when the Perl (and, presumably, the
1500 DB_File extension) was built is now available as
1501 C<@Config{qw(db_version_major db_version_minor db_version_patch)}>
1502 from Perl and as C<DB_VERSION_MAJOR_CFG DB_VERSION_MINOR_CFG
1503 DB_VERSION_PATCH_CFG> from C.
1504
1505 =item *
1506
1507 Building Berkeley DB3 for compatibility modes for DB, NDBM, and ODBM
1508 has been documented in INSTALL.
1509
1510 =item *
1511
1512 If you have CPAN access (either network or a local copy such as a
1513 CD-ROM) you can during specify extra modules to Configure to build and
1514 install with Perl using the -Dextras=...  option.  See INSTALL for
1515 more details.
1516
1517 =item *
1518
1519 In addition to config.over a new override file, config.arch, is
1520 available.  That is supposed to be used by hints file writers for
1521 architecture-wide changes (as opposed to config.over which is for
1522 site-wide changes).
1523
1524 =item *
1525
1526 If your file system supports symbolic links you can build Perl outside
1527 of the source directory by
1528
1529         mkdir /tmp/perl/build/directory
1530         cd /tmp/perl/build/directory
1531         sh /path/to/perl/source/Configure -Dmksymlinks ...
1532
1533 This will create in /tmp/perl/build/directory a tree of symbolic links
1534 pointing to files in /path/to/perl/source.  The original files are left
1535 unaffected.  After Configure has finished you can just say
1536
1537         make all test
1538
1539 and Perl will be built and tested, all in /tmp/perl/build/directory.
1540
1541 =item *
1542
1543 For Perl developers several new make targets for profiling
1544 and debugging have been added, see L<perlhack>.
1545
1546 =over 8
1547
1548 =item *
1549
1550 Use of the F<gprof> tool to profile Perl has been documented in
1551 L<perlhack>.  There is a make target called "perl.gprof" for
1552 generating a gprofiled Perl executable.
1553
1554 =item *
1555
1556 If you have GCC 3, there is a make target called "perl.gcov" for
1557 creating a gcoved Perl executable for coverage analysis.  See
1558 L<perlhack>.
1559
1560 =item *
1561
1562 If you are on IRIX or Tru64 platforms, new profiling/debugging options
1563 have been added, see L<perlhack> for more information about pixie and
1564 Third Degree.
1565
1566 =back
1567
1568 =item *
1569
1570 Guidelines of how to construct minimal Perl installations have
1571 been added to INSTALL.
1572
1573 =item *
1574
1575 The Thread extension is now not built at all under ithreads
1576 (C<Configure -Duseithreads>) because it wouldn't work anyway (the
1577 Thread extension requires being Configured with C<-Duse5005threads>).
1578
1579 But note that the Thread.pm interface is now shared by both
1580 thread models.
1581
1582 =back
1583
1584 =head2 New Or Improved Platforms
1585
1586 For the list of platforms known to support Perl,
1587 see L<perlport/"Supported Platforms">.
1588
1589 =over 4
1590
1591 =item *
1592
1593 AIX dynamic loading should be now better supported.
1594
1595 =item *
1596
1597 AIX should now work better with gcc, threads, and 64-bitness.  Also the
1598 long doubles support in AIX should be better now.  See L<perlaix>.
1599
1600 =item *
1601
1602 After a long pause, AmigaOS has been verified to be happy with Perl.
1603
1604 =item *
1605
1606 AtheOS (http://www.atheos.cx/) is a new platform.
1607
1608 =item *
1609
1610 BeOS has been reclaimed.
1611
1612 =item *
1613
1614 DG/UX platform now supports the 5.005-style threads.  See L<perldgux>.
1615
1616 =item *
1617
1618 DYNIX/ptx platform (a.k.a. dynixptx) is supported at or near osvers 4.5.2.
1619
1620 =item *
1621
1622 EBCDIC platforms (z/OS, also known as OS/390, POSIX-BC, and VM/ESA)
1623 have been regained.  Many test suite tests still fail and the
1624 co-existence of Unicode and EBCDIC isn't quite settled, but the
1625 situation is much better than with Perl 5.6.  See L<perlos390>,
1626 L<perlbs2000> (for POSIX-BC), and L<perlvmesa> for more information.
1627
1628 =item *
1629
1630 Building perl with -Duseithreads or -Duse5005threads now works under
1631 HP-UX 10.20 (previously it only worked under 10.30 or later). You will
1632 need a thread library package installed. See README.hpux.
1633
1634 =item *
1635
1636 MacOS Classic (MacPerl has of course been available since
1637 perl 5.004 but now the source code bases of standard Perl
1638 and MacPerl have been synchronised)
1639
1640 =item *
1641
1642 MacOS X (or Darwin) should now be able to build Perl even on HFS+
1643 filesystems.  (The case-insensitivity confused the Perl build process.)
1644
1645 =item *
1646
1647 NCR MP-RAS is now supported.
1648
1649 =item *
1650
1651 All the NetBSD specific patches (except for the installation
1652 specific ones) have been merged back to the main distribution.
1653
1654 =item *
1655
1656 NetWare from Novell is now supported.  See L<perlnetware>.
1657
1658 =item *
1659
1660 NonStop-UX is now supported.
1661
1662 =item *
1663
1664 NEC SUPER-UX is now supported.
1665
1666 =item *
1667
1668 All the OpenBSD specific patches (except for the installation
1669 specific ones) have been merged back to the main distribution.
1670
1671 =item *
1672
1673 Perl has been tested with the GNU pth userlevel thread package
1674 ( http://www.gnu.org/software/pth/pth.html ) . All but one thread
1675 test worked, and that one failure was because of test results arriving
1676 in unexpected order.
1677
1678 =item *
1679
1680 Amdahl UTS UNIX mainframe platform is now supported.
1681
1682 =item *
1683
1684 WinCE is now supported.  See L<perlce>.
1685
1686 =item *
1687
1688 z/OS (formerly known as OS/390, formerly known as MVS OE) has now
1689 support for dynamic loading.  This is not selected by default,
1690 however, you must specify -Dusedl in the arguments of Configure.
1691
1692 =back
1693
1694 =head1 Selected Bug Fixes
1695
1696 Numerous memory leaks and uninitialized memory accesses have been
1697 hunted down.  Most importantly anonymous subs used to leak quite
1698 a bit.
1699
1700 =over 4
1701
1702 =item *
1703
1704 The autouse pragma didn't work for Multi::Part::Function::Names.
1705
1706 =item *
1707
1708 caller() could cause core dumps in certain situations.  Carp was sometimes
1709 affected by this problem.
1710
1711 =item *
1712
1713 chop(@list) in list context returned the characters chopped in
1714 reverse order.  This has been reversed to be in the right order.
1715
1716 =item *
1717
1718 Configure no longer includes the DBM libraries (dbm, gdbm, db, ndbm)
1719 when building the Perl binary.  The only exception to this is SunOS 4.x,
1720 which needs them.
1721
1722 =item *
1723
1724 The behaviour of non-decimal but numeric string constants such as
1725 "0x23" was platform-dependent: in some platforms that was seen as 35,
1726 in some as 0, in some as a floating point number (don't ask).  This
1727 was caused by Perl using the operating system libraries in a situation
1728 where the result of the string to number conversion is undefined: now
1729 Perl consistently handles such strings as zero in numeric contexts.
1730
1731 =item *
1732
1733 The order of DESTROYs has been made more predictable.
1734
1735 =item *
1736
1737 Several debugger fixes: exit code now reflects the script exit code,
1738 condition C<"0"> now treated correctly, the C<d> command now checks
1739 line number, the C<$.> no longer gets corrupted, all debugger output
1740 now goes correctly to the socket if RemotePort is set.
1741
1742 =item *
1743
1744 Perl 5.6.0 could emit spurious warnings about redefinition of dl_error()
1745 when statically building extensions into perl.  This has been corrected.
1746
1747 =item *
1748
1749 L<dprofpp> -R didn't work.
1750
1751 =item *
1752
1753 C<*foo{FORMAT}> now works.
1754 =item *
1755
1756 Infinity is now recognized as a number.
1757
1758 =item *
1759
1760 UNIVERSAL::isa no longer caches methods incorrectly.  (This broke
1761 the Tk extension with 5.6.0.)
1762
1763 =item *
1764
1765 Lexicals I: lexicals outside an eval "" weren't resolved
1766 correctly inside a subroutine definition inside the eval "" if they
1767 were not already referenced in the top level of the eval""ed code.
1768
1769 =item *
1770
1771 Lexicals II: lexicals leaked at file scope into subroutines that
1772 were declared before the lexicals.
1773
1774 =item *
1775
1776 Lexical warnings now propagating correctly between scopes
1777 and into C<eval "...">.
1778
1779 =item *
1780
1781 C<use warnings qw(FATAL all)> did not work as intended.  This has been
1782 corrected.
1783
1784 =item *
1785
1786 warnings::enabled() now reports the state of $^W correctly if the caller
1787 isn't using lexical warnings.
1788
1789 =item *
1790
1791 Line renumbering with eval and C<#line> now works.
1792
1793 =item *
1794
1795 Fixed numerous memory leaks, especially in eval "".
1796
1797 =item *
1798
1799 mkdir() now ignores trailing slashes in the directory name,
1800 as mandated by POSIX.
1801
1802 =item *
1803
1804 Some versions of glibc have a broken modfl().  This affects builds
1805 with C<-Duselongdouble>.  This version of Perl detects this brokenness
1806 and has a workaround for it.  The glibc release 2.2.2 is known to have
1807 fixed the modfl() bug.
1808
1809 =item *
1810
1811 Modulus of unsigned numbers now works (4063328477 % 65535 used to
1812 return 27406, instead of 27047).
1813
1814 =item *
1815
1816 Some "not a number" warnings introduced in 5.6.0 eliminated to be
1817 more compatible with 5.005.  Infinity is now recognised as a number.
1818
1819 =item *
1820
1821 Numeric conversions did not recognize changes in the string value
1822 properly in certain circumstances.
1823
1824 =item *
1825
1826 Attributes (like :shared) didn't work with our().
1827
1828 =item *
1829
1830 our() variables will not cause "will not stay shared" warnings.
1831
1832 =item *
1833
1834 "our" variables of the same name declared in two sibling blocks
1835 resulted in bogus warnings about "redeclaration" of the variables.
1836 The problem has been corrected.
1837
1838 =item *
1839
1840 pack "Z" now correctly terminates the string with "\0".
1841
1842 =item *
1843
1844 Fix password routines which in some shadow password platforms
1845 (e.g. HP-UX) caused getpwent() to return every other entry.
1846
1847 =item *
1848
1849 The PERL5OPT environment variable (for passing command line arguments
1850 to Perl) didn't work for more than a single group of options.
1851
1852 =item *
1853
1854 PERL5OPT with embedded spaces didn't work.
1855
1856 =item *
1857
1858 printf() no longer resets the numeric locale to "C".
1859
1860 =item *
1861
1862 C<qw(a\\b)> now parses correctly as C<'a\\b'>.
1863
1864 =item *
1865
1866 pos() did not return the correct value within s///ge in earlier
1867 versions.  This is now handled correctly.
1868
1869 =item *
1870
1871 Printing quads (64-bit integers) with printf/sprintf now works
1872 without the q L ll prefixes (assuming you are on a quad-capable platform).
1873
1874 =item *
1875
1876 Regular expressions on references and overloaded scalars now work.
1877
1878 =item *
1879
1880 Right-hand side magic (GMAGIC) could in many cases such as string
1881 concatenation be invoked too many times.
1882
1883 =item *
1884
1885 scalar() now forces scalar context even when used in void context.
1886
1887 =item *
1888
1889 SOCKS support is now much more robust.
1890
1891 =item *
1892
1893 sort() arguments are now compiled in the right wantarray context
1894 (they were accidentally using the context of the sort() itself).
1895 The comparison block is now run in scalar context, and the arguments
1896 to be sorted are always provided list context.
1897
1898 =item *
1899
1900 Changed the POSIX character class C<[[:space:]]> to include the (very
1901 rarely used) vertical tab character.  Added a new POSIX-ish character
1902 class C<[[:blank:]]> which stands for horizontal whitespace
1903 (currently, the space and the tab).
1904
1905 =item *
1906
1907 The tainting behaviour of sprintf() has been rationalized.  It does
1908 not taint the result of floating point formats anymore, making the
1909 behaviour consistent with that of string interpolation.
1910
1911 =item *
1912
1913 Some cases of inconsistent taint propagation (such as within hash
1914 values) have been fixed.
1915
1916 =item *
1917
1918 The RE engine found in Perl 5.6.0 accidentally pessimised certain kinds
1919 of simple pattern matches.  These are now handled better.
1920
1921 =item *
1922
1923 Regular expression debug output (whether through C<use re 'debug'>
1924 or via C<-Dr>) now looks better.
1925
1926 =item *
1927
1928 Multi-line matches like C<"a\nxb\n" =~ /(?!\A)x/m> were flawed.  The
1929 bug has been fixed.
1930
1931 =item *
1932
1933 Use of $& could trigger a core dump under some situations.  This
1934 is now avoided.
1935
1936 =item *
1937
1938 The regular expression captured submatches ($1, $2, ...) are now
1939 more consistently unset if the match fails, instead of leaving false
1940 data lying around in them.
1941
1942 =item *
1943
1944 readline() on files opened in "slurp" mode could return an extra "" at
1945 the end in certain situations.  This has been corrected.
1946
1947 =item *
1948
1949 Autovivification of symbolic references of special variables described
1950 in L<perlvar> (as in C<${$num}>) was accidentally disabled.  This works
1951 again now.
1952
1953 =item *
1954
1955 Sys::Syslog ignored the C<LOG_AUTH> constant.
1956
1957 =item *
1958
1959 All but the first argument of the IO syswrite() method are now optional.
1960
1961 =item *
1962
1963 $AUTOLOAD, sort(), lock(), and spawning subprocesses
1964 in multiple threads simultaneously are now thread-safe.
1965
1966 =item *
1967
1968 Tie::ARRAY SPLICE method was broken.
1969
1970 =item *
1971
1972 Allow read-only string on left hand side of non-modifying tr///.
1973
1974 =item *
1975
1976 Several Unicode fixes.
1977
1978 =over 8
1979
1980 =item *
1981
1982 BOMs (byte order marks) in the beginning of Perl files
1983 (scripts, modules) should now be transparently skipped.
1984 UTF-16 (UCS-2) encoded Perl files should now be read correctly.
1985
1986 =item *
1987
1988 The character tables have been updated to Unicode 3.1.1.
1989
1990 =item *
1991
1992 Comparing with utf8 data does not magically upgrade non-utf8 data
1993 into utf8.  (This was a problem for example if you were mixing data
1994 from I/O and Unicode data: your output might have got magically encoded
1995 as UTF-8.)
1996
1997 =item *
1998
1999 Generating illegal Unicode code points like U+FFFE, or the UTF-16
2000 surrogates, now also generates an optional warning.
2001
2002 =item *
2003
2004 C<IsAlnum>, C<IsAlpha>, and C<IsWord> now match titlecase.
2005
2006 =item *
2007
2008 Concatenation with the C<.> operator or via variable interpolation,
2009 C<eq>, C<substr>, C<reverse>, C<quotemeta>, the C<x> operator,
2010 substitution with C<s///>, single-quoted UTF8, should now work.
2011
2012 =item *
2013
2014 The C<tr///> operator now works.  Note that the C<tr///CU>
2015 functionality has been removed (but see pack('U0', ...)).
2016
2017 =item *
2018
2019 C<eval "v200"> now works.
2020
2021 =item *
2022
2023 Perl 5.6.0 parsed m/\x{ab}/ incorrectly, leading to spurious warnings.
2024 This has been corrected.
2025
2026 =item *
2027
2028 Zero entries were missing from the Unicode classes like C<IsDigit>.
2029
2030 =back
2031
2032 =item *
2033
2034 Large unsigned numbers (those above 2**31) could sometimes lose their
2035 unsignedness, causing bogus results in arithmetic operations.
2036
2037 =back
2038
2039 =head2 Platform Specific Changes and Fixes
2040
2041 =over 4
2042
2043 =item *
2044
2045 BSDI 4.*
2046
2047 Perl now works on post-4.0 BSD/OSes.
2048
2049 =item *
2050
2051 All BSDs
2052
2053 Setting C<$0> now works (as much as possible; see L<perlvar> for details).
2054
2055 =item *
2056
2057 Cygwin
2058
2059 Numerous updates; currently synchronised with Cygwin 1.1.4.
2060
2061 =item *
2062
2063 Previously DYNIX/ptx had problems in its Configure probe for non-blocking I/O.
2064
2065 =item *
2066
2067 EPOC
2068
2069 EPOC update after Perl 5.6.0.  See README.epoc.
2070
2071 =item *
2072
2073 FreeBSD 3.*
2074
2075 Perl now works on post-3.0 FreeBSDs.
2076
2077 =item *
2078
2079 HP-UX
2080
2081 README.hpux updated; C<Configure -Duse64bitall> now almost works.
2082
2083 =item *
2084
2085 IRIX
2086
2087 Numerous compilation flag and hint enhancements; accidental mixing
2088 of 32-bit and 64-bit libraries (a doomed attempt) made much harder.
2089
2090 =item *
2091
2092 Linux
2093
2094 =over 8
2095
2096 =item *
2097
2098 Long doubles should now work (see INSTALL).
2099
2100 =item *
2101
2102 Linux previously had problems related to sockaddrlen when using
2103 accept(), revcfrom() (in Perl: recv()), getpeername(), and getsockname().
2104
2105 =back
2106
2107 =item *
2108
2109 MacOS Classic
2110
2111 Compilation of the standard Perl distribution in MacOS Classic should
2112 now work if you have the Metrowerks development environment and
2113 the missing Mac-specific toolkit bits.  Contact the macperl mailing
2114 list for details.
2115
2116 =item *
2117
2118 MPE/iX
2119
2120 MPE/iX update after Perl 5.6.0.  See README.mpeix.
2121
2122 =item *
2123
2124 NetBSD/sparc
2125
2126 Perl now works on NetBSD/sparc.
2127
2128 =item *
2129
2130 OS/2
2131
2132 Now works with usethreads (see INSTALL).
2133
2134 =item *
2135
2136 Solaris
2137
2138 64-bitness using the Sun Workshop compiler now works.
2139
2140 =item *
2141
2142 Tru64 (aka Digital UNIX, aka DEC OSF/1)
2143
2144 The operating system version letter now recorded in $Config{osvers}.
2145 Allow compiling with gcc (previously explicitly forbidden).  Compiling
2146 with gcc still not recommended because buggy code results, even with
2147 gcc 2.95.2.
2148
2149 =item *
2150
2151 Unicos
2152
2153 Fixed various alignment problems that lead into core dumps either
2154 during build or later; no longer dies on math errors at runtime;
2155 now using full quad integers (64 bits), previously was using 
2156 only 46 bit integers for speed.
2157
2158 =item *
2159
2160 VMS
2161
2162 chdir() now works better despite a CRT bug; now works with MULTIPLICITY
2163 (see INSTALL); now works with Perl's malloc.
2164
2165 The tainting of C<%ENV> elements via C<keys> or C<values> was previously
2166 unimplemented.  It now works as documented.
2167
2168 The C<waitpid> emulation has been improved.  The worst bug (now fixed)
2169 was that a pid of -1 would cause a wildcard search of all processes on
2170 the system.  The most significant enhancement is that we can now
2171 usually get the completion status of a terminated process.
2172
2173 POSIX-style signals are now emulated much better on VMS versions prior
2174 to 7.0.
2175
2176 The C<system> function and backticks operator have improved
2177 functionality and better error handling.
2178
2179 File access tests now use current process privileges rather than the
2180 user's default privileges, which could sometimes result in a mismatch
2181 between reported access and actual access.
2182
2183 =item *
2184
2185 Windows
2186
2187 =over 8
2188
2189 =item *
2190
2191 accept() no longer leaks memory.
2192
2193 =item *
2194
2195 Borland C++ v5.5 is now a supported compiler that can build Perl.
2196 However, the generated binaries continue to be incompatible with those
2197 generated by the other supported compilers (GCC and Visual C++).
2198
2199 =item *
2200
2201 Better chdir() return value for a non-existent directory.
2202
2203 =item *
2204
2205 Duping socket handles with open(F, ">&MYSOCK") now works under Windows 9x.
2206
2207 =item *
2208
2209 New %ENV entries now propagate to subprocesses.
2210
2211 =item *
2212
2213 Current directory entries in %ENV are now correctly propagated to child
2214 processes.
2215
2216 =item *
2217
2218 $ENV{LIB} now used to search for libs under Visual C.
2219
2220 =item *
2221
2222 fork() emulation has been improved in various ways, but still continues
2223 to be experimental.  See L<perlfork> for known bugs and caveats.
2224
2225 =item *
2226
2227 A failed (pseudo)fork now returns undef and sets errno to EAGAIN.
2228
2229 =item *
2230
2231 Win32::GetCwd() correctly returns C:\ instead of C: when at the drive root.
2232 Other bugs in chdir() and Cwd::cwd() have also been fixed.
2233
2234 =item *
2235
2236 HTML files will be installed in c:\perl\html instead of c:\perl\lib\pod\html
2237
2238 =item *
2239
2240 The makefiles now provide a single switch to bulk-enable all the features
2241 enabled in ActiveState ActivePerl (a popular Win32 binary distribution).
2242
2243 =item *
2244
2245 Allow REG_EXPAND_SZ keys in the registry.
2246
2247 =item *
2248
2249 Can now send() from all threads, not just the first one.
2250
2251 =item *
2252
2253 Fake signal handling reenabled, bugs and all.
2254
2255 =item *
2256
2257 %SIG has been enabled under USE_ITHREADS, but its use is completely
2258 unsupported under all configurations.
2259
2260 =item *
2261
2262 Less stack reserved per thread so that more threads can run
2263 concurrently. (Still 16M per thread.)
2264
2265 =item *
2266
2267 C<File::Spec-&gt;tmpdir()> now prefers C:/temp over /tmp
2268 (works better when perl is running as service).
2269
2270 =item *
2271
2272 Better UNC path handling under ithreads.
2273
2274 =item *
2275
2276 wait(), waitpid() and backticks now return the correct exit status under
2277 Windows 9x.
2278
2279 =item *
2280
2281 winsock handle leak fixed.
2282
2283 =back
2284
2285 =back
2286
2287 =head1 New or Changed Diagnostics
2288
2289 =over 4
2290
2291 =item *
2292
2293 The lexical warnings category "deprecated" is no longer a sub-category
2294 of the "syntax" category. It is now a top-level category in its own
2295 right.
2296
2297 =item *
2298
2299 All regular expression compilation error messages are now hopefully
2300 easier to understand both because the error message now comes before
2301 the failed regex and because the point of failure is now clearly
2302 marked by a C<E<lt>-- HERE> marker.
2303
2304 =item *
2305
2306 The various "opened only for", "on closed", "never opened" warnings
2307 drop the C<main::> prefix for filehandles in the C<main> package,
2308 for example C<STDIN> instead of C<main::STDIN>. 
2309
2310 =item *
2311
2312 The "Unrecognized escape" warning has been extended to include C<\8>,
2313 C<\9>, and C<\_>.  There is no need to escape any of the C<\w> characters.
2314
2315 =item *
2316
2317 Two new debugging options have been added: if you have compiled your
2318 Perl with debugging, you can use the -DT and -DR options to trace
2319 tokenising and to add reference counts to displaying variables,
2320 respectively.
2321
2322 =item *
2323
2324 perl5db.pl has been modified to present a more consistent commands
2325 interface, via (CommandSet=580).  perl5db.t was also added to test the
2326 changes, and as a placeholder for further tests.
2327
2328 See L<perldebug>
2329
2330 =item *
2331
2332 If an attempt to use a (non-blessed) reference as an array index
2333 is made, a warning is given.
2334
2335 =item *
2336
2337 C<push @a;> and C<unshift @a;> (with no values to push or unshift)
2338 now give a warning.  This may be a problem for generated and evaled
2339 code.
2340
2341 =item *
2342
2343 If you try to L<perlfunc/pack> a number less than 0 or larger than 255
2344 using the C<"C"> format you will get an optional warning.  Similarly
2345 for the C<"c"> format and a number less than -128 or more than 127.
2346
2347 =item *
2348
2349 Certain regex modifiers such as C<(?o)> make sense only if applied to
2350 the entire regex.  You will an optional warning if you try to do otherwise.
2351
2352 =item *
2353
2354 Using arrays or hashes as references (e.g. C<< %foo-&gt;{bar} >>
2355 has been deprecated for a while.  Now you will get an optional warning.
2356
2357 =back
2358
2359 =head1 Changed Internals
2360
2361 =over 4
2362
2363 =item *
2364
2365 perlapi.pod (a companion to perlguts) now attempts to document the
2366 internal API.
2367
2368 =item *
2369
2370 You can now build a really minimal perl called microperl.
2371 Building microperl does not require even running Configure;
2372 C<make -f Makefile.micro> should be enough.  Beware: microperl makes
2373 many assumptions, some of which may be too bold; the resulting
2374 executable may crash or otherwise misbehave in wondrous ways.
2375 For careful hackers only.
2376
2377 =item *
2378
2379 Added rsignal(), whichsig(), do_join(), op_clear, op_null,
2380 ptr_table_clear(), ptr_table_free(), sv_setref_uv(), and several UTF-8
2381 interfaces to the publicised API.  For the full list of the available
2382 APIs see L<perlapi>.
2383
2384 =item *
2385
2386 Made possible to propagate customised exceptions via croak()ing.
2387
2388 =item *
2389
2390 Now xsubs can have attributes just like subs.  (Well, at least the
2391 built-in attributes.)
2392
2393 =item *
2394
2395 dTHR and djSP have been obsoleted; the former removed (because it's
2396 a no-op) and the latter replaced with dSP.
2397
2398 =item *
2399
2400 PERL_OBJECT has been completely removed.
2401
2402 =item *
2403
2404 The MAGIC constants (e.g. C<'P'>) have been macrofied
2405 (e.g. C<PERL_MAGIC_TIED>) for better source code readability
2406 and maintainability.
2407
2408 =item *
2409
2410 The regex compiler now maintains a structure that identifies nodes in
2411 the compiled bytecode with the corresponding syntactic features of the
2412 original regex expression.  The information is attached to the new
2413 C<offsets> member of the C<struct regexp>. See L<perldebguts> for more
2414 complete information.
2415
2416 =item *
2417
2418 The C code has been made much more C<gcc -Wall> clean.  Some warning
2419 messages still remain in some platforms, so if you are compiling with
2420 gcc you may see some warnings about dubious practices.  The warnings
2421 are being worked on.
2422
2423 =item *
2424
2425 F<perly.c>, F<sv.c>, and F<sv.h> have now been extensively commented.
2426
2427 =item *
2428
2429 Documentation on how to use the Perl source repository has been added
2430 to F<Porting/repository.pod>.
2431
2432 =item *
2433
2434 There are now several profiling make targets.
2435
2436 =back
2437
2438 =head1 Security Vulnerability Closed
2439
2440 (This change was already made in 5.7.0 but bears repeating here.)
2441
2442 A potential security vulnerability in the optional suidperl component
2443 of Perl was identified in August 2000.  suidperl is neither built nor
2444 installed by default.  As of November 2001 the only known vulnerable
2445 platform is Linux, most likely all Linux distributions.  CERT and
2446 various vendors and distributors have been alerted about the vulnerability.
2447 See http://www.cpan.org/src/5.0/sperl-2000-08-05/sperl-2000-08-05.txt
2448 for more information.
2449
2450 The problem was caused by Perl trying to report a suspected security
2451 exploit attempt using an external program, /bin/mail.  On Linux
2452 platforms the /bin/mail program had an undocumented feature which
2453 when combined with suidperl gave access to a root shell, resulting in
2454 a serious compromise instead of reporting the exploit attempt.  If you
2455 don't have /bin/mail, or if you have 'safe setuid scripts', or if
2456 suidperl is not installed, you are safe.
2457
2458 The exploit attempt reporting feature has been completely removed from
2459 Perl 5.8.0 (and the maintenance release 5.6.1, and it was removed also
2460 from all the Perl 5.7 releases), so that particular vulnerability
2461 isn't there anymore.  However, further security vulnerabilities are,
2462 unfortunately, always possible.  The suidperl functionality is most
2463 probably going to be removed in Perl 5.10.  In any case, suidperl
2464 should only be used by security experts who know exactly what they are
2465 doing and why they are using suidperl instead of some other solution
2466 such as sudo (see http://www.courtesan.com/sudo/).
2467
2468 =head1 New Tests
2469
2470 Several new tests have been added, especially for the F<lib>
2471 subsection.  There are now about 34 000 individual tests (spread over
2472 about 530 test scripts), in the regression suite (5.6.1 has about
2473 11700 tests, in 258 test scripts) Many of the new tests are introduced
2474 by the new modules, but still in general Perl is now more thoroughly
2475 tested.
2476
2477 Because of the large number of tests, running the regression suite
2478 will take considerably longer time than it used to: expect the suite
2479 to take up to 4-5 times longer to run than in perl 5.6.  In a really
2480 fast machine you can hope to finish the suite in about 5 minutes
2481 (wallclock time).
2482
2483 The tests are now reported in a different order than in earlier Perls.
2484 (This happens because the test scripts from under t/lib have been moved
2485 to be closer to the library/extension they are testing.)
2486
2487 =head1 Known Problems
2488
2489 =head2 AIX
2490
2491 =over 4
2492
2493 =item *
2494
2495 In AIX 4.2 Perl extensions that use C++ functions that use statics
2496 may have problems in that the statics are not getting initialized.
2497 In newer AIX releases this has been solved by linking Perl with
2498 the libC_r library, but unfortunately in AIX 4.2 the said library
2499 has an obscure bug where the various functions related to time
2500 (such as time() and gettimeofday()) return broken values, and
2501 therefore in AIX 4.2 Perl is not linked against the libC_r.
2502
2503 =item *
2504
2505 vac 5.0.0.0 May Produce Buggy Code For Perl
2506
2507 The AIX C compiler vac version 5.0.0.0 may produce buggy code,
2508 resulting in few random tests failing, but when the failing tests
2509 are run by hand, they succeed.  We suggest upgrading to at least
2510 vac version 5.0.1.0, that has been known to compile Perl correctly.
2511 "lslpp -L|grep vac.C" will tell you the vac version.
2512
2513 =back
2514
2515 =head2 Amiga Perl Invoking Mystery
2516
2517 One cannot call Perl using the C<volume:> syntax, that is, C<perl -v>
2518 works, but for example C<bin:perl -v> doesn't.  The exact reason isn't
2519 known but the current suspect is the F<ixemul> library.
2520
2521 =head2 lib/ftmp-security tests warn 'system possibly insecure'
2522
2523 Don't panic.  Read INSTALL 'make test' section instead.
2524
2525 =head2 Cygwin intermittent failures of lib/Memoize/t/expire_file 11 and 12
2526
2527 The subtests 11 and 12 sometimes fail and sometimes work.
2528
2529 =head2 FreeBSD 4.5 fails lib/File/Spec/t/rel2abs2rel.t
2530
2531 F<lib/File/Spec/t/rel2abs2rel.t> tests that "`` works" by running a
2532 a perl 1 liner in backticks, using "$^X" as the path to perl.
2533 It is failing on FreeBSD 4.5, but only when run as part of make test.
2534 This seems to be a kernel problem rather than perl - reading the symlink
2535 F</proc/curproc/file> returns "unknown" rather than the path to perl, and a
2536 kernel debugger reveals that variable C<numfullpathfail2> in
2537 F</usr/src/sys/kern/vfs_cache.c> is being incremented whenever
2538 F</proc/curproc/file> fails to return the perl executable's path.
2539
2540 =head2 HP-UX lib/io_multihomed Fails When LP64-Configured
2541
2542 The lib/io_multihomed test may hang in HP-UX if Perl has been
2543 configured to be 64-bit. Because other 64-bit platforms do not hang in
2544 this test, HP-UX is suspect. All other tests pass in 64-bit HP-UX. The
2545 test attempts to create and connect to "multihomed" sockets (sockets
2546 which have multiple IP addresses).
2547
2548 =head2  HP-UX lib/posix Subtest 9 Fails When LP64-Configured
2549
2550 If perl is configured with -Duse64bitall, the successful result of the
2551 subtest 10 of lib/posix may arrive before the successful result of the
2552 subtest 9, which confuses the test harness so much that it thinks the
2553 subtest 9 failed.
2554
2555 =head2 Linux With Sfio Fails op/misc Test 48
2556
2557 No known fix.
2558
2559 =head2 Mac OS X
2560
2561 The following tests are known to fail:
2562
2563  Failed Test                 Stat Wstat Total Fail  Failed  List of Failed
2564  -------------------------------------------------------------------------
2565  ../ext/DB_File/t/db-btree.t    0    11    ??   ??       %  ??
2566  ../ext/DB_File/t/db-recno.t              149    3   2.01%  61 63 65
2567  ../ext/POSIX/t/posix.t                    31    1   3.23%  10
2568  ../lib/warnings.t                        450    1   0.22%  316
2569
2570 =head2 OS/390
2571
2572 OS/390 has rather many test failures but the situation is actually
2573 better than it was in 5.6.0, it's just that so many new modules and
2574 tests have been added.
2575
2576  Failed Test                     Stat Wstat Total Fail  Failed  List of Failed
2577  -----------------------------------------------------------------------------
2578  ../ext/B/Deparse.t                            14    1   7.14%  14
2579  ../ext/B/Showlex.t                             1    1 100.00%  1
2580  ../ext/Encode/Encode/Tcl.t                   610   13   2.13%  592 594 596 598
2581                                                                 600 602 604-610
2582  ../ext/IO/lib/IO/t/io_unix.t     113 28928     5    3  60.00%  3-5
2583  ../ext/POSIX/POSIX.t                          29    1   3.45%  14
2584  ../ext/Storable/t/lock.t         255 65280     5    3  60.00%  3-5
2585  ../lib/locale.t                  129 33024   117   19  16.24%  99-117
2586  ../lib/warnings.t                            434    1   0.23%  75
2587  ../lib/ExtUtils.t                             27    1   3.70%  25
2588  ../lib/Math/BigInt/t/bigintpm.t             1190    1   0.08%  1145
2589  ../lib/Unicode/UCD.t                          81   48  59.26%  1-16 49-64 66-81
2590  ../lib/User/pwent.t                            9    1  11.11%  4
2591  op/pat.t                                     660    6   0.91%  242-243 424-425
2592                                                                 626-627
2593  op/split.t                         0     9    ??   ??       %  ??
2594  op/taint.t                                   174    3   1.72%  156 162 168
2595  op/tr.t                                       70    3   4.29%  50 58-59
2596  Failed 16/422 test scripts, 96.21% okay. 105/23251 subtests failed, 99.55% okay.
2597
2598 =head2 op/sprintf tests 129 and 130
2599
2600 The op/sprintf tests 129 and 130 are known to fail on some platforms.
2601 Examples include any platform using sfio, and Compaq/Tandem's NonStop-UX.
2602 The failing platforms do not comply with the ANSI C Standard, line
2603 19ff on page 134 of ANSI X3.159 1989 to be exact.  (They produce
2604 something other than "1" and "-1" when formatting 0.6 and -0.6 using
2605 the printf format "%.0f", most often they produce "0" and "-0".)
2606
2607 =head2  Failure of Thread tests
2608
2609 B<Note that support for 5.005-style threading remains experimental
2610 and practically unsupported.>
2611
2612 The following tests are known to fail due to fundamental problems in
2613 the 5.005 threading implementation. These are not new failures--Perl
2614 5.005_0x has the same bugs, but didn't have these tests.
2615
2616   ext/List/Util/t/first         2
2617   lib/autouse                   4
2618   ext/Thread/thr5005            19-20
2619
2620 These failures are unlikely to get fixed.
2621
2622 =head2 UNICOS
2623
2624 =over 4
2625
2626 =item *
2627
2628 ext/POSIX/sigaction subtests 6 and 13 may fail.
2629
2630 =item *
2631
2632 lib/ExtUtils may spuriously claim that subtest 28 failed,
2633 which is interesting since the test only has 27 tests.
2634
2635 =item *
2636
2637 Numerous numerical test failures
2638
2639   op/numconvert                 209,210,217,218
2640   op/override                   7
2641   ext/Time/HiRes/HiRes          9
2642   lib/Math/BigInt/t/bigintpm    1145
2643   lib/Math/Trig                 25
2644
2645 These tests fail because of yet unresolved floating point inaccuracies.
2646
2647 =back
2648
2649 =head2 UNICOS and UNICOS/mk
2650
2651 The io/fs test #31 is failing because in UNICOS and UNICOS/mk
2652 truncate() cannot be used to grow the size of filehandles, only
2653 to reduce the size.  The workaround is to truncate files instead
2654 of filehandles.
2655
2656 =head2 UTS
2657
2658 There are a few known test failures, see L<perluts>.
2659
2660 =head2 VMS
2661
2662 There should be no reported test failures with a default configuration,
2663 though there are a number of tests marked TODO that point to areas
2664 needing further debugging and/or porting work.
2665
2666 =head2 Win32
2667
2668 In multi-CPU boxes there are some problems with the I/O buffering:
2669 some output may appear twice.
2670
2671 =head2 Localising a Tied Variable Leaks Memory
2672
2673     use Tie::Hash;
2674     tie my %tie_hash => 'Tie::StdHash';
2675
2676     ...
2677
2678     local($tie_hash{Foo}) = 1; # leaks
2679
2680 Code like the above is known to leak memory every time the local()
2681 is executed.
2682
2683 =head2 Localising Tied Arrays and Hashes Is Broken
2684
2685     local %tied_array;
2686
2687 doesn't work as one would expect: the old value is restored
2688 incorrectly.
2689
2690 =head2 Self-tying of Arrays and Hashes Is Forbidden
2691
2692 Self-tying of arrays and hashes is broken in rather deep and
2693 hard-to-fix ways.  As a stop-gap measure to avoid people from getting
2694 frustrated at the mysterious results (core dumps, most often) it is
2695 for now forbidden (you will get a fatal error even from an attempt).
2696
2697 =head2 Building Extensions Can Fail Because Of Largefiles
2698
2699 Some extensions like mod_perl are known to have issues with
2700 `largefiles', a change brought by Perl 5.6.0 in which file offsets
2701 default to 64 bits wide, where supported.  Modules may fail to compile
2702 at all or compile and work incorrectly.  Currently there is no good
2703 solution for the problem, but Configure now provides appropriate
2704 non-largefile ccflags, ldflags, libswanted, and libs in the %Config
2705 hash (e.g., $Config{ccflags_nolargefiles}) so the extensions that are
2706 having problems can try configuring themselves without the
2707 largefileness.  This is admittedly not a clean solution, and the
2708 solution may not even work at all.  One potential failure is whether
2709 one can (or, if one can, whether it's a good idea) link together at
2710 all binaries with different ideas about file offsets, all this is
2711 platform-dependent.
2712
2713 =head2 Unicode Support on EBCDIC Still Spotty
2714
2715 Though mostly working, Unicode support still has problem spots on
2716 EBCDIC platforms.  One such known spot are the C<\p{}> and C<\P{}>
2717 regular expression constructs for code points less than 256: the
2718 pP are testing for Unicode code points, not knowing about EBCDIC.
2719
2720 =head2 The Compiler Suite Is Still Experimental
2721
2722 The compiler suite is slowly getting better but it continues to be
2723 highly experimental.  Use in production environments is discouraged.
2724
2725 =head2 The Long Double Support Is Still Experimental
2726
2727 The ability to configure Perl's numbers to use "long doubles",
2728 floating point numbers of hopefully better accuracy, is still
2729 experimental.  The implementations of long doubles are not yet
2730 widespread and the existing implementations are not quite mature
2731 or standardised, therefore trying to support them is a rare
2732 and moving target.  The gain of more precision may also be offset
2733 by slowdown in computations (more bits to move around, and the
2734 operations are more likely to be executed by less optimised
2735 libraries).
2736
2737 =head2 Seen In Perl 5.7 But Gone Now
2738
2739 C<Time::Piece> (previously known as C<Time::Object>) was removed
2740 because it was felt that it didn't have enough value in it to be a
2741 core module.  It is still a useful module, though, and is available
2742 from the CPAN.
2743
2744 =head1 Reporting Bugs
2745
2746 If you find what you think is a bug, you might check the articles
2747 recently posted to the comp.lang.perl.misc newsgroup and the perl
2748 bug database at http://bugs.perl.org.  There may also be
2749 information at http://www.perl.com/, the Perl Home Page.
2750
2751 If you believe you have an unreported bug, please run the B<perlbug>
2752 program included with your release.  Be sure to trim your bug down
2753 to a tiny but sufficient test case.  Your bug report, along with the
2754 output of C<perl -V>, will be sent off to perlbug@perl.org to be
2755 analysed by the Perl porting team.
2756
2757 =head1 SEE ALSO
2758
2759 The F<Changes> file for exhaustive details on what changed.
2760
2761 The F<INSTALL> file for how to build Perl.
2762
2763 The F<README> file for general stuff.
2764
2765 The F<Artistic> and F<Copying> files for copyright information.
2766
2767 =head1 HISTORY
2768
2769 Written by Jarkko Hietaniemi <F<jhi@iki.fi>>.
2770
2771 =cut