collapse threading doc changes as suggested by Nicholas, adding in notes on the addit...
[p5sagit/p5-mst-13.2.git] / pod / perl5100delta.pod
1 =encoding utf8
2
3 =head1 NAME
4
5 perl5100delta - what is new for perl 5.10.0
6
7 =head1 DESCRIPTION
8
9 This document describes the differences between the 5.8.8 release and
10 the 5.10.0 release.
11
12 Many of the bug fixes in 5.10.0 were already seen in the 5.8.X maintenance
13 releases; they are not duplicated here and are documented in the set of
14 man pages named perl58[1-8]?delta.
15
16 =head1 Core Enhancements
17
18 =head2 The C<feature> pragma
19
20 The C<feature> pragma is used to enable new syntax that would break Perl's
21 backwards-compatibility with older releases of the language. It's a lexical
22 pragma, like C<strict> or C<warnings>.
23
24 Currently the following new features are available: C<switch> (adds a
25 switch statement), C<say> (adds a C<say> built-in function), and C<state>
26 (adds a C<state> keyword for declaring "static" variables). Those
27 features are described in their own sections of this document.
28
29 The C<feature> pragma is also implicitly loaded when you require a minimal
30 perl version (with the C<use VERSION> construct) greater than, or equal
31 to, 5.9.5. See L<feature> for details.
32
33 =head2 New B<-E> command-line switch
34
35 B<-E> is equivalent to B<-e>, but it implicitly enables all
36 optional features (like C<use feature ":5.10">).
37
38 =head2 Defined-or operator
39
40 A new operator C<//> (defined-or) has been implemented.
41 The following expression:
42
43     $a // $b
44
45 is merely equivalent to
46
47    defined $a ? $a : $b
48
49 and the statement
50
51    $c //= $d;
52
53 can now be used instead of
54
55    $c = $d unless defined $c;
56
57 The C<//> operator has the same precedence and associativity as C<||>.
58 Special care has been taken to ensure that this operator Do What You Mean
59 while not breaking old code, but some edge cases involving the empty
60 regular expression may now parse differently.  See L<perlop> for
61 details.
62
63 =head2 Switch and Smart Match operator
64
65 Perl 5 now has a switch statement. It's available when C<use feature
66 'switch'> is in effect. This feature introduces three new keywords,
67 C<given>, C<when>, and C<default>:
68
69     given ($foo) {
70         when (/^abc/) { $abc = 1; }
71         when (/^def/) { $def = 1; }
72         when (/^xyz/) { $xyz = 1; }
73         default { $nothing = 1; }
74     }
75
76 A more complete description of how Perl matches the switch variable
77 against the C<when> conditions is given in L<perlsyn/"Switch statements">.
78
79 This kind of match is called I<smart match>, and it's also possible to use
80 it outside of switch statements, via the new C<~~> operator. See
81 L<perlsyn/"Smart matching in detail">.
82
83 This feature was contributed by Robin Houston.
84
85 =head2 Regular expressions
86
87 =over 4
88
89 =item Recursive Patterns
90
91 It is now possible to write recursive patterns without using the C<(??{})>
92 construct. This new way is more efficient, and in many cases easier to
93 read.
94
95 Each capturing parenthesis can now be treated as an independent pattern
96 that can be entered by using the C<(?PARNO)> syntax (C<PARNO> standing for
97 "parenthesis number"). For example, the following pattern will match
98 nested balanced angle brackets:
99
100     /
101      ^                      # start of line
102      (                      # start capture buffer 1
103         <                   #   match an opening angle bracket
104         (?:                 #   match one of:
105             (?>             #     don't backtrack over the inside of this group
106                 [^<>]+      #       one or more non angle brackets
107             )               #     end non backtracking group
108         |                   #     ... or ...
109             (?1)            #     recurse to bracket 1 and try it again
110         )*                  #   0 or more times.
111         >                   #   match a closing angle bracket
112      )                      # end capture buffer one
113      $                      # end of line
114     /x
115
116 PCRE users should note that Perl's recursive regex feature allows
117 backtracking into a recursed pattern, whereas in PCRE the recursion is
118 atomic or "possessive" in nature.  As in the example above, you can
119 add (?>) to control this selectively.  (Yves Orton)
120
121 =item Named Capture Buffers
122
123 It is now possible to name capturing parenthesis in a pattern and refer to
124 the captured contents by name. The naming syntax is C<< (?<NAME>....) >>.
125 It's possible to backreference to a named buffer with the C<< \k<NAME> >>
126 syntax. In code, the new magical hashes C<%+> and C<%-> can be used to
127 access the contents of the capture buffers.
128
129 Thus, to replace all doubled chars with a single copy, one could write
130
131     s/(?<letter>.)\k<letter>/$+{letter}/g
132
133 Only buffers with defined contents will be "visible" in the C<%+> hash, so
134 it's possible to do something like
135
136     foreach my $name (keys %+) {
137         print "content of buffer '$name' is $+{$name}\n";
138     }
139
140 The C<%-> hash is a bit more complete, since it will contain array refs
141 holding values from all capture buffers similarly named, if there should
142 be many of them.
143
144 C<%+> and C<%-> are implemented as tied hashes through the new module
145 C<Tie::Hash::NamedCapture>.
146
147 Users exposed to the .NET regex engine will find that the perl
148 implementation differs in that the numerical ordering of the buffers
149 is sequential, and not "unnamed first, then named". Thus in the pattern
150
151    /(A)(?<B>B)(C)(?<D>D)/
152
153 $1 will be 'A', $2 will be 'B', $3 will be 'C' and $4 will be 'D' and not
154 $1 is 'A', $2 is 'C' and $3 is 'B' and $4 is 'D' that a .NET programmer
155 would expect. This is considered a feature. :-) (Yves Orton)
156
157 =item Possessive Quantifiers
158
159 Perl now supports the "possessive quantifier" syntax of the "atomic match"
160 pattern. Basically a possessive quantifier matches as much as it can and never
161 gives any back. Thus it can be used to control backtracking. The syntax is
162 similar to non-greedy matching, except instead of using a '?' as the modifier
163 the '+' is used. Thus C<?+>, C<*+>, C<++>, C<{min,max}+> are now legal
164 quantifiers. (Yves Orton)
165
166 =item Backtracking control verbs
167
168 The regex engine now supports a number of special-purpose backtrack
169 control verbs: (*THEN), (*PRUNE), (*MARK), (*SKIP), (*COMMIT), (*FAIL)
170 and (*ACCEPT). See L<perlre> for their descriptions. (Yves Orton)
171
172 =item Relative backreferences
173
174 A new syntax C<\g{N}> or C<\gN> where "N" is a decimal integer allows a
175 safer form of back-reference notation as well as allowing relative
176 backreferences. This should make it easier to generate and embed patterns
177 that contain backreferences. See L<perlre/"Capture buffers">. (Yves Orton)
178
179 =item C<\K> escape
180
181 The functionality of Jeff Pinyan's module Regexp::Keep has been added to
182 the core. In regular expressions you can now use the special escape C<\K>
183 as a way to do something like floating length positive lookbehind. It is
184 also useful in substitutions like:
185
186   s/(foo)bar/$1/g
187
188 that can now be converted to
189
190   s/foo\Kbar//g
191
192 which is much more efficient. (Yves Orton)
193
194 =item Vertical and horizontal whitespace, and linebreak
195
196 Regular expressions now recognize the C<\v> and C<\h> escapes that match
197 vertical and horizontal whitespace, respectively. C<\V> and C<\H>
198 logically match their complements.
199
200 C<\R> matches a generic linebreak, that is, vertical whitespace, plus
201 the multi-character sequence C<"\x0D\x0A">.
202
203 =back
204
205 =head2 C<say()>
206
207 say() is a new built-in, only available when C<use feature 'say'> is in
208 effect, that is similar to print(), but that implicitly appends a newline
209 to the printed string. See L<perlfunc/say>. (Robin Houston)
210
211 =head2 Lexical C<$_>
212
213 The default variable C<$_> can now be lexicalized, by declaring it like
214 any other lexical variable, with a simple
215
216     my $_;
217
218 The operations that default on C<$_> will use the lexically-scoped
219 version of C<$_> when it exists, instead of the global C<$_>.
220
221 In a C<map> or a C<grep> block, if C<$_> was previously my'ed, then the
222 C<$_> inside the block is lexical as well (and scoped to the block).
223
224 In a scope where C<$_> has been lexicalized, you can still have access to
225 the global version of C<$_> by using C<$::_>, or, more simply, by
226 overriding the lexical declaration with C<our $_>. (Rafael Garcia-Suarez)
227
228 =head2 The C<_> prototype
229
230 A new prototype character has been added. C<_> is equivalent to C<$> but
231 defaults to C<$_> if the corresponding argument isn't supplied (both C<$>
232 and C<_> denote a scalar). Due to the optional nature of the argument, 
233 you can only use it at the end of a prototype, or before a semicolon.
234
235 This has a small incompatible consequence: the prototype() function has
236 been adjusted to return C<_> for some built-ins in appropriate cases (for
237 example, C<prototype('CORE::rmdir')>). (Rafael Garcia-Suarez)
238
239 =head2 UNITCHECK blocks
240
241 C<UNITCHECK>, a new special code block has been introduced, in addition to
242 C<BEGIN>, C<CHECK>, C<INIT> and C<END>.
243
244 C<CHECK> and C<INIT> blocks, while useful for some specialized purposes,
245 are always executed at the transition between the compilation and the
246 execution of the main program, and thus are useless whenever code is
247 loaded at runtime. On the other hand, C<UNITCHECK> blocks are executed
248 just after the unit which defined them has been compiled. See L<perlmod>
249 for more information. (Alex Gough)
250
251 =head2 New Pragma, C<mro>
252
253 A new pragma, C<mro> (for Method Resolution Order) has been added. It
254 permits to switch, on a per-class basis, the algorithm that perl uses to
255 find inherited methods in case of a multiple inheritance hierarchy. The
256 default MRO hasn't changed (DFS, for Depth First Search). Another MRO is
257 available: the C3 algorithm. See L<mro> for more information.
258 (Brandon Black)
259
260 Note that, due to changes in the implementation of class hierarchy search,
261 code that used to undef the C<*ISA> glob will most probably break. Anyway,
262 undef'ing C<*ISA> had the side-effect of removing the magic on the @ISA
263 array and should not have been done in the first place. Also, the
264 cache C<*::ISA::CACHE::> no longer exists; to force reset the @ISA cache,
265 you now need to use the C<mro> API, or more simply to assign to @ISA
266 (e.g. with C<@ISA = @ISA>).
267
268 =head2 readdir() may return a "short filename" on Windows
269
270 The readdir() function may return a "short filename" when the long
271 filename contains characters outside the ANSI codepage.  Similarly
272 Cwd::cwd() may return a short directory name, and glob() may return short
273 names as well.  On the NTFS file system these short names can always be
274 represented in the ANSI codepage.  This will not be true for all other file
275 system drivers; e.g. the FAT filesystem stores short filenames in the OEM
276 codepage, so some files on FAT volumes remain unaccessible through the
277 ANSI APIs.
278
279 Similarly, $^X, @INC, and $ENV{PATH} are preprocessed at startup to make
280 sure all paths are valid in the ANSI codepage (if possible).
281
282 The Win32::GetLongPathName() function now returns the UTF-8 encoded
283 correct long file name instead of using replacement characters to force
284 the name into the ANSI codepage.  The new Win32::GetANSIPathName()
285 function can be used to turn a long pathname into a short one only if the
286 long one cannot be represented in the ANSI codepage.
287
288 Many other functions in the C<Win32> module have been improved to accept
289 UTF-8 encoded arguments.  Please see L<Win32> for details.
290
291 =head2 readpipe() is now overridable
292
293 The built-in function readpipe() is now overridable. Overriding it permits
294 also to override its operator counterpart, C<qx//> (a.k.a. C<``>).
295 Moreover, it now defaults to C<$_> if no argument is provided. (Rafael
296 Garcia-Suarez)
297
298 =head2 Default argument for readline()
299
300 readline() now defaults to C<*ARGV> if no argument is provided. (Rafael
301 Garcia-Suarez)
302
303 =head2 state() variables
304
305 A new class of variables has been introduced. State variables are similar
306 to C<my> variables, but are declared with the C<state> keyword in place of
307 C<my>. They're visible only in their lexical scope, but their value is
308 persistent: unlike C<my> variables, they're not undefined at scope entry,
309 but retain their previous value. (Rafael Garcia-Suarez, Nicholas Clark)
310
311 To use state variables, one needs to enable them by using
312
313     use feature 'state';
314
315 or by using the C<-E> command-line switch in one-liners.
316 See L<perlsub/"Persistent Private Variables">.
317
318 =head2 Stacked filetest operators
319
320 As a new form of syntactic sugar, it's now possible to stack up filetest
321 operators. You can now write C<-f -w -x $file> in a row to mean
322 C<-x $file && -w _ && -f _>. See L<perlfunc/-X>.
323
324 =head2 UNIVERSAL::DOES()
325
326 The C<UNIVERSAL> class has a new method, C<DOES()>. It has been added to
327 solve semantic problems with the C<isa()> method. C<isa()> checks for
328 inheritance, while C<DOES()> has been designed to be overridden when
329 module authors use other types of relations between classes (in addition
330 to inheritance). (chromatic)
331
332 See L<< UNIVERSAL/"$obj->DOES( ROLE )" >>.
333
334 =head2 Formats
335
336 Formats were improved in several ways. A new field, C<^*>, can be used for
337 variable-width, one-line-at-a-time text. Null characters are now handled
338 correctly in picture lines. Using C<@#> and C<~~> together will now
339 produce a compile-time error, as those format fields are incompatible.
340 L<perlform> has been improved, and miscellaneous bugs fixed.
341
342 =head2 Byte-order modifiers for pack() and unpack()
343
344 There are two new byte-order modifiers, C<E<gt>> (big-endian) and C<E<lt>>
345 (little-endian), that can be appended to most pack() and unpack() template
346 characters and groups to force a certain byte-order for that type or group.
347 See L<perlfunc/pack> and L<perlpacktut> for details.
348
349 =head2 C<no VERSION>
350
351 You can now use C<no> followed by a version number to specify that you
352 want to use a version of perl older than the specified one.
353
354 =head2 C<chdir>, C<chmod> and C<chown> on filehandles
355
356 C<chdir>, C<chmod> and C<chown> can now work on filehandles as well as
357 filenames, if the system supports respectively C<fchdir>, C<fchmod> and
358 C<fchown>, thanks to a patch provided by Gisle Aas.
359
360 =head2 OS groups
361
362 C<$(> and C<$)> now return groups in the order where the OS returns them,
363 thanks to Gisle Aas. This wasn't previously the case.
364
365 =head2 Recursive sort subs
366
367 You can now use recursive subroutines with sort(), thanks to Robin Houston.
368
369 =head2 Exceptions in constant folding
370
371 The constant folding routine is now wrapped in an exception handler, and
372 if folding throws an exception (such as attempting to evaluate 0/0), perl
373 now retains the current optree, rather than aborting the whole program.
374 Without this change, programs would not compile if they had expressions that
375 happened to generate exceptions, even though those expressions were in code
376 that could never be reached at runtime. (Nicholas Clark, Dave Mitchell)
377
378 =head2 Source filters in @INC
379
380 It's possible to enhance the mechanism of subroutine hooks in @INC by
381 adding a source filter on top of the filehandle opened and returned by the
382 hook. This feature was planned a long time ago, but wasn't quite working
383 until now. See L<perlfunc/require> for details. (Nicholas Clark)
384
385 =head2 New internal variables
386
387 =over 4
388
389 =item C<${^RE_DEBUG_FLAGS}>
390
391 This variable controls what debug flags are in effect for the regular
392 expression engine when running under C<use re "debug">. See L<re> for
393 details.
394
395 =item C<${^CHILD_ERROR_NATIVE}>
396
397 This variable gives the native status returned by the last pipe close,
398 backtick command, successful call to wait() or waitpid(), or from the
399 system() operator. See L<perlvar> for details. (Contributed by Gisle Aas.)
400
401 =item C<${^RE_TRIE_MAXBUF}>
402
403 See L</"Trie optimisation of literal string alternations">.
404
405 =item C<${^WIN32_SLOPPY_STAT}>
406
407 See L</"Sloppy stat on Windows">.
408
409 =back
410
411 =head2 Miscellaneous
412
413 C<unpack()> now defaults to unpacking the C<$_> variable.
414
415 C<mkdir()> without arguments now defaults to C<$_>.
416
417 The internal dump output has been improved, so that non-printable characters
418 such as newline and backspace are output in C<\x> notation, rather than
419 octal.
420
421 The B<-C> option can no longer be used on the C<#!> line. It wasn't
422 working there anyway, since the standard streams are already set up
423 at this point in the execution of the perl interpreter. You can use
424 binmode() instead to get the desired behaviour.
425
426 =head2 UCD 5.0.0
427
428 The copy of the Unicode Character Database included in Perl 5 has
429 been updated to version 5.0.0.
430
431 =head2 MAD
432
433 MAD, which stands for I<Miscellaneous Attribute Decoration>, is a
434 still-in-development work leading to a Perl 5 to Perl 6 converter. To
435 enable it, it's necessary to pass the argument C<-Dmad> to Configure. The
436 obtained perl isn't binary compatible with a regular perl 5.10, and has
437 space and speed penalties; moreover not all regression tests still pass
438 with it. (Larry Wall, Nicholas Clark)
439
440 =head2 kill() on Windows
441
442 On Windows platforms, C<kill(-9, $pid)> now kills a process tree.
443 (On Unix, this delivers the signal to all processes in the same process
444 group.)
445
446 =head1 Incompatible Changes
447
448 =head2 Packing and UTF-8 strings
449
450 The semantics of pack() and unpack() regarding UTF-8-encoded data has been
451 changed. Processing is now by default character per character instead of
452 byte per byte on the underlying encoding. Notably, code that used things
453 like C<pack("a*", $string)> to see through the encoding of string will now
454 simply get back the original $string. Packed strings can also get upgraded
455 during processing when you store upgraded characters. You can get the old
456 behaviour by using C<use bytes>.
457
458 To be consistent with pack(), the C<C0> in unpack() templates indicates
459 that the data is to be processed in character mode, i.e. character by
460 character; on the contrary, C<U0> in unpack() indicates UTF-8 mode, where
461 the packed string is processed in its UTF-8-encoded Unicode form on a byte
462 by byte basis. This is reversed with regard to perl 5.8.X, but now consistent
463 between pack() and unpack().
464
465 Moreover, C<C0> and C<U0> can also be used in pack() templates to specify
466 respectively character and byte modes.
467
468 C<C0> and C<U0> in the middle of a pack or unpack format now switch to the
469 specified encoding mode, honoring parens grouping. Previously, parens were
470 ignored.
471
472 Also, there is a new pack() character format, C<W>, which is intended to
473 replace the old C<C>. C<C> is kept for unsigned chars coded as bytes in
474 the strings internal representation. C<W> represents unsigned (logical)
475 character values, which can be greater than 255. It is therefore more
476 robust when dealing with potentially UTF-8-encoded data (as C<C> will wrap
477 values outside the range 0..255, and not respect the string encoding).
478
479 In practice, that means that pack formats are now encoding-neutral, except
480 C<C>.
481
482 For consistency, C<A> in unpack() format now trims all Unicode whitespace
483 from the end of the string. Before perl 5.9.2, it used to strip only the
484 classical ASCII space characters.
485
486 =head2 Byte/character count feature in unpack()
487
488 A new unpack() template character, C<".">, returns the number of bytes or
489 characters (depending on the selected encoding mode, see above) read so far.
490
491 =head2 The C<$*> and C<$#> variables have been removed
492
493 C<$*>, which was deprecated in favor of the C</s> and C</m> regexp
494 modifiers, has been removed.
495
496 The deprecated C<$#> variable (output format for numbers) has been
497 removed.
498
499 Two new severe warnings, C<$#/$* is no longer supported>, have been added.
500
501 =head2 substr() lvalues are no longer fixed-length
502
503 The lvalues returned by the three argument form of substr() used to be a
504 "fixed length window" on the original string. In some cases this could
505 cause surprising action at distance or other undefined behaviour. Now the
506 length of the window adjusts itself to the length of the string assigned to
507 it.
508
509 =head2 Parsing of C<-f _>
510
511 The identifier C<_> is now forced to be a bareword after a filetest
512 operator. This solves a number of misparsing issues when a global C<_>
513 subroutine is defined.
514
515 =head2 C<:unique>
516
517 The C<:unique> attribute has been made a no-op, since its current
518 implementation was fundamentally flawed and not threadsafe.
519
520 =head2 Effect of pragmas in eval
521
522 The compile-time value of the C<%^H> hint variable can now propagate into
523 eval("")uated code. This makes it more useful to implement lexical
524 pragmas.
525
526 As a side-effect of this, the overloaded-ness of constants now propagates
527 into eval("").
528
529 =head2 chdir FOO
530
531 A bareword argument to chdir() is now recognized as a file handle.
532 Earlier releases interpreted the bareword as a directory name.
533 (Gisle Aas)
534
535 =head2 Handling of .pmc files
536
537 An old feature of perl was that before C<require> or C<use> look for a
538 file with a F<.pm> extension, they will first look for a similar filename
539 with a F<.pmc> extension. If this file is found, it will be loaded in
540 place of any potentially existing file ending in a F<.pm> extension.
541
542 Previously, F<.pmc> files were loaded only if more recent than the
543 matching F<.pm> file. Starting with 5.9.4, they'll be always loaded if
544 they exist.
545
546 =head2 $^V is now a C<version> object instead of a v-string
547
548 $^V can still be used with the C<%vd> format in printf, but any
549 character-level operations will now access the string representation
550 of the C<version> object and not the ordinals of a v-string.
551 Expressions like C<< substr($^V, 0, 2) >> or C<< split //, $^V >>
552 no longer work and must be rewritten.
553
554 =head2 @- and @+ in patterns
555
556 The special arrays C<@-> and C<@+> are no longer interpolated in regular
557 expressions. (Sadahiro Tomoyuki)
558
559 =head2 $AUTOLOAD can now be tainted
560
561 If you call a subroutine by a tainted name, and if it defers to an
562 AUTOLOAD function, then $AUTOLOAD will be (correctly) tainted.
563 (Rick Delaney)
564
565 =head2 Tainting and printf
566
567 When perl is run under taint mode, C<printf()> and C<sprintf()> will now
568 reject any tainted format argument. (Rafael Garcia-Suarez)
569
570 =head2 undef and signal handlers
571
572 Undefining or deleting a signal handler via C<undef $SIG{FOO}> is now
573 equivalent to setting it to C<'DEFAULT'>. (Rafael Garcia-Suarez)
574
575 =head2 strictures and dereferencing in defined()
576
577 C<use strict 'refs'> was ignoring taking a hard reference in an argument
578 to defined(), as in :
579
580     use strict 'refs';
581     my $x = 'foo';
582     if (defined $$x) {...}
583
584 This now correctly produces the run-time error C<Can't use string as a
585 SCALAR ref while "strict refs" in use>.
586
587 C<defined @$foo> and C<defined %$bar> are now also subject to C<strict
588 'refs'> (that is, C<$foo> and C<$bar> shall be proper references there.)
589 (C<defined(@foo)> and C<defined(%bar)> are discouraged constructs anyway.)
590 (Nicholas Clark)
591
592 =head2 C<(?p{})> has been removed
593
594 The regular expression construct C<(?p{})>, which was deprecated in perl
595 5.8, has been removed. Use C<(??{})> instead. (Rafael Garcia-Suarez)
596
597 =head2 Pseudo-hashes have been removed
598
599 Support for pseudo-hashes has been removed from Perl 5.9. (The C<fields>
600 pragma remains here, but uses an alternate implementation.)
601
602 =head2 Removal of the bytecode compiler and of perlcc
603
604 C<perlcc>, the byteloader and the supporting modules (B::C, B::CC,
605 B::Bytecode, etc.) are no longer distributed with the perl sources. Those
606 experimental tools have never worked reliably, and, due to the lack of
607 volunteers to keep them in line with the perl interpreter developments, it
608 was decided to remove them instead of shipping a broken version of those.
609 The last version of those modules can be found with perl 5.9.4.
610
611 However the B compiler framework stays supported in the perl core, as with
612 the more useful modules it has permitted (among others, B::Deparse and
613 B::Concise).
614
615 =head2 Removal of the JPL
616
617 The JPL (Java-Perl Lingo) has been removed from the perl sources tarball.
618
619 =head2 Recursive inheritance detected earlier
620
621 Perl will now immediately throw an exception if you modify any package's
622 C<@ISA> in such a way that it would cause recursive inheritance.
623
624 Previously, the exception would not occur until Perl attempted to make
625 use of the recursive inheritance while resolving a method or doing a
626 C<$foo-E<gt>isa($bar)> lookup.
627
628 =head2 warnings::enabled and warnings::warnif changed to favor users of modules
629
630 The behaviour in 5.10.x favors the person using the module;
631 The behaviour in 5.8.x favors the module writer;
632
633 Assume the following code:
634
635   main calls Foo::Bar::baz()
636   Foo::Bar inherits from Foo::Base
637   Foo::Bar::baz() calls Foo::Base::_bazbaz()
638   Foo::Base::_bazbaz() calls: warnings::warnif('substr', 'some warning 
639 message');
640
641 On 5.8.x, the code warns when Foo::Bar contains C<use warnings;>
642 It does not matter if Foo::Base or main have warnings enabled
643 to disable the warning one has to modify Foo::Bar.
644
645 On 5.10.0 and newer, the code warns when main contains C<use warnings;>
646 It does not matter if Foo::Base or Foo::Bar have warnings enabled
647 to disable the warning one has to modify main.
648
649 =head1 Modules and Pragmata
650
651 =head2 Upgrading individual core modules
652
653 Even more core modules are now also available separately through the
654 CPAN.  If you wish to update one of these modules, you don't need to
655 wait for a new perl release.  From within the cpan shell, running the
656 'r' command will report on modules with upgrades available.  See
657 C<perldoc CPAN> for more information.
658
659 =head2 Pragmata Changes
660
661 =over 4
662
663 =item C<feature>
664
665 The new pragma C<feature> is used to enable new features that might break
666 old code. See L</"The C<feature> pragma"> above.
667
668 =item C<mro>
669
670 This new pragma enables to change the algorithm used to resolve inherited
671 methods. See L</"New Pragma, C<mro>"> above.
672
673 =item Scoping of the C<sort> pragma
674
675 The C<sort> pragma is now lexically scoped. Its effect used to be global.
676
677 =item Scoping of C<bignum>, C<bigint>, C<bigrat>
678
679 The three numeric pragmas C<bignum>, C<bigint> and C<bigrat> are now
680 lexically scoped. (Tels)
681
682 =item C<base>
683
684 The C<base> pragma now warns if a class tries to inherit from itself.
685 (Curtis "Ovid" Poe)
686
687 =item C<strict> and C<warnings>
688
689 C<strict> and C<warnings> will now complain loudly if they are loaded via
690 incorrect casing (as in C<use Strict;>). (Johan Vromans)
691
692 =item C<version>
693
694 The C<version> module provides support for version objects.
695
696 =item C<warnings>
697
698 The C<warnings> pragma doesn't load C<Carp> anymore. That means that code
699 that used C<Carp> routines without having loaded it at compile time might
700 need to be adjusted; typically, the following (faulty) code won't work
701 anymore, and will require parentheses to be added after the function name:
702
703     use warnings;
704     require Carp;
705     Carp::confess 'argh';
706
707 =item C<less>
708
709 C<less> now does something useful (or at least it tries to). In fact, it
710 has been turned into a lexical pragma. So, in your modules, you can now
711 test whether your users have requested to use less CPU, or less memory,
712 less magic, or maybe even less fat. See L<less> for more. (Joshua ben
713 Jore)
714
715 =back
716
717 =head2 New modules
718
719 =over 4
720
721 =item *
722
723 C<encoding::warnings>, by Audrey Tang, is a module to emit warnings
724 whenever an ASCII character string containing high-bit bytes is implicitly
725 converted into UTF-8. It's a lexical pragma since Perl 5.9.4; on older
726 perls, its effect is global.
727
728 =item *
729
730 C<Module::CoreList>, by Richard Clamp, is a small handy module that tells
731 you what versions of core modules ship with any versions of Perl 5. It
732 comes with a command-line frontend, C<corelist>.
733
734 =item *
735
736 C<Math::BigInt::FastCalc> is an XS-enabled, and thus faster, version of
737 C<Math::BigInt::Calc>.
738
739 =item *
740
741 C<Compress::Zlib> is an interface to the zlib compression library. It
742 comes with a bundled version of zlib, so having a working zlib is not a
743 prerequisite to install it. It's used by C<Archive::Tar> (see below).
744
745 =item *
746
747 C<IO::Zlib> is an C<IO::>-style interface to C<Compress::Zlib>.
748
749 =item *
750
751 C<Archive::Tar> is a module to manipulate C<tar> archives.
752
753 =item *
754
755 C<Digest::SHA> is a module used to calculate many types of SHA digests,
756 has been included for SHA support in the CPAN module.
757
758 =item *
759
760 C<ExtUtils::CBuilder> and C<ExtUtils::ParseXS> have been added.
761
762 =item *
763
764 C<Hash::Util::FieldHash>, by Anno Siegel, has been added. This module
765 provides support for I<field hashes>: hashes that maintain an association
766 of a reference with a value, in a thread-safe garbage-collected way.
767 Such hashes are useful to implement inside-out objects.
768
769 =item *
770
771 C<Module::Build>, by Ken Williams, has been added. It's an alternative to
772 C<ExtUtils::MakeMaker> to build and install perl modules.
773
774 =item *
775
776 C<Module::Load>, by Jos Boumans, has been added. It provides a single
777 interface to load Perl modules and F<.pl> files.
778
779 =item *
780
781 C<Module::Loaded>, by Jos Boumans, has been added. It's used to mark
782 modules as loaded or unloaded.
783
784 =item *
785
786 C<Package::Constants>, by Jos Boumans, has been added. It's a simple
787 helper to list all constants declared in a given package.
788
789 =item *
790
791 C<Win32API::File>, by Tye McQueen, has been added (for Windows builds).
792 This module provides low-level access to Win32 system API calls for
793 files/dirs.
794
795 =item *
796
797 C<Locale::Maketext::Simple>, needed by CPANPLUS, is a simple wrapper around
798 C<Locale::Maketext::Lexicon>. Note that C<Locale::Maketext::Lexicon> isn't
799 included in the perl core; the behaviour of C<Locale::Maketext::Simple>
800 gracefully degrades when the later isn't present.
801
802 =item *
803
804 C<Params::Check> implements a generic input parsing/checking mechanism. It
805 is used by CPANPLUS.
806
807 =item *
808
809 C<Term::UI> simplifies the task to ask questions at a terminal prompt.
810
811 =item *
812
813 C<Object::Accessor> provides an interface to create per-object accessors.
814
815 =item *
816
817 C<Module::Pluggable> is a simple framework to create modules that accept
818 pluggable sub-modules.
819
820 =item *
821
822 C<Module::Load::Conditional> provides simple ways to query and possibly
823 load installed modules.
824
825 =item *
826
827 C<Time::Piece> provides an object oriented interface to time functions,
828 overriding the built-ins localtime() and gmtime().
829
830 =item *
831
832 C<IPC::Cmd> helps to find and run external commands, possibly
833 interactively.
834
835 =item *
836
837 C<File::Fetch> provide a simple generic file fetching mechanism.
838
839 =item *
840
841 C<Log::Message> and C<Log::Message::Simple> are used by the log facility
842 of C<CPANPLUS>.
843
844 =item *
845
846 C<Archive::Extract> is a generic archive extraction mechanism
847 for F<.tar> (plain, gziped or bzipped) or F<.zip> files.
848
849 =item *
850
851 C<CPANPLUS> provides an API and a command-line tool to access the CPAN
852 mirrors.
853
854 =item *
855
856 C<Pod::Escapes> provides utilities that are useful in decoding Pod
857 EE<lt>...E<gt> sequences.
858
859 =item *
860
861 C<Pod::Simple> is now the backend for several of the Pod-related modules
862 included with Perl.
863
864 =back
865
866 =head2 Selected Changes to Core Modules
867
868 =over 4
869
870 =item C<Attribute::Handlers>
871
872 C<Attribute::Handlers> can now report the caller's file and line number.
873 (David Feldman)
874
875 All interpreted attributes are now passed as array references. (Damian
876 Conway)
877
878 =item C<B::Lint>
879
880 C<B::Lint> is now based on C<Module::Pluggable>, and so can be extended
881 with plugins. (Joshua ben Jore)
882
883 =item C<B>
884
885 It's now possible to access the lexical pragma hints (C<%^H>) by using the
886 method B::COP::hints_hash(). It returns a C<B::RHE> object, which in turn
887 can be used to get a hash reference via the method B::RHE::HASH(). (Joshua
888 ben Jore)
889
890 =item C<Thread>
891
892 As the old 5005thread threading model has been removed, in favor of the
893 ithreads scheme, the C<Thread> module is now a compatibility wrapper, to
894 be used in old code only. It has been removed from the default list of
895 dynamic extensions.
896
897 =back
898
899 =head1 Utility Changes
900
901 =over 4
902
903 =item perl -d
904
905 The Perl debugger can now save all debugger commands for sourcing later;
906 notably, it can now emulate stepping backwards, by restarting and
907 rerunning all bar the last command from a saved command history.
908
909 It can also display the parent inheritance tree of a given class, with the
910 C<i> command.
911
912 =item ptar
913
914 C<ptar> is a pure perl implementation of C<tar> that comes with
915 C<Archive::Tar>.
916
917 =item ptardiff
918
919 C<ptardiff> is a small utility used to generate a diff between the contents
920 of a tar archive and a directory tree. Like C<ptar>, it comes with
921 C<Archive::Tar>.
922
923 =item shasum
924
925 C<shasum> is a command-line utility, used to print or to check SHA
926 digests. It comes with the new C<Digest::SHA> module.
927
928 =item corelist
929
930 The C<corelist> utility is now installed with perl (see L</"New modules">
931 above).
932
933 =item h2ph and h2xs
934
935 C<h2ph> and C<h2xs> have been made more robust with regard to
936 "modern" C code.
937
938 C<h2xs> implements a new option C<--use-xsloader> to force use of
939 C<XSLoader> even in backwards compatible modules.
940
941 The handling of authors' names that had apostrophes has been fixed.
942
943 Any enums with negative values are now skipped.
944
945 =item perlivp
946
947 C<perlivp> no longer checks for F<*.ph> files by default.  Use the new C<-a>
948 option to run I<all> tests.
949
950 =item find2perl
951
952 C<find2perl> now assumes C<-print> as a default action. Previously, it
953 needed to be specified explicitly.
954
955 Several bugs have been fixed in C<find2perl>, regarding C<-exec> and
956 C<-eval>. Also the options C<-path>, C<-ipath> and C<-iname> have been
957 added.
958
959 =item config_data
960
961 C<config_data> is a new utility that comes with C<Module::Build>. It
962 provides a command-line interface to the configuration of Perl modules
963 that use Module::Build's framework of configurability (that is,
964 C<*::ConfigData> modules that contain local configuration information for
965 their parent modules.)
966
967 =item cpanp
968
969 C<cpanp>, the CPANPLUS shell, has been added. (C<cpanp-run-perl>, a
970 helper for CPANPLUS operation, has been added too, but isn't intended for
971 direct use).
972
973 =item cpan2dist
974
975 C<cpan2dist> is a new utility that comes with CPANPLUS. It's a tool to
976 create distributions (or packages) from CPAN modules.
977
978 =item pod2html
979
980 The output of C<pod2html> has been enhanced to be more customizable via
981 CSS. Some formatting problems were also corrected. (Jari Aalto)
982
983 =back
984
985 =head1 New Documentation
986
987 The L<perlpragma> manpage documents how to write one's own lexical
988 pragmas in pure Perl (something that is possible starting with 5.9.4).
989
990 The new L<perlglossary> manpage is a glossary of terms used in the Perl
991 documentation, technical and otherwise, kindly provided by O'Reilly Media,
992 Inc.
993
994 The L<perlreguts> manpage, courtesy of Yves Orton, describes internals of the
995 Perl regular expression engine.
996
997 The L<perlreapi> manpage describes the interface to the perl interpreter
998 used to write pluggable regular expression engines (by Ã†var Arnfjörð
999 Bjarmason).
1000
1001 The L<perlunitut> manpage is an tutorial for programming with Unicode and
1002 string encodings in Perl, courtesy of Juerd Waalboer.
1003
1004 A new manual page, L<perlunifaq> (the Perl Unicode FAQ), has been added
1005 (Juerd Waalboer).
1006
1007 The L<perlcommunity> manpage gives a description of the Perl community
1008 on the Internet and in real life. (Edgar "Trizor" Bering)
1009
1010 The L<CORE> manual page documents the C<CORE::> namespace. (Tels)
1011
1012 The long-existing feature of C</(?{...})/> regexps setting C<$_> and pos()
1013 is now documented.
1014
1015 =head1 Performance Enhancements
1016
1017 =head2 In-place sorting
1018
1019 Sorting arrays in place (C<@a = sort @a>) is now optimized to avoid
1020 making a temporary copy of the array.
1021
1022 Likewise, C<reverse sort ...> is now optimized to sort in reverse,
1023 avoiding the generation of a temporary intermediate list.
1024
1025 =head2 Lexical array access
1026
1027 Access to elements of lexical arrays via a numeric constant between 0 and
1028 255 is now faster. (This used to be only the case for global arrays.)
1029
1030 =head2 XS-assisted SWASHGET
1031
1032 Some pure-perl code that perl was using to retrieve Unicode properties and
1033 transliteration mappings has been reimplemented in XS.
1034
1035 =head2 Constant subroutines
1036
1037 The interpreter internals now support a far more memory efficient form of
1038 inlineable constants. Storing a reference to a constant value in a symbol
1039 table is equivalent to a full typeglob referencing a constant subroutine,
1040 but using about 400 bytes less memory. This proxy constant subroutine is
1041 automatically upgraded to a real typeglob with subroutine if necessary.
1042 The approach taken is analogous to the existing space optimisation for
1043 subroutine stub declarations, which are stored as plain scalars in place
1044 of the full typeglob.
1045
1046 Several of the core modules have been converted to use this feature for
1047 their system dependent constants - as a result C<use POSIX;> now takes about
1048 200K less memory.
1049
1050 =head2 C<PERL_DONT_CREATE_GVSV>
1051
1052 The new compilation flag C<PERL_DONT_CREATE_GVSV>, introduced as an option
1053 in perl 5.8.8, is turned on by default in perl 5.9.3. It prevents perl
1054 from creating an empty scalar with every new typeglob. See L<perl589delta>
1055 for details.
1056
1057 =head2 Weak references are cheaper
1058
1059 Weak reference creation is now I<O(1)> rather than I<O(n)>, courtesy of
1060 Nicholas Clark. Weak reference deletion remains I<O(n)>, but if deletion only
1061 happens at program exit, it may be skipped completely.
1062
1063 =head2 sort() enhancements
1064
1065 Salvador Fandiño provided improvements to reduce the memory usage of C<sort>
1066 and to speed up some cases.
1067
1068 =head2 Memory optimisations
1069
1070 Several internal data structures (typeglobs, GVs, CVs, formats) have been
1071 restructured to use less memory. (Nicholas Clark)
1072
1073 =head2 UTF-8 cache optimisation
1074
1075 The UTF-8 caching code is now more efficient, and used more often.
1076 (Nicholas Clark)
1077
1078 =head2 Sloppy stat on Windows
1079
1080 On Windows, perl's stat() function normally opens the file to determine
1081 the link count and update attributes that may have been changed through
1082 hard links. Setting ${^WIN32_SLOPPY_STAT} to a true value speeds up
1083 stat() by not performing this operation. (Jan Dubois)
1084
1085 =head2 Regular expressions optimisations
1086
1087 =over 4
1088
1089 =item Engine de-recursivised
1090
1091 The regular expression engine is no longer recursive, meaning that
1092 patterns that used to overflow the stack will either die with useful
1093 explanations, or run to completion, which, since they were able to blow
1094 the stack before, will likely take a very long time to happen. If you were
1095 experiencing the occasional stack overflow (or segfault) and upgrade to
1096 discover that now perl apparently hangs instead, look for a degenerate
1097 regex. (Dave Mitchell)
1098
1099 =item Single char char-classes treated as literals
1100
1101 Classes of a single character are now treated the same as if the character
1102 had been used as a literal, meaning that code that uses char-classes as an
1103 escaping mechanism will see a speedup. (Yves Orton)
1104
1105 =item Trie optimisation of literal string alternations
1106
1107 Alternations, where possible, are optimised into more efficient matching
1108 structures. String literal alternations are merged into a trie and are
1109 matched simultaneously.  This means that instead of O(N) time for matching
1110 N alternations at a given point, the new code performs in O(1) time.
1111 A new special variable, ${^RE_TRIE_MAXBUF}, has been added to fine-tune
1112 this optimization. (Yves Orton)
1113
1114 B<Note:> Much code exists that works around perl's historic poor
1115 performance on alternations. Often the tricks used to do so will disable
1116 the new optimisations. Hopefully the utility modules used for this purpose
1117 will be educated about these new optimisations.
1118
1119 =item Aho-Corasick start-point optimisation
1120
1121 When a pattern starts with a trie-able alternation and there aren't
1122 better optimisations available, the regex engine will use Aho-Corasick
1123 matching to find the start point. (Yves Orton)
1124
1125 =back
1126
1127 =head1 Installation and Configuration Improvements
1128
1129 =head2 Configuration improvements
1130
1131 =over 4
1132
1133 =item C<-Dusesitecustomize>
1134
1135 Run-time customization of @INC can be enabled by passing the
1136 C<-Dusesitecustomize> flag to Configure. When enabled, this will make perl
1137 run F<$sitelibexp/sitecustomize.pl> before anything else.  This script can
1138 then be set up to add additional entries to @INC.
1139
1140 =item Relocatable installations
1141
1142 There is now Configure support for creating a relocatable perl tree. If
1143 you Configure with C<-Duserelocatableinc>, then the paths in @INC (and
1144 everything else in %Config) can be optionally located via the path of the
1145 perl executable.
1146
1147 That means that, if the string C<".../"> is found at the start of any
1148 path, it's substituted with the directory of $^X. So, the relocation can
1149 be configured on a per-directory basis, although the default with
1150 C<-Duserelocatableinc> is that everything is relocated. The initial
1151 install is done to the original configured prefix.
1152
1153 =item strlcat() and strlcpy()
1154
1155 The configuration process now detects whether strlcat() and strlcpy() are
1156 available.  When they are not available, perl's own version is used (from
1157 Russ Allbery's public domain implementation).  Various places in the perl
1158 interpreter now use them. (Steve Peters)
1159
1160 =item C<d_pseudofork> and C<d_printf_format_null>
1161
1162 A new configuration variable, available as C<$Config{d_pseudofork}> in
1163 the L<Config> module, has been added, to distinguish real fork() support
1164 from fake pseudofork used on Windows platforms.
1165
1166 A new configuration variable, C<d_printf_format_null>, has been added, 
1167 to see if printf-like formats are allowed to be NULL.
1168
1169 =item Configure help
1170
1171 C<Configure -h> has been extended with the most commonly used options.
1172
1173 =back
1174
1175 =head2 Compilation improvements
1176
1177 =over 4
1178
1179 =item Parallel build
1180
1181 Parallel makes should work properly now, although there may still be problems
1182 if C<make test> is instructed to run in parallel.
1183
1184 =item Borland's compilers support
1185
1186 Building with Borland's compilers on Win32 should work more smoothly. In
1187 particular Steve Hay has worked to side step many warnings emitted by their
1188 compilers and at least one C compiler internal error.
1189
1190 =item Static build on Windows
1191
1192 Perl extensions on Windows now can be statically built into the Perl DLL.
1193
1194 Also, it's now possible to build a C<perl-static.exe> that doesn't depend
1195 on the Perl DLL on Win32. See the Win32 makefiles for details.
1196 (Vadim Konovalov)
1197
1198 =item ppport.h files
1199
1200 All F<ppport.h> files in the XS modules bundled with perl are now
1201 autogenerated at build time. (Marcus Holland-Moritz)
1202
1203 =item C++ compatibility
1204
1205 Efforts have been made to make perl and the core XS modules compilable
1206 with various C++ compilers (although the situation is not perfect with
1207 some of the compilers on some of the platforms tested.)
1208
1209 =item Support for Microsoft 64-bit compiler
1210
1211 Support for building perl with Microsoft's 64-bit compiler has been
1212 improved. (ActiveState)
1213
1214 =item Visual C++
1215
1216 Perl can now be compiled with Microsoft Visual C++ 2005 (and 2008 Beta 2).
1217
1218 =item Win32 builds
1219
1220 All win32 builds (MS-Win, WinCE) have been merged and cleaned up.
1221
1222 =back
1223
1224 =head2 Installation improvements
1225
1226 =over 4
1227
1228 =item Module auxiliary files
1229
1230 README files and changelogs for CPAN modules bundled with perl are no
1231 longer installed.
1232
1233 =back
1234
1235 =head2 New Or Improved Platforms
1236
1237 Perl has been reported to work on Symbian OS. See L<perlsymbian> for more
1238 information.
1239
1240 Many improvements have been made towards making Perl work correctly on
1241 z/OS.
1242
1243 Perl has been reported to work on DragonFlyBSD and MidnightBSD.
1244
1245 Perl has also been reported to work on NexentaOS
1246 ( http://www.gnusolaris.org/ ).
1247
1248 The VMS port has been improved. See L<perlvms>.
1249
1250 Support for Cray XT4 Catamount/Qk has been added. See
1251 F<hints/catamount.sh> in the source code distribution for more
1252 information.
1253
1254 Vendor patches have been merged for RedHat and Gentoo.
1255
1256 DynaLoader::dl_unload_file() now works on Windows.
1257
1258 =head1 Selected Bug Fixes
1259
1260 =over 4
1261
1262 =item strictures in regexp-eval blocks
1263
1264 C<strict> wasn't in effect in regexp-eval blocks (C</(?{...})/>).
1265
1266 =item Calling CORE::require()
1267
1268 CORE::require() and CORE::do() were always parsed as require() and do()
1269 when they were overridden. This is now fixed.
1270
1271 =item Subscripts of slices
1272
1273 You can now use a non-arrowed form for chained subscripts after a list
1274 slice, like in:
1275
1276     ({foo => "bar"})[0]{foo}
1277
1278 This used to be a syntax error; a C<< -> >> was required.
1279
1280 =item C<no warnings 'category'> works correctly with -w
1281
1282 Previously when running with warnings enabled globally via C<-w>, selective
1283 disabling of specific warning categories would actually turn off all warnings.
1284 This is now fixed; now C<no warnings 'io';> will only turn off warnings in the
1285 C<io> class. Previously it would erroneously turn off all warnings.
1286
1287 =item threads improvements
1288
1289 Several memory leaks in ithreads were closed. Also, ithreads were made
1290 less memory-intensive.
1291
1292 C<threads> is now a dual-life module, also available on CPAN. It has been
1293 expanded in many ways. A kill() method is available for thread signalling.
1294 One can get thread status, or the list of running or joinable threads.
1295
1296 A new C<< threads->exit() >> method is used to exit from the application
1297 (this is the default for the main thread) or from the current thread only
1298 (this is the default for all other threads). On the other hand, the exit()
1299 built-in now always causes the whole application to terminate. (Jerry
1300 D. Hedden)
1301
1302 =item chr() and negative values
1303
1304 chr() on a negative value now gives C<\x{FFFD}>, the Unicode replacement
1305 character, unless when the C<bytes> pragma is in effect, where the low
1306 eight bits of the value are used.
1307
1308 =item PERL5SHELL and tainting
1309
1310 On Windows, the PERL5SHELL environment variable is now checked for
1311 taintedness. (Rafael Garcia-Suarez)
1312
1313 =item Using *FILE{IO}
1314
1315 C<stat()> and C<-X> filetests now treat *FILE{IO} filehandles like *FILE
1316 filehandles. (Steve Peters)
1317
1318 =item Overloading and reblessing
1319
1320 Overloading now works when references are reblessed into another class.
1321 Internally, this has been implemented by moving the flag for "overloading"
1322 from the reference to the referent, which logically is where it should
1323 always have been. (Nicholas Clark)
1324
1325 =item Overloading and UTF-8
1326
1327 A few bugs related to UTF-8 handling with objects that have
1328 stringification overloaded have been fixed. (Nicholas Clark)
1329
1330 =item eval memory leaks fixed
1331
1332 Traditionally, C<eval 'syntax error'> has leaked badly. Many (but not all)
1333 of these leaks have now been eliminated or reduced. (Dave Mitchell)
1334
1335 =item Random device on Windows
1336
1337 In previous versions, perl would read the file F</dev/urandom> if it
1338 existed when seeding its random number generator.  That file is unlikely
1339 to exist on Windows, and if it did would probably not contain appropriate
1340 data, so perl no longer tries to read it on Windows. (Alex Davies)
1341
1342 =item PERLIO_DEBUG
1343
1344 The C<PERLIO_DEBUG> environment variable no longer has any effect for
1345 setuid scripts and for scripts run with B<-T>.
1346
1347 Moreover, with a thread-enabled perl, using C<PERLIO_DEBUG> could lead to
1348 an internal buffer overflow. This has been fixed.
1349
1350 =item PerlIO::scalar and read-only scalars
1351
1352 PerlIO::scalar will now prevent writing to read-only scalars. Moreover,
1353 seek() is now supported with PerlIO::scalar-based filehandles, the
1354 underlying string being zero-filled as needed. (Rafael, Jarkko Hietaniemi)
1355
1356 =item study() and UTF-8
1357
1358 study() never worked for UTF-8 strings, but could lead to false results.
1359 It's now a no-op on UTF-8 data. (Yves Orton)
1360
1361 =item Critical signals
1362
1363 The signals SIGILL, SIGBUS and SIGSEGV are now always delivered in an
1364 "unsafe" manner (contrary to other signals, that are deferred until the
1365 perl interpreter reaches a reasonably stable state; see
1366 L<perlipc/"Deferred Signals (Safe Signals)">). (Rafael)
1367
1368 =item @INC-hook fix
1369
1370 When a module or a file is loaded through an @INC-hook, and when this hook
1371 has set a filename entry in %INC, __FILE__ is now set for this module
1372 accordingly to the contents of that %INC entry. (Rafael)
1373
1374 =item C<-t> switch fix
1375
1376 The C<-w> and C<-t> switches can now be used together without messing
1377 up which categories of warnings are activated. (Rafael)
1378
1379 =item Duping UTF-8 filehandles
1380
1381 Duping a filehandle which has the C<:utf8> PerlIO layer set will now
1382 properly carry that layer on the duped filehandle. (Rafael)
1383
1384 =item Localisation of hash elements
1385
1386 Localizing a hash element whose key was given as a variable didn't work
1387 correctly if the variable was changed while the local() was in effect (as
1388 in C<local $h{$x}; ++$x>). (Bo Lindbergh)
1389
1390 =back
1391
1392 =head1 New or Changed Diagnostics
1393
1394 =over 4
1395
1396 =item Use of uninitialized value
1397
1398 Perl will now try to tell you the name of the variable (if any) that was
1399 undefined.
1400
1401 =item Deprecated use of my() in false conditional
1402
1403 A new deprecation warning, I<Deprecated use of my() in false conditional>,
1404 has been added, to warn against the use of the dubious and deprecated
1405 construct
1406
1407     my $x if 0;
1408
1409 See L<perldiag>. Use C<state> variables instead.
1410
1411 =item !=~ should be !~
1412
1413 A new warning, C<!=~ should be !~>, is emitted to prevent this misspelling
1414 of the non-matching operator.
1415
1416 =item Newline in left-justified string
1417
1418 The warning I<Newline in left-justified string> has been removed.
1419
1420 =item Too late for "-T" option
1421
1422 The error I<Too late for "-T" option> has been reformulated to be more
1423 descriptive.
1424
1425 =item "%s" variable %s masks earlier declaration
1426
1427 This warning is now emitted in more consistent cases; in short, when one
1428 of the declarations involved is a C<my> variable:
1429
1430     my $x;   my $x;     # warns
1431     my $x;  our $x;     # warns
1432     our $x;  my $x;     # warns
1433
1434 On the other hand, the following:
1435
1436     our $x; our $x;
1437
1438 now gives a C<"our" variable %s redeclared> warning.
1439
1440 =item readdir()/closedir()/etc. attempted on invalid dirhandle
1441
1442 These new warnings are now emitted when a dirhandle is used but is
1443 either closed or not really a dirhandle.
1444
1445 =item Opening dirhandle/filehandle %s also as a file/directory
1446
1447 Two deprecation warnings have been added: (Rafael)
1448
1449     Opening dirhandle %s also as a file
1450     Opening filehandle %s also as a directory
1451
1452 =item Use of -P is deprecated
1453
1454 Perl's command-line switch C<-P> is now deprecated.
1455
1456 =item v-string in use/require is non-portable
1457
1458 Perl will warn you against potential backwards compatibility problems with
1459 the C<use VERSION> syntax.
1460
1461 =item perl -V
1462
1463 C<perl -V> has several improvements, making it more useable from shell
1464 scripts to get the value of configuration variables. See L<perlrun> for
1465 details.
1466
1467 =back
1468
1469 =head1 Changed Internals
1470
1471 In general, the source code of perl has been refactored, tidied up,
1472 and optimized in many places. Also, memory management and allocation
1473 has been improved in several points.
1474
1475 When compiling the perl core with gcc, as many gcc warning flags are
1476 turned on as is possible on the platform.  (This quest for cleanliness
1477 doesn't extend to XS code because we cannot guarantee the tidiness of
1478 code we didn't write.)  Similar strictness flags have been added or
1479 tightened for various other C compilers.
1480
1481 =head2 Reordering of SVt_* constants
1482
1483 The relative ordering of constants that define the various types of C<SV>
1484 have changed; in particular, C<SVt_PVGV> has been moved before C<SVt_PVLV>,
1485 C<SVt_PVAV>, C<SVt_PVHV> and C<SVt_PVCV>.  This is unlikely to make any
1486 difference unless you have code that explicitly makes assumptions about that
1487 ordering. (The inheritance hierarchy of C<B::*> objects has been changed
1488 to reflect this.)
1489
1490 =head2 Elimination of SVt_PVBM
1491
1492 Related to this, the internal type C<SVt_PVBM> has been removed. This
1493 dedicated type of C<SV> was used by the C<index> operator and parts of the
1494 regexp engine to facilitate fast Boyer-Moore matches. Its use internally has
1495 been replaced by C<SV>s of type C<SVt_PVGV>.
1496
1497 =head2 New type SVt_BIND
1498
1499 A new type C<SVt_BIND> has been added, in readiness for the project to
1500 implement Perl 6 on 5. There deliberately is no implementation yet, and
1501 they cannot yet be created or destroyed.
1502
1503 =head2 Removal of CPP symbols
1504
1505 The C preprocessor symbols C<PERL_PM_APIVERSION> and
1506 C<PERL_XS_APIVERSION>, which were supposed to give the version number of
1507 the oldest perl binary-compatible (resp. source-compatible) with the
1508 present one, were not used, and sometimes had misleading values. They have
1509 been removed.
1510
1511 =head2 Less space is used by ops
1512
1513 The C<BASEOP> structure now uses less space. The C<op_seq> field has been
1514 removed and replaced by a single bit bit-field C<op_opt>. C<op_type> is now 9
1515 bits long. (Consequently, the C<B::OP> class doesn't provide an C<seq>
1516 method anymore.)
1517
1518 =head2 New parser
1519
1520 perl's parser is now generated by bison (it used to be generated by
1521 byacc.) As a result, it seems to be a bit more robust.
1522
1523 Also, Dave Mitchell improved the lexer debugging output under C<-DT>.
1524
1525 =head2 Use of C<const>
1526
1527 Andy Lester supplied many improvements to determine which function
1528 parameters and local variables could actually be declared C<const> to the C
1529 compiler. Steve Peters provided new C<*_set> macros and reworked the core to
1530 use these rather than assigning to macros in LVALUE context.
1531
1532 =head2 Mathoms
1533
1534 A new file, F<mathoms.c>, has been added. It contains functions that are
1535 no longer used in the perl core, but that remain available for binary or
1536 source compatibility reasons. However, those functions will not be
1537 compiled in if you add C<-DNO_MATHOMS> in the compiler flags.
1538
1539 =head2 C<AvFLAGS> has been removed
1540
1541 The C<AvFLAGS> macro has been removed.
1542
1543 =head2 C<av_*> changes
1544
1545 The C<av_*()> functions, used to manipulate arrays, no longer accept null
1546 C<AV*> parameters.
1547
1548 =head2 $^H and %^H
1549
1550 The implementation of the special variables $^H and %^H has changed, to
1551 allow implementing lexical pragmas in pure Perl.
1552
1553 =head2 B:: modules inheritance changed
1554
1555 The inheritance hierarchy of C<B::> modules has changed; C<B::NV> now
1556 inherits from C<B::SV> (it used to inherit from C<B::IV>).
1557
1558 =head2 Anonymous hash and array constructors
1559
1560 The anonymous hash and array constructors now take 1 op in the optree
1561 instead of 3, now that pp_anonhash and pp_anonlist return a reference to
1562 an hash/array when the op is flagged with OPf_SPECIAL. (Nicholas Clark)
1563
1564 =head1 Known Problems
1565
1566 There's still a remaining problem in the implementation of the lexical
1567 C<$_>: it doesn't work inside C</(?{...})/> blocks. (See the TODO test in
1568 F<t/op/mydef.t>.)
1569
1570 Stacked filetest operators won't work when the C<filetest> pragma is in
1571 effect, because they rely on the stat() buffer C<_> being populated, and
1572 filetest bypasses stat().
1573
1574 =head2 UTF-8 problems
1575
1576 The handling of Unicode still is unclean in several places, where it's
1577 dependent on whether a string is internally flagged as UTF-8. This will
1578 be made more consistent in perl 5.12, but that won't be possible without
1579 a certain amount of backwards incompatibility.
1580
1581 =head1 Platform Specific Problems
1582
1583 When compiled with g++ and thread support on Linux, it's reported that the
1584 C<$!> stops working correctly. This is related to the fact that the glibc
1585 provides two strerror_r(3) implementation, and perl selects the wrong
1586 one.
1587
1588 =head1 Reporting Bugs
1589
1590 If you find what you think is a bug, you might check the articles
1591 recently posted to the comp.lang.perl.misc newsgroup and the perl
1592 bug database at http://rt.perl.org/rt3/ .  There may also be
1593 information at http://www.perl.org/ , the Perl Home Page.
1594
1595 If you believe you have an unreported bug, please run the B<perlbug>
1596 program included with your release.  Be sure to trim your bug down
1597 to a tiny but sufficient test case.  Your bug report, along with the
1598 output of C<perl -V>, will be sent off to perlbug@perl.org to be
1599 analysed by the Perl porting team.
1600
1601 =head1 SEE ALSO
1602
1603 The F<Changes> file and the perl590delta to perl595delta man pages for
1604 exhaustive details on what changed.
1605
1606 The F<INSTALL> file for how to build Perl.
1607
1608 The F<README> file for general stuff.
1609
1610 The F<Artistic> and F<Copying> files for copyright information.
1611
1612 =cut