collapse threading doc changes as suggested by Nicholas, adding in notes on the addit...
[p5sagit/p5-mst-13.2.git] / pod / perl5113delta.pod
1 =head1 NAME
2
3 perl5113delta - what is new for perl v5.11.3
4
5 =head1 DESCRIPTION
6
7 This document describes differences between the 5.11.2 release and
8 the 5.11.3 release.
9
10 If you are upgrading from an earlier release such as 5.11.1, first read
11 the L<perl5112delta>, which describes differences between 5.11.1 and
12 5.11.2
13
14 =head1 Incompatible Changes
15
16 =head2 Filehandles are blessed directly into C<IO::Handle>, as C<FileHandle> is merely a wrapper around C<IO::Handle>.
17
18 The previous behaviour was to bless Filehandles into L<FileHandle>
19 (an empty proxy class) if it was loaded into memory and otherwise
20 to bless them into C<IO::Handle>.
21
22 =head1 Core Enhancements
23
24 =head2 Unicode version
25
26 Perl is shipped with the latest Unicode version, 5.2, dated October 2009.  See
27 L<http://www.unicode.org/versions/Unicode5.2.0> for details about this release
28 of Unicode.  See L<perlunicode> for instructions on installing and using
29 older versions of Unicode.
30
31 =head2 Unicode properties
32
33 Perl can now handle every Unicode character property.  A new pod,
34 L<perluniprops>, lists all available non-Unihan character properties.  By
35 default the Unihan properties and certain others (deprecated and Unicode
36 internal-only ones) are not exposed.  See below for more details on
37 these; there is also a section in the pod listing them, and why they are
38 not exposed.
39
40 Perl now fully supports the Unicode compound-style of using C<=> and C<:>
41 in writing regular expressions: C<\p{property=value}> and
42 C<\p{property:value}> (both of which mean the same thing).
43
44 Perl now fully supports the Unicode loose matching rules for text
45 between the braces in C<\p{...}> constructs.  In addition, Perl also allows
46 underscores between digits of numbers.
47
48 All the Unicode-defined synonyms for properties and property values are
49 now accepted.
50
51 C<qr/\X/>, which matches a Unicode logical character, has been expanded to work
52 better with various Asian languages.  It now is defined as an C<extended
53 grapheme cluster>.  (See L<http://www.unicode.org/reports/tr29/>).
54 Anything matched previously that made sense will continue to be matched.  But
55 in addition:
56
57 =over
58
59 =item *
60
61 C<\X> will now not break apart a C<S<CR LF>> sequence.
62
63 =item *
64
65 C<\X> will now match a sequence including the C<ZWJ> and C<ZWNJ> characters.
66
67 =item *
68
69 C<\X> will now always match at least one character, including an initial mark.
70 Marks generally come after a base character, but it is possible in Unicode to
71 have them in isolation, and C<\X> will now handle that case, for example at the
72 beginning of a line or after a C<ZWSP>.  And this is the part where C<\X>
73 doesn't match the things that it used to that don't make sense.  Formerly, for
74 example, you could have the nonsensical case of an accented LF.
75
76 =item *
77
78 C<\X> will now match a (Korean) Hangul syllable sequence, and the Thai and Lao
79 exception cases.
80
81 =back
82
83 Otherwise, this change should be transparent for the non-affected languages.
84
85 C<\p{...}> matches using the Canonical_Combining_Class property were
86 completely broken in previous Perls.  This is now fixed.
87
88 In previous Perls, the Unicode C<Decomposition_Type=Compat> property and a
89 Perl extension had the same name, which led to neither matching all the
90 correct values (with more than 100 mistakes in one, and several thousand
91 in the other).  The Perl extension has now been renamed to be
92 C<Decomposition_Type=Noncanonical> (short: C<dt=noncanon>).  It has the same
93 meaning as was previously intended, namely the union of all the
94 non-canonical Decomposition types, with Unicode C<Compat> being just one of
95 those.
96
97 C<\p{Uppercase}> and C<\p{Lowercase}> have been brought into line with the
98 Unicode definitions.  This means they each match a few more characters
99 than previously.
100
101 C<\p{Cntrl}> now matches the same characters as C<\p{Control}>.  This means it
102 no longer will match Private Use (gc=co), Surrogates (gc=cs), nor Format
103 (gc=cf) code points.  The Format code points represent the biggest
104 possible problem.  All but 36 of them are either officially deprecated
105 or strongly discouraged from being used.  Of those 36, likely the most
106 widely used are the soft hyphen (U+00AD), and BOM, ZWSP, ZWNJ, WJ, and
107 similar, plus Bi-directional controls.
108
109 C<\p{Alpha}> now matches the same characters as C<\p{Alphabetic}>.  The Perl
110 definition included a number of things that aren't really alpha (all
111 marks), while omitting many that were.  As a direct consequence, the
112 definitions of C<\p{Alnum}> and C<\p{Word}> which depend on Alpha also change.
113
114 C<\p{Word}> also now doesn't match certain characters it wasn't supposed
115 to, such as fractions.
116
117 C<\p{Print}> no longer matches the line control characters: Tab, LF, CR,
118 FF, VT, and NEL.  This brings it in line with the documentation.
119
120 C<\p{Decomposition_Type=Canonical}> now includes the Hangul syllables.
121
122 The Numeric type property has been extended to include the Unihan
123 characters.
124
125 There is a new Perl extension, the 'Present_In', or simply 'In',
126 property.  This is an extension of the Unicode Age property, but
127 C<\p{In=5.0}> matches any code point whose usage has been determined
128 I<as of> Unicode version 5.0.  The C<\p{Age=5.0}> only matches code points
129 added in I<precisely> version 5.0.
130
131 A number of properties did not have the correct values for unassigned
132 code points.  This is now fixed.  The affected properties are
133 Bidi_Class, East_Asian_Width, Joining_Type, Decomposition_Type,
134 Hangul_Syllable_Type, Numeric_Type, and Line_Break.
135
136 The Default_Ignorable_Code_Point, ID_Continue, and ID_Start properties
137 have been updated to their current Unicode definitions.
138
139 Certain properties that are supposed to be Unicode internal-only were
140 erroneously exposed by previous Perls.  Use of these in regular
141 expressions will now generate, if enabled, a deprecated warning message.
142 The properties are: Other_Alphabetic, Other_Default_Ignorable_Code_Point,
143 Other_Grapheme_Extend, Other_ID_Continue, Other_ID_Start, Other_Lowercase,
144 Other_Math, and Other_Uppercase.
145
146 An installation can now fairly easily change which Unicode properties
147 Perl understands.  As mentioned above, certain properties are by default
148 turned off.  These include all the Unihan properties (which should be
149 accessible via the CPAN module Unicode::Unihan) and any deprecated or
150 Unicode internal-only property that Perl has never exposed.
151
152 The generated files in the C<lib/unicore/To> directory are now more
153 clearly marked as being stable, directly usable by applications.
154 New hash entries in them give the format of the normal entries,
155 which allows for easier machine parsing.  Perl can generate files
156 in this directory for any property, though most are suppressed.  An
157 installation can choose to change which get written.  Instructions
158 are in L<perluniprops>.
159
160 =head2 Regular Expressions
161
162 U+0FFFF is now a legal character in regular expressions.
163
164 =head1 Modules and Pragmata
165
166 =head2 Pragmata Changes
167
168 =over 4
169
170 =item C<constant>
171
172 Upgraded from version 1.19 to 1.20.
173
174 =item C<diagnostics>
175
176 This pragma no longer suppresses C<Use of uninitialized value in range (or flip)> warnings. [perl #71204]
177
178 =item C<feature>
179
180 Upgraded from 1.13 to 1.14.  Added the C<unicode_strings> feature:
181
182     use feature "unicode_strings";
183
184 This pragma turns on Unicode semantics for the case-changing operations
185 (uc/lc/ucfirst/lcfirst) on strings that don't have the internal UTF-8 flag set,
186 but that contain single-byte characters between 128 and 255.
187
188 =item C<legacy>
189
190 The experimental C<legacy> pragma, introduced in 5.11.2, has been removed,
191 and its functionality replaced by the new feature pragma, C<use feature
192 "unicode_strings">.
193
194 =item C<threads>
195
196 Upgraded from version 1.74 to 1.75.
197
198 =item C<warnings>
199
200 Upgraded from 1.07 to 1.08.  Added new C<warnings::fatal_enabled()> function.
201
202 =back
203
204 =head2 Updated Modules
205
206 =over 4
207
208 =item C<Archive::Extract>
209
210 Upgraded from version 0.34 to 0.36.
211
212 =item C<CPAN>
213
214 Upgraded from version 1.94_51 to 1.94_5301, which is 1.94_53 on CPAN
215 plus some local fixes for bleadperl.
216
217 Includes better bzip2 support, improved FirstTime experience with
218 auto-selection of CPAN mirrors, proper handling of modules removed from the
219 Perl core, and an updated 'cpan' utility script
220
221 =item C<CPANPLUS>
222
223 Upgraded from version 0.89_09 to 0.90.
224
225 =item C<Encode>
226
227 Upgraded from version 2.38 to 2.39.
228
229 =item C<ExtUtils::MakeMaker>
230
231 Upgraded from version 6.55_02 to 6.56.  Adds new BUILD_REQUIRES key to
232 indicate build-only prerequisites.  Also adds support for
233 mingw64 and the new "package NAME VERSION" syntax.
234
235 =item C<File::Path>
236
237 Upgraded from version 2.08 to 2.08_01.
238
239 =item C<Module::Build>
240
241 Upgraded from version 0.35_09 to 0.36.  Compared to 0.35, this version has a
242 new 'installdeps' action, supports the PERL_MB_OPT environment variable, adds a
243 'share_dir' property for L<File::ShareDir> support, support the "package NAME
244 VERSION" syntax and has many other enhancements and bug fixes.  The
245 'passthrough' style of Module::Build::Compat has been deprecated.
246
247 =item C<Module::CoreList>
248
249 Upgraded from version 2.23 to 2.24.
250
251 =item C<POSIX>
252
253 Upgraded from version 1.18 to 1.19. Error codes for C<getaddrinfo()> and
254 C<getnameinfo()> are now available.
255
256 =item C<Pod::Simple>
257
258 Upgraded from version 3.10 to 3.13.
259
260 =item C<Safe>
261
262 Upgraded from version 2.19 to 2.20.
263
264 =back
265
266 =head1 Utility Changes
267
268 =over 4
269
270 =item F<perlbug>
271
272 No longer reports "Message sent" when it hasn't actually sent the message
273
274 =back
275
276 =head1 Changes to Existing Documentation
277
278 The Pod specification (L<perlpodspec>) has been updated to bring the
279 specification in line with modern usage already supported by most Pod systems.
280 A parameter string may now follow the format name in a "begin/end" region.
281 Links to URIs with a text description are now allowed.  The usage of
282 C<LE<lt>"section"E<gt>> has been marked as deprecated.
283
284 L<if.pm|if> has been documented in L<perlfunc/use> as a means to get
285 conditional loading of modules despite the implicit BEGIN block around C<use>.
286
287
288
289 =head1 Installation and Configuration Improvements
290
291 =head2 Testing improvements
292
293 =over 4
294
295 =item It's now possible to override C<PERL5OPT> and friends in F<t/TEST>
296
297 =back
298
299 =head2 Platform Specific Changes
300
301 =over 4
302
303 =item Win32
304
305 =over 4
306
307 =item *
308
309 Always add a manifest resource to C<perl.exe> to specify the C<trustInfo>
310 settings for Windows Vista and later.  Without this setting Windows
311 will treat C<perl.exe> as a legacy application and apply various
312 heuristics like redirecting access to protected file system areas
313 (like the "Program Files" folder) to the users "VirtualStore"
314 instead of generating a proper "permission denied" error.
315
316 For VC8 and VC9 this manifest setting is automatically generated by
317 the compiler/linker (together with the binding information for their
318 respective runtime libraries); for all other compilers we need to
319 embed the manifest resource explicitly in the external resource file.
320
321 This change also requests the Microsoft Common-Controls version 6.0
322 (themed controls introduced in Windows XP) via the dependency list
323 in the assembly manifest.  For VC8 and VC9 this is specified using the
324 C</manifestdependency> linker commandline option instead.
325
326 =back
327
328 =item cygwin
329
330 =over 4
331
332 =item Enable IPv6 support on cygwin 1.7 and newer
333
334 =back
335
336 =item OpenVMS
337
338 =over 4
339
340 =item Make -UDEBUGGING the default on VMS for 5.12.0.
341
342 Like it has been everywhere else for ages and ages.  Also make
343 command-line selection of -UDEBUGGING and -DDEBUGGING work in
344 configure.com; before the only way to turn it off was by saying
345 no in answer to the interactive question.
346
347 =back
348
349 =back
350
351 =head1 Selected Bug Fixes
352
353 =over 4
354
355 =item *
356
357 Ensure that pp_qr returns a new regexp SV each time. Resolves RT #69852.
358
359 Instead of returning a(nother) reference to the (pre-compiled) regexp in the
360 optree, use reg_temp_copy() to create a copy of it, and return a reference to
361 that. This resolves issues about Regexp::DESTROY not being called in a timely
362 fashion (the original bug tracked by RT #69852), as well as bugs related to
363 blessing regexps, and of assigning to regexps, as described in correspondence
364 added to the ticket.
365
366 It transpires that we also need to undo the SvPVX() sharing when ithreads
367 cloning a Regexp SV, because mother_re is set to NULL, instead of a cloned
368 copy of the mother_re. This change might fix bugs with regexps and threads in
369 certain other situations, but as yet neither tests nor bug reports have
370 indicated any problems, so it might not actually be an edge case that it's
371 possible to reach.
372
373 =item  *
374
375 Several compilation errors and segfaults when perl was built with C<-Dmad> were fixed.
376
377 =item *
378
379 Fixes for lexer API changes in 5.11.2 which broke NYTProf's savesrc option.
380
381 =item *
382
383 F<-t> should only return TRUE for file handles connected to a TTY
384
385 The Microsoft C version of isatty() returns TRUE for all
386 character mode devices, including the /dev/null style "nul"
387 device and printers like "lpt1".
388
389 =item *
390
391 Fixed a regression caused by commit fafafbaf which caused a panic during
392 parameter passing [perl #70171]
393
394 =item *
395
396 On systems which in-place edits without backup files, -i'*' now works as
397 the documentation says it does [perl #70802]
398
399 =item *
400
401 Saving and restoring magic flags no longer loses readonly flag.
402
403 =item *
404
405 The malformed syntax C<grep EXPR LIST> (note the missing comma) no longer
406 causes abrupt and total failure.
407
408 =item *
409
410 Regular expressions compiled with C<qr{}> literals properly set C<$'> when
411 matching again.
412
413 =item *
414
415 Using named subroutines with C<sort> should no longer lead to bus errors [perl
416 #71076]
417
418 =item *
419
420 Numerous bugfixes catch small issues caused by the recently-added Lexer API.
421
422 =item *
423
424 Smart match against C<@_> sometimes gave false negatives. [perl #71078]
425
426 =item *
427
428 C<$@> may now be assigned a read-only value (without error or busting the stack).
429
430 =item *
431
432 C<sort> called recursively from within an active comparison subroutine no
433 longer causes a bus error if run multiple times. [perl #71076]
434
435 =back
436
437 =head1 New or Changed Diagnostics
438
439 =over 4
440
441 =item *
442
443 C<split> now warns when called in void context
444
445 =item *
446
447 C<printf>-style functions called with too few arguments will now issue the
448 warning C<"Missing argument in %s"> [perl #71000]
449
450 =back
451
452 =head1 New Tests
453
454 Many modules updated from CPAN incorporate new tests.
455
456 =over 4
457
458 =item t/comp/final_line_num.t
459
460 See if line numbers are correct at EOF
461
462 =item t/comp/form_scope.t
463
464 See if format scoping works
465
466 =item t/comp/line_debug.t
467
468 See if @{"_<$file"} works
469
470 =item t/op/filetest_t.t
471
472 See if -t file test works
473
474 =item t/op/qr.t
475
476 See if qr works
477
478 =item t/op/utf8cache.t
479
480 Tests malfunctions of utf8 cache
481
482 =item t/re/uniprops.t
483
484 Test unicode \p{} regex constructs
485
486 =back
487
488 =head1 Deprecations
489
490 The following items are now deprecated.
491
492 =over 4
493
494 =item Use of "goto" to jump into a construct is deprecated
495
496 Using C<goto> to jump from an outer scope into an inner
497 scope is now deprecated. This rare use case was causing
498 problems in the implementation of scopes.
499
500 =back
501
502 =head1 Acknowledgements
503
504 Perl 5.11.3 represents approximately one month of development since
505 Perl 5.11.2 and contains 61407 lines of changes across 396 files
506 from 40 authors and committers:
507
508 Abigail, Alex Davies, Alexandr Ciornii, Andrew Rodland, Andy
509 Dougherty, Bram, brian d foy, Chip Salzenberg, Chris Williams, Craig
510 A. Berry, Daniel Frederick Crisman, David Golden, Dennis Kaarsemaker,
511 Eric Brine, Father Chrysostomos, Gene Sullivan, Gerard Goossen, H.
512 Merijn Brand, Hugo van der Sanden, Jan Dubois, Jerry D. Hedden,
513 Jesse Vincent, Jim Cromie, Karl Williamson, Leon Brocard, Max
514 Maischein, Michael Breen, Moritz Lenz, Nicholas Clark, Rafael
515 Garcia-Suarez, Reini Urban, Ricardo Signes, Stepan Kasal, Steve
516 Hay, Steve Peters, Tim Bunce, Tony Cook, Vincent Pit and Zefram.
517
518 Many of the changes included in this version originated in the CPAN
519 modules included in Perl's core. We're grateful to the entire CPAN
520 community for helping Perl to flourish.
521
522 =head1 Reporting Bugs
523
524 If you find what you think is a bug, you might check the articles
525 recently posted to the comp.lang.perl.misc newsgroup and the perl
526 bug database at http://rt.perl.org/perlbug/ .  There may also be
527 information at http://www.perl.org/ , the Perl Home Page.
528
529 If you believe you have an unreported bug, please run the B<perlbug>
530 program included with your release.  Be sure to trim your bug down
531 to a tiny but sufficient test case.  Your bug report, along with the
532 output of C<perl -V>, will be sent off to perlbug@perl.org to be
533 analysed by the Perl porting team.
534
535 If the bug you are reporting has security implications, which make it
536 inappropriate to send to a publicly archived mailing list, then please send
537 it to perl5-security-report@perl.org. This points to a closed subscription
538 unarchived mailing list, which includes all the core committers, who be able
539 to help assess the impact of issues, figure out a resolution, and help
540 co-ordinate the release of patches to mitigate or fix the problem across all
541 platforms on which Perl is supported. Please only use this address for
542 security issues in the Perl core, not for modules independently
543 distributed on CPAN.
544
545 =head1 SEE ALSO
546
547 The F<Changes> file for an explanation of how to view exhaustive details
548 on what changed.
549
550 The F<INSTALL> file for how to build Perl.
551
552 The F<README> file for general stuff.
553
554 The F<Artistic> and F<Copying> files for copyright information.
555
556 =cut
557
558