Tick off Unicode collation and the normalization from
[p5sagit/p5-mst-13.2.git] / pod / perltodo.pod
1 =head1 NAME
2
3 perltodo - Perl TO-DO List
4
5 =head1 DESCRIPTION
6
7 This is a list of wishes for Perl.  Send updates to
8 I<perl5-porters@perl.org>.  If you want to work on any of these
9 projects, be sure to check the perl5-porters archives for past ideas,
10 flames, and propaganda.  This will save you time and also prevent you
11 from implementing something that Larry has already vetoed.  One set
12 of archives may be found at:
13
14     http://www.xray.mpe.mpg.de/mailing-lists/perl5-porters/
15
16 =head1 To do during 5.6.x
17
18 =head2 Support for I/O disciplines
19
20 C<perlio> provides this, but the interface could be a lot more
21 straightforward.
22
23 =head2 Autoload bytes.pm
24
25 When the lexer sees, for instance, C<bytes::length>, it should
26 automatically load the C<bytes> pragma.
27
28 =head2 Make "\u{XXXX}" et al work
29
30 Danger, Will Robinson! Discussing the semantics of C<"\x{F00}">,
31 C<"\xF00"> and C<"\U{F00}"> on P5P I<will> lead to a long and boring
32 flamewar.
33
34 =head2 Create a char *sv_pvprintify(sv, STRLEN *lenp, UV flags)
35
36 For displaying PVs with control characters, embedded nulls, and Unicode.
37 This would be useful for printing warnings, or data and regex dumping,
38 not_a_number(), and so on.
39
40 Requirements: should handle both byte and UTF8 strings.  isPRINT()
41 characters printed as-is, character less than 256 as \xHH, Unicode
42 characters as \x{HHH}.  Don't assume ASCII-like, either, get somebody
43 on EBCDIC to test the output.
44
45 Possible options, controlled by the flags:
46 - whitespace (other than ' ' of isPRINT()) printed as-is
47 - use isPRINT_LC() instead of isPRINT()
48 - print control characters like this: "\cA"
49 - print control characters like this: "^A"
50 - non-PRINTables printed as '.' instead of \xHH
51 - use \OOO instead of \xHH
52 - use the C/Perl-metacharacters like \n, \t
53 - have a maximum length for the produced string (read it from *lenp)
54 - append a "..." to the produced string if the maximum length is exceeded
55 - really fancy: print unicode characters as \N{...}
56
57 =head2 Overloadable regex assertions
58
59 This may or may not be possible with the current regular expression
60 engine. The idea is that, for instance, C<\b> needs to be
61 algorithmically computed if you're dealing with Thai text. Hence, the
62 B<\b> assertion wants to be overloaded by a function.
63
64 =head2 Unicode case mappings 
65
66     Case Mappings? http://www.unicode.org/unicode/reports/tr21/
67
68 =head2 Unicode regular expression character classes
69
70 They have some tricks Perl doesn't yet implement like character
71 class subtraction.
72
73         http://www.unicode.org/unicode/reports/tr18/
74
75 =head2 use Thread for iThreads
76
77 Artur Bergman's C<iThreads> module is a start on this, but needs to
78 be more mature.
79
80 =head2 make perl_clone optionally clone ops
81
82 So that pseudoforking, mod_perl, iThreads and nvi will work properly
83 (but not as efficiently) until the regex engine is fixed to be threadsafe.
84
85 =head2 Work out exit/die semantics for threads
86
87 =head2 Typed lexicals for compiler
88
89 =head2 Compiler workarounds for Win32
90
91 =head2 AUTOLOADing in the compiler
92
93 =head2 Fixing comppadlist when compiling
94
95 =head2 Cleaning up exported namespace
96
97 =head2 Complete signal handling
98
99 Add C<PERL_ASYNC_CHECK> to opcodes which loop; replace C<sigsetjmp> with
100 C<sigjmp>; check C<wait> for signal safety.
101
102 =head2 Out-of-source builds
103
104 This was done for 5.6.0, but needs reworking for 5.7.x
105
106 =head2 POSIX realtime support
107
108 POSIX 1003.1 1996 Edition support--realtime stuff: POSIX semaphores,
109 message queues, shared memory, realtime clocks, timers, signals (the
110 metaconfig units mostly already exist for these)
111
112 =head2 UNIX98 support
113
114 Reader-writer locks, realtime/asynchronous IO
115
116 =head2 IPv6 Support
117
118 There are non-core modules, such as C<Net::IPv6>, but these will need
119 integrating when IPv6 actually starts to really happen.  See RFC 2292
120 and RFC 2553.
121
122 =head2 Long double conversion
123
124 Floating point formatting is still causing some weird test failures.
125
126 =head2 Locales
127
128 Locales and Unicode interact with each other in unpleasant ways.
129 One possible solution would be to adopt/support ICU:
130
131         http://oss.software.ibm.com/developerworks/opensource/icu/project/
132
133 =head2 Thread-safe regexes
134
135 The regular expression engine is currently non-threadsafe.
136
137 =head2 Arithmetic on non-Arabic numerals
138
139 C<[1234567890]> aren't the only numerals any more.
140
141 =head2 POSIX Unicode character classes
142
143 ([=a=] for equivalance classes, [.ch.] for collation.)
144 These are dependent on Unicode normalization and collation.
145
146 =head2 Factoring out common suffices/prefices in regexps (trie optimization)
147
148 Currently, the user has to optimize C<foo|far> and C<foo|goo> into
149 C<f(?:oo|ar)> and C<[fg]oo> by hand; this could be done automatically.
150
151 =head2 Security audit shipped utilities
152
153 All the code we ship with Perl needs to be sensible about temporary file
154 handling, locking, input validation, and so on.
155
156 =head2 Custom opcodes
157
158 Have a way to introduce user-defined opcodes without the subroutine call
159 overhead of an XSUB; the user should be able to create PP code. Simon
160 Cozens has some ideas on this.
161
162 =head2 spawnvp() on Win32
163
164 Win32 has problems spawning processes, particularly when the arguments
165 to the child process contain spaces, quotes or tab characters.
166
167 =head2 DLL Versioning
168
169 Windows needs a way to know what version of a XS or C<libperl> DLL it's
170 loading.
171
172 =head2 Introduce @( and @)
173
174 C<$(> may return "foo bar baz". Unfortunately, since groups can
175 theoretically have spaces in their names, this could be one, two or
176 three groups.
177
178 =head2 Floating point handling
179
180 C<NaN> and C<inf> support is particularly troublesome.
181 (fp_classify(), fp_class(), fp_class_d(), class(), isinf(),
182 isfinite(), finite(), isnormal(), unordered(), <ieeefp.h>,
183 <fp_class.h> (there are metaconfig units for all these) (I think),
184 fp_setmask(), fp_getmask(), fp_setround(), fp_getround()
185 (no metaconfig units yet for these).  Don't forget finitel(), fp_classl(),
186 fp_class_l(), (yes, both do, unfortunately, exist), and unorderedl().)
187
188 As of Perl 5.6.1 is a Perl macro, Perl_isnan().
189
190 =head2 IV/UV preservation
191
192 Nicholas Clark has done a lot of work on this, but work is continuing.
193 C<+>, C<-> and C<*> work, but guards need to be in place for C<%>, C</>,
194 C<&>, C<oct>, C<hex> and C<pack>.
195
196 =head2 Replace pod2html with something using Pod::Parser
197
198 The CPAN module C<Malik::Pod::Html> may be a more suitable basis for a
199 C<pod2html> convertor; the current one duplicates the functionality
200 abstracted in C<Pod::Parser>, which makes updating the POD language
201 difficult.
202
203 =head2 Automate module testing on CPAN
204
205 When a new Perl is being beta tested, porters have to manually grab
206 their favourite CPAN modules and test them - this should be done
207 automatically.
208
209 =head2 sendmsg and recvmsg
210
211 We have all the other BSD socket functions but these. There are
212 metaconfig units for these functions which can be added. To avoid these
213 being new opcodes, a solution similar to the way C<sockatmark> was added
214 would be preferable. (Autoload the C<IO::whatever> module.)
215
216 =head2 Rewrite perlre documentation
217
218 The new-style patterns need full documentation, and the whole document
219 needs to be a lot clearer.
220
221 =head2 Convert example code to IO::Handle filehandles
222
223 =head2 Document Win32 choices
224
225 =head2 Check new modules
226
227 =head2 Make roffitall find pods and libs itself
228
229 Simon Cozens has done some work on this but it needs a rethink.
230
231 =head1 To do at some point
232
233 These are ideas that have been regularly tossed around, that most
234 people believe should be done maybe during 5.8.x
235
236 =head2 Remove regular expression recursion
237
238 Because the regular expression engine is recursive, badly designed
239 expressions can lead to lots of recursion filling up the stack. Ilya
240 claims that it is easy to convert the engine to being iterative, but
241 this has still not yet been done. There may be a regular expression
242 engine hit squad meeting at TPC5.
243
244 =head2 Memory leaks after failed eval
245
246 Perl will leak memory if you C<eval "hlagh hlagh hlagh hlagh">. This is
247 partially because it attempts to build up an op tree for that code and
248 doesn't properly free it. The same goes for non-syntactically-correct
249 regular expressions. Hugo looked into this, but decided it needed a
250 mark-and-sweep GC implementation. 
251
252 Alan notes that: The basic idea was to extend the parser token stack
253 (C<YYSTYPE>) to include a type field so we knew what sort of thing each
254 element of the stack was.  The F<<perly.c> code would then have to be
255 postprocessed to record the type of each entry on the stack as it was
256 created, and the parser patched so that it could unroll the stack
257 properly on error.
258
259 This is possible to do, but would be pretty messy to implement, as it
260 would rely on even more sed hackery in F<perly.fixer>.
261
262 =head2 pack "(stuff)*"
263
264 That's to say, C<pack "(sI)40"> would be the same as C<pack "sI"x40>
265
266 =head2 bitfields in pack
267
268 =head2 Cross compilation
269
270 Make Perl buildable with a cross-compiler. This will play havoc with
271 Configure, which needs to how how the target system will respond to
272 its tests; maybe C<microperl> will be a good starting point here.
273 (Indeed, Bart Schuller reports that he compiled up C<microperl> for
274 the Agenda PDA and it works fine.)  A really big spanner in the works
275 is the bootstrapping build process of Perl: if the filesystem the
276 target systems sees is not the same what the build host sees, various
277 input, output, and (Perl) library files need to be copied back and forth.
278
279 As of 5.8.0 Configure mostly works for cross-compilation
280 (used successfully for iPAQ Linux), miniperl gets built,
281 but then building DynaLoader (and other extensions) fails
282 since MakeMaker knows nothing of cross-compilation.
283 (See INSTALL/Cross-compilation for the state of things.)
284
285 =head2 Perl preprocessor / macros
286
287 Source filters help with this, but do not get us all the way. For
288 instance, it should be possible to implement the C<??> operator somehow;
289 source filters don't (quite) cut it.
290
291 =head2 Perl lexer in Perl
292
293 Damian Conway is planning to work on this, but it hasn't happened yet.
294
295 =head2 Using POSIX calls internally
296
297 When faced with a BSD vs. SySV -style interface to some library or
298 system function, perl's roots show in that it typically prefers the BSD
299 interface (but falls back to the SysV one).  One example is getpgrp().
300 Other examples include C<memcpy> vs. C<bcopy>.  There are others, mostly in
301 F<<pp_sys.c>.
302
303 Mostly, this item is a suggestion for which way to start a journey into
304 an C<#ifdef> forest.  It is not primarily a suggestion to eliminate any of
305 the C<#ifdef> forests.
306
307 POSIX calls are perhaps more likely to be portable to unexpected
308 architectures. They are also perhaps more likely to be actively
309 maintained by a current vendor.  They are also perhaps more likely to be
310 available in thread-safe versions, if appropriate.
311
312 =head2 -i rename file when changed
313
314 It's only necessary to rename a file when inplace editing when the file
315 has changed. Detecting a change is perhaps the difficult bit.
316
317 =head2 All ARGV input should act like E<lt>E<gt>
318
319 =head2 Support for rerunning debugger
320
321 There should be a way of restarting the debugger on demand.
322
323 =head2 Test Suite for the Debugger
324
325 The debugger is a complex piece of software and fixing something
326 here may inadvertently break something else over there.  To tame
327 this chaotic behaviour, a test suite is necessary. 
328
329 =head2 my sub foo { }
330
331 The basic principle is sound, but there are problems with the semantics
332 of self-referential and mutually referential lexical subs: how to
333 declare the subs?
334
335 =head2 One-pass global destruction
336
337 Sweeping away all the allocated memory in one go is a laudable goal, but
338 it's difficult and in most cases, it's easier to let the memory get
339 freed by exiting.
340
341 =head2 Rewrite regexp parser
342
343 There has been talk recently of rewriting the regular expression parser
344 to produce an optree instead of a chain of opcodes; it's unclear whether
345 or not this would be a win. 
346
347 =head2 Cache recently used regexps
348
349 This is to speed up 
350
351     for my $re (@regexps) {
352         $matched++ if /$re/
353     }
354
355 C<qr//> already gives us a way of saving compiled regexps, but it should
356 be done automatically.
357
358 =head2 Re-entrant functions
359
360 Add configure probes for C<_r> forms of system calls and fit them to the
361 core. Unfortunately, calling conventions for these functions and not
362 standardised.
363
364 =head2 Cross-compilation support
365
366 Bart Schuller reports that using C<microperl> and a cross-compiler, he
367 got Perl working on the Agenda PDA. However, one cannot build a full
368 Perl because Configure needs to get the results for the target platform,
369 for the host.
370
371 =head2 Bit-shifting bitvectors
372
373 Given:
374
375     vec($v, 1000, 1) = 1;
376
377 One should be able to do
378
379     $v <<= 1;
380
381 and have the 999'th bit set.
382
383 Currently if you try with shift bitvectors you shift the NV/UV, instead
384 of the bits in the PV.  Not very logical.
385
386 =head2 debugger pragma
387
388 The debugger is implemented in Perl in F<perl5db.pl>; turning it into a
389 pragma should be easy, but making it work lexically might be more
390 difficult. Fiddling with C<$^P> would be necessary.
391
392 =head2 use less pragma
393
394 Identify areas where speed/memory tradeoffs can be made and have a hint
395 to switch between them.
396
397 =head2 switch structures
398
399 Although we have C<Switch.pm> in core, Larry points to the dormant
400 C<nswitch> and C<cswitch> ops in F<pp.c>; using these opcodes would be
401 much faster.
402
403 =head2 Cache eval tree
404
405 =head2 rcatmaybe
406
407 =head2 Shrink opcode tables
408
409 =head2 Optimize away @_
410
411 Look at the "reification" code in C<av.c>
412
413 =head2 Prototypes versus indirect objects
414
415 Currently, indirect object syntax bypasses prototype checks.
416
417 =head2 Install HMTL
418
419 HTML versions of the documentation need to be installed by default; a
420 call to C<installhtml> from C<installperl> may be all that's necessary.
421
422 =head2 Prototype method calls
423
424 =head2 Return context prototype declarations
425
426 =head2 magic_setisa
427
428 =head2 Garbage collection
429
430 There have been persistent mumblings about putting a mark-and-sweep
431 garbage detector into Perl; Alan Burlison has some ideas about this.
432
433 =head2 IO tutorial
434
435 Mark-Jason Dominus has the beginnings of one of these.
436
437 =head2 pack/unpack tutorial
438
439 Simon Cozens has the beginnings of one of these.
440
441 =head2 Rewrite perldoc
442
443 There are a few suggestions for what to do with C<perldoc>: maybe a
444 full-text search, an index function, locating pages on a particular
445 high-level subject, and so on.
446
447 =head2 Install .3p manpages
448
449 This is a bone of contention; we can create C<.3p> manpages for each
450 built-in function, but should we install them by default? Tcl does this,
451 and it clutters up C<apropos>.
452
453 =head2 Unicode tutorial
454
455 Simon Cozens promises to do this before he gets old.
456
457 =head2 Update POSIX.pm for 1003.1-2
458
459 =head2 Retargetable installation
460
461 Allow C<@INC> to be changed after Perl is built.
462
463 =head2 POSIX emulation on non-POSIX systems
464
465 Make C<POSIX.pm> behave as POSIXly as possible everywhere, meaning we
466 have to implement POSIX equivalents for some functions if necessary.
467
468 =head2 Rename Win32 headers
469
470 =head2 Finish off lvalue functions
471
472 They don't work in the debugger, and they don't work for list or hash
473 slices.
474
475 =head2 Update sprintf documentation
476
477 Hugo van der Sanden plans to look at this.
478
479 =head2 Use fchown/fchmod internally
480
481 This has been done in places, but needs a thorough code review.
482 Also fchdir is available in some platforms.
483
484 =head1 Vague ideas
485
486 Ideas which have been discussed, and which may or may not happen.
487
488 =head2 ref() in list context
489
490 It's unclear what this should do or how to do it without breaking old
491 code.
492
493 =head2 Make tr/// return histogram of characters in list context
494
495 There is a patch for this, but it may require Unicodification.
496
497 =head2 Compile to real threaded code
498
499 =head2 Structured types
500
501 =head2 Modifiable $1 et al.
502
503     ($x = "elephant") =~ /e(ph)/;
504     $1 = "g"; # $x = "elegant"
505
506 What happens if there are multiple (nested?) brackets? What if the
507 string changes between the match and the assignment?
508
509 =head2 Procedural interfaces for IO::*, etc.
510
511 Some core modules have been accused of being overly-OO. Adding
512 procedural interfaces could demystify them.
513
514 =head2 RPC modules
515
516 =head2 Attach/detach debugger from running program
517
518 With C<gdb>, you can attach the debugger to a running program if you
519 pass the process ID. It would be good to do this with the Perl debugger
520 on a running Perl program, although I'm not sure how it would be done.
521
522 =head2 Alternative RE syntax module
523
524     use Regex::Newbie;
525     $re = Regex::Newbie->new
526                        ->start
527                        ->match("foo")
528                        ->repeat(Regex::Newbie->class("char"),3)
529                        ->end;
530     /$re/;
531
532 =head2 GUI::Native
533
534 A non-core module that would use "native" GUI to create graphical
535 applications.
536
537 =head2 foreach(reverse ...)
538
539 Currently
540
541     foreach (reverse @_) { ... }
542
543 puts C<@_> on the stack, reverses it putting the reversed version on the
544 stack, then iterates forwards. Instead, it could be special-cased to put
545 C<@_> on the stack then iterate backwards.
546
547 =head2 Constant function cache
548
549 =head2 Approximate regular expression matching
550
551 =head1 Ongoing
552
553 These items B<always> need doing:
554
555 =head2 Update guts documentation
556
557 Simon Cozens tries to do this when possible, and contributions to the
558 C<perlapi> documentation is welcome.
559
560 =head2 Add more tests
561
562 Michael Schwern will donate $500 to Yet Another Society when all core
563 modules have tests.
564
565 =head2 Update auxiliary tools
566
567 The code we ship with Perl should look like good Perl 5.
568
569 =head1 Recently done things
570
571 These are things which have been on the todo lists in previous releases
572 but have recently been completed.
573
574 =head2 Safe signal handling
575
576 A new signal model went into 5.7.1 without much fanfare. Operations and
577 C<malloc>s are no longer interrupted by signals, which are handled
578 between opcodes. This means that C<PERL_ASYNC_CHECK> now actually does
579 something. However, there are still a few things that need to be done.
580
581 =head2 Tie Modules
582
583 Modules which implement arrays in terms of strings, substrings or files
584 can be found on the CPAN.
585
586 =head2 gettimeofday
587
588 C<Time::Hires> has been integrated into the core.
589
590 =head2 setitimer and getimiter
591
592 Adding C<Time::Hires> got us this too.
593
594 =head2 Testing __DIE__ hook
595
596 Tests have been added.
597
598 =head2 CPP equivalent in Perl
599
600 A C Yardley will probably have done this by the time you can read this.
601 This allows for a generalization of the C constant detection used in
602 building C<Errno.pm>.
603
604 =head2 Explicit switch statements
605
606 C<Switch.pm> has been integrated into the core to give you all manner of
607 C<switch...case> semantics.
608
609 =head2 autocroak
610
611 This is C<Fatal.pm>.
612
613 =head2 UTF/EBCDIC
614
615 Nick Ing-Simmons has made UTF-EBCDIC (UTR13) work with Perl.
616
617     EBCDIC?        http://www.unicode.org/unicode/reports/tr16/
618
619 =head2 UTF Regexes
620
621 Although there are probably some small bugs to be rooted out, Jarkko
622 Hietaniemi has made regular expressions polymorphic between bytes and
623 characters.
624
625 =head2 perlcc to produce executable
626
627 C<perlcc> was recently rewritten, and can now produce standalone
628 executables.
629
630 =head2 END blocks saved in compiled output
631
632 =head2 Secure temporary file module
633
634 Tim Jenness' C<File::Temp> is now in core.
635
636 =head2 Integrate Time::HiRes
637
638 This module is now part of core.
639
640 =head2 Turn Cwd into XS
641
642 Benjamin Sugars has done this.
643
644 =head2 Mmap for input
645
646 Nick Ing-Simmons' C<perlio> supports an C<mmap> IO method.
647
648 =head2 Byte to/from UTF8 and UTF8 to/from local conversion
649
650 C<Encode> provides this.
651
652 =head2 Add sockatmark support
653
654 Added in 5.7.1
655
656 =head2 Mailing list archives
657
658 http://lists.perl.org/, http://archive.develooper.com/
659
660 =head2 Bug tracking
661
662 Richard Foley has written the bug tracking system at http://bugs.perl.org/
663
664 =head2 Integrate MacPerl
665
666 Chris Nandor and Matthias Neeracher have integrated the MacPerl changes
667 into 5.6.0.
668
669 =head2 Web "nerve center" for Perl
670
671 http://use.perl.org/ is what you're looking for.
672
673 =head2 Regular expression tutorial
674
675 C<perlretut>, provided by Mark Kvale.
676
677 =head2 Debugging Tutorial
678
679 C<perldebtut>, written by Richard Foley.
680
681 =head2 Integrate new modules
682
683 Jarkko has been integrating madly into 5.7.x
684
685 =head2 Integrate profiler
686
687 C<Devel::DProf> is now a core module.
688
689 =head2 Y2K error detection
690
691 There's a configure option to detect unsafe concatenation with "19", and
692 a CPAN module. (C<D'oh::Year>)
693
694 =head2 Regular expression debugger
695
696 While not part of core, Mark-Jason Dominus has written C<Rx> and has
697 also come up with a generalised strategy for regular expression
698 debugging.
699
700 =head2 POD checker
701
702 That's, uh, F<podchecker>
703
704 =head2 "Dynamic" lexicals
705
706 =head2 Cache precompiled modules
707
708 =head1 Deprecated Wishes
709
710 These are items which used to be in the todo file, but have been
711 deprecated for some reason.
712
713 =head2 Loop control on do{}
714
715 This would break old code; use C<do{{ }}> instead.
716
717 =head2 Lexically scoped typeglobs
718
719 Not needed now we have lexical IO handles.
720
721 =head2 format BOTTOM
722
723 =head2 report HANDLE
724
725 Damian Conway's text formatting modules seem to be the Way To Go.
726
727 =head2 Generalised want()/caller())
728
729 =head2 Named prototypes
730
731 These both seem to be delayed until Perl 6.
732
733 =head2 Built-in globbing
734
735 The C<File::Glob> module has been used to replace the C<glob> function.
736
737 =head2 Regression tests for suidperl
738
739 C<suidperl> is deprecated in favour of common sense.
740
741 =head2 Cached hash values
742
743 We have shared hash keys, which perform the same job.
744
745 =head2 Add compression modules
746
747 The compression modules are a little heavy; meanwhile, Nick Clark is
748 working on experimental pragmata to do transparent decompression on
749 input.
750
751 =head2 Reorganise documentation into tutorials/references
752
753 Could not get consensus on P5P about this.
754
755 =head2 Remove distinction between functions and operators
756
757 Caution: highly flammable.
758
759 =head2 Make XS easier to use
760
761 Use C<Inline> instead, or SWIG.
762
763 =head2 Make embedding easier to use
764
765 Use C<Inline::CPR>.
766
767 =head2 man for perl
768
769 See the Perl Power Tools. (http://language.perl.com/ppt/)
770
771 =head2 my $Package::variable
772
773 Use C<our> instead.
774
775 =head2 "or" tests defined, not truth
776
777 Suggesting this on P5P B<will> cause a boring and interminable flamewar.
778
779 =head2 "class"-based lexicals
780
781 Use flyweight objects, secure hashes or, dare I say it, pseudo-hashes instead.
782 (Or whatever will replace pseudohashes in 5.10.)
783
784 =head2 byteperl
785
786 C<ByteLoader> covers this.
787
788 =head2 Lazy evaluation / tail recursion removal
789
790 C<List::Util> gives first() (a short-circuiting grep); tail recursion
791 removal is done manually, with C<goto &whoami;>. (However, MJD has
792 found that C<goto &whoami> introduces a performance penalty, so maybe
793 there should be a way to do this after all: C<sub foo {START: ... goto
794 START;> is better.)
795
796 =head2 Make "use utf8" the default
797
798 Because of backward compatibility this is difficult: scripts could not
799 contain B<any legacy eight-bit data> (like Latin-1) anymore, even in
800 string literals or pod.  Also would introduce a measurable slowdown of
801 at least few percentages since all regular expression operations would
802 be done in full UTF-8.  But if you want to try this, add
803 -DUSE_UTF8_SCRIPTS to your compilation flags.
804
805 =head2 Unicode collation and normalization
806
807 The Unicode::Collate and Unicode::Normalize modules
808 by SADAHIRO Tomoyuki have been included since 5.8.0.
809
810     Collation?     http://www.unicode.org/unicode/reports/tr10/
811     Normalization? http://www.unicode.org/unicode/reports/tr15/
812
813 =cut