Integrate Memoize 0.64. Few tweaks were required in
[p5sagit/p5-mst-13.2.git] / pod / perltodo.pod
1 =head1 NAME
2
3 perltodo - Perl TO-DO List
4
5 =head1 DESCRIPTION
6
7 This is a list of wishes for Perl.  Send updates to
8 I<perl5-porters@perl.org>.  If you want to work on any of these
9 projects, be sure to check the perl5-porters archives for past ideas,
10 flames, and propaganda.  This will save you time and also prevent you
11 from implementing something that Larry has already vetoed.  One set
12 of archives may be found at:
13
14     http://www.xray.mpe.mpg.de/mailing-lists/perl5-porters/
15
16 =head1 To do during 5.6.x
17
18 =head2 Support for I/O disciplines
19
20 C<perlio> provides this, but the interface could be a lot more
21 straightforward.
22
23 =head2 Eliminate need for "use utf8";
24
25 While the C<utf8> pragma is autoloaded when necessary, it's still needed
26 for things like Unicode characters in a source file. The UTF8 hint can
27 always be set to true, but it needs to be set to false when F<utf8.pm>
28 is being compiled. (To stop Perl trying to autoload the C<utf8>
29 pragma...)
30
31 =head2 Autoload byte.pm
32
33 When the lexer sees, for instance, C<bytes::length>, it should
34 automatically load the C<bytes> pragma.
35
36 =head2 Make "\u{XXXX}" et al work
37
38 Danger, Will Robinson! Discussing the semantics of C<"\x{F00}">,
39 C<"\xF00"> and C<"\U{F00}"> on P5P I<will> lead to a long and boring
40 flamewar.
41
42 =head2 Overloadable regex assertions
43
44 This may or may not be possible with the current regular expression
45 engine. The idea is that, for instance, C<\b> needs to be
46 algorithmically computed if you're dealing with Thai text. Hence, the
47 B<\b> assertion wants to be overloaded by a function.
48
49 =head2 Unicode collation and normalization
50
51 Simon Cozens promises to work on this.
52
53     Collation?     http://www.unicode.org/unicode/reports/tr10/
54     Normalization? http://www.unicode.org/unicode/reports/tr15/
55
56 =head2 Unicode case mappings 
57
58     Case Mappings? http://www.unicode.org/unicode/reports/tr21/
59
60 =head2 Unicode regular expression character classes
61
62 They have some tricks Perl doesn't yet implement.
63
64         http://www.unicode.org/unicode/reports/tr18/
65
66 =head2 use Thread for iThreads
67
68 Artur Bergman's C<iThreads> module is a start on this, but needs to
69 be more mature.
70
71 =head2 make perl_clone optionally clone ops
72
73 So that pseudoforking, mod_perl, iThreads and nvi will work properly
74 (but not as efficiently) until the regex engine is fixed to be threadsafe.
75
76 =head2 Work out exit/die semantics for threads
77
78 =head2 Typed lexicals for compiler
79
80 =head2 Compiler workarounds for Win32
81
82 =head2 AUTOLOADing in the compiler
83
84 =head2 Fixing comppadlist when compiling
85
86 =head2 Cleaning up exported namespace
87
88 =head2 Complete signal handling
89
90 Add C<PERL_ASYNC_CHECK> to opcodes which loop; replace C<sigsetjmp> with
91 C<sigjmp>; check C<wait> for signal safety.
92
93 =head2 Out-of-source builds
94
95 This was done for 5.6.0, but needs reworking for 5.7.x
96
97 =head2 POSIX realtime support
98
99 POSIX 1003.1 1996 Edition support--realtime stuff: POSIX semaphores,
100 message queues, shared memory, realtime clocks, timers, signals (the
101 metaconfig units mostly already exist for these)
102
103 =head2 UNIX98 support
104
105 Reader-writer locks, realtime/asynchronous IO
106
107 =head2 IPv6 Support
108
109 There are non-core modules, such as C<Net::IPv6>, but these will need
110 integrating when IPv6 actually starts to really happen.  See RFC 2292
111 and RFC 2553.
112
113 =head2 Long double conversion
114
115 Floating point formatting is still causing some weird test failures.
116
117 =head2 Locales
118
119 Locales and Unicode interact with each other in unpleasant ways.
120 One possible solution would be to adopt/support ICU:
121
122         http://oss.software.ibm.com/developerworks/opensource/icu/project/
123
124 =head2 Thread-safe regexes
125
126 The regular expression engine is currently non-threadsafe.
127
128 =head2 Arithmetic on non-Arabic numerals
129
130 C<[1234567890]> aren't the only numerals any more.
131
132 =head2 POSIX Unicode character classes
133
134 ([=a=] for equivalance classes, [.ch.] for collation.)
135 These are dependent on Unicode normalization and collation.
136
137 =head2 Factoring out common suffices/prefices in regexps (trie optimization)
138
139 Currently, the user has to optimize C<foo|far> and C<foo|goo> into
140 C<f(?:oo|ar)> and C<[fg]oo> by hand; this could be done automatically.
141
142 =head2 Security audit shipped utilities
143
144 All the code we ship with Perl needs to be sensible about temporary file
145 handling, locking, input validation, and so on.
146
147 =head2 Custom opcodes
148
149 Have a way to introduce user-defined opcodes without the subroutine call
150 overhead of an XSUB; the user should be able to create PP code. Simon
151 Cozens has some ideas on this.
152
153 =head2 spawnvp() on Win32
154
155 Win32 has problems spawning processes, particularly when the arguments
156 to the child process contain spaces, quotes or tab characters.
157
158 =head2 DLL Versioning
159
160 Windows needs a way to know what version of a XS or C<libperl> DLL it's
161 loading.
162
163 =head2 Introduce @( and @)
164
165 C<$(> may return "foo bar baz". Unfortunately, since groups can
166 theoretically have spaces in their names, this could be one, two or
167 three groups.
168
169 =head2 Floating point handling
170
171 C<NaN> and C<inf> support is particularly troublesome.
172 (fp_classify(), fp_class(), fp_class_d(), class(), isinf(),
173 isfinite(), finite(), isnormal(), unordered(), <ieeefp.h>,
174 <fp_class.h> (there are metaconfig units for all these) (I think),
175 fp_setmask(), fp_getmask(), fp_setround(), fp_getround()
176 (no metaconfig units yet for these).  Don't forget finitel(), fp_classl(),
177 fp_class_l(), (yes, both do, unfortunately, exist), and unorderedl().)
178
179 As of Perl 5.6.1 is a Perl macro, Perl_isnan().
180
181 =head2 IV/UV preservation
182
183 Nicholas Clark has done a lot of work on this, but work is continuing.
184 C<+>, C<-> and C<*> work, but guards need to be in place for C<%>, C</>,
185 C<&>, C<oct>, C<hex> and C<pack>.
186
187 =head2 Replace pod2html with something using Pod::Parser
188
189 The CPAN module C<Malik::Pod::Html> may be a more suitable basis for a
190 C<pod2html> convertor; the current one duplicates the functionality
191 abstracted in C<Pod::Parser>, which makes updating the POD language
192 difficult.
193
194 =head2 Automate module testing on CPAN
195
196 When a new Perl is being beta tested, porters have to manually grab
197 their favourite CPAN modules and test them - this should be done
198 automatically.
199
200 =head2 sendmsg and recvmsg
201
202 We have all the other BSD socket functions but these. There are
203 metaconfig units for these functions which can be added. To avoid these
204 being new opcodes, a solution similar to the way C<sockatmark> was added
205 would be preferable. (Autoload the C<IO::whatever> module.)
206
207 =head2 Rewrite perlre documentation
208
209 The new-style patterns need full documentation, and the whole document
210 needs to be a lot clearer.
211
212 =head2 Convert example code to IO::Handle filehandles
213
214 =head2 Document Win32 choices
215
216 =head2 Check new modules
217
218 =head2 Make roffitall find pods and libs itself
219
220 Simon Cozens has done some work on this but it needs a rethink.
221
222 =head1 To do at some point
223
224 These are ideas that have been regularly tossed around, that most
225 people believe should be done maybe during 5.8.x
226
227 =head2 Remove regular expression recursion
228
229 Because the regular expression engine is recursive, badly designed
230 expressions can lead to lots of recursion filling up the stack. Ilya
231 claims that it is easy to convert the engine to being iterative, but
232 this has still not yet been done. There may be a regular expression
233 engine hit squad meeting at TPC5.
234
235 =head2 Memory leaks after failed eval
236
237 Perl will leak memory if you C<eval "hlagh hlagh hlagh hlagh">. This is
238 partially because it attempts to build up an op tree for that code and
239 doesn't properly free it. The same goes for non-syntactically-correct
240 regular expressions. Hugo looked into this, but decided it needed a
241 mark-and-sweep GC implementation. 
242
243 Alan notes that: The basic idea was to extend the parser token stack
244 (C<YYSTYPE>) to include a type field so we knew what sort of thing each
245 element of the stack was.  The F<<perly.c> code would then have to be
246 postprocessed to record the type of each entry on the stack as it was
247 created, and the parser patched so that it could unroll the stack
248 properly on error.
249
250 This is possible to do, but would be pretty messy to implement, as it
251 would rely on even more sed hackery in F<perly.fixer>.
252
253 =head2 pack "(stuff)*"
254
255 That's to say, C<pack "(sI)40"> would be the same as C<pack "sI"x40>
256
257 =head2 bitfields in pack
258
259 =head2 Cross compilation
260
261 Make Perl buildable with a cross-compiler. This will play havoc with
262 Configure, which needs to how how the target system will respond to
263 its tests; maybe C<microperl> will be a good starting point here.
264 (Indeed, Bart Schuller reports that he compiled up C<microperl> for
265 the Agenda PDA and it works fine.)  A really big spanner in the works
266 is the bootstrapping build process of Perl: if the filesystem the
267 target systems sees is not the same what the build host sees, various
268 input, output, and (Perl) library files need to be copied back and forth.
269
270 =head2 Perl preprocessor / macros
271
272 Source filters help with this, but do not get us all the way. For
273 instance, it should be possible to implement the C<??> operator somehow;
274 source filters don't (quite) cut it.
275
276 =head2 Perl lexer in Perl
277
278 Damian Conway is planning to work on this, but it hasn't happened yet.
279
280 =head2 Using POSIX calls internally
281
282 When faced with a BSD vs. SySV -style interface to some library or
283 system function, perl's roots show in that it typically prefers the BSD
284 interface (but falls back to the SysV one).  One example is getpgrp().
285 Other examples include C<memcpy> vs. C<bcopy>.  There are others, mostly in
286 F<<pp_sys.c>.
287
288 Mostly, this item is a suggestion for which way to start a journey into
289 an C<#ifdef> forest.  It is not primarily a suggestion to eliminate any of
290 the C<#ifdef> forests.
291
292 POSIX calls are perhaps more likely to be portable to unexpected
293 architectures. They are also perhaps more likely to be actively
294 maintained by a current vendor.  They are also perhaps more likely to be
295 available in thread-safe versions, if appropriate.
296
297 =head2 -i rename file when changed
298
299 It's only necessary to rename a file when inplace editing when the file
300 has changed. Detecting a change is perhaps the difficult bit.
301
302 =head2 All ARGV input should act like E<lt>E<gt>
303
304 =head2 Support for rerunning debugger
305
306 There should be a way of restarting the debugger on demand.
307
308 =head2 my sub foo { }
309
310 The basic principle is sound, but there are problems with the semantics
311 of self-referential and mutually referential lexical subs: how to
312 declare the subs?
313
314 =head2 One-pass global destruction
315
316 Sweeping away all the allocated memory in one go is a laudable goal, but
317 it's difficult and in most cases, it's easier to let the memory get
318 freed by exiting.
319
320 =head2 Rewrite regexp parser
321
322 There has been talk recently of rewriting the regular expression parser
323 to produce an optree instead of a chain of opcodes; it's unclear whether
324 or not this would be a win. 
325
326 =head2 Cache recently used regexps
327
328 This is to speed up 
329
330     for my $re (@regexps) {
331         $matched++ if /$re/
332     }
333
334 C<qr//> already gives us a way of saving compiled regexps, but it should
335 be done automatically.
336
337 =head2 Re-entrant functions
338
339 Add configure probes for C<_r> forms of system calls and fit them to the
340 core. Unfortunately, calling conventions for these functions and not
341 standardised.
342
343 =head2 Cross-compilation support
344
345 Bart Schuller reports that using C<microperl> and a cross-compiler, he
346 got Perl working on the Agenda PDA. However, one cannot build a full
347 Perl because Configure needs to get the results for the target platform,
348 for the host.
349
350 =head2 Bit-shifting bitvectors
351
352 Given:
353
354     vec($v, 1000, 1) = 1;
355
356 One should be able to do
357
358     $v <<= 1;
359
360 and have the 999'th bit set.
361
362 Currently if you try with shift bitvectors you shift the NV/UV, instead
363 of the bits in the PV.  Not very logical.
364
365 =head2 debugger pragma
366
367 The debugger is implemented in Perl in F<perl5db.pl>; turning it into a
368 pragma should be easy, but making it work lexically might be more
369 difficult. Fiddling with C<$^P> would be necessary.
370
371 =head2 use less pragma
372
373 Identify areas where speed/memory tradeoffs can be made and have a hint
374 to switch between them.
375
376 =head2 switch structures
377
378 Although we have C<Switch.pm> in core, Larry points to the dormant
379 C<nswitch> and C<cswitch> ops in F<pp.c>; using these opcodes would be
380 much faster.
381
382 =head2 Cache eval tree
383
384 =head2 rcatmaybe
385
386 =head2 Shrink opcode tables
387
388 =head2 Optimize away @_
389
390 Look at the "reification" code in C<av.c>
391
392 =head2 Prototypes versus indirect objects
393
394 Currently, indirect object syntax bypasses prototype checks.
395
396 =head2 Install HMTL
397
398 HTML versions of the documentation need to be installed by default; a
399 call to C<installhtml> from C<installperl> may be all that's necessary.
400
401 =head2 Prototype method calls
402
403 =head2 Return context prototype declarations
404
405 =head2 magic_setisa
406
407 =head2 Garbage collection
408
409 There have been persistent mumblings about putting a mark-and-sweep
410 garbage detector into Perl; Alan Burlison has some ideas about this.
411
412 =head2 IO tutorial
413
414 Mark-Jason Dominus has the beginnings of one of these.
415
416 =head2 pack/unpack tutorial
417
418 Simon Cozens has the beginnings of one of these.
419
420 =head2 Rewrite perldoc
421
422 There are a few suggestions for what to do with C<perldoc>: maybe a
423 full-text search, an index function, locating pages on a particular
424 high-level subject, and so on.
425
426 =head2 Install .3p manpages
427
428 This is a bone of contention; we can create C<.3p> manpages for each
429 built-in function, but should we install them by default? Tcl does this,
430 and it clutters up C<apropos>.
431
432 =head2 Unicode tutorial
433
434 Simon Cozens promises to do this before he gets old.
435
436 =head2 Update POSIX.pm for 1003.1-2
437
438 =head2 Retargetable installation
439
440 Allow C<@INC> to be changed after Perl is built.
441
442 =head2 POSIX emulation on non-POSIX systems
443
444 Make C<POSIX.pm> behave as POSIXly as possible everywhere, meaning we
445 have to implement POSIX equivalents for some functions if necessary.
446
447 =head2 Rename Win32 headers
448
449 =head2 Finish off lvalue functions
450
451 They don't work in the debugger, and they don't work for list or hash
452 slices.
453
454 =head2 Update sprintf documentation
455
456 Hugo van der Sanden plans to look at this.
457
458 =head2 Use fchown/fchmod internally
459
460 This has been done in places, but needs a thorough code review.
461 Also fchdir is available in some platforms.
462
463 =head1 Vague ideas
464
465 Ideas which have been discussed, and which may or may not happen.
466
467 =head2 ref() in list context
468
469 It's unclear what this should do or how to do it without breaking old
470 code.
471
472 =head2 Make tr/// return histogram
473
474 There is a patch for this, but it may require Unicodification.
475
476 =head2 Compile to real threaded code
477
478 =head2 Structured types
479
480 =head2 Modifiable $1 et al.
481
482     ($x = "elephant") =~ /e(ph)/;
483     $1 = "g"; # $x = "elegant"
484
485 What happens if there are multiple (nested?) brackets? What if the
486 string changes between the match and the assignment?
487
488 =head2 Procedural interfaces for IO::*, etc.
489
490 Some core modules have been accused of being overly-OO. Adding
491 procedural interfaces could demystify them.
492
493 =head2 RPC modules
494
495 =head2 Attach/detach debugger from running program
496
497 With C<gdb>, you can attach the debugger to a running program if you
498 pass the process ID. It would be good to do this with the Perl debugger
499 on a running Perl program, although I'm not sure how it would be done.
500
501 =head2 Alternative RE syntax module
502
503     use Regex::Newbie;
504     $re = Regex::Newbie->new
505                        ->start
506                        ->match("foo")
507                        ->repeat(Regex::Newbie->class("char"),3)
508                        ->end;
509     /$re/;
510
511 =head2 GUI::Native
512
513 A non-core module that would use "native" GUI to create graphical
514 applications.
515
516 =head2 foreach(reverse ...)
517
518 Currently
519
520     foreach (reverse @_) { ... }
521
522 puts C<@_> on the stack, reverses it putting the reversed version on the
523 stack, then iterates forwards. Instead, it could be special-cased to put
524 C<@_> on the stack then iterate backwards.
525
526 =head2 Constant function cache
527
528 =head2 Approximate regular expression matching
529
530 =head1 Ongoing
531
532 These items B<always> need doing:
533
534 =head2 Update guts documentation
535
536 Simon Cozens tries to do this when possible, and contributions to the
537 C<perlapi> documentation is welcome.
538
539 =head2 Add more tests
540
541 Michael Schwern will donate $500 to Yet Another Society when all core
542 modules have tests.
543
544 =head2 Update auxiliary tools
545
546 The code we ship with Perl should look like good Perl 5.
547
548 =head1 Recently done things
549
550 These are things which have been on the todo lists in previous releases
551 but have recently been completed.
552
553 =head2 Safe signal handling
554
555 A new signal model went into 5.7.1 without much fanfare. Operations and
556 C<malloc>s are no longer interrupted by signals, which are handled
557 between opcodes. This means that C<PERL_ASYNC_CHECK> now actually does
558 something. However, there are still a few things that need to be done.
559
560 =head2 Tie Modules
561
562 Modules which implement arrays in terms of strings, substrings or files
563 can be found on the CPAN.
564
565 =head2 gettimeofday
566
567 C<Time::Hires> has been integrated into the core.
568
569 =head2 setitimer and getimiter
570
571 Adding C<Time::Hires> got us this too.
572
573 =head2 Testing __DIE__ hook
574
575 Tests have been added.
576
577 =head2 CPP equivalent in Perl
578
579 A C Yardley will probably have done this by the time you can read this.
580 This allows for a generalization of the C constant detection used in
581 building C<Errno.pm>.
582
583 =head2 Explicit switch statements
584
585 C<Switch.pm> has been integrated into the core to give you all manner of
586 C<switch...case> semantics.
587
588 =head2 autocroak
589
590 This is C<Fatal.pm>.
591
592 =head2 UTF/EBCDIC
593
594 Nick Ing-Simmons has made UTF-EBCDIC (UTR13) work with Perl.
595
596     EBCDIC?        http://www.unicode.org/unicode/reports/tr16/
597
598 =head2 UTF Regexes
599
600 Although there are probably some small bugs to be rooted out, Jarkko
601 Hietaniemi has made regular expressions polymorphic between bytes and
602 characters.
603
604 =head2 perlcc to produce executable
605
606 C<perlcc> was recently rewritten, and can now produce standalone
607 executables.
608
609 =head2 END blocks saved in compiled output
610
611 =head2 Secure temporary file module
612
613 Tim Jenness' C<File::Temp> is now in core.
614
615 =head2 Integrate Time::HiRes
616
617 This module is now part of core.
618
619 =head2 Turn Cwd into XS
620
621 Benjamin Sugars has done this.
622
623 =head2 Mmap for input
624
625 Nick Ing-Simmons' C<perlio> supports an C<mmap> IO method.
626
627 =head2 Byte to/from UTF8 and UTF8 to/from local conversion
628
629 C<Encode> provides this.
630
631 =head2 Add sockatmark support
632
633 Added in 5.7.1
634
635 =head2 Mailing list archives
636
637 http://lists.perl.org/, http://archive.develooper.com/
638
639 =head2 Bug tracking
640
641 Richard Foley has written the bug tracking system at http://bugs.perl.org/
642
643 =head2 Integrate MacPerl
644
645 Chris Nandor and Matthias Neeracher have integrated the MacPerl changes
646 into 5.6.0.
647
648 =head2 Web "nerve center" for Perl
649
650 http://use.perl.org/ is what you're looking for.
651
652 =head2 Regular expression tutorial
653
654 C<perlretut>, provided by Mark Kvale.
655
656 =head2 Debugging Tutorial
657
658 C<perldebtut>, written by Richard Foley.
659
660 =head2 Integrate new modules
661
662 Jarkko has been integrating madly into 5.7.x
663
664 =head2 Integrate profiler
665
666 C<Devel::DProf> is now a core module.
667
668 =head2 Y2K error detection
669
670 There's a configure option to detect unsafe concatenation with "19", and
671 a CPAN module. (C<D'oh::Year>)
672
673 =head2 Regular expression debugger
674
675 While not part of core, Mark-Jason Dominus has written C<Rx> and has
676 also come up with a generalised strategy for regular expression
677 debugging.
678
679 =head2 POD checker
680
681 That's, uh, F<podchecker>
682
683 =head2 "Dynamic" lexicals
684
685 =head2 Cache precompiled modules
686
687 =head1 Deprecated Wishes
688
689 These are items which used to be in the todo file, but have been
690 deprecated for some reason.
691
692 =head2 Loop control on do{}
693
694 This would break old code; use C<do{{ }}> instead.
695
696 =head2 Lexically scoped typeglobs
697
698 Not needed now we have lexical IO handles.
699
700 =head2 format BOTTOM
701
702 =head2 report HANDLE
703
704 Damian Conway's text formatting modules seem to be the Way To Go.
705
706 =head2 Generalised want()/caller())
707
708 =head2 Named prototypes
709
710 These both seem to be delayed until Perl 6.
711
712 =head2 Built-in globbing
713
714 The C<File::Glob> module has been used to replace the C<glob> function.
715
716 =head2 Regression tests for suidperl
717
718 C<suidperl> is deprecated in favour of common sense.
719
720 =head2 Cached hash values
721
722 We have shared hash keys, which perform the same job.
723
724 =head2 Add compression modules
725
726 The compression modules are a little heavy; meanwhile, Nick Clark is
727 working on experimental pragmata to do transparent decompression on
728 input.
729
730 =head2 Reorganise documentation into tutorials/references
731
732 Could not get consensus on P5P about this.
733
734 =head2 Remove distinction between functions and operators
735
736 Caution: highly flammable.
737
738 =head2 Make XS easier to use
739
740 Use C<Inline> instead, or SWIG.
741
742 =head2 Make embedding easier to use
743
744 Use C<Inline::CPR>.
745
746 =head2 man for perl
747
748 See the Perl Power Tools. (http://language.perl.com/ppt/)
749
750 =head2 my $Package::variable
751
752 Use C<our> instead.
753
754 =head2 "or" tests defined, not truth
755
756 Suggesting this on P5P B<will> cause a boring and interminable flamewar.
757
758 =head2 "class"-based lexicals
759
760 Use flyweight objects, secure hashes or, dare I say it, pseudo-hashes instead.
761
762 =head2 byteperl
763
764 C<ByteLoader> covers this.
765
766 =head2 Lazy evaluation / tail recursion removal
767
768 C<List::Util> in core gives some of these; tail recursion removal is
769 done manually, with C<goto &whoami;>. (However, MJD has found that
770 C<goto &whoami> introduces a performance penalty, so maybe there should
771 be a way to do this after all: C<sub foo {START: ... goto START;> is
772 better.)