Document the need for sv_printify().
[p5sagit/p5-mst-13.2.git] / pod / perltodo.pod
1 =head1 NAME
2
3 perltodo - Perl TO-DO List
4
5 =head1 DESCRIPTION
6
7 This is a list of wishes for Perl.  Send updates to
8 I<perl5-porters@perl.org>.  If you want to work on any of these
9 projects, be sure to check the perl5-porters archives for past ideas,
10 flames, and propaganda.  This will save you time and also prevent you
11 from implementing something that Larry has already vetoed.  One set
12 of archives may be found at:
13
14     http://www.xray.mpe.mpg.de/mailing-lists/perl5-porters/
15
16 =head1 To do during 5.6.x
17
18 =head2 Support for I/O disciplines
19
20 C<perlio> provides this, but the interface could be a lot more
21 straightforward.
22
23 =head2 Eliminate need for "use utf8";
24
25 While the C<utf8> pragma is autoloaded when necessary, it's still needed
26 for things like Unicode characters in a source file. The UTF8 hint can
27 always be set to true, but it needs to be set to false when F<utf8.pm>
28 is being compiled. (To stop Perl trying to autoload the C<utf8>
29 pragma...)
30
31 =head2 Create a char *sv_printify(sv, STRLEN *lenp, UV flags) function
32
33 For displaying PVs with control characters, embedded nulls, and Unicode.
34 This would be useful for printing warnings, or data and regex dumping,
35 not_a_number(), and so on.
36
37 =head2 Autoload byte.pm
38
39 When the lexer sees, for instance, C<bytes::length>, it should
40 automatically load the C<bytes> pragma.
41
42 =head2 Make "\u{XXXX}" et al work
43
44 Danger, Will Robinson! Discussing the semantics of C<"\x{F00}">,
45 C<"\xF00"> and C<"\U{F00}"> on P5P I<will> lead to a long and boring
46 flamewar.
47
48 =head2 Overloadable regex assertions
49
50 This may or may not be possible with the current regular expression
51 engine. The idea is that, for instance, C<\b> needs to be
52 algorithmically computed if you're dealing with Thai text. Hence, the
53 B<\b> assertion wants to be overloaded by a function.
54
55 =head2 Unicode collation and normalization
56
57 Simon Cozens promises to work on this.
58
59     Collation?     http://www.unicode.org/unicode/reports/tr10/
60     Normalization? http://www.unicode.org/unicode/reports/tr15/
61
62 =head2 Unicode case mappings 
63
64     Case Mappings? http://www.unicode.org/unicode/reports/tr21/
65
66 =head2 Unicode regular expression character classes
67
68 They have some tricks Perl doesn't yet implement.
69
70         http://www.unicode.org/unicode/reports/tr18/
71
72 =head2 use Thread for iThreads
73
74 Artur Bergman's C<iThreads> module is a start on this, but needs to
75 be more mature.
76
77 =head2 make perl_clone optionally clone ops
78
79 So that pseudoforking, mod_perl, iThreads and nvi will work properly
80 (but not as efficiently) until the regex engine is fixed to be threadsafe.
81
82 =head2 Work out exit/die semantics for threads
83
84 =head2 Typed lexicals for compiler
85
86 =head2 Compiler workarounds for Win32
87
88 =head2 AUTOLOADing in the compiler
89
90 =head2 Fixing comppadlist when compiling
91
92 =head2 Cleaning up exported namespace
93
94 =head2 Complete signal handling
95
96 Add C<PERL_ASYNC_CHECK> to opcodes which loop; replace C<sigsetjmp> with
97 C<sigjmp>; check C<wait> for signal safety.
98
99 =head2 Out-of-source builds
100
101 This was done for 5.6.0, but needs reworking for 5.7.x
102
103 =head2 POSIX realtime support
104
105 POSIX 1003.1 1996 Edition support--realtime stuff: POSIX semaphores,
106 message queues, shared memory, realtime clocks, timers, signals (the
107 metaconfig units mostly already exist for these)
108
109 =head2 UNIX98 support
110
111 Reader-writer locks, realtime/asynchronous IO
112
113 =head2 IPv6 Support
114
115 There are non-core modules, such as C<Net::IPv6>, but these will need
116 integrating when IPv6 actually starts to really happen.  See RFC 2292
117 and RFC 2553.
118
119 =head2 Long double conversion
120
121 Floating point formatting is still causing some weird test failures.
122
123 =head2 Locales
124
125 Locales and Unicode interact with each other in unpleasant ways.
126 One possible solution would be to adopt/support ICU:
127
128         http://oss.software.ibm.com/developerworks/opensource/icu/project/
129
130 =head2 Thread-safe regexes
131
132 The regular expression engine is currently non-threadsafe.
133
134 =head2 Arithmetic on non-Arabic numerals
135
136 C<[1234567890]> aren't the only numerals any more.
137
138 =head2 POSIX Unicode character classes
139
140 ([=a=] for equivalance classes, [.ch.] for collation.)
141 These are dependent on Unicode normalization and collation.
142
143 =head2 Factoring out common suffices/prefices in regexps (trie optimization)
144
145 Currently, the user has to optimize C<foo|far> and C<foo|goo> into
146 C<f(?:oo|ar)> and C<[fg]oo> by hand; this could be done automatically.
147
148 =head2 Security audit shipped utilities
149
150 All the code we ship with Perl needs to be sensible about temporary file
151 handling, locking, input validation, and so on.
152
153 =head2 Custom opcodes
154
155 Have a way to introduce user-defined opcodes without the subroutine call
156 overhead of an XSUB; the user should be able to create PP code. Simon
157 Cozens has some ideas on this.
158
159 =head2 spawnvp() on Win32
160
161 Win32 has problems spawning processes, particularly when the arguments
162 to the child process contain spaces, quotes or tab characters.
163
164 =head2 DLL Versioning
165
166 Windows needs a way to know what version of a XS or C<libperl> DLL it's
167 loading.
168
169 =head2 Introduce @( and @)
170
171 C<$(> may return "foo bar baz". Unfortunately, since groups can
172 theoretically have spaces in their names, this could be one, two or
173 three groups.
174
175 =head2 Floating point handling
176
177 C<NaN> and C<inf> support is particularly troublesome.
178 (fp_classify(), fp_class(), fp_class_d(), class(), isinf(),
179 isfinite(), finite(), isnormal(), unordered(), <ieeefp.h>,
180 <fp_class.h> (there are metaconfig units for all these) (I think),
181 fp_setmask(), fp_getmask(), fp_setround(), fp_getround()
182 (no metaconfig units yet for these).  Don't forget finitel(), fp_classl(),
183 fp_class_l(), (yes, both do, unfortunately, exist), and unorderedl().)
184
185 As of Perl 5.6.1 is a Perl macro, Perl_isnan().
186
187 =head2 IV/UV preservation
188
189 Nicholas Clark has done a lot of work on this, but work is continuing.
190 C<+>, C<-> and C<*> work, but guards need to be in place for C<%>, C</>,
191 C<&>, C<oct>, C<hex> and C<pack>.
192
193 =head2 Replace pod2html with something using Pod::Parser
194
195 The CPAN module C<Malik::Pod::Html> may be a more suitable basis for a
196 C<pod2html> convertor; the current one duplicates the functionality
197 abstracted in C<Pod::Parser>, which makes updating the POD language
198 difficult.
199
200 =head2 Automate module testing on CPAN
201
202 When a new Perl is being beta tested, porters have to manually grab
203 their favourite CPAN modules and test them - this should be done
204 automatically.
205
206 =head2 sendmsg and recvmsg
207
208 We have all the other BSD socket functions but these. There are
209 metaconfig units for these functions which can be added. To avoid these
210 being new opcodes, a solution similar to the way C<sockatmark> was added
211 would be preferable. (Autoload the C<IO::whatever> module.)
212
213 =head2 Rewrite perlre documentation
214
215 The new-style patterns need full documentation, and the whole document
216 needs to be a lot clearer.
217
218 =head2 Convert example code to IO::Handle filehandles
219
220 =head2 Document Win32 choices
221
222 =head2 Check new modules
223
224 =head2 Make roffitall find pods and libs itself
225
226 Simon Cozens has done some work on this but it needs a rethink.
227
228 =head1 To do at some point
229
230 These are ideas that have been regularly tossed around, that most
231 people believe should be done maybe during 5.8.x
232
233 =head2 Remove regular expression recursion
234
235 Because the regular expression engine is recursive, badly designed
236 expressions can lead to lots of recursion filling up the stack. Ilya
237 claims that it is easy to convert the engine to being iterative, but
238 this has still not yet been done. There may be a regular expression
239 engine hit squad meeting at TPC5.
240
241 =head2 Memory leaks after failed eval
242
243 Perl will leak memory if you C<eval "hlagh hlagh hlagh hlagh">. This is
244 partially because it attempts to build up an op tree for that code and
245 doesn't properly free it. The same goes for non-syntactically-correct
246 regular expressions. Hugo looked into this, but decided it needed a
247 mark-and-sweep GC implementation. 
248
249 Alan notes that: The basic idea was to extend the parser token stack
250 (C<YYSTYPE>) to include a type field so we knew what sort of thing each
251 element of the stack was.  The F<<perly.c> code would then have to be
252 postprocessed to record the type of each entry on the stack as it was
253 created, and the parser patched so that it could unroll the stack
254 properly on error.
255
256 This is possible to do, but would be pretty messy to implement, as it
257 would rely on even more sed hackery in F<perly.fixer>.
258
259 =head2 pack "(stuff)*"
260
261 That's to say, C<pack "(sI)40"> would be the same as C<pack "sI"x40>
262
263 =head2 bitfields in pack
264
265 =head2 Cross compilation
266
267 Make Perl buildable with a cross-compiler. This will play havoc with
268 Configure, which needs to how how the target system will respond to
269 its tests; maybe C<microperl> will be a good starting point here.
270 (Indeed, Bart Schuller reports that he compiled up C<microperl> for
271 the Agenda PDA and it works fine.)  A really big spanner in the works
272 is the bootstrapping build process of Perl: if the filesystem the
273 target systems sees is not the same what the build host sees, various
274 input, output, and (Perl) library files need to be copied back and forth.
275
276 =head2 Perl preprocessor / macros
277
278 Source filters help with this, but do not get us all the way. For
279 instance, it should be possible to implement the C<??> operator somehow;
280 source filters don't (quite) cut it.
281
282 =head2 Perl lexer in Perl
283
284 Damian Conway is planning to work on this, but it hasn't happened yet.
285
286 =head2 Using POSIX calls internally
287
288 When faced with a BSD vs. SySV -style interface to some library or
289 system function, perl's roots show in that it typically prefers the BSD
290 interface (but falls back to the SysV one).  One example is getpgrp().
291 Other examples include C<memcpy> vs. C<bcopy>.  There are others, mostly in
292 F<<pp_sys.c>.
293
294 Mostly, this item is a suggestion for which way to start a journey into
295 an C<#ifdef> forest.  It is not primarily a suggestion to eliminate any of
296 the C<#ifdef> forests.
297
298 POSIX calls are perhaps more likely to be portable to unexpected
299 architectures. They are also perhaps more likely to be actively
300 maintained by a current vendor.  They are also perhaps more likely to be
301 available in thread-safe versions, if appropriate.
302
303 =head2 -i rename file when changed
304
305 It's only necessary to rename a file when inplace editing when the file
306 has changed. Detecting a change is perhaps the difficult bit.
307
308 =head2 All ARGV input should act like E<lt>E<gt>
309
310 =head2 Support for rerunning debugger
311
312 There should be a way of restarting the debugger on demand.
313
314 =head2 my sub foo { }
315
316 The basic principle is sound, but there are problems with the semantics
317 of self-referential and mutually referential lexical subs: how to
318 declare the subs?
319
320 =head2 One-pass global destruction
321
322 Sweeping away all the allocated memory in one go is a laudable goal, but
323 it's difficult and in most cases, it's easier to let the memory get
324 freed by exiting.
325
326 =head2 Rewrite regexp parser
327
328 There has been talk recently of rewriting the regular expression parser
329 to produce an optree instead of a chain of opcodes; it's unclear whether
330 or not this would be a win. 
331
332 =head2 Cache recently used regexps
333
334 This is to speed up 
335
336     for my $re (@regexps) {
337         $matched++ if /$re/
338     }
339
340 C<qr//> already gives us a way of saving compiled regexps, but it should
341 be done automatically.
342
343 =head2 Re-entrant functions
344
345 Add configure probes for C<_r> forms of system calls and fit them to the
346 core. Unfortunately, calling conventions for these functions and not
347 standardised.
348
349 =head2 Cross-compilation support
350
351 Bart Schuller reports that using C<microperl> and a cross-compiler, he
352 got Perl working on the Agenda PDA. However, one cannot build a full
353 Perl because Configure needs to get the results for the target platform,
354 for the host.
355
356 =head2 Bit-shifting bitvectors
357
358 Given:
359
360     vec($v, 1000, 1) = 1;
361
362 One should be able to do
363
364     $v <<= 1;
365
366 and have the 999'th bit set.
367
368 Currently if you try with shift bitvectors you shift the NV/UV, instead
369 of the bits in the PV.  Not very logical.
370
371 =head2 debugger pragma
372
373 The debugger is implemented in Perl in F<perl5db.pl>; turning it into a
374 pragma should be easy, but making it work lexically might be more
375 difficult. Fiddling with C<$^P> would be necessary.
376
377 =head2 use less pragma
378
379 Identify areas where speed/memory tradeoffs can be made and have a hint
380 to switch between them.
381
382 =head2 switch structures
383
384 Although we have C<Switch.pm> in core, Larry points to the dormant
385 C<nswitch> and C<cswitch> ops in F<pp.c>; using these opcodes would be
386 much faster.
387
388 =head2 Cache eval tree
389
390 =head2 rcatmaybe
391
392 =head2 Shrink opcode tables
393
394 =head2 Optimize away @_
395
396 Look at the "reification" code in C<av.c>
397
398 =head2 Prototypes versus indirect objects
399
400 Currently, indirect object syntax bypasses prototype checks.
401
402 =head2 Install HMTL
403
404 HTML versions of the documentation need to be installed by default; a
405 call to C<installhtml> from C<installperl> may be all that's necessary.
406
407 =head2 Prototype method calls
408
409 =head2 Return context prototype declarations
410
411 =head2 magic_setisa
412
413 =head2 Garbage collection
414
415 There have been persistent mumblings about putting a mark-and-sweep
416 garbage detector into Perl; Alan Burlison has some ideas about this.
417
418 =head2 IO tutorial
419
420 Mark-Jason Dominus has the beginnings of one of these.
421
422 =head2 pack/unpack tutorial
423
424 Simon Cozens has the beginnings of one of these.
425
426 =head2 Rewrite perldoc
427
428 There are a few suggestions for what to do with C<perldoc>: maybe a
429 full-text search, an index function, locating pages on a particular
430 high-level subject, and so on.
431
432 =head2 Install .3p manpages
433
434 This is a bone of contention; we can create C<.3p> manpages for each
435 built-in function, but should we install them by default? Tcl does this,
436 and it clutters up C<apropos>.
437
438 =head2 Unicode tutorial
439
440 Simon Cozens promises to do this before he gets old.
441
442 =head2 Update POSIX.pm for 1003.1-2
443
444 =head2 Retargetable installation
445
446 Allow C<@INC> to be changed after Perl is built.
447
448 =head2 POSIX emulation on non-POSIX systems
449
450 Make C<POSIX.pm> behave as POSIXly as possible everywhere, meaning we
451 have to implement POSIX equivalents for some functions if necessary.
452
453 =head2 Rename Win32 headers
454
455 =head2 Finish off lvalue functions
456
457 They don't work in the debugger, and they don't work for list or hash
458 slices.
459
460 =head2 Update sprintf documentation
461
462 Hugo van der Sanden plans to look at this.
463
464 =head2 Use fchown/fchmod internally
465
466 This has been done in places, but needs a thorough code review.
467 Also fchdir is available in some platforms.
468
469 =head1 Vague ideas
470
471 Ideas which have been discussed, and which may or may not happen.
472
473 =head2 ref() in list context
474
475 It's unclear what this should do or how to do it without breaking old
476 code.
477
478 =head2 Make tr/// return histogram
479
480 There is a patch for this, but it may require Unicodification.
481
482 =head2 Compile to real threaded code
483
484 =head2 Structured types
485
486 =head2 Modifiable $1 et al.
487
488     ($x = "elephant") =~ /e(ph)/;
489     $1 = "g"; # $x = "elegant"
490
491 What happens if there are multiple (nested?) brackets? What if the
492 string changes between the match and the assignment?
493
494 =head2 Procedural interfaces for IO::*, etc.
495
496 Some core modules have been accused of being overly-OO. Adding
497 procedural interfaces could demystify them.
498
499 =head2 RPC modules
500
501 =head2 Attach/detach debugger from running program
502
503 With C<gdb>, you can attach the debugger to a running program if you
504 pass the process ID. It would be good to do this with the Perl debugger
505 on a running Perl program, although I'm not sure how it would be done.
506
507 =head2 Alternative RE syntax module
508
509     use Regex::Newbie;
510     $re = Regex::Newbie->new
511                        ->start
512                        ->match("foo")
513                        ->repeat(Regex::Newbie->class("char"),3)
514                        ->end;
515     /$re/;
516
517 =head2 GUI::Native
518
519 A non-core module that would use "native" GUI to create graphical
520 applications.
521
522 =head2 foreach(reverse ...)
523
524 Currently
525
526     foreach (reverse @_) { ... }
527
528 puts C<@_> on the stack, reverses it putting the reversed version on the
529 stack, then iterates forwards. Instead, it could be special-cased to put
530 C<@_> on the stack then iterate backwards.
531
532 =head2 Constant function cache
533
534 =head2 Approximate regular expression matching
535
536 =head1 Ongoing
537
538 These items B<always> need doing:
539
540 =head2 Update guts documentation
541
542 Simon Cozens tries to do this when possible, and contributions to the
543 C<perlapi> documentation is welcome.
544
545 =head2 Add more tests
546
547 Michael Schwern will donate $500 to Yet Another Society when all core
548 modules have tests.
549
550 =head2 Update auxiliary tools
551
552 The code we ship with Perl should look like good Perl 5.
553
554 =head1 Recently done things
555
556 These are things which have been on the todo lists in previous releases
557 but have recently been completed.
558
559 =head2 Safe signal handling
560
561 A new signal model went into 5.7.1 without much fanfare. Operations and
562 C<malloc>s are no longer interrupted by signals, which are handled
563 between opcodes. This means that C<PERL_ASYNC_CHECK> now actually does
564 something. However, there are still a few things that need to be done.
565
566 =head2 Tie Modules
567
568 Modules which implement arrays in terms of strings, substrings or files
569 can be found on the CPAN.
570
571 =head2 gettimeofday
572
573 C<Time::Hires> has been integrated into the core.
574
575 =head2 setitimer and getimiter
576
577 Adding C<Time::Hires> got us this too.
578
579 =head2 Testing __DIE__ hook
580
581 Tests have been added.
582
583 =head2 CPP equivalent in Perl
584
585 A C Yardley will probably have done this by the time you can read this.
586 This allows for a generalization of the C constant detection used in
587 building C<Errno.pm>.
588
589 =head2 Explicit switch statements
590
591 C<Switch.pm> has been integrated into the core to give you all manner of
592 C<switch...case> semantics.
593
594 =head2 autocroak
595
596 This is C<Fatal.pm>.
597
598 =head2 UTF/EBCDIC
599
600 Nick Ing-Simmons has made UTF-EBCDIC (UTR13) work with Perl.
601
602     EBCDIC?        http://www.unicode.org/unicode/reports/tr16/
603
604 =head2 UTF Regexes
605
606 Although there are probably some small bugs to be rooted out, Jarkko
607 Hietaniemi has made regular expressions polymorphic between bytes and
608 characters.
609
610 =head2 perlcc to produce executable
611
612 C<perlcc> was recently rewritten, and can now produce standalone
613 executables.
614
615 =head2 END blocks saved in compiled output
616
617 =head2 Secure temporary file module
618
619 Tim Jenness' C<File::Temp> is now in core.
620
621 =head2 Integrate Time::HiRes
622
623 This module is now part of core.
624
625 =head2 Turn Cwd into XS
626
627 Benjamin Sugars has done this.
628
629 =head2 Mmap for input
630
631 Nick Ing-Simmons' C<perlio> supports an C<mmap> IO method.
632
633 =head2 Byte to/from UTF8 and UTF8 to/from local conversion
634
635 C<Encode> provides this.
636
637 =head2 Add sockatmark support
638
639 Added in 5.7.1
640
641 =head2 Mailing list archives
642
643 http://lists.perl.org/, http://archive.develooper.com/
644
645 =head2 Bug tracking
646
647 Richard Foley has written the bug tracking system at http://bugs.perl.org/
648
649 =head2 Integrate MacPerl
650
651 Chris Nandor and Matthias Neeracher have integrated the MacPerl changes
652 into 5.6.0.
653
654 =head2 Web "nerve center" for Perl
655
656 http://use.perl.org/ is what you're looking for.
657
658 =head2 Regular expression tutorial
659
660 C<perlretut>, provided by Mark Kvale.
661
662 =head2 Debugging Tutorial
663
664 C<perldebtut>, written by Richard Foley.
665
666 =head2 Integrate new modules
667
668 Jarkko has been integrating madly into 5.7.x
669
670 =head2 Integrate profiler
671
672 C<Devel::DProf> is now a core module.
673
674 =head2 Y2K error detection
675
676 There's a configure option to detect unsafe concatenation with "19", and
677 a CPAN module. (C<D'oh::Year>)
678
679 =head2 Regular expression debugger
680
681 While not part of core, Mark-Jason Dominus has written C<Rx> and has
682 also come up with a generalised strategy for regular expression
683 debugging.
684
685 =head2 POD checker
686
687 That's, uh, F<podchecker>
688
689 =head2 "Dynamic" lexicals
690
691 =head2 Cache precompiled modules
692
693 =head1 Deprecated Wishes
694
695 These are items which used to be in the todo file, but have been
696 deprecated for some reason.
697
698 =head2 Loop control on do{}
699
700 This would break old code; use C<do{{ }}> instead.
701
702 =head2 Lexically scoped typeglobs
703
704 Not needed now we have lexical IO handles.
705
706 =head2 format BOTTOM
707
708 =head2 report HANDLE
709
710 Damian Conway's text formatting modules seem to be the Way To Go.
711
712 =head2 Generalised want()/caller())
713
714 =head2 Named prototypes
715
716 These both seem to be delayed until Perl 6.
717
718 =head2 Built-in globbing
719
720 The C<File::Glob> module has been used to replace the C<glob> function.
721
722 =head2 Regression tests for suidperl
723
724 C<suidperl> is deprecated in favour of common sense.
725
726 =head2 Cached hash values
727
728 We have shared hash keys, which perform the same job.
729
730 =head2 Add compression modules
731
732 The compression modules are a little heavy; meanwhile, Nick Clark is
733 working on experimental pragmata to do transparent decompression on
734 input.
735
736 =head2 Reorganise documentation into tutorials/references
737
738 Could not get consensus on P5P about this.
739
740 =head2 Remove distinction between functions and operators
741
742 Caution: highly flammable.
743
744 =head2 Make XS easier to use
745
746 Use C<Inline> instead, or SWIG.
747
748 =head2 Make embedding easier to use
749
750 Use C<Inline::CPR>.
751
752 =head2 man for perl
753
754 See the Perl Power Tools. (http://language.perl.com/ppt/)
755
756 =head2 my $Package::variable
757
758 Use C<our> instead.
759
760 =head2 "or" tests defined, not truth
761
762 Suggesting this on P5P B<will> cause a boring and interminable flamewar.
763
764 =head2 "class"-based lexicals
765
766 Use flyweight objects, secure hashes or, dare I say it, pseudo-hashes instead.
767
768 =head2 byteperl
769
770 C<ByteLoader> covers this.
771
772 =head2 Lazy evaluation / tail recursion removal
773
774 C<List::Util> in core gives some of these; tail recursion removal is
775 done manually, with C<goto &whoami;>. (However, MJD has found that
776 C<goto &whoami> introduces a performance penalty, so maybe there should
777 be a way to do this after all: C<sub foo {START: ... goto START;> is
778 better.)
779
780 =head2 Make "use utf8" the default
781
782 There is a patch available for this, search p5p archives for
783 the Subject "[EXPERIMENTAL PATCH] make unicode (utf8) default"
784 but this would be unacceptable because of backward compatibility:
785 scripts could not contain B<any legacy eight-bit data>.  Also would
786 introduce a measurable slowdown of at least few percentages since all
787 regular expression operations would be done in full UTF-8.
788