Regen headers.
[p5sagit/p5-mst-13.2.git] / Todo-5.6
1 Unicode support
2     finish byte <-> utf8 and localencoding <-> utf8 conversions
3     make substr($bytestr,0,0,$charstr) do the right conversion
4     add Unicode::Map equivivalent to core
5     add support for I/O disciplines
6         - a way to specify disciplines when opening things:
7             open(F, "<:crlf :utf16", $file)
8         - a way to specify disciplines for an already opened handle:
9             binmode(STDIN, ":slurp :raw")
10         - a way to set default disciplines for all handle constructors:
11             use open IN => ":any", OUT => ":utf8", SYS => ":utf16"
12     eliminate need for "use utf8;"
13     autoload byte.pm when byte:: is seen by the parser
14     check uv_to_utf8() calls for buffer overflow
15     make \uXXXX (and \u{XXXX}?) where XXXX are hex digits
16         to work similarly to Unicode tech reports and Java
17         notation \uXXXX (and already existing \x{XXXX))?
18         more than four hexdigits? make also \U+XXXX work?
19
20     see ext/Encode/Todo for notes and references about proper detection
21     of malformed UTF-8
22
23     SCSU?          http://www.unicode.org/unicode/reports/tr6/
24     Collation?     http://www.unicode.org/unicode/reports/tr10/
25     Normalization? http://www.unicode.org/unicode/reports/tr15/
26     EBCDIC?        http://www.unicode.org/unicode/reports/tr16/
27     Regexes?       http://www.unicode.org/unicode/reports/tr18/
28     Case Mappings? http://www.unicode.org/unicode/reports/tr21/
29
30     See also "Locales", "Regexen", and "Miscellaneous".
31
32 Multi-threading
33     support "use Thread;" under useithreads
34     add mechanism to:
35       - create new interpreter in a different thread
36       - exchange data between interpreters/threads
37       - share namespaces between interpreters/threads
38     work out consistent semantics for exit/die in threads
39     support for externally created threads?
40     Thread::Pool?
41
42 Compiler
43     auto-produce executable
44     typed lexicals should affect B::CC::load_pad
45     workarounds to help Win32
46     END blocks need saving in compiled output
47     _AUTOLOAD prodding
48     fix comppadlist (names in comppad_name can have fake SvCUR
49         from where newASSIGNOP steals the field)
50
51 Namespace cleanup
52     CPP-space:    restrict what we export from headers when !PERL_CORE
53     header-space: move into CORE/perl/?
54     API-space:    complete the list of things that constitute public api
55
56 Configure
57     make configuring+building away from source directory work (VPATH et al)
58         this is related to: cross-compilation configuring (see Todo)
59     _r support (see Todo for mode detailed description)
60     POSIX 1003.1 1996 Edition support--realtime stuff:
61         POSIX semaphores, message queues, shared memory, realtime clocks,
62         timers, signals (the metaconfig units mostly already exist for these)
63         PREFERABLY AS AN EXTENSION
64     UNIX98 support: reader-writer locks, realtime/asynchronous IO
65         PREFERABLY AS AN EXTENSION
66     IPv6 support: see RFC2292, RFC2553
67         PREFERABLY AS AN EXTENSION
68         there already is Socket6 in CPAN
69
70 Long doubles
71     figure out where the PV->NV->PV conversion gets it wrong at least
72     in AIX and Tru64 (V5.0 and onwards) when using long doubles: see the
73     regexp tricks we had to insert to t/comp/use.t and t/lib/bigfltpm.t,
74      (?:9|8999\d+) and the like.
75
76 64-bit support
77     Configure probe for quad_t, uquad_t, and (argh) u_quad_t, they might
78     be in some systems the only thing working as quadtype and uquadtype.
79     more pain: long_long, u_long_long. 
80
81 Locales
82     deprecate traditional/legacy locales?
83     How do locales work across packages?
84     figure out how to support Unicode locales
85         suggestion: integrate the IBM Classes for Unicode (ICU)
86         http://oss.software.ibm.com/developerworks/opensource/icu/project/
87                 ICU is "portable, open-source Unicode library with:
88                 charset-independent locales (with multiple locales
89                 simultaneously supported in same thread; character
90                 conversions; formatting/parsing for numbers, currencies,
91                 date/time and messages; message catalogs (resources);
92                 transliteration, collation, normalization, and text
93                 boundaries (grapheme, word, line-break))".
94         Check out also the Locale Converter:
95         http://alphaworks.ibm.com/tech/localeconverter
96     There is also the iconv interface, either from XPG4 or GNU (glibc).
97     iconv is about character set conversions.
98     Either ICU or iconv would be valuable to get integrated
99     into Perl, Configure already probes for libiconv and <iconv.h>. 
100
101 Regexen
102    make RE engine thread-safe
103    a way to do full character set arithmetics: now one can do
104         addition, negate a whole class, and negate certain subclasses
105         (e.g. \D, [:^digit:]), but a more generic way to add/subtract/
106         intersect characters/classes, like described in the Unicode technical
107         report on Regular Expression Guidelines,
108         http://www.unicode.org/unicode/reports/tr18/
109         (amusingly, the TR notes that difference and intersection
110          can be done using "Perl-style look-ahead")
111         difference syntax?  maybe [[:alpha:][^abc]] meaning
112         "all alphabetic expect a, b, and c"? or [[:alpha:]-[abc]]?
113         (maybe bad, as we explicitly disallow such 'ranges')
114         intersection syntax? maybe [[..]&[...]]?
115    POSIX [=bar=] and [.zap.] would nice too but there's no API for them
116         =bar= could be done with Unicode, though, see the Unicode TR #15 about
117         normalization forms:
118         http://www.unicode.org/unicode/reports/tr15/
119         this is also a part of the Unicode 3.0:
120         http://www.unicode.org/unicode/uni2book/u2.html
121         executive summary: there are several different levels of 'equivalence'
122    trie optimization: factor out common suffixes (and prefixes?)
123         from |-alternating groups (both for exact strings and character
124         classes, use lookaheads?)
125    approximate matching
126
127 Security
128     use fchown, fchmod (and futimes?) internally when possible
129     use fchdir(how portable?)
130     create secure reliable portable temporary file modules
131     audit the standard utilities for security problems and fix them
132
133 Reliable Signals
134     custom opcodes
135     alternate runops() for signal despatch
136     figure out how to die() in delayed sighandler
137     make Thread::Signal work under useithreads
138
139 Win32 stuff
140     sort out the spawnvp() mess for system('a','b','c') compatibility
141     work out DLL versioning
142
143 Miscellaneous
144     introduce @( and @) because group names can have spaces
145     add new modules (Archive::Tar, Compress::Zlib, CPAN::FTP?)
146     sub-second sleep()? alarm()? time()? (integrate Time::HiRes?
147         Configure doesn't yet probe for usleep/nanosleep/ualarm but
148         the units exist)
149     floating point handling: nans, infinities, fp exception masks, etc.
150         At least the following interfaces exist: fp_classify(), fp_class(),
151         class(), isinf(), isfinite(), finite(), isnormal(), unordered(),
152         <ieeefp.h>, <fp_class.h> (there are metaconfig units for all these),
153         fp_setmask(), fp_getmask(), fp_setround(), fp_getround()
154         (no metaconfig units yet for these).
155         Don't forget finitel(), fp_classl(), fp_class_l(), (yes, both do,
156         unfortunately, exist), and unorderedl().
157         PREFERABLY AS AN EXTENSION.
158         As of 5.6.1 there is cpp macro Perl_isnan().
159     fix the basic arithmetics (+ - * / %) to preserve IVness/UVness if
160         both arguments are IVs/UVs: it sucks that one cannot see
161         the 'carry flag' (or equivalent) of the CPU from C,
162         C is too high-level...
163     replace pod2html with new PodtoHtml? (requires other modules from CPAN)
164     automate testing with large parts of CPAN
165     turn Cwd into an XS module?  (Configure already probes for getcwd())
166     mmap for speeding up input? (Configure already probes for the mmap family)
167     sendmsg, recvmsg? (Configure doesn't probe for these but the units exist)
168     setitimer, getitimer? (the metaconfig units exist)
169
170 Ongoing
171     keep filenames 8.3 friendly, where feasible
172     upgrade to newer versions of all independently maintained modules
173     comprehensive perldelta.pod
174
175 Documentation
176     describe new age patterns
177     update perl{guts,call,embed,xs} with additions, changes to API
178     convert more examples to use autovivified filehandles
179     document Win32 choices
180     spot-check all new modules for completeness
181     better docs for pack()/unpack()
182     reorg tutorials vs. reference sections
183     make roffitall to be dynamical about its pods and libs
184