4220ca45b1bc4fc0d3867e9936e3edca14ada9fd
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = Nullav;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void **arena_root   = &PL_body_arenaroots[sv_type];
644     void **root         = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void **r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void **thing_copy = (void **)thing;     \
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      + relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
813      - relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      + relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
819      - relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      + relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
835      - relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      + relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
841      - relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126     /* If NV 0.0 is store as all bits 0 then Zero() already creates a correct
1127        0.0 for us.  */
1128         if (old_type_details->zero_nv)
1129             SvNV_set(sv, 0);
1130 #endif
1131
1132         if (new_type == SVt_PVIO)
1133             IoPAGE_LEN(sv)      = 60;
1134         if (old_type < SVt_RV)
1135             SvPV_set(sv, 0);
1136         break;
1137     default:
1138         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1139     }
1140
1141     if (old_type_details->size) {
1142         /* If the old body had an allocated size, then we need to free it.  */
1143 #ifdef PURIFY
1144         my_safefree(old_body);
1145 #else
1146         del_body((void*)((char*)old_body + old_type_details->offset),
1147                  &PL_body_roots[old_type]);
1148 #endif
1149     }
1150 }
1151
1152 /*
1153 =for apidoc sv_backoff
1154
1155 Remove any string offset. You should normally use the C<SvOOK_off> macro
1156 wrapper instead.
1157
1158 =cut
1159 */
1160
1161 int
1162 Perl_sv_backoff(pTHX_ register SV *sv)
1163 {
1164     assert(SvOOK(sv));
1165     assert(SvTYPE(sv) != SVt_PVHV);
1166     assert(SvTYPE(sv) != SVt_PVAV);
1167     if (SvIVX(sv)) {
1168         const char * const s = SvPVX_const(sv);
1169         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1170         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1171         SvIV_set(sv, 0);
1172         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1173     }
1174     SvFLAGS(sv) &= ~SVf_OOK;
1175     return 0;
1176 }
1177
1178 /*
1179 =for apidoc sv_grow
1180
1181 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1182 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1183 Use the C<SvGROW> wrapper instead.
1184
1185 =cut
1186 */
1187
1188 char *
1189 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1190 {
1191     register char *s;
1192
1193 #ifdef HAS_64K_LIMIT
1194     if (newlen >= 0x10000) {
1195         PerlIO_printf(Perl_debug_log,
1196                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1197         my_exit(1);
1198     }
1199 #endif /* HAS_64K_LIMIT */
1200     if (SvROK(sv))
1201         sv_unref(sv);
1202     if (SvTYPE(sv) < SVt_PV) {
1203         sv_upgrade(sv, SVt_PV);
1204         s = SvPVX_mutable(sv);
1205     }
1206     else if (SvOOK(sv)) {       /* pv is offset? */
1207         sv_backoff(sv);
1208         s = SvPVX_mutable(sv);
1209         if (newlen > SvLEN(sv))
1210             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1211 #ifdef HAS_64K_LIMIT
1212         if (newlen >= 0x10000)
1213             newlen = 0xFFFF;
1214 #endif
1215     }
1216     else
1217         s = SvPVX_mutable(sv);
1218
1219     if (newlen > SvLEN(sv)) {           /* need more room? */
1220         newlen = PERL_STRLEN_ROUNDUP(newlen);
1221         if (SvLEN(sv) && s) {
1222 #ifdef MYMALLOC
1223             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1224             if (newlen <= l) {
1225                 SvLEN_set(sv, l);
1226                 return s;
1227             } else
1228 #endif
1229             s = saferealloc(s, newlen);
1230         }
1231         else {
1232             s = safemalloc(newlen);
1233             if (SvPVX_const(sv) && SvCUR(sv)) {
1234                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1235             }
1236         }
1237         SvPV_set(sv, s);
1238         SvLEN_set(sv, newlen);
1239     }
1240     return s;
1241 }
1242
1243 /*
1244 =for apidoc sv_setiv
1245
1246 Copies an integer into the given SV, upgrading first if necessary.
1247 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1248
1249 =cut
1250 */
1251
1252 void
1253 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1254 {
1255     SV_CHECK_THINKFIRST_COW_DROP(sv);
1256     switch (SvTYPE(sv)) {
1257     case SVt_NULL:
1258         sv_upgrade(sv, SVt_IV);
1259         break;
1260     case SVt_NV:
1261         sv_upgrade(sv, SVt_PVNV);
1262         break;
1263     case SVt_RV:
1264     case SVt_PV:
1265         sv_upgrade(sv, SVt_PVIV);
1266         break;
1267
1268     case SVt_PVGV:
1269     case SVt_PVAV:
1270     case SVt_PVHV:
1271     case SVt_PVCV:
1272     case SVt_PVFM:
1273     case SVt_PVIO:
1274         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1275                    OP_DESC(PL_op));
1276     }
1277     (void)SvIOK_only(sv);                       /* validate number */
1278     SvIV_set(sv, i);
1279     SvTAINT(sv);
1280 }
1281
1282 /*
1283 =for apidoc sv_setiv_mg
1284
1285 Like C<sv_setiv>, but also handles 'set' magic.
1286
1287 =cut
1288 */
1289
1290 void
1291 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1292 {
1293     sv_setiv(sv,i);
1294     SvSETMAGIC(sv);
1295 }
1296
1297 /*
1298 =for apidoc sv_setuv
1299
1300 Copies an unsigned integer into the given SV, upgrading first if necessary.
1301 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1302
1303 =cut
1304 */
1305
1306 void
1307 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1308 {
1309     /* With these two if statements:
1310        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1311
1312        without
1313        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1314
1315        If you wish to remove them, please benchmark to see what the effect is
1316     */
1317     if (u <= (UV)IV_MAX) {
1318        sv_setiv(sv, (IV)u);
1319        return;
1320     }
1321     sv_setiv(sv, 0);
1322     SvIsUV_on(sv);
1323     SvUV_set(sv, u);
1324 }
1325
1326 /*
1327 =for apidoc sv_setuv_mg
1328
1329 Like C<sv_setuv>, but also handles 'set' magic.
1330
1331 =cut
1332 */
1333
1334 void
1335 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1336 {
1337     sv_setiv(sv, 0);
1338     SvIsUV_on(sv);
1339     sv_setuv(sv,u);
1340     SvSETMAGIC(sv);
1341 }
1342
1343 /*
1344 =for apidoc sv_setnv
1345
1346 Copies a double into the given SV, upgrading first if necessary.
1347 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1354 {
1355     SV_CHECK_THINKFIRST_COW_DROP(sv);
1356     switch (SvTYPE(sv)) {
1357     case SVt_NULL:
1358     case SVt_IV:
1359         sv_upgrade(sv, SVt_NV);
1360         break;
1361     case SVt_RV:
1362     case SVt_PV:
1363     case SVt_PVIV:
1364         sv_upgrade(sv, SVt_PVNV);
1365         break;
1366
1367     case SVt_PVGV:
1368     case SVt_PVAV:
1369     case SVt_PVHV:
1370     case SVt_PVCV:
1371     case SVt_PVFM:
1372     case SVt_PVIO:
1373         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1374                    OP_NAME(PL_op));
1375     }
1376     SvNV_set(sv, num);
1377     (void)SvNOK_only(sv);                       /* validate number */
1378     SvTAINT(sv);
1379 }
1380
1381 /*
1382 =for apidoc sv_setnv_mg
1383
1384 Like C<sv_setnv>, but also handles 'set' magic.
1385
1386 =cut
1387 */
1388
1389 void
1390 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1391 {
1392     sv_setnv(sv,num);
1393     SvSETMAGIC(sv);
1394 }
1395
1396 /* Print an "isn't numeric" warning, using a cleaned-up,
1397  * printable version of the offending string
1398  */
1399
1400 STATIC void
1401 S_not_a_number(pTHX_ SV *sv)
1402 {
1403      SV *dsv;
1404      char tmpbuf[64];
1405      const char *pv;
1406
1407      if (DO_UTF8(sv)) {
1408           dsv = sv_2mortal(newSVpvn("", 0));
1409           pv = sv_uni_display(dsv, sv, 10, 0);
1410      } else {
1411           char *d = tmpbuf;
1412           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1413           /* each *s can expand to 4 chars + "...\0",
1414              i.e. need room for 8 chars */
1415         
1416           const char *s, *end;
1417           for (s = SvPVX_const(sv), end = s + SvCUR(sv); s < end && d < limit;
1418                s++) {
1419                int ch = *s & 0xFF;
1420                if (ch & 128 && !isPRINT_LC(ch)) {
1421                     *d++ = 'M';
1422                     *d++ = '-';
1423                     ch &= 127;
1424                }
1425                if (ch == '\n') {
1426                     *d++ = '\\';
1427                     *d++ = 'n';
1428                }
1429                else if (ch == '\r') {
1430                     *d++ = '\\';
1431                     *d++ = 'r';
1432                }
1433                else if (ch == '\f') {
1434                     *d++ = '\\';
1435                     *d++ = 'f';
1436                }
1437                else if (ch == '\\') {
1438                     *d++ = '\\';
1439                     *d++ = '\\';
1440                }
1441                else if (ch == '\0') {
1442                     *d++ = '\\';
1443                     *d++ = '0';
1444                }
1445                else if (isPRINT_LC(ch))
1446                     *d++ = ch;
1447                else {
1448                     *d++ = '^';
1449                     *d++ = toCTRL(ch);
1450                }
1451           }
1452           if (s < end) {
1453                *d++ = '.';
1454                *d++ = '.';
1455                *d++ = '.';
1456           }
1457           *d = '\0';
1458           pv = tmpbuf;
1459     }
1460
1461     if (PL_op)
1462         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1463                     "Argument \"%s\" isn't numeric in %s", pv,
1464                     OP_DESC(PL_op));
1465     else
1466         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1467                     "Argument \"%s\" isn't numeric", pv);
1468 }
1469
1470 /*
1471 =for apidoc looks_like_number
1472
1473 Test if the content of an SV looks like a number (or is a number).
1474 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1475 non-numeric warning), even if your atof() doesn't grok them.
1476
1477 =cut
1478 */
1479
1480 I32
1481 Perl_looks_like_number(pTHX_ SV *sv)
1482 {
1483     register const char *sbegin;
1484     STRLEN len;
1485
1486     if (SvPOK(sv)) {
1487         sbegin = SvPVX_const(sv);
1488         len = SvCUR(sv);
1489     }
1490     else if (SvPOKp(sv))
1491         sbegin = SvPV_const(sv, len);
1492     else
1493         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1494     return grok_number(sbegin, len, NULL);
1495 }
1496
1497 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1498    until proven guilty, assume that things are not that bad... */
1499
1500 /*
1501    NV_PRESERVES_UV:
1502
1503    As 64 bit platforms often have an NV that doesn't preserve all bits of
1504    an IV (an assumption perl has been based on to date) it becomes necessary
1505    to remove the assumption that the NV always carries enough precision to
1506    recreate the IV whenever needed, and that the NV is the canonical form.
1507    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1508    precision as a side effect of conversion (which would lead to insanity
1509    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1510    1) to distinguish between IV/UV/NV slots that have cached a valid
1511       conversion where precision was lost and IV/UV/NV slots that have a
1512       valid conversion which has lost no precision
1513    2) to ensure that if a numeric conversion to one form is requested that
1514       would lose precision, the precise conversion (or differently
1515       imprecise conversion) is also performed and cached, to prevent
1516       requests for different numeric formats on the same SV causing
1517       lossy conversion chains. (lossless conversion chains are perfectly
1518       acceptable (still))
1519
1520
1521    flags are used:
1522    SvIOKp is true if the IV slot contains a valid value
1523    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1524    SvNOKp is true if the NV slot contains a valid value
1525    SvNOK  is true only if the NV value is accurate
1526
1527    so
1528    while converting from PV to NV, check to see if converting that NV to an
1529    IV(or UV) would lose accuracy over a direct conversion from PV to
1530    IV(or UV). If it would, cache both conversions, return NV, but mark
1531    SV as IOK NOKp (ie not NOK).
1532
1533    While converting from PV to IV, check to see if converting that IV to an
1534    NV would lose accuracy over a direct conversion from PV to NV. If it
1535    would, cache both conversions, flag similarly.
1536
1537    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1538    correctly because if IV & NV were set NV *always* overruled.
1539    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1540    changes - now IV and NV together means that the two are interchangeable:
1541    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1542
1543    The benefit of this is that operations such as pp_add know that if
1544    SvIOK is true for both left and right operands, then integer addition
1545    can be used instead of floating point (for cases where the result won't
1546    overflow). Before, floating point was always used, which could lead to
1547    loss of precision compared with integer addition.
1548
1549    * making IV and NV equal status should make maths accurate on 64 bit
1550      platforms
1551    * may speed up maths somewhat if pp_add and friends start to use
1552      integers when possible instead of fp. (Hopefully the overhead in
1553      looking for SvIOK and checking for overflow will not outweigh the
1554      fp to integer speedup)
1555    * will slow down integer operations (callers of SvIV) on "inaccurate"
1556      values, as the change from SvIOK to SvIOKp will cause a call into
1557      sv_2iv each time rather than a macro access direct to the IV slot
1558    * should speed up number->string conversion on integers as IV is
1559      favoured when IV and NV are equally accurate
1560
1561    ####################################################################
1562    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1563    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1564    On the other hand, SvUOK is true iff UV.
1565    ####################################################################
1566
1567    Your mileage will vary depending your CPU's relative fp to integer
1568    performance ratio.
1569 */
1570
1571 #ifndef NV_PRESERVES_UV
1572 #  define IS_NUMBER_UNDERFLOW_IV 1
1573 #  define IS_NUMBER_UNDERFLOW_UV 2
1574 #  define IS_NUMBER_IV_AND_UV    2
1575 #  define IS_NUMBER_OVERFLOW_IV  4
1576 #  define IS_NUMBER_OVERFLOW_UV  5
1577
1578 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1579
1580 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1581 STATIC int
1582 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1583 {
1584     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1585     if (SvNVX(sv) < (NV)IV_MIN) {
1586         (void)SvIOKp_on(sv);
1587         (void)SvNOK_on(sv);
1588         SvIV_set(sv, IV_MIN);
1589         return IS_NUMBER_UNDERFLOW_IV;
1590     }
1591     if (SvNVX(sv) > (NV)UV_MAX) {
1592         (void)SvIOKp_on(sv);
1593         (void)SvNOK_on(sv);
1594         SvIsUV_on(sv);
1595         SvUV_set(sv, UV_MAX);
1596         return IS_NUMBER_OVERFLOW_UV;
1597     }
1598     (void)SvIOKp_on(sv);
1599     (void)SvNOK_on(sv);
1600     /* Can't use strtol etc to convert this string.  (See truth table in
1601        sv_2iv  */
1602     if (SvNVX(sv) <= (UV)IV_MAX) {
1603         SvIV_set(sv, I_V(SvNVX(sv)));
1604         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1605             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1606         } else {
1607             /* Integer is imprecise. NOK, IOKp */
1608         }
1609         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1610     }
1611     SvIsUV_on(sv);
1612     SvUV_set(sv, U_V(SvNVX(sv)));
1613     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1614         if (SvUVX(sv) == UV_MAX) {
1615             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1616                possibly be preserved by NV. Hence, it must be overflow.
1617                NOK, IOKp */
1618             return IS_NUMBER_OVERFLOW_UV;
1619         }
1620         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1621     } else {
1622         /* Integer is imprecise. NOK, IOKp */
1623     }
1624     return IS_NUMBER_OVERFLOW_IV;
1625 }
1626 #endif /* !NV_PRESERVES_UV*/
1627
1628 /*
1629 =for apidoc sv_2iv_flags
1630
1631 Return the integer value of an SV, doing any necessary string
1632 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1633 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1634
1635 =cut
1636 */
1637
1638 IV
1639 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1640 {
1641     if (!sv)
1642         return 0;
1643     if (SvGMAGICAL(sv)) {
1644         if (flags & SV_GMAGIC)
1645             mg_get(sv);
1646         if (SvIOKp(sv))
1647             return SvIVX(sv);
1648         if (SvNOKp(sv)) {
1649             return I_V(SvNVX(sv));
1650         }
1651         if (SvPOKp(sv) && SvLEN(sv))
1652             return asIV(sv);
1653         if (!SvROK(sv)) {
1654             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1655                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1656                     report_uninit(sv);
1657             }
1658             return 0;
1659         }
1660     }
1661     if (SvTHINKFIRST(sv)) {
1662         if (SvROK(sv)) {
1663             if (SvAMAGIC(sv)) {
1664                 SV * const tmpstr=AMG_CALLun(sv,numer);
1665                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1666                     return SvIV(tmpstr);
1667                 }
1668             }
1669             return PTR2IV(SvRV(sv));
1670         }
1671         if (SvIsCOW(sv)) {
1672             sv_force_normal_flags(sv, 0);
1673         }
1674         if (SvREADONLY(sv) && !SvOK(sv)) {
1675             if (ckWARN(WARN_UNINITIALIZED))
1676                 report_uninit(sv);
1677             return 0;
1678         }
1679     }
1680     if (SvIOKp(sv)) {
1681         if (SvIsUV(sv)) {
1682             return (IV)(SvUVX(sv));
1683         }
1684         else {
1685             return SvIVX(sv);
1686         }
1687     }
1688     if (SvNOKp(sv)) {
1689         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1690          * without also getting a cached IV/UV from it at the same time
1691          * (ie PV->NV conversion should detect loss of accuracy and cache
1692          * IV or UV at same time to avoid this.  NWC */
1693
1694         if (SvTYPE(sv) == SVt_NV)
1695             sv_upgrade(sv, SVt_PVNV);
1696
1697         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1698         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1699            certainly cast into the IV range at IV_MAX, whereas the correct
1700            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1701            cases go to UV */
1702         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1703             SvIV_set(sv, I_V(SvNVX(sv)));
1704             if (SvNVX(sv) == (NV) SvIVX(sv)
1705 #ifndef NV_PRESERVES_UV
1706                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1707                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1708                 /* Don't flag it as "accurately an integer" if the number
1709                    came from a (by definition imprecise) NV operation, and
1710                    we're outside the range of NV integer precision */
1711 #endif
1712                 ) {
1713                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1714                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1715                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1716                                       PTR2UV(sv),
1717                                       SvNVX(sv),
1718                                       SvIVX(sv)));
1719
1720             } else {
1721                 /* IV not precise.  No need to convert from PV, as NV
1722                    conversion would already have cached IV if it detected
1723                    that PV->IV would be better than PV->NV->IV
1724                    flags already correct - don't set public IOK.  */
1725                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1726                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1727                                       PTR2UV(sv),
1728                                       SvNVX(sv),
1729                                       SvIVX(sv)));
1730             }
1731             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1732                but the cast (NV)IV_MIN rounds to a the value less (more
1733                negative) than IV_MIN which happens to be equal to SvNVX ??
1734                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1735                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1736                (NV)UVX == NVX are both true, but the values differ. :-(
1737                Hopefully for 2s complement IV_MIN is something like
1738                0x8000000000000000 which will be exact. NWC */
1739         }
1740         else {
1741             SvUV_set(sv, U_V(SvNVX(sv)));
1742             if (
1743                 (SvNVX(sv) == (NV) SvUVX(sv))
1744 #ifndef  NV_PRESERVES_UV
1745                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1746                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1747                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1748                 /* Don't flag it as "accurately an integer" if the number
1749                    came from a (by definition imprecise) NV operation, and
1750                    we're outside the range of NV integer precision */
1751 #endif
1752                 )
1753                 SvIOK_on(sv);
1754             SvIsUV_on(sv);
1755             DEBUG_c(PerlIO_printf(Perl_debug_log,
1756                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1757                                   PTR2UV(sv),
1758                                   SvUVX(sv),
1759                                   SvUVX(sv)));
1760         }
1761     }
1762     else if (SvPOKp(sv) && SvLEN(sv)) {
1763         UV value;
1764         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1765         /* We want to avoid a possible problem when we cache an IV which
1766            may be later translated to an NV, and the resulting NV is not
1767            the same as the direct translation of the initial string
1768            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1769            be careful to ensure that the value with the .456 is around if the
1770            NV value is requested in the future).
1771         
1772            This means that if we cache such an IV, we need to cache the
1773            NV as well.  Moreover, we trade speed for space, and do not
1774            cache the NV if we are sure it's not needed.
1775          */
1776
1777         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1778         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1779              == IS_NUMBER_IN_UV) {
1780             /* It's definitely an integer, only upgrade to PVIV */
1781             if (SvTYPE(sv) < SVt_PVIV)
1782                 sv_upgrade(sv, SVt_PVIV);
1783             (void)SvIOK_on(sv);
1784         } else if (SvTYPE(sv) < SVt_PVNV)
1785             sv_upgrade(sv, SVt_PVNV);
1786
1787         /* If NV preserves UV then we only use the UV value if we know that
1788            we aren't going to call atof() below. If NVs don't preserve UVs
1789            then the value returned may have more precision than atof() will
1790            return, even though value isn't perfectly accurate.  */
1791         if ((numtype & (IS_NUMBER_IN_UV
1792 #ifdef NV_PRESERVES_UV
1793                         | IS_NUMBER_NOT_INT
1794 #endif
1795             )) == IS_NUMBER_IN_UV) {
1796             /* This won't turn off the public IOK flag if it was set above  */
1797             (void)SvIOKp_on(sv);
1798
1799             if (!(numtype & IS_NUMBER_NEG)) {
1800                 /* positive */;
1801                 if (value <= (UV)IV_MAX) {
1802                     SvIV_set(sv, (IV)value);
1803                 } else {
1804                     SvUV_set(sv, value);
1805                     SvIsUV_on(sv);
1806                 }
1807             } else {
1808                 /* 2s complement assumption  */
1809                 if (value <= (UV)IV_MIN) {
1810                     SvIV_set(sv, -(IV)value);
1811                 } else {
1812                     /* Too negative for an IV.  This is a double upgrade, but
1813                        I'm assuming it will be rare.  */
1814                     if (SvTYPE(sv) < SVt_PVNV)
1815                         sv_upgrade(sv, SVt_PVNV);
1816                     SvNOK_on(sv);
1817                     SvIOK_off(sv);
1818                     SvIOKp_on(sv);
1819                     SvNV_set(sv, -(NV)value);
1820                     SvIV_set(sv, IV_MIN);
1821                 }
1822             }
1823         }
1824         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1825            will be in the previous block to set the IV slot, and the next
1826            block to set the NV slot.  So no else here.  */
1827         
1828         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1829             != IS_NUMBER_IN_UV) {
1830             /* It wasn't an (integer that doesn't overflow the UV). */
1831             SvNV_set(sv, Atof(SvPVX_const(sv)));
1832
1833             if (! numtype && ckWARN(WARN_NUMERIC))
1834                 not_a_number(sv);
1835
1836 #if defined(USE_LONG_DOUBLE)
1837             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1838                                   PTR2UV(sv), SvNVX(sv)));
1839 #else
1840             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1841                                   PTR2UV(sv), SvNVX(sv)));
1842 #endif
1843
1844
1845 #ifdef NV_PRESERVES_UV
1846             (void)SvIOKp_on(sv);
1847             (void)SvNOK_on(sv);
1848             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1849                 SvIV_set(sv, I_V(SvNVX(sv)));
1850                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1851                     SvIOK_on(sv);
1852                 } else {
1853                     /* Integer is imprecise. NOK, IOKp */
1854                 }
1855                 /* UV will not work better than IV */
1856             } else {
1857                 if (SvNVX(sv) > (NV)UV_MAX) {
1858                     SvIsUV_on(sv);
1859                     /* Integer is inaccurate. NOK, IOKp, is UV */
1860                     SvUV_set(sv, UV_MAX);
1861                     SvIsUV_on(sv);
1862                 } else {
1863                     SvUV_set(sv, U_V(SvNVX(sv)));
1864                     /* 0xFFFFFFFFFFFFFFFF not an issue in here */
1865                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1866                         SvIOK_on(sv);
1867                         SvIsUV_on(sv);
1868                     } else {
1869                         /* Integer is imprecise. NOK, IOKp, is UV */
1870                         SvIsUV_on(sv);
1871                     }
1872                 }
1873             }
1874 #else /* NV_PRESERVES_UV */
1875             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1876                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1877                 /* The IV slot will have been set from value returned by
1878                    grok_number above.  The NV slot has just been set using
1879                    Atof.  */
1880                 SvNOK_on(sv);
1881                 assert (SvIOKp(sv));
1882             } else {
1883                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1884                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1885                     /* Small enough to preserve all bits. */
1886                     (void)SvIOKp_on(sv);
1887                     SvNOK_on(sv);
1888                     SvIV_set(sv, I_V(SvNVX(sv)));
1889                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1890                         SvIOK_on(sv);
1891                     /* Assumption: first non-preserved integer is < IV_MAX,
1892                        this NV is in the preserved range, therefore: */
1893                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1894                           < (UV)IV_MAX)) {
1895                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1896                     }
1897                 } else {
1898                     /* IN_UV NOT_INT
1899                          0      0       already failed to read UV.
1900                          0      1       already failed to read UV.
1901                          1      0       you won't get here in this case. IV/UV
1902                                         slot set, public IOK, Atof() unneeded.
1903                          1      1       already read UV.
1904                        so there's no point in sv_2iuv_non_preserve() attempting
1905                        to use atol, strtol, strtoul etc.  */
1906                     sv_2iuv_non_preserve (sv, numtype);
1907                 }
1908             }
1909 #endif /* NV_PRESERVES_UV */
1910         }
1911     } else  {
1912         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
1913             report_uninit(sv);
1914         if (SvTYPE(sv) < SVt_IV)
1915             /* Typically the caller expects that sv_any is not NULL now.  */
1916             sv_upgrade(sv, SVt_IV);
1917         return 0;
1918     }
1919     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1920         PTR2UV(sv),SvIVX(sv)));
1921     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1922 }
1923
1924 /*
1925 =for apidoc sv_2uv_flags
1926
1927 Return the unsigned integer value of an SV, doing any necessary string
1928 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1929 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1930
1931 =cut
1932 */
1933
1934 UV
1935 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1936 {
1937     if (!sv)
1938         return 0;
1939     if (SvGMAGICAL(sv)) {
1940         if (flags & SV_GMAGIC)
1941             mg_get(sv);
1942         if (SvIOKp(sv))
1943             return SvUVX(sv);
1944         if (SvNOKp(sv))
1945             return U_V(SvNVX(sv));
1946         if (SvPOKp(sv) && SvLEN(sv))
1947             return asUV(sv);
1948         if (!SvROK(sv)) {
1949             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1950                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1951                     report_uninit(sv);
1952             }
1953             return 0;
1954         }
1955     }
1956     if (SvTHINKFIRST(sv)) {
1957         if (SvROK(sv)) {
1958           SV* tmpstr;
1959           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
1960                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
1961               return SvUV(tmpstr);
1962           return PTR2UV(SvRV(sv));
1963         }
1964         if (SvIsCOW(sv)) {
1965             sv_force_normal_flags(sv, 0);
1966         }
1967         if (SvREADONLY(sv) && !SvOK(sv)) {
1968             if (ckWARN(WARN_UNINITIALIZED))
1969                 report_uninit(sv);
1970             return 0;
1971         }
1972     }
1973     if (SvIOKp(sv)) {
1974         if (SvIsUV(sv)) {
1975             return SvUVX(sv);
1976         }
1977         else {
1978             return (UV)SvIVX(sv);
1979         }
1980     }
1981     if (SvNOKp(sv)) {
1982         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1983          * without also getting a cached IV/UV from it at the same time
1984          * (ie PV->NV conversion should detect loss of accuracy and cache
1985          * IV or UV at same time to avoid this. */
1986         /* IV-over-UV optimisation - choose to cache IV if possible */
1987
1988         if (SvTYPE(sv) == SVt_NV)
1989             sv_upgrade(sv, SVt_PVNV);
1990
1991         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1992         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1993             SvIV_set(sv, I_V(SvNVX(sv)));
1994             if (SvNVX(sv) == (NV) SvIVX(sv)
1995 #ifndef NV_PRESERVES_UV
1996                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1997                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1998                 /* Don't flag it as "accurately an integer" if the number
1999                    came from a (by definition imprecise) NV operation, and
2000                    we're outside the range of NV integer precision */
2001 #endif
2002                 ) {
2003                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
2004                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2005                                       "0x%"UVxf" uv(%"NVgf" => %"IVdf") (precise)\n",
2006                                       PTR2UV(sv),
2007                                       SvNVX(sv),
2008                                       SvIVX(sv)));
2009
2010             } else {
2011                 /* IV not precise.  No need to convert from PV, as NV
2012                    conversion would already have cached IV if it detected
2013                    that PV->IV would be better than PV->NV->IV
2014                    flags already correct - don't set public IOK.  */
2015                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2016                                       "0x%"UVxf" uv(%"NVgf" => %"IVdf") (imprecise)\n",
2017                                       PTR2UV(sv),
2018                                       SvNVX(sv),
2019                                       SvIVX(sv)));
2020             }
2021             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
2022                but the cast (NV)IV_MIN rounds to a the value less (more
2023                negative) than IV_MIN which happens to be equal to SvNVX ??
2024                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
2025                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
2026                (NV)UVX == NVX are both true, but the values differ. :-(
2027                Hopefully for 2s complement IV_MIN is something like
2028                0x8000000000000000 which will be exact. NWC */
2029         }
2030         else {
2031             SvUV_set(sv, U_V(SvNVX(sv)));
2032             if (
2033                 (SvNVX(sv) == (NV) SvUVX(sv))
2034 #ifndef  NV_PRESERVES_UV
2035                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
2036                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
2037                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
2038                 /* Don't flag it as "accurately an integer" if the number
2039                    came from a (by definition imprecise) NV operation, and
2040                    we're outside the range of NV integer precision */
2041 #endif
2042                 )
2043                 SvIOK_on(sv);
2044             SvIsUV_on(sv);
2045             DEBUG_c(PerlIO_printf(Perl_debug_log,
2046                                   "0x%"UVxf" 2uv(%"UVuf" => %"IVdf") (as unsigned)\n",
2047                                   PTR2UV(sv),
2048                                   SvUVX(sv),
2049                                   SvUVX(sv)));
2050         }
2051     }
2052     else if (SvPOKp(sv) && SvLEN(sv)) {
2053         UV value;
2054         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2055
2056         /* We want to avoid a possible problem when we cache a UV which
2057            may be later translated to an NV, and the resulting NV is not
2058            the translation of the initial data.
2059         
2060            This means that if we cache such a UV, we need to cache the
2061            NV as well.  Moreover, we trade speed for space, and do not
2062            cache the NV if not needed.
2063          */
2064
2065         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
2066         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2067              == IS_NUMBER_IN_UV) {
2068             /* It's definitely an integer, only upgrade to PVIV */
2069             if (SvTYPE(sv) < SVt_PVIV)
2070                 sv_upgrade(sv, SVt_PVIV);
2071             (void)SvIOK_on(sv);
2072         } else if (SvTYPE(sv) < SVt_PVNV)
2073             sv_upgrade(sv, SVt_PVNV);
2074
2075         /* If NV preserves UV then we only use the UV value if we know that
2076            we aren't going to call atof() below. If NVs don't preserve UVs
2077            then the value returned may have more precision than atof() will
2078            return, even though it isn't accurate.  */
2079         if ((numtype & (IS_NUMBER_IN_UV
2080 #ifdef NV_PRESERVES_UV
2081                         | IS_NUMBER_NOT_INT
2082 #endif
2083             )) == IS_NUMBER_IN_UV) {
2084             /* This won't turn off the public IOK flag if it was set above  */
2085             (void)SvIOKp_on(sv);
2086
2087             if (!(numtype & IS_NUMBER_NEG)) {
2088                 /* positive */;
2089                 if (value <= (UV)IV_MAX) {
2090                     SvIV_set(sv, (IV)value);
2091                 } else {
2092                     /* it didn't overflow, and it was positive. */
2093                     SvUV_set(sv, value);
2094                     SvIsUV_on(sv);
2095                 }
2096             } else {
2097                 /* 2s complement assumption  */
2098                 if (value <= (UV)IV_MIN) {
2099                     SvIV_set(sv, -(IV)value);
2100                 } else {
2101                     /* Too negative for an IV.  This is a double upgrade, but
2102                        I'm assuming it will be rare.  */
2103                     if (SvTYPE(sv) < SVt_PVNV)
2104                         sv_upgrade(sv, SVt_PVNV);
2105                     SvNOK_on(sv);
2106                     SvIOK_off(sv);
2107                     SvIOKp_on(sv);
2108                     SvNV_set(sv, -(NV)value);
2109                     SvIV_set(sv, IV_MIN);
2110                 }
2111             }
2112         }
2113         
2114         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2115             != IS_NUMBER_IN_UV) {
2116             /* It wasn't an integer, or it overflowed the UV. */
2117             SvNV_set(sv, Atof(SvPVX_const(sv)));
2118
2119             if (! numtype && ckWARN(WARN_NUMERIC))
2120                     not_a_number(sv);
2121
2122 #if defined(USE_LONG_DOUBLE)
2123             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%" PERL_PRIgldbl ")\n",
2124                                   PTR2UV(sv), SvNVX(sv)));
2125 #else
2126             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"NVgf")\n",
2127                                   PTR2UV(sv), SvNVX(sv)));
2128 #endif
2129
2130 #ifdef NV_PRESERVES_UV
2131             (void)SvIOKp_on(sv);
2132             (void)SvNOK_on(sv);
2133             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2134                 SvIV_set(sv, I_V(SvNVX(sv)));
2135                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
2136                     SvIOK_on(sv);
2137                 } else {
2138                     /* Integer is imprecise. NOK, IOKp */
2139                 }
2140                 /* UV will not work better than IV */
2141             } else {
2142                 if (SvNVX(sv) > (NV)UV_MAX) {
2143                     SvIsUV_on(sv);
2144                     /* Integer is inaccurate. NOK, IOKp, is UV */
2145                     SvUV_set(sv, UV_MAX);
2146                     SvIsUV_on(sv);
2147                 } else {
2148                     SvUV_set(sv, U_V(SvNVX(sv)));
2149                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
2150                        NV preservse UV so can do correct comparison.  */
2151                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
2152                         SvIOK_on(sv);
2153                         SvIsUV_on(sv);
2154                     } else {
2155                         /* Integer is imprecise. NOK, IOKp, is UV */
2156                         SvIsUV_on(sv);
2157                     }
2158                 }
2159             }
2160 #else /* NV_PRESERVES_UV */
2161             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2162                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
2163                 /* The UV slot will have been set from value returned by
2164                    grok_number above.  The NV slot has just been set using
2165                    Atof.  */
2166                 SvNOK_on(sv);
2167                 assert (SvIOKp(sv));
2168             } else {
2169                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
2170                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2171                     /* Small enough to preserve all bits. */
2172                     (void)SvIOKp_on(sv);
2173                     SvNOK_on(sv);
2174                     SvIV_set(sv, I_V(SvNVX(sv)));
2175                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
2176                         SvIOK_on(sv);
2177                     /* Assumption: first non-preserved integer is < IV_MAX,
2178                        this NV is in the preserved range, therefore: */
2179                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
2180                           < (UV)IV_MAX)) {
2181                         Perl_croak(aTHX_ "sv_2uv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
2182                     }
2183                 } else
2184                     sv_2iuv_non_preserve (sv, numtype);
2185             }
2186 #endif /* NV_PRESERVES_UV */
2187         }
2188     }
2189     else  {
2190         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2191             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2192                 report_uninit(sv);
2193         }
2194         if (SvTYPE(sv) < SVt_IV)
2195             /* Typically the caller expects that sv_any is not NULL now.  */
2196             sv_upgrade(sv, SVt_IV);
2197         return 0;
2198     }
2199
2200     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2201                           PTR2UV(sv),SvUVX(sv)));
2202     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2203 }
2204
2205 /*
2206 =for apidoc sv_2nv
2207
2208 Return the num value of an SV, doing any necessary string or integer
2209 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2210 macros.
2211
2212 =cut
2213 */
2214
2215 NV
2216 Perl_sv_2nv(pTHX_ register SV *sv)
2217 {
2218     if (!sv)
2219         return 0.0;
2220     if (SvGMAGICAL(sv)) {
2221         mg_get(sv);
2222         if (SvNOKp(sv))
2223             return SvNVX(sv);
2224         if (SvPOKp(sv) && SvLEN(sv)) {
2225             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2226                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2227                 not_a_number(sv);
2228             return Atof(SvPVX_const(sv));
2229         }
2230         if (SvIOKp(sv)) {
2231             if (SvIsUV(sv))
2232                 return (NV)SvUVX(sv);
2233             else
2234                 return (NV)SvIVX(sv);
2235         }       
2236         if (!SvROK(sv)) {
2237             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2238                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2239                     report_uninit(sv);
2240             }
2241             return (NV)0;
2242         }
2243     }
2244     if (SvTHINKFIRST(sv)) {
2245         if (SvROK(sv)) {
2246           SV* tmpstr;
2247           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
2248                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
2249               return SvNV(tmpstr);
2250           return PTR2NV(SvRV(sv));
2251         }
2252         if (SvIsCOW(sv)) {
2253             sv_force_normal_flags(sv, 0);
2254         }
2255         if (SvREADONLY(sv) && !SvOK(sv)) {
2256             if (ckWARN(WARN_UNINITIALIZED))
2257                 report_uninit(sv);
2258             return 0.0;
2259         }
2260     }
2261     if (SvTYPE(sv) < SVt_NV) {
2262         if (SvTYPE(sv) == SVt_IV)
2263             sv_upgrade(sv, SVt_PVNV);
2264         else
2265             sv_upgrade(sv, SVt_NV);
2266 #ifdef USE_LONG_DOUBLE
2267         DEBUG_c({
2268             STORE_NUMERIC_LOCAL_SET_STANDARD();
2269             PerlIO_printf(Perl_debug_log,
2270                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2271                           PTR2UV(sv), SvNVX(sv));
2272             RESTORE_NUMERIC_LOCAL();
2273         });
2274 #else
2275         DEBUG_c({
2276             STORE_NUMERIC_LOCAL_SET_STANDARD();
2277             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2278                           PTR2UV(sv), SvNVX(sv));
2279             RESTORE_NUMERIC_LOCAL();
2280         });
2281 #endif
2282     }
2283     else if (SvTYPE(sv) < SVt_PVNV)
2284         sv_upgrade(sv, SVt_PVNV);
2285     if (SvNOKp(sv)) {
2286         return SvNVX(sv);
2287     }
2288     if (SvIOKp(sv)) {
2289         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2290 #ifdef NV_PRESERVES_UV
2291         SvNOK_on(sv);
2292 #else
2293         /* Only set the public NV OK flag if this NV preserves the IV  */
2294         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2295         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2296                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2297             SvNOK_on(sv);
2298         else
2299             SvNOKp_on(sv);
2300 #endif
2301     }
2302     else if (SvPOKp(sv) && SvLEN(sv)) {
2303         UV value;
2304         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2305         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2306             not_a_number(sv);
2307 #ifdef NV_PRESERVES_UV
2308         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2309             == IS_NUMBER_IN_UV) {
2310             /* It's definitely an integer */
2311             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2312         } else
2313             SvNV_set(sv, Atof(SvPVX_const(sv)));
2314         SvNOK_on(sv);
2315 #else
2316         SvNV_set(sv, Atof(SvPVX_const(sv)));
2317         /* Only set the public NV OK flag if this NV preserves the value in
2318            the PV at least as well as an IV/UV would.
2319            Not sure how to do this 100% reliably. */
2320         /* if that shift count is out of range then Configure's test is
2321            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2322            UV_BITS */
2323         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2324             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2325             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2326         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2327             /* Can't use strtol etc to convert this string, so don't try.
2328                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2329             SvNOK_on(sv);
2330         } else {
2331             /* value has been set.  It may not be precise.  */
2332             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2333                 /* 2s complement assumption for (UV)IV_MIN  */
2334                 SvNOK_on(sv); /* Integer is too negative.  */
2335             } else {
2336                 SvNOKp_on(sv);
2337                 SvIOKp_on(sv);
2338
2339                 if (numtype & IS_NUMBER_NEG) {
2340                     SvIV_set(sv, -(IV)value);
2341                 } else if (value <= (UV)IV_MAX) {
2342                     SvIV_set(sv, (IV)value);
2343                 } else {
2344                     SvUV_set(sv, value);
2345                     SvIsUV_on(sv);
2346                 }
2347
2348                 if (numtype & IS_NUMBER_NOT_INT) {
2349                     /* I believe that even if the original PV had decimals,
2350                        they are lost beyond the limit of the FP precision.
2351                        However, neither is canonical, so both only get p
2352                        flags.  NWC, 2000/11/25 */
2353                     /* Both already have p flags, so do nothing */
2354                 } else {
2355                     const NV nv = SvNVX(sv);
2356                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2357                         if (SvIVX(sv) == I_V(nv)) {
2358                             SvNOK_on(sv);
2359                             SvIOK_on(sv);
2360                         } else {
2361                             SvIOK_on(sv);
2362                             /* It had no "." so it must be integer.  */
2363                         }
2364                     } else {
2365                         /* between IV_MAX and NV(UV_MAX).
2366                            Could be slightly > UV_MAX */
2367
2368                         if (numtype & IS_NUMBER_NOT_INT) {
2369                             /* UV and NV both imprecise.  */
2370                         } else {
2371                             const UV nv_as_uv = U_V(nv);
2372
2373                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2374                                 SvNOK_on(sv);
2375                                 SvIOK_on(sv);
2376                             } else {
2377                                 SvIOK_on(sv);
2378                             }
2379                         }
2380                     }
2381                 }
2382             }
2383         }
2384 #endif /* NV_PRESERVES_UV */
2385     }
2386     else  {
2387         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2388             report_uninit(sv);
2389         if (SvTYPE(sv) < SVt_NV)
2390             /* Typically the caller expects that sv_any is not NULL now.  */
2391             /* XXX Ilya implies that this is a bug in callers that assume this
2392                and ideally should be fixed.  */
2393             sv_upgrade(sv, SVt_NV);
2394         return 0.0;
2395     }
2396 #if defined(USE_LONG_DOUBLE)
2397     DEBUG_c({
2398         STORE_NUMERIC_LOCAL_SET_STANDARD();
2399         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2400                       PTR2UV(sv), SvNVX(sv));
2401         RESTORE_NUMERIC_LOCAL();
2402     });
2403 #else
2404     DEBUG_c({
2405         STORE_NUMERIC_LOCAL_SET_STANDARD();
2406         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2407                       PTR2UV(sv), SvNVX(sv));
2408         RESTORE_NUMERIC_LOCAL();
2409     });
2410 #endif
2411     return SvNVX(sv);
2412 }
2413
2414 /* asIV(): extract an integer from the string value of an SV.
2415  * Caller must validate PVX  */
2416
2417 STATIC IV
2418 S_asIV(pTHX_ SV *sv)
2419 {
2420     UV value;
2421     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2422
2423     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2424         == IS_NUMBER_IN_UV) {
2425         /* It's definitely an integer */
2426         if (numtype & IS_NUMBER_NEG) {
2427             if (value < (UV)IV_MIN)
2428                 return -(IV)value;
2429         } else {
2430             if (value < (UV)IV_MAX)
2431                 return (IV)value;
2432         }
2433     }
2434     if (!numtype) {
2435         if (ckWARN(WARN_NUMERIC))
2436             not_a_number(sv);
2437     }
2438     return I_V(Atof(SvPVX_const(sv)));
2439 }
2440
2441 /* asUV(): extract an unsigned integer from the string value of an SV
2442  * Caller must validate PVX  */
2443
2444 STATIC UV
2445 S_asUV(pTHX_ SV *sv)
2446 {
2447     UV value;
2448     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2449
2450     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2451         == IS_NUMBER_IN_UV) {
2452         /* It's definitely an integer */
2453         if (!(numtype & IS_NUMBER_NEG))
2454             return value;
2455     }
2456     if (!numtype) {
2457         if (ckWARN(WARN_NUMERIC))
2458             not_a_number(sv);
2459     }
2460     return U_V(Atof(SvPVX_const(sv)));
2461 }
2462
2463 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2464  * UV as a string towards the end of buf, and return pointers to start and
2465  * end of it.
2466  *
2467  * We assume that buf is at least TYPE_CHARS(UV) long.
2468  */
2469
2470 static char *
2471 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2472 {
2473     char *ptr = buf + TYPE_CHARS(UV);
2474     char * const ebuf = ptr;
2475     int sign;
2476
2477     if (is_uv)
2478         sign = 0;
2479     else if (iv >= 0) {
2480         uv = iv;
2481         sign = 0;
2482     } else {
2483         uv = -iv;
2484         sign = 1;
2485     }
2486     do {
2487         *--ptr = '0' + (char)(uv % 10);
2488     } while (uv /= 10);
2489     if (sign)
2490         *--ptr = '-';
2491     *peob = ebuf;
2492     return ptr;
2493 }
2494
2495 /*
2496 =for apidoc sv_2pv_flags
2497
2498 Returns a pointer to the string value of an SV, and sets *lp to its length.
2499 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2500 if necessary.
2501 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2502 usually end up here too.
2503
2504 =cut
2505 */
2506
2507 char *
2508 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2509 {
2510     register char *s;
2511     int olderrno;
2512     SV *tsv, *origsv;
2513     char tbuf[64];      /* Must fit sprintf/Gconvert of longest IV/NV */
2514     char *tmpbuf = tbuf;
2515     STRLEN len = 0;     /* Hush gcc. len is always initialised before use.  */
2516
2517     if (!sv) {
2518         if (lp)
2519             *lp = 0;
2520         return (char *)"";
2521     }
2522     if (SvGMAGICAL(sv)) {
2523         if (flags & SV_GMAGIC)
2524             mg_get(sv);
2525         if (SvPOKp(sv)) {
2526             if (lp)
2527                 *lp = SvCUR(sv);
2528             if (flags & SV_MUTABLE_RETURN)
2529                 return SvPVX_mutable(sv);
2530             if (flags & SV_CONST_RETURN)
2531                 return (char *)SvPVX_const(sv);
2532             return SvPVX(sv);
2533         }
2534         if (SvIOKp(sv)) {
2535             len = SvIsUV(sv) ? my_sprintf(tmpbuf,"%"UVuf, (UV)SvUVX(sv))
2536                 : my_sprintf(tmpbuf,"%"IVdf, (IV)SvIVX(sv));
2537             tsv = Nullsv;
2538             goto tokensave_has_len;
2539         }
2540         if (SvNOKp(sv)) {
2541             Gconvert(SvNVX(sv), NV_DIG, 0, tmpbuf);
2542             tsv = Nullsv;
2543             goto tokensave;
2544         }
2545         if (!SvROK(sv)) {
2546             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2547                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2548                     report_uninit(sv);
2549             }
2550             if (lp)
2551                 *lp = 0;
2552             return (char *)"";
2553         }
2554     }
2555     if (SvTHINKFIRST(sv)) {
2556         if (SvROK(sv)) {
2557             SV* tmpstr;
2558             register const char *typestr;
2559             if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,string)) &&
2560                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2561                 /* Unwrap this:  */
2562                 /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr); */
2563
2564                 char *pv;
2565                 if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2566                     if (flags & SV_CONST_RETURN) {
2567                         pv = (char *) SvPVX_const(tmpstr);
2568                     } else {
2569                         pv = (flags & SV_MUTABLE_RETURN)
2570                             ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2571                     }
2572                     if (lp)
2573                         *lp = SvCUR(tmpstr);
2574                 } else {
2575                     pv = sv_2pv_flags(tmpstr, lp, flags);
2576                 }
2577                 if (SvUTF8(tmpstr))
2578                     SvUTF8_on(sv);
2579                 else
2580                     SvUTF8_off(sv);
2581                 return pv;
2582             }
2583             origsv = sv;
2584             sv = (SV*)SvRV(sv);
2585             if (!sv)
2586                 typestr = "NULLREF";
2587             else {
2588                 MAGIC *mg;
2589                 
2590                 if (SvTYPE(sv) == SVt_PVMG && ((SvFLAGS(sv) &
2591                            (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2592                           == (SVs_OBJECT|SVs_SMG))
2593                     && (mg = mg_find(sv, PERL_MAGIC_qr))) {
2594                     const regexp *re = (regexp *)mg->mg_obj;
2595
2596                     if (!mg->mg_ptr) {
2597                         const char *fptr = "msix";
2598                         char reflags[6];
2599                         char ch;
2600                         int left = 0;
2601                         int right = 4;
2602                         char need_newline = 0;
2603                         U16 reganch =
2604                             (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2605
2606                         while((ch = *fptr++)) {
2607                             if(reganch & 1) {
2608                                 reflags[left++] = ch;
2609                             }
2610                             else {
2611                                 reflags[right--] = ch;
2612                             }
2613                             reganch >>= 1;
2614                         }
2615                         if(left != 4) {
2616                             reflags[left] = '-';
2617                             left = 5;
2618                         }
2619
2620                         mg->mg_len = re->prelen + 4 + left;
2621                         /*
2622                          * If /x was used, we have to worry about a regex
2623                          * ending with a comment later being embedded
2624                          * within another regex. If so, we don't want this
2625                          * regex's "commentization" to leak out to the
2626                          * right part of the enclosing regex, we must cap
2627                          * it with a newline.
2628                          *
2629                          * So, if /x was used, we scan backwards from the
2630                          * end of the regex. If we find a '#' before we
2631                          * find a newline, we need to add a newline
2632                          * ourself. If we find a '\n' first (or if we
2633                          * don't find '#' or '\n'), we don't need to add
2634                          * anything.  -jfriedl
2635                          */
2636                         if (PMf_EXTENDED & re->reganch) {
2637                             const char *endptr = re->precomp + re->prelen;
2638                             while (endptr >= re->precomp) {
2639                                 const char c = *(endptr--);
2640                                 if (c == '\n')
2641                                     break; /* don't need another */
2642                                 if (c == '#') {
2643                                     /* we end while in a comment, so we
2644                                        need a newline */
2645                                     mg->mg_len++; /* save space for it */
2646                                     need_newline = 1; /* note to add it */
2647                                     break;
2648                                 }
2649                             }
2650                         }
2651
2652                         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2653                         Copy("(?", mg->mg_ptr, 2, char);
2654                         Copy(reflags, mg->mg_ptr+2, left, char);
2655                         Copy(":", mg->mg_ptr+left+2, 1, char);
2656                         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2657                         if (need_newline)
2658                             mg->mg_ptr[mg->mg_len - 2] = '\n';
2659                         mg->mg_ptr[mg->mg_len - 1] = ')';
2660                         mg->mg_ptr[mg->mg_len] = 0;
2661                     }
2662                     PL_reginterp_cnt += re->program[0].next_off;
2663
2664                     if (re->reganch & ROPT_UTF8)
2665                         SvUTF8_on(origsv);
2666                     else
2667                         SvUTF8_off(origsv);
2668                     if (lp)
2669                         *lp = mg->mg_len;
2670                     return mg->mg_ptr;
2671                 }
2672
2673                 typestr = sv_reftype(sv, 0);
2674
2675                 tsv = NEWSV(0,0);
2676                 if (SvOBJECT(sv)) {
2677                     const char * const name = HvNAME_get(SvSTASH(sv));
2678                     Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2679                                    name ? name : "__ANON__" , typestr, PTR2UV(sv));
2680                 }
2681                 else
2682                     Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr, PTR2UV(sv));
2683                 goto tokensaveref;
2684             }
2685             if (lp)
2686                 *lp = strlen(typestr);
2687             return (char *)typestr;
2688         }
2689         if (SvREADONLY(sv) && !SvOK(sv)) {
2690             if (ckWARN(WARN_UNINITIALIZED))
2691                 report_uninit(sv);
2692             if (lp)
2693                 *lp = 0;
2694             return (char *)"";
2695         }
2696     }
2697     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2698         /* I'm assuming that if both IV and NV are equally valid then
2699            converting the IV is going to be more efficient */
2700         const U32 isIOK = SvIOK(sv);
2701         const U32 isUIOK = SvIsUV(sv);
2702         char buf[TYPE_CHARS(UV)];
2703         char *ebuf, *ptr;
2704
2705         if (SvTYPE(sv) < SVt_PVIV)
2706             sv_upgrade(sv, SVt_PVIV);
2707         if (isUIOK)
2708             ptr = uiv_2buf(buf, 0, SvUVX(sv), 1, &ebuf);
2709         else
2710             ptr = uiv_2buf(buf, SvIVX(sv), 0, 0, &ebuf);
2711         /* inlined from sv_setpvn */
2712         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2713         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2714         SvCUR_set(sv, ebuf - ptr);
2715         s = SvEND(sv);
2716         *s = '\0';
2717         if (isIOK)
2718             SvIOK_on(sv);
2719         else
2720             SvIOKp_on(sv);
2721         if (isUIOK)
2722             SvIsUV_on(sv);
2723     }
2724     else if (SvNOKp(sv)) {
2725         if (SvTYPE(sv) < SVt_PVNV)
2726             sv_upgrade(sv, SVt_PVNV);
2727         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2728         s = SvGROW_mutable(sv, NV_DIG + 20);
2729         olderrno = errno;       /* some Xenix systems wipe out errno here */
2730 #ifdef apollo
2731         if (SvNVX(sv) == 0.0)
2732             (void)strcpy(s,"0");
2733         else
2734 #endif /*apollo*/
2735         {
2736             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2737         }
2738         errno = olderrno;
2739 #ifdef FIXNEGATIVEZERO
2740         if (*s == '-' && s[1] == '0' && !s[2])
2741             strcpy(s,"0");
2742 #endif
2743         while (*s) s++;
2744 #ifdef hcx
2745         if (s[-1] == '.')
2746             *--s = '\0';
2747 #endif
2748     }
2749     else {
2750         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2751             report_uninit(sv);
2752         if (lp)
2753         *lp = 0;
2754         if (SvTYPE(sv) < SVt_PV)
2755             /* Typically the caller expects that sv_any is not NULL now.  */
2756             sv_upgrade(sv, SVt_PV);
2757         return (char *)"";
2758     }
2759     {
2760         const STRLEN len = s - SvPVX_const(sv);
2761         if (lp) 
2762             *lp = len;
2763         SvCUR_set(sv, len);
2764     }
2765     SvPOK_on(sv);
2766     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2767                           PTR2UV(sv),SvPVX_const(sv)));
2768     if (flags & SV_CONST_RETURN)
2769         return (char *)SvPVX_const(sv);
2770     if (flags & SV_MUTABLE_RETURN)
2771         return SvPVX_mutable(sv);
2772     return SvPVX(sv);
2773
2774   tokensave:
2775     len = strlen(tmpbuf);
2776  tokensave_has_len:
2777     assert (!tsv);
2778     if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2779         /* Sneaky stuff here */
2780
2781       tokensaveref:
2782         if (!tsv)
2783             tsv = newSVpvn(tmpbuf, len);
2784         sv_2mortal(tsv);
2785         if (lp)
2786             *lp = SvCUR(tsv);
2787         return SvPVX(tsv);
2788     }
2789     else {
2790         dVAR;
2791
2792 #ifdef FIXNEGATIVEZERO
2793         if (len == 2 && tmpbuf[0] == '-' && tmpbuf[1] == '0') {
2794             tmpbuf[0] = '0';
2795             tmpbuf[1] = 0;
2796             len = 1;
2797         }
2798 #endif
2799         SvUPGRADE(sv, SVt_PV);
2800         if (lp)
2801             *lp = len;
2802         s = SvGROW_mutable(sv, len + 1);
2803         SvCUR_set(sv, len);
2804         SvPOKp_on(sv);
2805         return memcpy(s, tmpbuf, len + 1);
2806     }
2807 }
2808
2809 /*
2810 =for apidoc sv_copypv
2811
2812 Copies a stringified representation of the source SV into the
2813 destination SV.  Automatically performs any necessary mg_get and
2814 coercion of numeric values into strings.  Guaranteed to preserve
2815 UTF-8 flag even from overloaded objects.  Similar in nature to
2816 sv_2pv[_flags] but operates directly on an SV instead of just the
2817 string.  Mostly uses sv_2pv_flags to do its work, except when that
2818 would lose the UTF-8'ness of the PV.
2819
2820 =cut
2821 */
2822
2823 void
2824 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2825 {
2826     STRLEN len;
2827     const char * const s = SvPV_const(ssv,len);
2828     sv_setpvn(dsv,s,len);
2829     if (SvUTF8(ssv))
2830         SvUTF8_on(dsv);
2831     else
2832         SvUTF8_off(dsv);
2833 }
2834
2835 /*
2836 =for apidoc sv_2pvbyte
2837
2838 Return a pointer to the byte-encoded representation of the SV, and set *lp
2839 to its length.  May cause the SV to be downgraded from UTF-8 as a
2840 side-effect.
2841
2842 Usually accessed via the C<SvPVbyte> macro.
2843
2844 =cut
2845 */
2846
2847 char *
2848 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2849 {
2850     sv_utf8_downgrade(sv,0);
2851     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2852 }
2853
2854 /*
2855 =for apidoc sv_2pvutf8
2856
2857 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2858 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2859
2860 Usually accessed via the C<SvPVutf8> macro.
2861
2862 =cut
2863 */
2864
2865 char *
2866 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2867 {
2868     sv_utf8_upgrade(sv);
2869     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2870 }
2871
2872
2873 /*
2874 =for apidoc sv_2bool
2875
2876 This function is only called on magical items, and is only used by
2877 sv_true() or its macro equivalent.
2878
2879 =cut
2880 */
2881
2882 bool
2883 Perl_sv_2bool(pTHX_ register SV *sv)
2884 {
2885     SvGETMAGIC(sv);
2886
2887     if (!SvOK(sv))
2888         return 0;
2889     if (SvROK(sv)) {
2890         SV* tmpsv;
2891         if (SvAMAGIC(sv) && (tmpsv=AMG_CALLun(sv,bool_)) &&
2892                 (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2893             return (bool)SvTRUE(tmpsv);
2894       return SvRV(sv) != 0;
2895     }
2896     if (SvPOKp(sv)) {
2897         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2898         if (Xpvtmp &&
2899                 (*sv->sv_u.svu_pv > '0' ||
2900                 Xpvtmp->xpv_cur > 1 ||
2901                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2902             return 1;
2903         else
2904             return 0;
2905     }
2906     else {
2907         if (SvIOKp(sv))
2908             return SvIVX(sv) != 0;
2909         else {
2910             if (SvNOKp(sv))
2911                 return SvNVX(sv) != 0.0;
2912             else
2913                 return FALSE;
2914         }
2915     }
2916 }
2917
2918 /*
2919 =for apidoc sv_utf8_upgrade
2920
2921 Converts the PV of an SV to its UTF-8-encoded form.
2922 Forces the SV to string form if it is not already.
2923 Always sets the SvUTF8 flag to avoid future validity checks even
2924 if all the bytes have hibit clear.
2925
2926 This is not as a general purpose byte encoding to Unicode interface:
2927 use the Encode extension for that.
2928
2929 =for apidoc sv_utf8_upgrade_flags
2930
2931 Converts the PV of an SV to its UTF-8-encoded form.
2932 Forces the SV to string form if it is not already.
2933 Always sets the SvUTF8 flag to avoid future validity checks even
2934 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2935 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2936 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2937
2938 This is not as a general purpose byte encoding to Unicode interface:
2939 use the Encode extension for that.
2940
2941 =cut
2942 */
2943
2944 STRLEN
2945 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2946 {
2947     if (sv == &PL_sv_undef)
2948         return 0;
2949     if (!SvPOK(sv)) {
2950         STRLEN len = 0;
2951         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2952             (void) sv_2pv_flags(sv,&len, flags);
2953             if (SvUTF8(sv))
2954                 return len;
2955         } else {
2956             (void) SvPV_force(sv,len);
2957         }
2958     }
2959
2960     if (SvUTF8(sv)) {
2961         return SvCUR(sv);
2962     }
2963
2964     if (SvIsCOW(sv)) {
2965         sv_force_normal_flags(sv, 0);
2966     }
2967
2968     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2969         sv_recode_to_utf8(sv, PL_encoding);
2970     else { /* Assume Latin-1/EBCDIC */
2971         /* This function could be much more efficient if we
2972          * had a FLAG in SVs to signal if there are any hibit
2973          * chars in the PV.  Given that there isn't such a flag
2974          * make the loop as fast as possible. */
2975         const U8 *s = (U8 *) SvPVX_const(sv);
2976         const U8 * const e = (U8 *) SvEND(sv);
2977         const U8 *t = s;
2978         int hibit = 0;
2979         
2980         while (t < e) {
2981             const U8 ch = *t++;
2982             if ((hibit = !NATIVE_IS_INVARIANT(ch)))
2983                 break;
2984         }
2985         if (hibit) {
2986             STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2987             U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2988
2989             SvPV_free(sv); /* No longer using what was there before. */
2990
2991             SvPV_set(sv, (char*)recoded);
2992             SvCUR_set(sv, len - 1);
2993             SvLEN_set(sv, len); /* No longer know the real size. */
2994         }
2995         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2996         SvUTF8_on(sv);
2997     }
2998     return SvCUR(sv);
2999 }
3000
3001 /*
3002 =for apidoc sv_utf8_downgrade
3003
3004 Attempts to convert the PV of an SV from characters to bytes.
3005 If the PV contains a character beyond byte, this conversion will fail;
3006 in this case, either returns false or, if C<fail_ok> is not
3007 true, croaks.
3008
3009 This is not as a general purpose Unicode to byte encoding interface:
3010 use the Encode extension for that.
3011
3012 =cut
3013 */
3014
3015 bool
3016 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
3017 {
3018     if (SvPOKp(sv) && SvUTF8(sv)) {
3019         if (SvCUR(sv)) {
3020             U8 *s;
3021             STRLEN len;
3022
3023             if (SvIsCOW(sv)) {
3024                 sv_force_normal_flags(sv, 0);
3025             }
3026             s = (U8 *) SvPV(sv, len);
3027             if (!utf8_to_bytes(s, &len)) {
3028                 if (fail_ok)
3029                     return FALSE;
3030                 else {
3031                     if (PL_op)
3032                         Perl_croak(aTHX_ "Wide character in %s",
3033                                    OP_DESC(PL_op));
3034                     else
3035                         Perl_croak(aTHX_ "Wide character");
3036                 }
3037             }
3038             SvCUR_set(sv, len);
3039         }
3040     }
3041     SvUTF8_off(sv);
3042     return TRUE;
3043 }
3044
3045 /*
3046 =for apidoc sv_utf8_encode
3047
3048 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
3049 flag off so that it looks like octets again.
3050
3051 =cut
3052 */
3053
3054 void
3055 Perl_sv_utf8_encode(pTHX_ register SV *sv)
3056 {
3057     (void) sv_utf8_upgrade(sv);
3058     if (SvIsCOW(sv)) {
3059         sv_force_normal_flags(sv, 0);
3060     }
3061     if (SvREADONLY(sv)) {
3062         Perl_croak(aTHX_ PL_no_modify);
3063     }
3064     SvUTF8_off(sv);
3065 }
3066
3067 /*
3068 =for apidoc sv_utf8_decode
3069
3070 If the PV of the SV is an octet sequence in UTF-8
3071 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
3072 so that it looks like a character. If the PV contains only single-byte
3073 characters, the C<SvUTF8> flag stays being off.
3074 Scans PV for validity and returns false if the PV is invalid UTF-8.
3075
3076 =cut
3077 */
3078
3079 bool
3080 Perl_sv_utf8_decode(pTHX_ register SV *sv)
3081 {
3082     if (SvPOKp(sv)) {
3083         const U8 *c;
3084         const U8 *e;
3085
3086         /* The octets may have got themselves encoded - get them back as
3087          * bytes
3088          */
3089         if (!sv_utf8_downgrade(sv, TRUE))
3090             return FALSE;
3091
3092         /* it is actually just a matter of turning the utf8 flag on, but
3093          * we want to make sure everything inside is valid utf8 first.
3094          */
3095         c = (const U8 *) SvPVX_const(sv);
3096         if (!is_utf8_string(c, SvCUR(sv)+1))
3097             return FALSE;
3098         e = (const U8 *) SvEND(sv);
3099         while (c < e) {
3100             const U8 ch = *c++;
3101             if (!UTF8_IS_INVARIANT(ch)) {
3102                 SvUTF8_on(sv);
3103                 break;
3104             }
3105         }
3106     }
3107     return TRUE;
3108 }
3109
3110 /*
3111 =for apidoc sv_setsv
3112
3113 Copies the contents of the source SV C<ssv> into the destination SV
3114 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3115 function if the source SV needs to be reused. Does not handle 'set' magic.
3116 Loosely speaking, it performs a copy-by-value, obliterating any previous
3117 content of the destination.
3118
3119 You probably want to use one of the assortment of wrappers, such as
3120 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3121 C<SvSetMagicSV_nosteal>.
3122
3123 =for apidoc sv_setsv_flags
3124
3125 Copies the contents of the source SV C<ssv> into the destination SV
3126 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3127 function if the source SV needs to be reused. Does not handle 'set' magic.
3128 Loosely speaking, it performs a copy-by-value, obliterating any previous
3129 content of the destination.
3130 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
3131 C<ssv> if appropriate, else not. If the C<flags> parameter has the
3132 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
3133 and C<sv_setsv_nomg> are implemented in terms of this function.
3134
3135 You probably want to use one of the assortment of wrappers, such as
3136 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3137 C<SvSetMagicSV_nosteal>.
3138
3139 This is the primary function for copying scalars, and most other
3140 copy-ish functions and macros use this underneath.
3141
3142 =cut
3143 */
3144
3145 void
3146 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
3147 {
3148     register U32 sflags;
3149     register int dtype;
3150     register int stype;
3151
3152     if (sstr == dstr)
3153         return;
3154     SV_CHECK_THINKFIRST_COW_DROP(dstr);
3155     if (!sstr)
3156         sstr = &PL_sv_undef;
3157     stype = SvTYPE(sstr);
3158     dtype = SvTYPE(dstr);
3159
3160     SvAMAGIC_off(dstr);
3161     if ( SvVOK(dstr) )
3162     {
3163         /* need to nuke the magic */
3164         mg_free(dstr);
3165         SvRMAGICAL_off(dstr);
3166     }
3167
3168     /* There's a lot of redundancy below but we're going for speed here */
3169
3170     switch (stype) {
3171     case SVt_NULL:
3172       undef_sstr:
3173         if (dtype != SVt_PVGV) {
3174             (void)SvOK_off(dstr);
3175             return;
3176         }
3177         break;
3178     case SVt_IV:
3179         if (SvIOK(sstr)) {
3180             switch (dtype) {
3181             case SVt_NULL:
3182                 sv_upgrade(dstr, SVt_IV);
3183                 break;
3184             case SVt_NV:
3185                 sv_upgrade(dstr, SVt_PVNV);
3186                 break;
3187             case SVt_RV:
3188             case SVt_PV:
3189                 sv_upgrade(dstr, SVt_PVIV);
3190                 break;
3191             }
3192             (void)SvIOK_only(dstr);
3193             SvIV_set(dstr,  SvIVX(sstr));
3194             if (SvIsUV(sstr))
3195                 SvIsUV_on(dstr);
3196             if (SvTAINTED(sstr))
3197                 SvTAINT(dstr);
3198             return;
3199         }
3200         goto undef_sstr;
3201
3202     case SVt_NV:
3203         if (SvNOK(sstr)) {
3204             switch (dtype) {
3205             case SVt_NULL:
3206             case SVt_IV:
3207                 sv_upgrade(dstr, SVt_NV);
3208                 break;
3209             case SVt_RV:
3210             case SVt_PV:
3211             case SVt_PVIV:
3212                 sv_upgrade(dstr, SVt_PVNV);
3213                 break;
3214             }
3215             SvNV_set(dstr, SvNVX(sstr));
3216             (void)SvNOK_only(dstr);
3217             if (SvTAINTED(sstr))
3218                 SvTAINT(dstr);
3219             return;
3220         }
3221         goto undef_sstr;
3222
3223     case SVt_RV:
3224         if (dtype < SVt_RV)
3225             sv_upgrade(dstr, SVt_RV);
3226         else if (dtype == SVt_PVGV &&
3227                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
3228             sstr = SvRV(sstr);
3229             if (sstr == dstr) {
3230                 if (GvIMPORTED(dstr) != GVf_IMPORTED
3231                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3232                 {
3233                     GvIMPORTED_on(dstr);
3234                 }
3235                 GvMULTI_on(dstr);
3236                 return;
3237             }
3238             goto glob_assign;
3239         }
3240         break;
3241     case SVt_PVFM:
3242 #ifdef PERL_OLD_COPY_ON_WRITE
3243         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3244             if (dtype < SVt_PVIV)
3245                 sv_upgrade(dstr, SVt_PVIV);
3246             break;
3247         }
3248         /* Fall through */
3249 #endif
3250     case SVt_PV:
3251         if (dtype < SVt_PV)
3252             sv_upgrade(dstr, SVt_PV);
3253         break;
3254     case SVt_PVIV:
3255         if (dtype < SVt_PVIV)
3256             sv_upgrade(dstr, SVt_PVIV);
3257         break;
3258     case SVt_PVNV:
3259         if (dtype < SVt_PVNV)
3260             sv_upgrade(dstr, SVt_PVNV);
3261         break;
3262     case SVt_PVAV:
3263     case SVt_PVHV:
3264     case SVt_PVCV:
3265     case SVt_PVIO:
3266         {
3267         const char * const type = sv_reftype(sstr,0);
3268         if (PL_op)
3269             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3270         else
3271             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3272         }
3273         break;
3274
3275     case SVt_PVGV:
3276         if (dtype <= SVt_PVGV) {
3277   glob_assign:
3278             if (dtype != SVt_PVGV) {
3279                 const char * const name = GvNAME(sstr);
3280                 const STRLEN len = GvNAMELEN(sstr);
3281                 /* don't upgrade SVt_PVLV: it can hold a glob */
3282                 if (dtype != SVt_PVLV)
3283                     sv_upgrade(dstr, SVt_PVGV);
3284                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3285                 GvSTASH(dstr) = GvSTASH(sstr);
3286                 if (GvSTASH(dstr))
3287                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3288                 GvNAME(dstr) = savepvn(name, len);
3289                 GvNAMELEN(dstr) = len;
3290                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3291             }
3292
3293 #ifdef GV_UNIQUE_CHECK
3294                 if (GvUNIQUE((GV*)dstr)) {
3295                     Perl_croak(aTHX_ PL_no_modify);
3296                 }
3297 #endif
3298
3299             (void)SvOK_off(dstr);
3300             GvINTRO_off(dstr);          /* one-shot flag */
3301             gp_free((GV*)dstr);
3302             GvGP(dstr) = gp_ref(GvGP(sstr));
3303             if (SvTAINTED(sstr))
3304                 SvTAINT(dstr);
3305             if (GvIMPORTED(dstr) != GVf_IMPORTED
3306                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3307             {
3308                 GvIMPORTED_on(dstr);
3309             }
3310             GvMULTI_on(dstr);
3311             return;
3312         }
3313         /* FALL THROUGH */
3314
3315     default:
3316         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3317             mg_get(sstr);
3318             if ((int)SvTYPE(sstr) != stype) {
3319                 stype = SvTYPE(sstr);
3320                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3321                     goto glob_assign;
3322             }
3323         }
3324         if (stype == SVt_PVLV)
3325             SvUPGRADE(dstr, SVt_PVNV);
3326         else
3327             SvUPGRADE(dstr, (U32)stype);
3328     }
3329
3330     sflags = SvFLAGS(sstr);
3331
3332     if (sflags & SVf_ROK) {
3333         if (dtype >= SVt_PV) {
3334             if (dtype == SVt_PVGV) {
3335                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3336                 SV *dref = 0;
3337                 const int intro = GvINTRO(dstr);
3338
3339 #ifdef GV_UNIQUE_CHECK
3340                 if (GvUNIQUE((GV*)dstr)) {
3341                     Perl_croak(aTHX_ PL_no_modify);
3342                 }
3343 #endif
3344
3345                 if (intro) {
3346                     GvINTRO_off(dstr);  /* one-shot flag */
3347                     GvLINE(dstr) = CopLINE(PL_curcop);
3348                     GvEGV(dstr) = (GV*)dstr;
3349                 }
3350                 GvMULTI_on(dstr);
3351                 switch (SvTYPE(sref)) {
3352                 case SVt_PVAV:
3353                     if (intro)
3354                         SAVEGENERICSV(GvAV(dstr));
3355                     else
3356                         dref = (SV*)GvAV(dstr);
3357                     GvAV(dstr) = (AV*)sref;
3358                     if (!GvIMPORTED_AV(dstr)
3359                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3360                     {
3361                         GvIMPORTED_AV_on(dstr);
3362                     }
3363                     break;
3364                 case SVt_PVHV:
3365                     if (intro)
3366                         SAVEGENERICSV(GvHV(dstr));
3367                     else
3368                         dref = (SV*)GvHV(dstr);
3369                     GvHV(dstr) = (HV*)sref;
3370                     if (!GvIMPORTED_HV(dstr)
3371                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3372                     {
3373                         GvIMPORTED_HV_on(dstr);
3374                     }
3375                     break;
3376                 case SVt_PVCV:
3377                     if (intro) {
3378                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3379                             SvREFCNT_dec(GvCV(dstr));
3380                             GvCV(dstr) = Nullcv;
3381                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3382                             PL_sub_generation++;
3383                         }
3384                         SAVEGENERICSV(GvCV(dstr));
3385                     }
3386                     else
3387                         dref = (SV*)GvCV(dstr);
3388                     if (GvCV(dstr) != (CV*)sref) {
3389                         CV* const cv = GvCV(dstr);
3390                         if (cv) {
3391                             if (!GvCVGEN((GV*)dstr) &&
3392                                 (CvROOT(cv) || CvXSUB(cv)))
3393                             {
3394                                 /* Redefining a sub - warning is mandatory if
3395                                    it was a const and its value changed. */
3396                                 if (ckWARN(WARN_REDEFINE)
3397                                     || (CvCONST(cv)
3398                                         && (!CvCONST((CV*)sref)
3399                                             || sv_cmp(cv_const_sv(cv),
3400                                                       cv_const_sv((CV*)sref)))))
3401                                 {
3402                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3403                                         CvCONST(cv)
3404                                         ? "Constant subroutine %s::%s redefined"
3405                                         : "Subroutine %s::%s redefined",
3406                                         HvNAME_get(GvSTASH((GV*)dstr)),
3407                                         GvENAME((GV*)dstr));
3408                                 }
3409                             }
3410                             if (!intro)
3411                                 cv_ckproto(cv, (GV*)dstr,
3412                                            SvPOK(sref)
3413                                            ? SvPVX_const(sref) : Nullch);
3414                         }
3415                         GvCV(dstr) = (CV*)sref;
3416                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3417                         GvASSUMECV_on(dstr);
3418                         PL_sub_generation++;
3419                     }
3420                     if (!GvIMPORTED_CV(dstr)
3421                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3422                     {
3423                         GvIMPORTED_CV_on(dstr);
3424                     }
3425                     break;
3426                 case SVt_PVIO:
3427                     if (intro)
3428                         SAVEGENERICSV(GvIOp(dstr));
3429                     else
3430                         dref = (SV*)GvIOp(dstr);
3431                     GvIOp(dstr) = (IO*)sref;
3432                     break;
3433                 case SVt_PVFM:
3434                     if (intro)
3435                         SAVEGENERICSV(GvFORM(dstr));
3436                     else
3437                         dref = (SV*)GvFORM(dstr);
3438                     GvFORM(dstr) = (CV*)sref;
3439                     break;
3440                 default:
3441                     if (intro)
3442                         SAVEGENERICSV(GvSV(dstr));
3443                     else
3444                         dref = (SV*)GvSV(dstr);
3445                     GvSV(dstr) = sref;
3446                     if (!GvIMPORTED_SV(dstr)
3447                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3448                     {
3449                         GvIMPORTED_SV_on(dstr);
3450                     }
3451                     break;
3452                 }
3453                 if (dref)
3454                     SvREFCNT_dec(dref);
3455                 if (SvTAINTED(sstr))
3456                     SvTAINT(dstr);
3457                 return;
3458             }
3459             if (SvPVX_const(dstr)) {
3460                 SvPV_free(dstr);
3461                 SvLEN_set(dstr, 0);
3462                 SvCUR_set(dstr, 0);
3463             }
3464         }
3465         (void)SvOK_off(dstr);
3466         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3467         SvROK_on(dstr);
3468         if (sflags & SVp_NOK) {
3469             SvNOKp_on(dstr);
3470             /* Only set the public OK flag if the source has public OK.  */
3471             if (sflags & SVf_NOK)
3472                 SvFLAGS(dstr) |= SVf_NOK;
3473             SvNV_set(dstr, SvNVX(sstr));
3474         }
3475         if (sflags & SVp_IOK) {
3476             (void)SvIOKp_on(dstr);
3477             if (sflags & SVf_IOK)
3478                 SvFLAGS(dstr) |= SVf_IOK;
3479             if (sflags & SVf_IVisUV)
3480                 SvIsUV_on(dstr);
3481             SvIV_set(dstr, SvIVX(sstr));
3482         }
3483         if (SvAMAGIC(sstr)) {
3484             SvAMAGIC_on(dstr);
3485         }
3486     }
3487     else if (sflags & SVp_POK) {
3488         bool isSwipe = 0;
3489
3490         /*
3491          * Check to see if we can just swipe the string.  If so, it's a
3492          * possible small lose on short strings, but a big win on long ones.
3493          * It might even be a win on short strings if SvPVX_const(dstr)
3494          * has to be allocated and SvPVX_const(sstr) has to be freed.
3495          */
3496
3497         /* Whichever path we take through the next code, we want this true,
3498            and doing it now facilitates the COW check.  */
3499         (void)SvPOK_only(dstr);
3500
3501         if (
3502             /* We're not already COW  */
3503             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3504 #ifndef PERL_OLD_COPY_ON_WRITE
3505              /* or we are, but dstr isn't a suitable target.  */
3506              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3507 #endif
3508              )
3509             &&
3510             !(isSwipe =
3511                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3512                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3513                  (!(flags & SV_NOSTEAL)) &&
3514                                         /* and we're allowed to steal temps */
3515                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3516                  SvLEN(sstr)    &&        /* and really is a string */
3517                                 /* and won't be needed again, potentially */
3518               !(PL_op && PL_op->op_type == OP_AASSIGN))
3519 #ifdef PERL_OLD_COPY_ON_WRITE
3520             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3521                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3522                  && SvTYPE(sstr) >= SVt_PVIV)
3523 #endif
3524             ) {
3525             /* Failed the swipe test, and it's not a shared hash key either.
3526                Have to copy the string.  */
3527             STRLEN len = SvCUR(sstr);
3528             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3529             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3530             SvCUR_set(dstr, len);
3531             *SvEND(dstr) = '\0';
3532         } else {
3533             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3534                be true in here.  */
3535             /* Either it's a shared hash key, or it's suitable for
3536                copy-on-write or we can swipe the string.  */
3537             if (DEBUG_C_TEST) {
3538                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3539                 sv_dump(sstr);
3540                 sv_dump(dstr);
3541             }
3542 #ifdef PERL_OLD_COPY_ON_WRITE
3543             if (!isSwipe) {
3544                 /* I believe I should acquire a global SV mutex if
3545                    it's a COW sv (not a shared hash key) to stop
3546                    it going un copy-on-write.
3547                    If the source SV has gone un copy on write between up there
3548                    and down here, then (assert() that) it is of the correct
3549                    form to make it copy on write again */
3550                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3551                     != (SVf_FAKE | SVf_READONLY)) {
3552                     SvREADONLY_on(sstr);
3553                     SvFAKE_on(sstr);
3554                     /* Make the source SV into a loop of 1.
3555                        (about to become 2) */
3556                     SV_COW_NEXT_SV_SET(sstr, sstr);
3557                 }
3558             }
3559 #endif
3560             /* Initial code is common.  */
3561             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3562                 SvPV_free(dstr);
3563             }
3564
3565             if (!isSwipe) {
3566                 /* making another shared SV.  */
3567                 STRLEN cur = SvCUR(sstr);
3568                 STRLEN len = SvLEN(sstr);
3569 #ifdef PERL_OLD_COPY_ON_WRITE
3570                 if (len) {
3571                     assert (SvTYPE(dstr) >= SVt_PVIV);
3572                     /* SvIsCOW_normal */
3573                     /* splice us in between source and next-after-source.  */
3574                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3575                     SV_COW_NEXT_SV_SET(sstr, dstr);
3576                     SvPV_set(dstr, SvPVX_mutable(sstr));
3577                 } else
3578 #endif
3579                 {
3580                     /* SvIsCOW_shared_hash */
3581                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3582                                           "Copy on write: Sharing hash\n"));
3583
3584                     assert (SvTYPE(dstr) >= SVt_PV);
3585                     SvPV_set(dstr,
3586                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3587                 }
3588                 SvLEN_set(dstr, len);
3589                 SvCUR_set(dstr, cur);
3590                 SvREADONLY_on(dstr);
3591                 SvFAKE_on(dstr);
3592                 /* Relesase a global SV mutex.  */
3593             }
3594             else
3595                 {       /* Passes the swipe test.  */
3596                 SvPV_set(dstr, SvPVX_mutable(sstr));
3597                 SvLEN_set(dstr, SvLEN(sstr));
3598                 SvCUR_set(dstr, SvCUR(sstr));
3599
3600                 SvTEMP_off(dstr);
3601                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3602                 SvPV_set(sstr, Nullch);
3603                 SvLEN_set(sstr, 0);
3604                 SvCUR_set(sstr, 0);
3605                 SvTEMP_off(sstr);
3606             }
3607         }
3608         if (sflags & SVf_UTF8)
3609             SvUTF8_on(dstr);
3610         if (sflags & SVp_NOK) {
3611             SvNOKp_on(dstr);
3612             if (sflags & SVf_NOK)
3613                 SvFLAGS(dstr) |= SVf_NOK;
3614             SvNV_set(dstr, SvNVX(sstr));
3615         }
3616         if (sflags & SVp_IOK) {
3617             (void)SvIOKp_on(dstr);
3618             if (sflags & SVf_IOK)
3619                 SvFLAGS(dstr) |= SVf_IOK;
3620             if (sflags & SVf_IVisUV)
3621                 SvIsUV_on(dstr);
3622             SvIV_set(dstr, SvIVX(sstr));
3623         }
3624         if (SvVOK(sstr)) {
3625             MAGIC *smg = mg_find(sstr,PERL_MAGIC_vstring);
3626             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3627                         smg->mg_ptr, smg->mg_len);
3628             SvRMAGICAL_on(dstr);
3629         }
3630     }
3631     else if (sflags & SVp_IOK) {
3632         if (sflags & SVf_IOK)
3633             (void)SvIOK_only(dstr);
3634         else {
3635             (void)SvOK_off(dstr);
3636             (void)SvIOKp_on(dstr);
3637         }
3638         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3639         if (sflags & SVf_IVisUV)
3640             SvIsUV_on(dstr);
3641         SvIV_set(dstr, SvIVX(sstr));
3642         if (sflags & SVp_NOK) {
3643             if (sflags & SVf_NOK)
3644                 (void)SvNOK_on(dstr);
3645             else
3646                 (void)SvNOKp_on(dstr);
3647             SvNV_set(dstr, SvNVX(sstr));
3648         }
3649     }
3650     else if (sflags & SVp_NOK) {
3651         if (sflags & SVf_NOK)
3652             (void)SvNOK_only(dstr);
3653         else {
3654             (void)SvOK_off(dstr);
3655             SvNOKp_on(dstr);
3656         }
3657         SvNV_set(dstr, SvNVX(sstr));
3658     }
3659     else {
3660         if (dtype == SVt_PVGV) {
3661             if (ckWARN(WARN_MISC))
3662                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3663         }
3664         else
3665             (void)SvOK_off(dstr);
3666     }
3667     if (SvTAINTED(sstr))
3668         SvTAINT(dstr);
3669 }
3670
3671 /*
3672 =for apidoc sv_setsv_mg
3673
3674 Like C<sv_setsv>, but also handles 'set' magic.
3675
3676 =cut
3677 */
3678
3679 void
3680 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3681 {
3682     sv_setsv(dstr,sstr);
3683     SvSETMAGIC(dstr);
3684 }
3685
3686 #ifdef PERL_OLD_COPY_ON_WRITE
3687 SV *
3688 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3689 {
3690     STRLEN cur = SvCUR(sstr);
3691     STRLEN len = SvLEN(sstr);
3692     register char *new_pv;
3693
3694     if (DEBUG_C_TEST) {
3695         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3696                       sstr, dstr);
3697         sv_dump(sstr);
3698         if (dstr)
3699                     sv_dump(dstr);
3700     }
3701
3702     if (dstr) {
3703         if (SvTHINKFIRST(dstr))
3704             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3705         else if (SvPVX_const(dstr))
3706             Safefree(SvPVX_const(dstr));
3707     }
3708     else
3709         new_SV(dstr);
3710     SvUPGRADE(dstr, SVt_PVIV);
3711
3712     assert (SvPOK(sstr));
3713     assert (SvPOKp(sstr));
3714     assert (!SvIOK(sstr));
3715     assert (!SvIOKp(sstr));
3716     assert (!SvNOK(sstr));
3717     assert (!SvNOKp(sstr));
3718
3719     if (SvIsCOW(sstr)) {
3720
3721         if (SvLEN(sstr) == 0) {
3722             /* source is a COW shared hash key.  */
3723             DEBUG_C(PerlIO_printf(Perl_debug_log,
3724                                   "Fast copy on write: Sharing hash\n"));
3725             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3726             goto common_exit;
3727         }
3728         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3729     } else {
3730         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3731         SvUPGRADE(sstr, SVt_PVIV);
3732         SvREADONLY_on(sstr);
3733         SvFAKE_on(sstr);
3734         DEBUG_C(PerlIO_printf(Perl_debug_log,
3735                               "Fast copy on write: Converting sstr to COW\n"));
3736         SV_COW_NEXT_SV_SET(dstr, sstr);
3737     }
3738     SV_COW_NEXT_SV_SET(sstr, dstr);
3739     new_pv = SvPVX_mutable(sstr);
3740
3741   common_exit:
3742     SvPV_set(dstr, new_pv);
3743     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3744     if (SvUTF8(sstr))
3745         SvUTF8_on(dstr);
3746     SvLEN_set(dstr, len);
3747     SvCUR_set(dstr, cur);
3748     if (DEBUG_C_TEST) {
3749         sv_dump(dstr);
3750     }
3751     return dstr;
3752 }
3753 #endif
3754
3755 /*
3756 =for apidoc sv_setpvn
3757
3758 Copies a string into an SV.  The C<len> parameter indicates the number of
3759 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3760 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3761
3762 =cut
3763 */
3764
3765 void
3766 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3767 {
3768     register char *dptr;
3769
3770     SV_CHECK_THINKFIRST_COW_DROP(sv);
3771     if (!ptr) {
3772         (void)SvOK_off(sv);
3773         return;
3774     }
3775     else {
3776         /* len is STRLEN which is unsigned, need to copy to signed */
3777         const IV iv = len;
3778         if (iv < 0)
3779             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3780     }
3781     SvUPGRADE(sv, SVt_PV);
3782
3783     dptr = SvGROW(sv, len + 1);
3784     Move(ptr,dptr,len,char);
3785     dptr[len] = '\0';
3786     SvCUR_set(sv, len);
3787     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3788     SvTAINT(sv);
3789 }
3790
3791 /*
3792 =for apidoc sv_setpvn_mg
3793
3794 Like C<sv_setpvn>, but also handles 'set' magic.
3795
3796 =cut
3797 */
3798
3799 void
3800 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3801 {
3802     sv_setpvn(sv,ptr,len);
3803     SvSETMAGIC(sv);
3804 }
3805
3806 /*
3807 =for apidoc sv_setpv
3808
3809 Copies a string into an SV.  The string must be null-terminated.  Does not
3810 handle 'set' magic.  See C<sv_setpv_mg>.
3811
3812 =cut
3813 */
3814
3815 void
3816 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3817 {
3818     register STRLEN len;
3819
3820     SV_CHECK_THINKFIRST_COW_DROP(sv);
3821     if (!ptr) {
3822         (void)SvOK_off(sv);
3823         return;
3824     }
3825     len = strlen(ptr);
3826     SvUPGRADE(sv, SVt_PV);
3827
3828     SvGROW(sv, len + 1);
3829     Move(ptr,SvPVX(sv),len+1,char);
3830     SvCUR_set(sv, len);
3831     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3832     SvTAINT(sv);
3833 }
3834
3835 /*
3836 =for apidoc sv_setpv_mg
3837
3838 Like C<sv_setpv>, but also handles 'set' magic.
3839
3840 =cut
3841 */
3842
3843 void
3844 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3845 {
3846     sv_setpv(sv,ptr);
3847     SvSETMAGIC(sv);
3848 }
3849
3850 /*
3851 =for apidoc sv_usepvn
3852
3853 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3854 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3855 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3856 string length, C<len>, must be supplied.  This function will realloc the
3857 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3858 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3859 See C<sv_usepvn_mg>.
3860
3861 =cut
3862 */
3863
3864 void
3865 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3866 {
3867     STRLEN allocate;
3868     SV_CHECK_THINKFIRST_COW_DROP(sv);
3869     SvUPGRADE(sv, SVt_PV);
3870     if (!ptr) {
3871         (void)SvOK_off(sv);
3872         return;
3873     }
3874     if (SvPVX_const(sv))
3875         SvPV_free(sv);
3876
3877     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3878     ptr = saferealloc (ptr, allocate);
3879     SvPV_set(sv, ptr);
3880     SvCUR_set(sv, len);
3881     SvLEN_set(sv, allocate);
3882     *SvEND(sv) = '\0';
3883     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3884     SvTAINT(sv);
3885 }
3886
3887 /*
3888 =for apidoc sv_usepvn_mg
3889
3890 Like C<sv_usepvn>, but also handles 'set' magic.
3891
3892 =cut
3893 */
3894
3895 void
3896 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3897 {
3898     sv_usepvn(sv,ptr,len);
3899     SvSETMAGIC(sv);
3900 }
3901
3902 #ifdef PERL_OLD_COPY_ON_WRITE
3903 /* Need to do this *after* making the SV normal, as we need the buffer
3904    pointer to remain valid until after we've copied it.  If we let go too early,
3905    another thread could invalidate it by unsharing last of the same hash key
3906    (which it can do by means other than releasing copy-on-write Svs)
3907    or by changing the other copy-on-write SVs in the loop.  */
3908 STATIC void
3909 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3910 {
3911     if (len) { /* this SV was SvIsCOW_normal(sv) */
3912          /* we need to find the SV pointing to us.  */
3913         SV * const current = SV_COW_NEXT_SV(after);
3914
3915         if (current == sv) {
3916             /* The SV we point to points back to us (there were only two of us
3917                in the loop.)
3918                Hence other SV is no longer copy on write either.  */
3919             SvFAKE_off(after);
3920             SvREADONLY_off(after);
3921         } else {
3922             /* We need to follow the pointers around the loop.  */
3923             SV *next;
3924             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3925                 assert (next);
3926                 current = next;
3927                  /* don't loop forever if the structure is bust, and we have
3928                     a pointer into a closed loop.  */
3929                 assert (current != after);
3930                 assert (SvPVX_const(current) == pvx);
3931             }
3932             /* Make the SV before us point to the SV after us.  */
3933             SV_COW_NEXT_SV_SET(current, after);
3934         }
3935     } else {
3936         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3937     }
3938 }
3939
3940 int
3941 Perl_sv_release_IVX(pTHX_ register SV *sv)
3942 {
3943     if (SvIsCOW(sv))
3944         sv_force_normal_flags(sv, 0);
3945     SvOOK_off(sv);
3946     return 0;
3947 }
3948 #endif
3949 /*
3950 =for apidoc sv_force_normal_flags
3951
3952 Undo various types of fakery on an SV: if the PV is a shared string, make
3953 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3954 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3955 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3956 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3957 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3958 set to some other value.) In addition, the C<flags> parameter gets passed to
3959 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3960 with flags set to 0.
3961
3962 =cut
3963 */
3964
3965 void
3966 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3967 {
3968 #ifdef PERL_OLD_COPY_ON_WRITE
3969     if (SvREADONLY(sv)) {
3970         /* At this point I believe I should acquire a global SV mutex.  */
3971         if (SvFAKE(sv)) {
3972             const char * const pvx = SvPVX_const(sv);
3973             const STRLEN len = SvLEN(sv);
3974             const STRLEN cur = SvCUR(sv);
3975             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3976             if (DEBUG_C_TEST) {
3977                 PerlIO_printf(Perl_debug_log,
3978                               "Copy on write: Force normal %ld\n",
3979                               (long) flags);
3980                 sv_dump(sv);
3981             }
3982             SvFAKE_off(sv);
3983             SvREADONLY_off(sv);
3984             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3985             SvPV_set(sv, (char*)0);
3986             SvLEN_set(sv, 0);
3987             if (flags & SV_COW_DROP_PV) {
3988                 /* OK, so we don't need to copy our buffer.  */
3989                 SvPOK_off(sv);
3990             } else {
3991                 SvGROW(sv, cur + 1);
3992                 Move(pvx,SvPVX(sv),cur,char);
3993                 SvCUR_set(sv, cur);
3994                 *SvEND(sv) = '\0';
3995             }
3996             sv_release_COW(sv, pvx, len, next);
3997             if (DEBUG_C_TEST) {
3998                 sv_dump(sv);
3999             }
4000         }
4001         else if (IN_PERL_RUNTIME)
4002             Perl_croak(aTHX_ PL_no_modify);
4003         /* At this point I believe that I can drop the global SV mutex.  */
4004     }
4005 #else
4006     if (SvREADONLY(sv)) {
4007         if (SvFAKE(sv)) {
4008             const char * const pvx = SvPVX_const(sv);
4009             const STRLEN len = SvCUR(sv);
4010             SvFAKE_off(sv);
4011             SvREADONLY_off(sv);
4012             SvPV_set(sv, Nullch);
4013             SvLEN_set(sv, 0);
4014             SvGROW(sv, len + 1);
4015             Move(pvx,SvPVX(sv),len,char);
4016             *SvEND(sv) = '\0';
4017             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
4018         }
4019         else if (IN_PERL_RUNTIME)
4020             Perl_croak(aTHX_ PL_no_modify);
4021     }
4022 #endif
4023     if (SvROK(sv))
4024         sv_unref_flags(sv, flags);
4025     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
4026         sv_unglob(sv);
4027 }
4028
4029 /*
4030 =for apidoc sv_chop
4031
4032 Efficient removal of characters from the beginning of the string buffer.
4033 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
4034 the string buffer.  The C<ptr> becomes the first character of the adjusted
4035 string. Uses the "OOK hack".
4036 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
4037 refer to the same chunk of data.
4038
4039 =cut
4040 */
4041
4042 void
4043 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
4044 {
4045     register STRLEN delta;
4046     if (!ptr || !SvPOKp(sv))
4047         return;
4048     delta = ptr - SvPVX_const(sv);
4049     SV_CHECK_THINKFIRST(sv);
4050     if (SvTYPE(sv) < SVt_PVIV)
4051         sv_upgrade(sv,SVt_PVIV);
4052
4053     if (!SvOOK(sv)) {
4054         if (!SvLEN(sv)) { /* make copy of shared string */
4055             const char *pvx = SvPVX_const(sv);
4056             const STRLEN len = SvCUR(sv);
4057             SvGROW(sv, len + 1);
4058             Move(pvx,SvPVX(sv),len,char);
4059             *SvEND(sv) = '\0';
4060         }
4061         SvIV_set(sv, 0);
4062         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
4063            and we do that anyway inside the SvNIOK_off
4064         */
4065         SvFLAGS(sv) |= SVf_OOK;
4066     }
4067     SvNIOK_off(sv);
4068     SvLEN_set(sv, SvLEN(sv) - delta);
4069     SvCUR_set(sv, SvCUR(sv) - delta);
4070     SvPV_set(sv, SvPVX(sv) + delta);
4071     SvIV_set(sv, SvIVX(sv) + delta);
4072 }
4073
4074 /*
4075 =for apidoc sv_catpvn
4076
4077 Concatenates the string onto the end of the string which is in the SV.  The
4078 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4079 status set, then the bytes appended should be valid UTF-8.
4080 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
4081
4082 =for apidoc sv_catpvn_flags
4083
4084 Concatenates the string onto the end of the string which is in the SV.  The
4085 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4086 status set, then the bytes appended should be valid UTF-8.
4087 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
4088 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
4089 in terms of this function.
4090
4091 =cut
4092 */
4093
4094 void
4095 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
4096 {
4097     STRLEN dlen;
4098     const char *dstr = SvPV_force_flags(dsv, dlen, flags);
4099
4100     SvGROW(dsv, dlen + slen + 1);
4101     if (sstr == dstr)
4102         sstr = SvPVX_const(dsv);
4103     Move(sstr, SvPVX(dsv) + dlen, slen, char);
4104     SvCUR_set(dsv, SvCUR(dsv) + slen);
4105     *SvEND(dsv) = '\0';
4106     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
4107     SvTAINT(dsv);
4108     if (flags & SV_SMAGIC)
4109         SvSETMAGIC(dsv);
4110 }
4111
4112 /*
4113 =for apidoc sv_catsv
4114
4115 Concatenates the string from SV C<ssv> onto the end of the string in
4116 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
4117 not 'set' magic.  See C<sv_catsv_mg>.
4118
4119 =for apidoc sv_catsv_flags
4120
4121 Concatenates the string from SV C<ssv> onto the end of the string in
4122 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
4123 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
4124 and C<sv_catsv_nomg> are implemented in terms of this function.
4125
4126 =cut */
4127
4128 void
4129 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
4130 {
4131     const char *spv;
4132     STRLEN slen;
4133     if (ssv) {
4134         if ((spv = SvPV_const(ssv, slen))) {
4135             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
4136                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
4137                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
4138                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
4139                 dsv->sv_flags doesn't have that bit set.
4140                 Andy Dougherty  12 Oct 2001
4141             */
4142             const I32 sutf8 = DO_UTF8(ssv);
4143             I32 dutf8;
4144
4145             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
4146                 mg_get(dsv);
4147             dutf8 = DO_UTF8(dsv);
4148
4149             if (dutf8 != sutf8) {
4150                 if (dutf8) {
4151                     /* Not modifying source SV, so taking a temporary copy. */
4152                     SV* csv = sv_2mortal(newSVpvn(spv, slen));
4153
4154                     sv_utf8_upgrade(csv);
4155                     spv = SvPV_const(csv, slen);
4156                 }
4157                 else
4158                     sv_utf8_upgrade_nomg(dsv);
4159             }
4160             sv_catpvn_nomg(dsv, spv, slen);
4161         }
4162     }
4163     if (flags & SV_SMAGIC)
4164         SvSETMAGIC(dsv);
4165 }
4166
4167 /*
4168 =for apidoc sv_catpv
4169
4170 Concatenates the string onto the end of the string which is in the SV.
4171 If the SV has the UTF-8 status set, then the bytes appended should be
4172 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
4173
4174 =cut */
4175
4176 void
4177 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
4178 {
4179     register STRLEN len;
4180     STRLEN tlen;
4181     char *junk;
4182
4183     if (!ptr)
4184         return;
4185     junk = SvPV_force(sv, tlen);
4186     len = strlen(ptr);
4187     SvGROW(sv, tlen + len + 1);
4188     if (ptr == junk)
4189         ptr = SvPVX_const(sv);
4190     Move(ptr,SvPVX(sv)+tlen,len+1,char);
4191     SvCUR_set(sv, SvCUR(sv) + len);
4192     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
4193     SvTAINT(sv);
4194 }
4195
4196 /*
4197 =for apidoc sv_catpv_mg
4198
4199 Like C<sv_catpv>, but also handles 'set' magic.
4200
4201 =cut
4202 */
4203
4204 void
4205 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
4206 {
4207     sv_catpv(sv,ptr);
4208     SvSETMAGIC(sv);
4209 }
4210
4211 /*
4212 =for apidoc newSV
4213
4214 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
4215 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
4216 macro.
4217
4218 =cut
4219 */
4220
4221 SV *
4222 Perl_newSV(pTHX_ STRLEN len)
4223 {
4224     register SV *sv;
4225
4226     new_SV(sv);
4227     if (len) {
4228         sv_upgrade(sv, SVt_PV);
4229         SvGROW(sv, len + 1);
4230     }
4231     return sv;
4232 }
4233 /*
4234 =for apidoc sv_magicext
4235
4236 Adds magic to an SV, upgrading it if necessary. Applies the
4237 supplied vtable and returns a pointer to the magic added.
4238
4239 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4240 In particular, you can add magic to SvREADONLY SVs, and add more than
4241 one instance of the same 'how'.
4242
4243 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4244 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4245 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4246 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4247
4248 (This is now used as a subroutine by C<sv_magic>.)
4249
4250 =cut
4251 */
4252 MAGIC * 
4253 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4254                  const char* name, I32 namlen)
4255 {
4256     MAGIC* mg;
4257
4258     if (SvTYPE(sv) < SVt_PVMG) {
4259         SvUPGRADE(sv, SVt_PVMG);
4260     }
4261     Newxz(mg, 1, MAGIC);
4262     mg->mg_moremagic = SvMAGIC(sv);
4263     SvMAGIC_set(sv, mg);
4264
4265     /* Sometimes a magic contains a reference loop, where the sv and
4266        object refer to each other.  To prevent a reference loop that
4267        would prevent such objects being freed, we look for such loops
4268        and if we find one we avoid incrementing the object refcount.
4269
4270        Note we cannot do this to avoid self-tie loops as intervening RV must
4271        have its REFCNT incremented to keep it in existence.
4272
4273     */
4274     if (!obj || obj == sv ||
4275         how == PERL_MAGIC_arylen ||
4276         how == PERL_MAGIC_qr ||
4277         how == PERL_MAGIC_symtab ||
4278         (SvTYPE(obj) == SVt_PVGV &&
4279             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4280             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4281             GvFORM(obj) == (CV*)sv)))
4282     {
4283         mg->mg_obj = obj;
4284     }
4285     else {
4286         mg->mg_obj = SvREFCNT_inc(obj);
4287         mg->mg_flags |= MGf_REFCOUNTED;
4288     }
4289
4290     /* Normal self-ties simply pass a null object, and instead of
4291        using mg_obj directly, use the SvTIED_obj macro to produce a
4292        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4293        with an RV obj pointing to the glob containing the PVIO.  In
4294        this case, to avoid a reference loop, we need to weaken the
4295        reference.
4296     */
4297
4298     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4299         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4300     {
4301       sv_rvweaken(obj);
4302     }
4303
4304     mg->mg_type = how;
4305     mg->mg_len = namlen;
4306     if (name) {
4307         if (namlen > 0)
4308             mg->mg_ptr = savepvn(name, namlen);
4309         else if (namlen == HEf_SVKEY)
4310             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4311         else
4312             mg->mg_ptr = (char *) name;
4313     }
4314     mg->mg_virtual = vtable;
4315
4316     mg_magical(sv);
4317     if (SvGMAGICAL(sv))
4318         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4319     return mg;
4320 }
4321
4322 /*
4323 =for apidoc sv_magic
4324
4325 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4326 then adds a new magic item of type C<how> to the head of the magic list.
4327
4328 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4329 handling of the C<name> and C<namlen> arguments.
4330
4331 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4332 to add more than one instance of the same 'how'.
4333
4334 =cut
4335 */
4336
4337 void
4338 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4339 {
4340     const MGVTBL *vtable;
4341     MAGIC* mg;
4342
4343 #ifdef PERL_OLD_COPY_ON_WRITE
4344     if (SvIsCOW(sv))
4345         sv_force_normal_flags(sv, 0);
4346 #endif
4347     if (SvREADONLY(sv)) {
4348         if (
4349             /* its okay to attach magic to shared strings; the subsequent
4350              * upgrade to PVMG will unshare the string */
4351             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4352
4353             && IN_PERL_RUNTIME
4354             && how != PERL_MAGIC_regex_global
4355             && how != PERL_MAGIC_bm
4356             && how != PERL_MAGIC_fm
4357             && how != PERL_MAGIC_sv
4358             && how != PERL_MAGIC_backref
4359            )
4360         {
4361             Perl_croak(aTHX_ PL_no_modify);
4362         }
4363     }
4364     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4365         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4366             /* sv_magic() refuses to add a magic of the same 'how' as an
4367                existing one
4368              */
4369             if (how == PERL_MAGIC_taint)
4370                 mg->mg_len |= 1;
4371             return;
4372         }
4373     }
4374
4375     switch (how) {
4376     case PERL_MAGIC_sv:
4377         vtable = &PL_vtbl_sv;
4378         break;
4379     case PERL_MAGIC_overload:
4380         vtable = &PL_vtbl_amagic;
4381         break;
4382     case PERL_MAGIC_overload_elem:
4383         vtable = &PL_vtbl_amagicelem;
4384         break;
4385     case PERL_MAGIC_overload_table:
4386         vtable = &PL_vtbl_ovrld;
4387         break;
4388     case PERL_MAGIC_bm:
4389         vtable = &PL_vtbl_bm;
4390         break;
4391     case PERL_MAGIC_regdata:
4392         vtable = &PL_vtbl_regdata;
4393         break;
4394     case PERL_MAGIC_regdatum:
4395         vtable = &PL_vtbl_regdatum;
4396         break;
4397     case PERL_MAGIC_env:
4398         vtable = &PL_vtbl_env;
4399         break;
4400     case PERL_MAGIC_fm:
4401         vtable = &PL_vtbl_fm;
4402         break;
4403     case PERL_MAGIC_envelem:
4404         vtable = &PL_vtbl_envelem;
4405         break;
4406     case PERL_MAGIC_regex_global:
4407         vtable = &PL_vtbl_mglob;
4408         break;
4409     case PERL_MAGIC_isa:
4410         vtable = &PL_vtbl_isa;
4411         break;
4412     case PERL_MAGIC_isaelem:
4413         vtable = &PL_vtbl_isaelem;
4414         break;
4415     case PERL_MAGIC_nkeys:
4416         vtable = &PL_vtbl_nkeys;
4417         break;
4418     case PERL_MAGIC_dbfile:
4419         vtable = NULL;
4420         break;
4421     case PERL_MAGIC_dbline:
4422         vtable = &PL_vtbl_dbline;
4423         break;
4424 #ifdef USE_LOCALE_COLLATE
4425     case PERL_MAGIC_collxfrm:
4426         vtable = &PL_vtbl_collxfrm;
4427         break;
4428 #endif /* USE_LOCALE_COLLATE */
4429     case PERL_MAGIC_tied:
4430         vtable = &PL_vtbl_pack;
4431         break;
4432     case PERL_MAGIC_tiedelem:
4433     case PERL_MAGIC_tiedscalar:
4434         vtable = &PL_vtbl_packelem;
4435         break;
4436     case PERL_MAGIC_qr:
4437         vtable = &PL_vtbl_regexp;
4438         break;
4439     case PERL_MAGIC_sig:
4440         vtable = &PL_vtbl_sig;
4441         break;
4442     case PERL_MAGIC_sigelem:
4443         vtable = &PL_vtbl_sigelem;
4444         break;
4445     case PERL_MAGIC_taint:
4446         vtable = &PL_vtbl_taint;
4447         break;
4448     case PERL_MAGIC_uvar:
4449         vtable = &PL_vtbl_uvar;
4450         break;
4451     case PERL_MAGIC_vec:
4452         vtable = &PL_vtbl_vec;
4453         break;
4454     case PERL_MAGIC_arylen_p:
4455     case PERL_MAGIC_rhash:
4456     case PERL_MAGIC_symtab:
4457     case PERL_MAGIC_vstring:
4458         vtable = NULL;
4459         break;
4460     case PERL_MAGIC_utf8:
4461         vtable = &PL_vtbl_utf8;
4462         break;
4463     case PERL_MAGIC_substr:
4464         vtable = &PL_vtbl_substr;
4465         break;
4466     case PERL_MAGIC_defelem:
4467         vtable = &PL_vtbl_defelem;
4468         break;
4469     case PERL_MAGIC_glob:
4470         vtable = &PL_vtbl_glob;
4471         break;
4472     case PERL_MAGIC_arylen:
4473         vtable = &PL_vtbl_arylen;
4474         break;
4475     case PERL_MAGIC_pos:
4476         vtable = &PL_vtbl_pos;
4477         break;
4478     case PERL_MAGIC_backref:
4479         vtable = &PL_vtbl_backref;
4480         break;
4481     case PERL_MAGIC_ext:
4482         /* Reserved for use by extensions not perl internals.           */
4483         /* Useful for attaching extension internal data to perl vars.   */
4484         /* Note that multiple extensions may clash if magical scalars   */
4485         /* etc holding private data from one are passed to another.     */
4486         vtable = NULL;
4487         break;
4488     default:
4489         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4490     }
4491
4492     /* Rest of work is done else where */
4493     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4494
4495     switch (how) {
4496     case PERL_MAGIC_taint:
4497         mg->mg_len = 1;
4498         break;
4499     case PERL_MAGIC_ext:
4500     case PERL_MAGIC_dbfile:
4501         SvRMAGICAL_on(sv);
4502         break;
4503     }
4504 }
4505
4506 /*
4507 =for apidoc sv_unmagic
4508
4509 Removes all magic of type C<type> from an SV.
4510
4511 =cut
4512 */
4513
4514 int
4515 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4516 {
4517     MAGIC* mg;
4518     MAGIC** mgp;
4519     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4520         return 0;
4521     mgp = &SvMAGIC(sv);
4522     for (mg = *mgp; mg; mg = *mgp) {
4523         if (mg->mg_type == type) {
4524             const MGVTBL* const vtbl = mg->mg_virtual;
4525             *mgp = mg->mg_moremagic;
4526             if (vtbl && vtbl->svt_free)
4527                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4528             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4529                 if (mg->mg_len > 0)
4530                     Safefree(mg->mg_ptr);
4531                 else if (mg->mg_len == HEf_SVKEY)
4532                     SvREFCNT_dec((SV*)mg->mg_ptr);
4533                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4534                     Safefree(mg->mg_ptr);
4535             }
4536             if (mg->mg_flags & MGf_REFCOUNTED)
4537                 SvREFCNT_dec(mg->mg_obj);
4538             Safefree(mg);
4539         }
4540         else
4541             mgp = &mg->mg_moremagic;
4542     }
4543     if (!SvMAGIC(sv)) {
4544         SvMAGICAL_off(sv);
4545        SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4546     }
4547
4548     return 0;
4549 }
4550
4551 /*
4552 =for apidoc sv_rvweaken
4553
4554 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4555 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4556 push a back-reference to this RV onto the array of backreferences
4557 associated with that magic.
4558
4559 =cut
4560 */
4561
4562 SV *
4563 Perl_sv_rvweaken(pTHX_ SV *sv)
4564 {
4565     SV *tsv;
4566     if (!SvOK(sv))  /* let undefs pass */
4567         return sv;
4568     if (!SvROK(sv))
4569         Perl_croak(aTHX_ "Can't weaken a nonreference");
4570     else if (SvWEAKREF(sv)) {
4571         if (ckWARN(WARN_MISC))
4572             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4573         return sv;
4574     }
4575     tsv = SvRV(sv);
4576     Perl_sv_add_backref(aTHX_ tsv, sv);
4577     SvWEAKREF_on(sv);
4578     SvREFCNT_dec(tsv);
4579     return sv;
4580 }
4581
4582 /* Give tsv backref magic if it hasn't already got it, then push a
4583  * back-reference to sv onto the array associated with the backref magic.
4584  */
4585
4586 void
4587 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4588 {
4589     AV *av;
4590     MAGIC *mg;
4591     if (SvMAGICAL(tsv) && (mg = mg_find(tsv, PERL_MAGIC_backref)))
4592         av = (AV*)mg->mg_obj;
4593     else {
4594         av = newAV();
4595         sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4596         /* av now has a refcnt of 2, which avoids it getting freed
4597          * before us during global cleanup. The extra ref is removed
4598          * by magic_killbackrefs() when tsv is being freed */
4599     }
4600     if (AvFILLp(av) >= AvMAX(av)) {
4601         av_extend(av, AvFILLp(av)+1);
4602     }
4603     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4604 }
4605
4606 /* delete a back-reference to ourselves from the backref magic associated
4607  * with the SV we point to.
4608  */
4609
4610 STATIC void
4611 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4612 {
4613     AV *av;
4614     SV **svp;
4615     I32 i;
4616     MAGIC *mg = NULL;
4617     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref))) {
4618         if (PL_in_clean_all)
4619             return;
4620     }
4621     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref)))
4622         Perl_croak(aTHX_ "panic: del_backref");
4623     av = (AV *)mg->mg_obj;
4624     svp = AvARRAY(av);
4625     /* We shouldn't be in here more than once, but for paranoia reasons lets
4626        not assume this.  */
4627     for (i = AvFILLp(av); i >= 0; i--) {
4628         if (svp[i] == sv) {
4629             const SSize_t fill = AvFILLp(av);
4630             if (i != fill) {
4631                 /* We weren't the last entry.
4632                    An unordered list has this property that you can take the
4633                    last element off the end to fill the hole, and it's still
4634                    an unordered list :-)
4635                 */
4636                 svp[i] = svp[fill];
4637             }
4638             svp[fill] = Nullsv;
4639             AvFILLp(av) = fill - 1;
4640         }
4641     }
4642 }
4643
4644 /*
4645 =for apidoc sv_insert
4646
4647 Inserts a string at the specified offset/length within the SV. Similar to
4648 the Perl substr() function.
4649
4650 =cut
4651 */
4652
4653 void
4654 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4655 {
4656     register char *big;
4657     register char *mid;
4658     register char *midend;
4659     register char *bigend;
4660     register I32 i;
4661     STRLEN curlen;
4662
4663
4664     if (!bigstr)
4665         Perl_croak(aTHX_ "Can't modify non-existent substring");
4666     SvPV_force(bigstr, curlen);
4667     (void)SvPOK_only_UTF8(bigstr);
4668     if (offset + len > curlen) {
4669         SvGROW(bigstr, offset+len+1);
4670         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4671         SvCUR_set(bigstr, offset+len);
4672     }
4673
4674     SvTAINT(bigstr);
4675     i = littlelen - len;
4676     if (i > 0) {                        /* string might grow */
4677         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4678         mid = big + offset + len;
4679         midend = bigend = big + SvCUR(bigstr);
4680         bigend += i;
4681         *bigend = '\0';
4682         while (midend > mid)            /* shove everything down */
4683             *--bigend = *--midend;
4684         Move(little,big+offset,littlelen,char);
4685         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4686         SvSETMAGIC(bigstr);
4687         return;
4688     }
4689     else if (i == 0) {
4690         Move(little,SvPVX(bigstr)+offset,len,char);
4691         SvSETMAGIC(bigstr);
4692         return;
4693     }
4694
4695     big = SvPVX(bigstr);
4696     mid = big + offset;
4697     midend = mid + len;
4698     bigend = big + SvCUR(bigstr);
4699
4700     if (midend > bigend)
4701         Perl_croak(aTHX_ "panic: sv_insert");
4702
4703     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4704         if (littlelen) {
4705             Move(little, mid, littlelen,char);
4706             mid += littlelen;
4707         }
4708         i = bigend - midend;
4709         if (i > 0) {
4710             Move(midend, mid, i,char);
4711             mid += i;
4712         }
4713         *mid = '\0';
4714         SvCUR_set(bigstr, mid - big);
4715     }
4716     else if ((i = mid - big)) { /* faster from front */
4717         midend -= littlelen;
4718         mid = midend;
4719         sv_chop(bigstr,midend-i);
4720         big += i;
4721         while (i--)
4722             *--midend = *--big;
4723         if (littlelen)
4724             Move(little, mid, littlelen,char);
4725     }
4726     else if (littlelen) {
4727         midend -= littlelen;
4728         sv_chop(bigstr,midend);
4729         Move(little,midend,littlelen,char);
4730     }
4731     else {
4732         sv_chop(bigstr,midend);
4733     }
4734     SvSETMAGIC(bigstr);
4735 }
4736
4737 /*
4738 =for apidoc sv_replace
4739
4740 Make the first argument a copy of the second, then delete the original.
4741 The target SV physically takes over ownership of the body of the source SV
4742 and inherits its flags; however, the target keeps any magic it owns,
4743 and any magic in the source is discarded.
4744 Note that this is a rather specialist SV copying operation; most of the
4745 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4746
4747 =cut
4748 */
4749
4750 void
4751 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4752 {
4753     const U32 refcnt = SvREFCNT(sv);
4754     SV_CHECK_THINKFIRST_COW_DROP(sv);
4755     if (SvREFCNT(nsv) != 1) {
4756         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4757                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4758     }
4759     if (SvMAGICAL(sv)) {
4760         if (SvMAGICAL(nsv))
4761             mg_free(nsv);
4762         else
4763             sv_upgrade(nsv, SVt_PVMG);
4764         SvMAGIC_set(nsv, SvMAGIC(sv));
4765         SvFLAGS(nsv) |= SvMAGICAL(sv);
4766         SvMAGICAL_off(sv);
4767         SvMAGIC_set(sv, NULL);
4768     }
4769     SvREFCNT(sv) = 0;
4770     sv_clear(sv);
4771     assert(!SvREFCNT(sv));
4772 #ifdef DEBUG_LEAKING_SCALARS
4773     sv->sv_flags  = nsv->sv_flags;
4774     sv->sv_any    = nsv->sv_any;
4775     sv->sv_refcnt = nsv->sv_refcnt;
4776     sv->sv_u      = nsv->sv_u;
4777 #else
4778     StructCopy(nsv,sv,SV);
4779 #endif
4780     /* Currently could join these into one piece of pointer arithmetic, but
4781        it would be unclear.  */
4782     if(SvTYPE(sv) == SVt_IV)
4783         SvANY(sv)
4784             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4785     else if (SvTYPE(sv) == SVt_RV) {
4786         SvANY(sv) = &sv->sv_u.svu_rv;
4787     }
4788         
4789
4790 #ifdef PERL_OLD_COPY_ON_WRITE
4791     if (SvIsCOW_normal(nsv)) {
4792         /* We need to follow the pointers around the loop to make the
4793            previous SV point to sv, rather than nsv.  */
4794         SV *next;
4795         SV *current = nsv;
4796         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4797             assert(next);
4798             current = next;
4799             assert(SvPVX_const(current) == SvPVX_const(nsv));
4800         }
4801         /* Make the SV before us point to the SV after us.  */
4802         if (DEBUG_C_TEST) {
4803             PerlIO_printf(Perl_debug_log, "previous is\n");
4804             sv_dump(current);
4805             PerlIO_printf(Perl_debug_log,
4806                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4807                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4808         }
4809         SV_COW_NEXT_SV_SET(current, sv);
4810     }
4811 #endif
4812     SvREFCNT(sv) = refcnt;
4813     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4814     SvREFCNT(nsv) = 0;
4815     del_SV(nsv);
4816 }
4817
4818 /*
4819 =for apidoc sv_clear
4820
4821 Clear an SV: call any destructors, free up any memory used by the body,
4822 and free the body itself. The SV's head is I<not> freed, although
4823 its type is set to all 1's so that it won't inadvertently be assumed
4824 to be live during global destruction etc.
4825 This function should only be called when REFCNT is zero. Most of the time
4826 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4827 instead.
4828
4829 =cut
4830 */
4831
4832 void
4833 Perl_sv_clear(pTHX_ register SV *sv)
4834 {
4835     dVAR;
4836     const U32 type = SvTYPE(sv);
4837     const struct body_details *const sv_type_details
4838         = bodies_by_type + type;
4839
4840     assert(sv);
4841     assert(SvREFCNT(sv) == 0);
4842
4843     if (type <= SVt_IV)
4844         return;
4845
4846     if (SvOBJECT(sv)) {
4847         if (PL_defstash) {              /* Still have a symbol table? */
4848             dSP;
4849             HV* stash;
4850             do {        
4851                 CV* destructor;
4852                 stash = SvSTASH(sv);
4853                 destructor = StashHANDLER(stash,DESTROY);
4854                 if (destructor) {
4855                     SV* const tmpref = newRV(sv);
4856                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4857                     ENTER;
4858                     PUSHSTACKi(PERLSI_DESTROY);
4859                     EXTEND(SP, 2);
4860                     PUSHMARK(SP);
4861                     PUSHs(tmpref);
4862                     PUTBACK;
4863                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4864                 
4865                 
4866                     POPSTACK;
4867                     SPAGAIN;
4868                     LEAVE;
4869                     if(SvREFCNT(tmpref) < 2) {
4870                         /* tmpref is not kept alive! */
4871                         SvREFCNT(sv)--;
4872                         SvRV_set(tmpref, NULL);
4873                         SvROK_off(tmpref);
4874                     }
4875                     SvREFCNT_dec(tmpref);
4876                 }
4877             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4878
4879
4880             if (SvREFCNT(sv)) {
4881                 if (PL_in_clean_objs)
4882                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4883                           HvNAME_get(stash));
4884                 /* DESTROY gave object new lease on life */
4885                 return;
4886             }
4887         }
4888
4889         if (SvOBJECT(sv)) {
4890             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4891             SvOBJECT_off(sv);   /* Curse the object. */
4892             if (type != SVt_PVIO)
4893                 --PL_sv_objcount;       /* XXX Might want something more general */
4894         }
4895     }
4896     if (type >= SVt_PVMG) {
4897         if (SvMAGIC(sv))
4898             mg_free(sv);
4899         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4900             SvREFCNT_dec(SvSTASH(sv));
4901     }
4902     switch (type) {
4903     case SVt_PVIO:
4904         if (IoIFP(sv) &&
4905             IoIFP(sv) != PerlIO_stdin() &&
4906             IoIFP(sv) != PerlIO_stdout() &&
4907             IoIFP(sv) != PerlIO_stderr())
4908         {
4909             io_close((IO*)sv, FALSE);
4910         }
4911         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4912             PerlDir_close(IoDIRP(sv));
4913         IoDIRP(sv) = (DIR*)NULL;
4914         Safefree(IoTOP_NAME(sv));
4915         Safefree(IoFMT_NAME(sv));
4916         Safefree(IoBOTTOM_NAME(sv));
4917         goto freescalar;
4918     case SVt_PVBM:
4919         goto freescalar;
4920     case SVt_PVCV:
4921     case SVt_PVFM:
4922         cv_undef((CV*)sv);
4923         goto freescalar;
4924     case SVt_PVHV:
4925         hv_undef((HV*)sv);
4926         break;
4927     case SVt_PVAV:
4928         av_undef((AV*)sv);
4929         break;
4930     case SVt_PVLV:
4931         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4932             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4933             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4934             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4935         }
4936         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4937             SvREFCNT_dec(LvTARG(sv));
4938         goto freescalar;
4939     case SVt_PVGV:
4940         gp_free((GV*)sv);
4941         Safefree(GvNAME(sv));
4942         /* If we're in a stash, we don't own a reference to it. However it does
4943            have a back reference to us, which needs to be cleared.  */
4944         if (GvSTASH(sv))
4945             sv_del_backref((SV*)GvSTASH(sv), sv);
4946     case SVt_PVMG:
4947     case SVt_PVNV:
4948     case SVt_PVIV:
4949       freescalar:
4950         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4951         if (SvOOK(sv)) {
4952             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4953             /* Don't even bother with turning off the OOK flag.  */
4954         }
4955     case SVt_PV:
4956     case SVt_RV:
4957         if (SvROK(sv)) {
4958             SV *target = SvRV(sv);
4959             if (SvWEAKREF(sv))
4960                 sv_del_backref(target, sv);
4961             else
4962                 SvREFCNT_dec(target);
4963         }
4964 #ifdef PERL_OLD_COPY_ON_WRITE
4965         else if (SvPVX_const(sv)) {
4966             if (SvIsCOW(sv)) {
4967                 /* I believe I need to grab the global SV mutex here and
4968                    then recheck the COW status.  */
4969                 if (DEBUG_C_TEST) {
4970                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4971                     sv_dump(sv);
4972                 }
4973                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4974                                SV_COW_NEXT_SV(sv));
4975                 /* And drop it here.  */
4976                 SvFAKE_off(sv);
4977             } else if (SvLEN(sv)) {
4978                 Safefree(SvPVX_const(sv));
4979             }
4980         }
4981 #else
4982         else if (SvPVX_const(sv) && SvLEN(sv))
4983             Safefree(SvPVX_mutable(sv));
4984         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4985             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4986             SvFAKE_off(sv);
4987         }
4988 #endif
4989         break;
4990     case SVt_NV:
4991         break;
4992     }
4993
4994     SvFLAGS(sv) &= SVf_BREAK;
4995     SvFLAGS(sv) |= SVTYPEMASK;
4996
4997     if (sv_type_details->arena) {
4998         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4999                  &PL_body_roots[type]);
5000     }
5001     else if (sv_type_details->size) {
5002         my_safefree(SvANY(sv));
5003     }
5004 }
5005
5006 /*
5007 =for apidoc sv_newref
5008
5009 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
5010 instead.
5011
5012 =cut
5013 */
5014
5015 SV *
5016 Perl_sv_newref(pTHX_ SV *sv)
5017 {
5018     if (sv)
5019         (SvREFCNT(sv))++;
5020     return sv;
5021 }
5022
5023 /*
5024 =for apidoc sv_free
5025
5026 Decrement an SV's reference count, and if it drops to zero, call
5027 C<sv_clear> to invoke destructors and free up any memory used by
5028 the body; finally, deallocate the SV's head itself.
5029 Normally called via a wrapper macro C<SvREFCNT_dec>.
5030
5031 =cut
5032 */
5033
5034 void
5035 Perl_sv_free(pTHX_ SV *sv)
5036 {
5037     dVAR;
5038     if (!sv)
5039         return;
5040     if (SvREFCNT(sv) == 0) {
5041         if (SvFLAGS(sv) & SVf_BREAK)
5042             /* this SV's refcnt has been artificially decremented to
5043              * trigger cleanup */
5044             return;
5045         if (PL_in_clean_all) /* All is fair */
5046             return;
5047         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5048             /* make sure SvREFCNT(sv)==0 happens very seldom */
5049             SvREFCNT(sv) = (~(U32)0)/2;
5050             return;
5051         }
5052         if (ckWARN_d(WARN_INTERNAL)) {
5053             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
5054                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
5055                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5056 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
5057             Perl_dump_sv_child(aTHX_ sv);
5058 #endif
5059         }
5060         return;
5061     }
5062     if (--(SvREFCNT(sv)) > 0)
5063         return;
5064     Perl_sv_free2(aTHX_ sv);
5065 }
5066
5067 void
5068 Perl_sv_free2(pTHX_ SV *sv)
5069 {
5070     dVAR;
5071 #ifdef DEBUGGING
5072     if (SvTEMP(sv)) {
5073         if (ckWARN_d(WARN_DEBUGGING))
5074             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
5075                         "Attempt to free temp prematurely: SV 0x%"UVxf
5076                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5077         return;
5078     }
5079 #endif
5080     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5081         /* make sure SvREFCNT(sv)==0 happens very seldom */
5082         SvREFCNT(sv) = (~(U32)0)/2;
5083         return;
5084     }
5085     sv_clear(sv);
5086     if (! SvREFCNT(sv))
5087         del_SV(sv);
5088 }
5089
5090 /*
5091 =for apidoc sv_len
5092
5093 Returns the length of the string in the SV. Handles magic and type
5094 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
5095
5096 =cut
5097 */
5098
5099 STRLEN
5100 Perl_sv_len(pTHX_ register SV *sv)
5101 {
5102     STRLEN len;
5103
5104     if (!sv)
5105         return 0;
5106
5107     if (SvGMAGICAL(sv))
5108         len = mg_length(sv);
5109     else
5110         (void)SvPV_const(sv, len);
5111     return len;
5112 }
5113
5114 /*
5115 =for apidoc sv_len_utf8
5116
5117 Returns the number of characters in the string in an SV, counting wide
5118 UTF-8 bytes as a single character. Handles magic and type coercion.
5119
5120 =cut
5121 */
5122
5123 /*
5124  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
5125  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
5126  * (Note that the mg_len is not the length of the mg_ptr field.)
5127  *
5128  */
5129
5130 STRLEN
5131 Perl_sv_len_utf8(pTHX_ register SV *sv)
5132 {
5133     if (!sv)
5134         return 0;
5135
5136     if (SvGMAGICAL(sv))
5137         return mg_length(sv);
5138     else
5139     {
5140         STRLEN len, ulen;
5141         const U8 *s = (U8*)SvPV_const(sv, len);
5142         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
5143
5144         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
5145             ulen = mg->mg_len;
5146 #ifdef PERL_UTF8_CACHE_ASSERT
5147             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
5148 #endif
5149         }
5150         else {
5151             ulen = Perl_utf8_length(aTHX_ s, s + len);
5152             if (!mg && !SvREADONLY(sv)) {
5153                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5154                 mg = mg_find(sv, PERL_MAGIC_utf8);
5155                 assert(mg);
5156             }
5157             if (mg)
5158                 mg->mg_len = ulen;
5159         }
5160         return ulen;
5161     }
5162 }
5163
5164 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
5165  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5166  * between UTF-8 and byte offsets.  There are two (substr offset and substr
5167  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
5168  * and byte offset) cache positions.
5169  *
5170  * The mg_len field is used by sv_len_utf8(), see its comments.
5171  * Note that the mg_len is not the length of the mg_ptr field.
5172  *
5173  */
5174 STATIC bool
5175 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
5176                    I32 offsetp, const U8 *s, const U8 *start)
5177 {
5178     bool found = FALSE;
5179
5180     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5181         if (!*mgp)
5182             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
5183         assert(*mgp);
5184
5185         if ((*mgp)->mg_ptr)
5186             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5187         else {
5188             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5189             (*mgp)->mg_ptr = (char *) *cachep;
5190         }
5191         assert(*cachep);
5192
5193         (*cachep)[i]   = offsetp;
5194         (*cachep)[i+1] = s - start;
5195         found = TRUE;
5196     }
5197
5198     return found;
5199 }
5200
5201 /*
5202  * S_utf8_mg_pos() is used to query and update mg_ptr field of
5203  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5204  * between UTF-8 and byte offsets.  See also the comments of
5205  * S_utf8_mg_pos_init().
5206  *
5207  */
5208 STATIC bool
5209 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
5210 {
5211     bool found = FALSE;
5212
5213     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5214         if (!*mgp)
5215             *mgp = mg_find(sv, PERL_MAGIC_utf8);
5216         if (*mgp && (*mgp)->mg_ptr) {
5217             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5218             ASSERT_UTF8_CACHE(*cachep);
5219             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
5220                  found = TRUE;
5221             else {                      /* We will skip to the right spot. */
5222                  STRLEN forw  = 0;
5223                  STRLEN backw = 0;
5224                  const U8* p = NULL;
5225
5226                  /* The assumption is that going backward is half
5227                   * the speed of going forward (that's where the
5228                   * 2 * backw in the below comes from).  (The real
5229                   * figure of course depends on the UTF-8 data.) */
5230
5231                  if ((*cachep)[i] > (STRLEN)uoff) {
5232                       forw  = uoff;
5233                       backw = (*cachep)[i] - (STRLEN)uoff;
5234
5235                       if (forw < 2 * backw)
5236                            p = start;
5237                       else
5238                            p = start + (*cachep)[i+1];
5239                  }
5240                  /* Try this only for the substr offset (i == 0),
5241                   * not for the substr length (i == 2). */
5242                  else if (i == 0) { /* (*cachep)[i] < uoff */
5243                       const STRLEN ulen = sv_len_utf8(sv);
5244
5245                       if ((STRLEN)uoff < ulen) {
5246                            forw  = (STRLEN)uoff - (*cachep)[i];
5247                            backw = ulen - (STRLEN)uoff;
5248
5249                            if (forw < 2 * backw)
5250                                 p = start + (*cachep)[i+1];
5251                            else
5252                                 p = send;
5253                       }
5254
5255                       /* If the string is not long enough for uoff,
5256                        * we could extend it, but not at this low a level. */
5257                  }
5258
5259                  if (p) {
5260                       if (forw < 2 * backw) {
5261                            while (forw--)
5262                                 p += UTF8SKIP(p);
5263                       }
5264                       else {
5265                            while (backw--) {
5266                                 p--;
5267                                 while (UTF8_IS_CONTINUATION(*p))
5268                                      p--;
5269                            }
5270                       }
5271
5272                       /* Update the cache. */
5273                       (*cachep)[i]   = (STRLEN)uoff;
5274                       (*cachep)[i+1] = p - start;
5275
5276                       /* Drop the stale "length" cache */
5277                       if (i == 0) {
5278                           (*cachep)[2] = 0;
5279                           (*cachep)[3] = 0;
5280                       }
5281
5282                       found = TRUE;
5283                  }
5284             }
5285             if (found) {        /* Setup the return values. */
5286                  *offsetp = (*cachep)[i+1];
5287                  *sp = start + *offsetp;
5288                  if (*sp >= send) {
5289                       *sp = send;
5290                       *offsetp = send - start;
5291                  }
5292                  else if (*sp < start) {
5293                       *sp = start;
5294                       *offsetp = 0;
5295                  }
5296             }
5297         }
5298 #ifdef PERL_UTF8_CACHE_ASSERT
5299         if (found) {
5300              U8 *s = start;
5301              I32 n = uoff;
5302
5303              while (n-- && s < send)
5304                   s += UTF8SKIP(s);
5305
5306              if (i == 0) {
5307                   assert(*offsetp == s - start);
5308                   assert((*cachep)[0] == (STRLEN)uoff);
5309                   assert((*cachep)[1] == *offsetp);
5310              }
5311              ASSERT_UTF8_CACHE(*cachep);
5312         }
5313 #endif
5314     }
5315
5316     return found;
5317 }
5318
5319 /*
5320 =for apidoc sv_pos_u2b
5321
5322 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5323 the start of the string, to a count of the equivalent number of bytes; if
5324 lenp is non-zero, it does the same to lenp, but this time starting from
5325 the offset, rather than from the start of the string. Handles magic and
5326 type coercion.
5327
5328 =cut
5329 */
5330
5331 /*
5332  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5333  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5334  * byte offsets.  See also the comments of S_utf8_mg_pos().
5335  *
5336  */
5337
5338 void
5339 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5340 {
5341     const U8 *start;
5342     STRLEN len;
5343
5344     if (!sv)
5345         return;
5346
5347     start = (U8*)SvPV_const(sv, len);
5348     if (len) {
5349         STRLEN boffset = 0;
5350         STRLEN *cache = 0;
5351         const U8 *s = start;
5352         I32 uoffset = *offsetp;
5353         const U8 * const send = s + len;
5354         MAGIC *mg = 0;
5355         bool found = FALSE;
5356
5357          if (utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send))
5358              found = TRUE;
5359          if (!found && uoffset > 0) {
5360               while (s < send && uoffset--)
5361                    s += UTF8SKIP(s);
5362               if (s >= send)
5363                    s = send;
5364               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5365                   boffset = cache[1];
5366               *offsetp = s - start;
5367          }
5368          if (lenp) {
5369               found = FALSE;
5370               start = s;
5371               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5372                   *lenp -= boffset;
5373                   found = TRUE;
5374               }
5375               if (!found && *lenp > 0) {
5376                    I32 ulen = *lenp;
5377                    if (ulen > 0)
5378                         while (s < send && ulen--)
5379                              s += UTF8SKIP(s);
5380                    if (s >= send)
5381                         s = send;
5382                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5383               }
5384               *lenp = s - start;
5385          }
5386          ASSERT_UTF8_CACHE(cache);
5387     }
5388     else {
5389          *offsetp = 0;
5390          if (lenp)
5391               *lenp = 0;
5392     }
5393
5394     return;
5395 }
5396
5397 /*
5398 =for apidoc sv_pos_b2u
5399
5400 Converts the value pointed to by offsetp from a count of bytes from the
5401 start of the string, to a count of the equivalent number of UTF-8 chars.
5402 Handles magic and type coercion.
5403
5404 =cut
5405 */
5406
5407 /*
5408  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5409  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5410  * byte offsets.  See also the comments of S_utf8_mg_pos().
5411  *
5412  */
5413
5414 void
5415 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5416 {
5417     const U8* s;
5418     STRLEN len;
5419
5420     if (!sv)
5421         return;
5422
5423     s = (const U8*)SvPV_const(sv, len);
5424     if ((I32)len < *offsetp)
5425         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5426     else {
5427         const U8* send = s + *offsetp;
5428         MAGIC* mg = NULL;
5429         STRLEN *cache = NULL;
5430
5431         len = 0;
5432
5433         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5434             mg = mg_find(sv, PERL_MAGIC_utf8);
5435             if (mg && mg->mg_ptr) {
5436                 cache = (STRLEN *) mg->mg_ptr;
5437                 if (cache[1] == (STRLEN)*offsetp) {
5438                     /* An exact match. */
5439                     *offsetp = cache[0];
5440
5441                     return;
5442                 }
5443                 else if (cache[1] < (STRLEN)*offsetp) {
5444                     /* We already know part of the way. */
5445                     len = cache[0];
5446                     s  += cache[1];
5447                     /* Let the below loop do the rest. */
5448                 }
5449                 else { /* cache[1] > *offsetp */
5450                     /* We already know all of the way, now we may
5451                      * be able to walk back.  The same assumption
5452                      * is made as in S_utf8_mg_pos(), namely that
5453                      * walking backward is twice slower than
5454                      * walking forward. */
5455                     const STRLEN forw  = *offsetp;
5456                     STRLEN backw = cache[1] - *offsetp;
5457
5458                     if (!(forw < 2 * backw)) {
5459                         const U8 *p = s + cache[1];
5460                         STRLEN ubackw = 0;
5461                         
5462                         cache[1] -= backw;
5463
5464                         while (backw--) {
5465                             p--;
5466                             while (UTF8_IS_CONTINUATION(*p)) {
5467                                 p--;
5468                                 backw--;
5469                             }
5470                             ubackw++;
5471                         }
5472
5473                         cache[0] -= ubackw;
5474                         *offsetp = cache[0];
5475
5476                         /* Drop the stale "length" cache */
5477                         cache[2] = 0;
5478                         cache[3] = 0;
5479
5480                         return;
5481                     }
5482                 }
5483             }
5484             ASSERT_UTF8_CACHE(cache);
5485         }
5486
5487         while (s < send) {
5488             STRLEN n = 1;
5489
5490             /* Call utf8n_to_uvchr() to validate the sequence
5491              * (unless a simple non-UTF character) */
5492             if (!UTF8_IS_INVARIANT(*s))
5493                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5494             if (n > 0) {
5495                 s += n;
5496                 len++;
5497             }
5498             else
5499                 break;
5500         }
5501
5502         if (!SvREADONLY(sv)) {
5503             if (!mg) {
5504                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5505                 mg = mg_find(sv, PERL_MAGIC_utf8);
5506             }
5507             assert(mg);
5508
5509             if (!mg->mg_ptr) {
5510                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5511                 mg->mg_ptr = (char *) cache;
5512             }
5513             assert(cache);
5514
5515             cache[0] = len;
5516             cache[1] = *offsetp;
5517             /* Drop the stale "length" cache */
5518             cache[2] = 0;
5519             cache[3] = 0;
5520         }
5521
5522         *offsetp = len;
5523     }
5524     return;
5525 }
5526
5527 /*
5528 =for apidoc sv_eq
5529
5530 Returns a boolean indicating whether the strings in the two SVs are
5531 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5532 coerce its args to strings if necessary.
5533
5534 =cut
5535 */
5536
5537 I32
5538 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5539 {
5540     const char *pv1;
5541     STRLEN cur1;
5542     const char *pv2;
5543     STRLEN cur2;
5544     I32  eq     = 0;
5545     char *tpv   = Nullch;
5546     SV* svrecode = Nullsv;
5547
5548     if (!sv1) {
5549         pv1 = "";
5550         cur1 = 0;
5551     }
5552     else
5553         pv1 = SvPV_const(sv1, cur1);
5554
5555     if (!sv2){
5556         pv2 = "";
5557         cur2 = 0;
5558     }
5559     else
5560         pv2 = SvPV_const(sv2, cur2);
5561
5562     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5563         /* Differing utf8ness.
5564          * Do not UTF8size the comparands as a side-effect. */
5565          if (PL_encoding) {
5566               if (SvUTF8(sv1)) {
5567                    svrecode = newSVpvn(pv2, cur2);
5568                    sv_recode_to_utf8(svrecode, PL_encoding);
5569                    pv2 = SvPV_const(svrecode, cur2);
5570               }
5571               else {
5572                    svrecode = newSVpvn(pv1, cur1);
5573                    sv_recode_to_utf8(svrecode, PL_encoding);
5574                    pv1 = SvPV_const(svrecode, cur1);
5575               }
5576               /* Now both are in UTF-8. */
5577               if (cur1 != cur2) {
5578                    SvREFCNT_dec(svrecode);
5579                    return FALSE;
5580               }
5581          }
5582          else {
5583               bool is_utf8 = TRUE;
5584
5585               if (SvUTF8(sv1)) {
5586                    /* sv1 is the UTF-8 one,
5587                     * if is equal it must be downgrade-able */
5588                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5589                                                      &cur1, &is_utf8);
5590                    if (pv != pv1)
5591                         pv1 = tpv = pv;
5592               }
5593               else {
5594                    /* sv2 is the UTF-8 one,
5595                     * if is equal it must be downgrade-able */
5596                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5597                                                       &cur2, &is_utf8);
5598                    if (pv != pv2)
5599                         pv2 = tpv = pv;
5600               }
5601               if (is_utf8) {
5602                    /* Downgrade not possible - cannot be eq */
5603                    assert (tpv == 0);
5604                    return FALSE;
5605               }
5606          }
5607     }
5608
5609     if (cur1 == cur2)
5610         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5611         
5612     if (svrecode)
5613          SvREFCNT_dec(svrecode);
5614
5615     if (tpv)
5616         Safefree(tpv);
5617
5618     return eq;
5619 }
5620
5621 /*
5622 =for apidoc sv_cmp
5623
5624 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5625 string in C<sv1> is less than, equal to, or greater than the string in
5626 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5627 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5628
5629 =cut
5630 */
5631
5632 I32
5633 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5634 {
5635     STRLEN cur1, cur2;
5636     const char *pv1, *pv2;
5637     char *tpv = Nullch;
5638     I32  cmp;
5639     SV *svrecode = Nullsv;
5640
5641     if (!sv1) {
5642         pv1 = "";
5643         cur1 = 0;
5644     }
5645     else
5646         pv1 = SvPV_const(sv1, cur1);
5647
5648     if (!sv2) {
5649         pv2 = "";
5650         cur2 = 0;
5651     }
5652     else
5653         pv2 = SvPV_const(sv2, cur2);
5654
5655     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5656         /* Differing utf8ness.
5657          * Do not UTF8size the comparands as a side-effect. */
5658         if (SvUTF8(sv1)) {
5659             if (PL_encoding) {
5660                  svrecode = newSVpvn(pv2, cur2);
5661                  sv_recode_to_utf8(svrecode, PL_encoding);
5662                  pv2 = SvPV_const(svrecode, cur2);
5663             }
5664             else {
5665                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5666             }
5667         }
5668         else {
5669             if (PL_encoding) {
5670                  svrecode = newSVpvn(pv1, cur1);
5671                  sv_recode_to_utf8(svrecode, PL_encoding);
5672                  pv1 = SvPV_const(svrecode, cur1);
5673             }
5674             else {
5675                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5676             }
5677         }
5678     }
5679
5680     if (!cur1) {
5681         cmp = cur2 ? -1 : 0;
5682     } else if (!cur2) {
5683         cmp = 1;
5684     } else {
5685         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5686
5687         if (retval) {
5688             cmp = retval < 0 ? -1 : 1;
5689         } else if (cur1 == cur2) {
5690             cmp = 0;
5691         } else {
5692             cmp = cur1 < cur2 ? -1 : 1;
5693         }
5694     }
5695
5696     if (svrecode)
5697          SvREFCNT_dec(svrecode);
5698
5699     if (tpv)
5700         Safefree(tpv);
5701
5702     return cmp;
5703 }
5704
5705 /*
5706 =for apidoc sv_cmp_locale
5707
5708 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5709 'use bytes' aware, handles get magic, and will coerce its args to strings
5710 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5711
5712 =cut
5713 */
5714
5715 I32
5716 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5717 {
5718 #ifdef USE_LOCALE_COLLATE
5719
5720     char *pv1, *pv2;
5721     STRLEN len1, len2;
5722     I32 retval;
5723
5724     if (PL_collation_standard)
5725         goto raw_compare;
5726
5727     len1 = 0;
5728     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5729     len2 = 0;
5730     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5731
5732     if (!pv1 || !len1) {
5733         if (pv2 && len2)
5734             return -1;
5735         else
5736             goto raw_compare;
5737     }
5738     else {
5739         if (!pv2 || !len2)
5740             return 1;
5741     }
5742
5743     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5744
5745     if (retval)
5746         return retval < 0 ? -1 : 1;
5747
5748     /*
5749      * When the result of collation is equality, that doesn't mean
5750      * that there are no differences -- some locales exclude some
5751      * characters from consideration.  So to avoid false equalities,
5752      * we use the raw string as a tiebreaker.
5753      */
5754
5755   raw_compare:
5756     /* FALL THROUGH */
5757
5758 #endif /* USE_LOCALE_COLLATE */
5759
5760     return sv_cmp(sv1, sv2);
5761 }
5762
5763
5764 #ifdef USE_LOCALE_COLLATE
5765
5766 /*
5767 =for apidoc sv_collxfrm
5768
5769 Add Collate Transform magic to an SV if it doesn't already have it.
5770
5771 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5772 scalar data of the variable, but transformed to such a format that a normal
5773 memory comparison can be used to compare the data according to the locale
5774 settings.
5775
5776 =cut
5777 */
5778
5779 char *
5780 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5781 {
5782     MAGIC *mg;
5783
5784     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5785     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5786         const char *s;
5787         char *xf;
5788         STRLEN len, xlen;
5789
5790         if (mg)
5791             Safefree(mg->mg_ptr);
5792         s = SvPV_const(sv, len);
5793         if ((xf = mem_collxfrm(s, len, &xlen))) {
5794             if (SvREADONLY(sv)) {
5795                 SAVEFREEPV(xf);
5796                 *nxp = xlen;
5797                 return xf + sizeof(PL_collation_ix);
5798             }
5799             if (! mg) {
5800                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5801                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5802                 assert(mg);
5803             }
5804             mg->mg_ptr = xf;
5805             mg->mg_len = xlen;
5806         }
5807         else {
5808             if (mg) {
5809                 mg->mg_ptr = NULL;
5810                 mg->mg_len = -1;
5811             }
5812         }
5813     }
5814     if (mg && mg->mg_ptr) {
5815         *nxp = mg->mg_len;
5816         return mg->mg_ptr + sizeof(PL_collation_ix);
5817     }
5818     else {
5819         *nxp = 0;
5820         return NULL;
5821     }
5822 }
5823
5824 #endif /* USE_LOCALE_COLLATE */
5825
5826 /*
5827 =for apidoc sv_gets
5828
5829 Get a line from the filehandle and store it into the SV, optionally
5830 appending to the currently-stored string.
5831
5832 =cut
5833 */
5834
5835 char *
5836 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5837 {
5838     const char *rsptr;
5839     STRLEN rslen;
5840     register STDCHAR rslast;
5841     register STDCHAR *bp;
5842     register I32 cnt;
5843     I32 i = 0;
5844     I32 rspara = 0;
5845     I32 recsize;
5846
5847     if (SvTHINKFIRST(sv))
5848         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5849     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5850        from <>.
5851        However, perlbench says it's slower, because the existing swipe code
5852        is faster than copy on write.
5853        Swings and roundabouts.  */
5854     SvUPGRADE(sv, SVt_PV);
5855
5856     SvSCREAM_off(sv);
5857
5858     if (append) {
5859         if (PerlIO_isutf8(fp)) {
5860             if (!SvUTF8(sv)) {
5861                 sv_utf8_upgrade_nomg(sv);
5862                 sv_pos_u2b(sv,&append,0);
5863             }
5864         } else if (SvUTF8(sv)) {
5865             SV * const tsv = NEWSV(0,0);
5866             sv_gets(tsv, fp, 0);
5867             sv_utf8_upgrade_nomg(tsv);
5868             SvCUR_set(sv,append);
5869             sv_catsv(sv,tsv);
5870             sv_free(tsv);
5871             goto return_string_or_null;
5872         }
5873     }
5874
5875     SvPOK_only(sv);
5876     if (PerlIO_isutf8(fp))
5877         SvUTF8_on(sv);
5878
5879     if (IN_PERL_COMPILETIME) {
5880         /* we always read code in line mode */
5881         rsptr = "\n";
5882         rslen = 1;
5883     }
5884     else if (RsSNARF(PL_rs)) {
5885         /* If it is a regular disk file use size from stat() as estimate
5886            of amount we are going to read - may result in malloc-ing
5887            more memory than we realy need if layers bellow reduce
5888            size we read (e.g. CRLF or a gzip layer)
5889          */
5890         Stat_t st;
5891         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5892             const Off_t offset = PerlIO_tell(fp);
5893             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5894                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5895             }
5896         }
5897         rsptr = NULL;
5898         rslen = 0;
5899     }
5900     else if (RsRECORD(PL_rs)) {
5901       I32 bytesread;
5902       char *buffer;
5903
5904       /* Grab the size of the record we're getting */
5905       recsize = SvIV(SvRV(PL_rs));
5906       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5907       /* Go yank in */
5908 #ifdef VMS
5909       /* VMS wants read instead of fread, because fread doesn't respect */
5910       /* RMS record boundaries. This is not necessarily a good thing to be */
5911       /* doing, but we've got no other real choice - except avoid stdio
5912          as implementation - perhaps write a :vms layer ?
5913        */
5914       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5915 #else
5916       bytesread = PerlIO_read(fp, buffer, recsize);
5917 #endif
5918       if (bytesread < 0)
5919           bytesread = 0;
5920       SvCUR_set(sv, bytesread += append);
5921       buffer[bytesread] = '\0';
5922       goto return_string_or_null;
5923     }
5924     else if (RsPARA(PL_rs)) {
5925         rsptr = "\n\n";
5926         rslen = 2;
5927         rspara = 1;
5928     }
5929     else {
5930         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5931         if (PerlIO_isutf8(fp)) {
5932             rsptr = SvPVutf8(PL_rs, rslen);
5933         }
5934         else {
5935             if (SvUTF8(PL_rs)) {
5936                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5937                     Perl_croak(aTHX_ "Wide character in $/");
5938                 }
5939             }
5940             rsptr = SvPV_const(PL_rs, rslen);
5941         }
5942     }
5943
5944     rslast = rslen ? rsptr[rslen - 1] : '\0';
5945
5946     if (rspara) {               /* have to do this both before and after */
5947         do {                    /* to make sure file boundaries work right */
5948             if (PerlIO_eof(fp))
5949                 return 0;
5950             i = PerlIO_getc(fp);
5951             if (i != '\n') {
5952                 if (i == -1)
5953                     return 0;
5954                 PerlIO_ungetc(fp,i);
5955                 break;
5956             }
5957         } while (i != EOF);
5958     }
5959
5960     /* See if we know enough about I/O mechanism to cheat it ! */
5961
5962     /* This used to be #ifdef test - it is made run-time test for ease
5963        of abstracting out stdio interface. One call should be cheap
5964        enough here - and may even be a macro allowing compile
5965        time optimization.
5966      */
5967
5968     if (PerlIO_fast_gets(fp)) {
5969
5970     /*
5971      * We're going to steal some values from the stdio struct
5972      * and put EVERYTHING in the innermost loop into registers.
5973      */
5974     register STDCHAR *ptr;
5975     STRLEN bpx;
5976     I32 shortbuffered;
5977
5978 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5979     /* An ungetc()d char is handled separately from the regular
5980      * buffer, so we getc() it back out and stuff it in the buffer.
5981      */
5982     i = PerlIO_getc(fp);
5983     if (i == EOF) return 0;
5984     *(--((*fp)->_ptr)) = (unsigned char) i;
5985     (*fp)->_cnt++;
5986 #endif
5987
5988     /* Here is some breathtakingly efficient cheating */
5989
5990     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5991     /* make sure we have the room */
5992     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5993         /* Not room for all of it
5994            if we are looking for a separator and room for some
5995          */
5996         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5997             /* just process what we have room for */
5998             shortbuffered = cnt - SvLEN(sv) + append + 1;
5999             cnt -= shortbuffered;
6000         }
6001         else {
6002             shortbuffered = 0;
6003             /* remember that cnt can be negative */
6004             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
6005         }
6006     }
6007     else
6008         shortbuffered = 0;
6009     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
6010     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
6011     DEBUG_P(PerlIO_printf(Perl_debug_log,
6012         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6013     DEBUG_P(PerlIO_printf(Perl_debug_log,
6014         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6015                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6016                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
6017     for (;;) {
6018       screamer:
6019         if (cnt > 0) {
6020             if (rslen) {
6021                 while (cnt > 0) {                    /* this     |  eat */
6022                     cnt--;
6023                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
6024                         goto thats_all_folks;        /* screams  |  sed :-) */
6025                 }
6026             }
6027             else {
6028                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
6029                 bp += cnt;                           /* screams  |  dust */
6030                 ptr += cnt;                          /* louder   |  sed :-) */
6031                 cnt = 0;
6032             }
6033         }
6034         
6035         if (shortbuffered) {            /* oh well, must extend */
6036             cnt = shortbuffered;
6037             shortbuffered = 0;
6038             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
6039             SvCUR_set(sv, bpx);
6040             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
6041             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
6042             continue;
6043         }
6044
6045         DEBUG_P(PerlIO_printf(Perl_debug_log,
6046                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
6047                               PTR2UV(ptr),(long)cnt));
6048         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
6049 #if 0
6050         DEBUG_P(PerlIO_printf(Perl_debug_log,
6051             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6052             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6053             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6054 #endif
6055         /* This used to call 'filbuf' in stdio form, but as that behaves like
6056            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
6057            another abstraction.  */
6058         i   = PerlIO_getc(fp);          /* get more characters */
6059 #if 0
6060         DEBUG_P(PerlIO_printf(Perl_debug_log,
6061             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6062             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6063             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6064 #endif
6065         cnt = PerlIO_get_cnt(fp);
6066         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
6067         DEBUG_P(PerlIO_printf(Perl_debug_log,
6068             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6069
6070         if (i == EOF)                   /* all done for ever? */
6071             goto thats_really_all_folks;
6072
6073         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
6074         SvCUR_set(sv, bpx);
6075         SvGROW(sv, bpx + cnt + 2);
6076         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
6077
6078         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
6079
6080         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
6081             goto thats_all_folks;
6082     }
6083
6084 thats_all_folks:
6085     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
6086           memNE((char*)bp - rslen, rsptr, rslen))
6087         goto screamer;                          /* go back to the fray */
6088 thats_really_all_folks:
6089     if (shortbuffered)
6090         cnt += shortbuffered;
6091         DEBUG_P(PerlIO_printf(Perl_debug_log,
6092             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6093     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
6094     DEBUG_P(PerlIO_printf(Perl_debug_log,
6095         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6096         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6097         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6098     *bp = '\0';
6099     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
6100     DEBUG_P(PerlIO_printf(Perl_debug_log,
6101         "Screamer: done, len=%ld, string=|%.*s|\n",
6102         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
6103     }
6104    else
6105     {
6106        /*The big, slow, and stupid way. */
6107 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
6108         STDCHAR *buf = 0;
6109         Newx(buf, 8192, STDCHAR);
6110         assert(buf);
6111 #else
6112         STDCHAR buf[8192];
6113 #endif
6114
6115 screamer2:
6116         if (rslen) {
6117             register const STDCHAR *bpe = buf + sizeof(buf);
6118             bp = buf;
6119             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
6120                 ; /* keep reading */
6121             cnt = bp - buf;
6122         }
6123         else {
6124             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
6125             /* Accomodate broken VAXC compiler, which applies U8 cast to
6126              * both args of ?: operator, causing EOF to change into 255
6127              */
6128             if (cnt > 0)
6129                  i = (U8)buf[cnt - 1];
6130             else
6131                  i = EOF;
6132         }
6133
6134         if (cnt < 0)
6135             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
6136         if (append)
6137              sv_catpvn(sv, (char *) buf, cnt);
6138         else
6139              sv_setpvn(sv, (char *) buf, cnt);
6140
6141         if (i != EOF &&                 /* joy */
6142             (!rslen ||
6143              SvCUR(sv) < rslen ||
6144              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
6145         {
6146             append = -1;
6147             /*
6148              * If we're reading from a TTY and we get a short read,
6149              * indicating that the user hit his EOF character, we need
6150              * to notice it now, because if we try to read from the TTY
6151              * again, the EOF condition will disappear.
6152              *
6153              * The comparison of cnt to sizeof(buf) is an optimization
6154              * that prevents unnecessary calls to feof().
6155              *
6156              * - jik 9/25/96
6157              */
6158             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
6159                 goto screamer2;
6160         }
6161
6162 #ifdef USE_HEAP_INSTEAD_OF_STACK
6163         Safefree(buf);
6164 #endif
6165     }
6166
6167     if (rspara) {               /* have to do this both before and after */
6168         while (i != EOF) {      /* to make sure file boundaries work right */
6169             i = PerlIO_getc(fp);
6170             if (i != '\n') {
6171                 PerlIO_ungetc(fp,i);
6172                 break;
6173             }
6174         }
6175     }
6176
6177 return_string_or_null:
6178     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
6179 }
6180
6181 /*
6182 =for apidoc sv_inc
6183
6184 Auto-increment of the value in the SV, doing string to numeric conversion
6185 if necessary. Handles 'get' magic.
6186
6187 =cut
6188 */
6189
6190 void
6191 Perl_sv_inc(pTHX_ register SV *sv)
6192 {
6193     register char *d;
6194     int flags;
6195
6196     if (!sv)
6197         return;
6198     SvGETMAGIC(sv);
6199     if (SvTHINKFIRST(sv)) {
6200         if (SvIsCOW(sv))
6201             sv_force_normal_flags(sv, 0);
6202         if (SvREADONLY(sv)) {
6203             if (IN_PERL_RUNTIME)
6204                 Perl_croak(aTHX_ PL_no_modify);
6205         }
6206         if (SvROK(sv)) {
6207             IV i;
6208             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
6209                 return;
6210             i = PTR2IV(SvRV(sv));
6211             sv_unref(sv);
6212             sv_setiv(sv, i);
6213         }
6214     }
6215     flags = SvFLAGS(sv);
6216     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
6217         /* It's (privately or publicly) a float, but not tested as an
6218            integer, so test it to see. */
6219         (void) SvIV(sv);
6220         flags = SvFLAGS(sv);
6221     }
6222     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6223         /* It's publicly an integer, or privately an integer-not-float */
6224 #ifdef PERL_PRESERVE_IVUV
6225       oops_its_int:
6226 #endif
6227         if (SvIsUV(sv)) {
6228             if (SvUVX(sv) == UV_MAX)
6229                 sv_setnv(sv, UV_MAX_P1);
6230             else
6231                 (void)SvIOK_only_UV(sv);
6232                 SvUV_set(sv, SvUVX(sv) + 1);
6233         } else {
6234             if (SvIVX(sv) == IV_MAX)
6235                 sv_setuv(sv, (UV)IV_MAX + 1);
6236             else {
6237                 (void)SvIOK_only(sv);
6238                 SvIV_set(sv, SvIVX(sv) + 1);
6239             }   
6240         }
6241         return;
6242     }
6243     if (flags & SVp_NOK) {
6244         (void)SvNOK_only(sv);
6245         SvNV_set(sv, SvNVX(sv) + 1.0);
6246         return;
6247     }
6248
6249     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6250         if ((flags & SVTYPEMASK) < SVt_PVIV)
6251             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6252         (void)SvIOK_only(sv);
6253         SvIV_set(sv, 1);
6254         return;
6255     }
6256     d = SvPVX(sv);
6257     while (isALPHA(*d)) d++;
6258     while (isDIGIT(*d)) d++;
6259     if (*d) {
6260 #ifdef PERL_PRESERVE_IVUV
6261         /* Got to punt this as an integer if needs be, but we don't issue
6262            warnings. Probably ought to make the sv_iv_please() that does
6263            the conversion if possible, and silently.  */
6264         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6265         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6266             /* Need to try really hard to see if it's an integer.
6267                9.22337203685478e+18 is an integer.
6268                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6269                so $a="9.22337203685478e+18"; $a+0; $a++
6270                needs to be the same as $a="9.22337203685478e+18"; $a++
6271                or we go insane. */
6272         
6273             (void) sv_2iv(sv);
6274             if (SvIOK(sv))
6275                 goto oops_its_int;
6276
6277             /* sv_2iv *should* have made this an NV */
6278             if (flags & SVp_NOK) {
6279                 (void)SvNOK_only(sv);
6280                 SvNV_set(sv, SvNVX(sv) + 1.0);
6281                 return;
6282             }
6283             /* I don't think we can get here. Maybe I should assert this
6284                And if we do get here I suspect that sv_setnv will croak. NWC
6285                Fall through. */
6286 #if defined(USE_LONG_DOUBLE)
6287             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6288                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6289 #else
6290             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6291                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6292 #endif
6293         }
6294 #endif /* PERL_PRESERVE_IVUV */
6295         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6296         return;
6297     }
6298     d--;
6299     while (d >= SvPVX_const(sv)) {
6300         if (isDIGIT(*d)) {
6301             if (++*d <= '9')
6302                 return;
6303             *(d--) = '0';
6304         }
6305         else {
6306 #ifdef EBCDIC
6307             /* MKS: The original code here died if letters weren't consecutive.
6308              * at least it didn't have to worry about non-C locales.  The
6309              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6310              * arranged in order (although not consecutively) and that only
6311              * [A-Za-z] are accepted by isALPHA in the C locale.
6312              */
6313             if (*d != 'z' && *d != 'Z') {
6314                 do { ++*d; } while (!isALPHA(*d));
6315                 return;
6316             }
6317             *(d--) -= 'z' - 'a';
6318 #else
6319             ++*d;
6320             if (isALPHA(*d))
6321                 return;
6322             *(d--) -= 'z' - 'a' + 1;
6323 #endif
6324         }
6325     }
6326     /* oh,oh, the number grew */
6327     SvGROW(sv, SvCUR(sv) + 2);
6328     SvCUR_set(sv, SvCUR(sv) + 1);
6329     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6330         *d = d[-1];
6331     if (isDIGIT(d[1]))
6332         *d = '1';
6333     else
6334         *d = d[1];
6335 }
6336
6337 /*
6338 =for apidoc sv_dec
6339
6340 Auto-decrement of the value in the SV, doing string to numeric conversion
6341 if necessary. Handles 'get' magic.
6342
6343 =cut
6344 */
6345
6346 void
6347 Perl_sv_dec(pTHX_ register SV *sv)
6348 {
6349     int flags;
6350
6351     if (!sv)
6352         return;
6353     SvGETMAGIC(sv);
6354     if (SvTHINKFIRST(sv)) {
6355         if (SvIsCOW(sv))
6356             sv_force_normal_flags(sv, 0);
6357         if (SvREADONLY(sv)) {
6358             if (IN_PERL_RUNTIME)
6359                 Perl_croak(aTHX_ PL_no_modify);
6360         }
6361         if (SvROK(sv)) {
6362             IV i;
6363             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6364                 return;
6365             i = PTR2IV(SvRV(sv));
6366             sv_unref(sv);
6367             sv_setiv(sv, i);
6368         }
6369     }
6370     /* Unlike sv_inc we don't have to worry about string-never-numbers
6371        and keeping them magic. But we mustn't warn on punting */
6372     flags = SvFLAGS(sv);
6373     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6374         /* It's publicly an integer, or privately an integer-not-float */
6375 #ifdef PERL_PRESERVE_IVUV
6376       oops_its_int:
6377 #endif
6378         if (SvIsUV(sv)) {
6379             if (SvUVX(sv) == 0) {
6380                 (void)SvIOK_only(sv);
6381                 SvIV_set(sv, -1);
6382             }
6383             else {
6384                 (void)SvIOK_only_UV(sv);
6385                 SvUV_set(sv, SvUVX(sv) - 1);
6386             }   
6387         } else {
6388             if (SvIVX(sv) == IV_MIN)
6389                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6390             else {
6391                 (void)SvIOK_only(sv);
6392                 SvIV_set(sv, SvIVX(sv) - 1);
6393             }   
6394         }
6395         return;
6396     }
6397     if (flags & SVp_NOK) {
6398         SvNV_set(sv, SvNVX(sv) - 1.0);
6399         (void)SvNOK_only(sv);
6400         return;
6401     }
6402     if (!(flags & SVp_POK)) {
6403         if ((flags & SVTYPEMASK) < SVt_PVIV)
6404             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6405         SvIV_set(sv, -1);
6406         (void)SvIOK_only(sv);
6407         return;
6408     }
6409 #ifdef PERL_PRESERVE_IVUV
6410     {
6411         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6412         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6413             /* Need to try really hard to see if it's an integer.
6414                9.22337203685478e+18 is an integer.
6415                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6416                so $a="9.22337203685478e+18"; $a+0; $a--
6417                needs to be the same as $a="9.22337203685478e+18"; $a--
6418                or we go insane. */
6419         
6420             (void) sv_2iv(sv);
6421             if (SvIOK(sv))
6422                 goto oops_its_int;
6423
6424             /* sv_2iv *should* have made this an NV */
6425             if (flags & SVp_NOK) {
6426                 (void)SvNOK_only(sv);
6427                 SvNV_set(sv, SvNVX(sv) - 1.0);
6428                 return;
6429             }
6430             /* I don't think we can get here. Maybe I should assert this
6431                And if we do get here I suspect that sv_setnv will croak. NWC
6432                Fall through. */
6433 #if defined(USE_LONG_DOUBLE)
6434             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6435                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6436 #else
6437             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6438                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6439 #endif
6440         }
6441     }
6442 #endif /* PERL_PRESERVE_IVUV */
6443     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6444 }
6445
6446 /*
6447 =for apidoc sv_mortalcopy
6448
6449 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6450 The new SV is marked as mortal. It will be destroyed "soon", either by an
6451 explicit call to FREETMPS, or by an implicit call at places such as
6452 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6453
6454 =cut
6455 */
6456
6457 /* Make a string that will exist for the duration of the expression
6458  * evaluation.  Actually, it may have to last longer than that, but
6459  * hopefully we won't free it until it has been assigned to a
6460  * permanent location. */
6461
6462 SV *
6463 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6464 {
6465     register SV *sv;
6466
6467     new_SV(sv);
6468     sv_setsv(sv,oldstr);
6469     EXTEND_MORTAL(1);
6470     PL_tmps_stack[++PL_tmps_ix] = sv;
6471     SvTEMP_on(sv);
6472     return sv;
6473 }
6474
6475 /*
6476 =for apidoc sv_newmortal
6477
6478 Creates a new null SV which is mortal.  The reference count of the SV is
6479 set to 1. It will be destroyed "soon", either by an explicit call to
6480 FREETMPS, or by an implicit call at places such as statement boundaries.
6481 See also C<sv_mortalcopy> and C<sv_2mortal>.
6482
6483 =cut
6484 */
6485
6486 SV *
6487 Perl_sv_newmortal(pTHX)
6488 {
6489     register SV *sv;
6490
6491     new_SV(sv);
6492     SvFLAGS(sv) = SVs_TEMP;
6493     EXTEND_MORTAL(1);
6494     PL_tmps_stack[++PL_tmps_ix] = sv;
6495     return sv;
6496 }
6497
6498 /*
6499 =for apidoc sv_2mortal
6500
6501 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6502 by an explicit call to FREETMPS, or by an implicit call at places such as
6503 statement boundaries.  SvTEMP() is turned on which means that the SV's
6504 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6505 and C<sv_mortalcopy>.
6506
6507 =cut
6508 */
6509
6510 SV *
6511 Perl_sv_2mortal(pTHX_ register SV *sv)
6512 {
6513     dVAR;
6514     if (!sv)
6515         return sv;
6516     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6517         return sv;
6518     EXTEND_MORTAL(1);
6519     PL_tmps_stack[++PL_tmps_ix] = sv;
6520     SvTEMP_on(sv);
6521     return sv;
6522 }
6523
6524 /*
6525 =for apidoc newSVpv
6526
6527 Creates a new SV and copies a string into it.  The reference count for the
6528 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6529 strlen().  For efficiency, consider using C<newSVpvn> instead.
6530
6531 =cut
6532 */
6533
6534 SV *
6535 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6536 {
6537     register SV *sv;
6538
6539     new_SV(sv);
6540     sv_setpvn(sv,s,len ? len : strlen(s));
6541     return sv;
6542 }
6543
6544 /*
6545 =for apidoc newSVpvn
6546
6547 Creates a new SV and copies a string into it.  The reference count for the
6548 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6549 string.  You are responsible for ensuring that the source string is at least
6550 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6551
6552 =cut
6553 */
6554
6555 SV *
6556 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6557 {
6558     register SV *sv;
6559
6560     new_SV(sv);
6561     sv_setpvn(sv,s,len);
6562     return sv;
6563 }
6564
6565
6566 /*
6567 =for apidoc newSVhek
6568
6569 Creates a new SV from the hash key structure.  It will generate scalars that
6570 point to the shared string table where possible. Returns a new (undefined)
6571 SV if the hek is NULL.
6572
6573 =cut
6574 */
6575
6576 SV *
6577 Perl_newSVhek(pTHX_ const HEK *hek)
6578 {
6579     if (!hek) {
6580         SV *sv;
6581
6582         new_SV(sv);
6583         return sv;
6584     }
6585
6586     if (HEK_LEN(hek) == HEf_SVKEY) {
6587         return newSVsv(*(SV**)HEK_KEY(hek));
6588     } else {
6589         const int flags = HEK_FLAGS(hek);
6590         if (flags & HVhek_WASUTF8) {
6591             /* Trouble :-)
6592                Andreas would like keys he put in as utf8 to come back as utf8
6593             */
6594             STRLEN utf8_len = HEK_LEN(hek);
6595             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6596             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6597
6598             SvUTF8_on (sv);
6599             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6600             return sv;
6601         } else if (flags & HVhek_REHASH) {
6602             /* We don't have a pointer to the hv, so we have to replicate the
6603                flag into every HEK. This hv is using custom a hasing
6604                algorithm. Hence we can't return a shared string scalar, as
6605                that would contain the (wrong) hash value, and might get passed
6606                into an hv routine with a regular hash  */
6607
6608             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6609             if (HEK_UTF8(hek))
6610                 SvUTF8_on (sv);
6611             return sv;
6612         }
6613         /* This will be overwhelminly the most common case.  */
6614         return newSVpvn_share(HEK_KEY(hek),
6615                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6616                               HEK_HASH(hek));
6617     }
6618 }
6619
6620 /*
6621 =for apidoc newSVpvn_share
6622
6623 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6624 table. If the string does not already exist in the table, it is created
6625 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6626 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6627 otherwise the hash is computed.  The idea here is that as the string table
6628 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6629 hash lookup will avoid string compare.
6630
6631 =cut
6632 */
6633
6634 SV *
6635 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6636 {
6637     register SV *sv;
6638     bool is_utf8 = FALSE;
6639     if (len < 0) {
6640         STRLEN tmplen = -len;
6641         is_utf8 = TRUE;
6642         /* See the note in hv.c:hv_fetch() --jhi */
6643         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6644         len = tmplen;
6645     }
6646     if (!hash)
6647         PERL_HASH(hash, src, len);
6648     new_SV(sv);
6649     sv_upgrade(sv, SVt_PV);
6650     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6651     SvCUR_set(sv, len);
6652     SvLEN_set(sv, 0);
6653     SvREADONLY_on(sv);
6654     SvFAKE_on(sv);
6655     SvPOK_on(sv);
6656     if (is_utf8)
6657         SvUTF8_on(sv);
6658     return sv;
6659 }
6660
6661
6662 #if defined(PERL_IMPLICIT_CONTEXT)
6663
6664 /* pTHX_ magic can't cope with varargs, so this is a no-context
6665  * version of the main function, (which may itself be aliased to us).
6666  * Don't access this version directly.
6667  */
6668
6669 SV *
6670 Perl_newSVpvf_nocontext(const char* pat, ...)
6671 {
6672     dTHX;
6673     register SV *sv;
6674     va_list args;
6675     va_start(args, pat);
6676     sv = vnewSVpvf(pat, &args);
6677     va_end(args);
6678     return sv;
6679 }
6680 #endif
6681
6682 /*
6683 =for apidoc newSVpvf
6684
6685 Creates a new SV and initializes it with the string formatted like
6686 C<sprintf>.
6687
6688 =cut
6689 */
6690
6691 SV *
6692 Perl_newSVpvf(pTHX_ const char* pat, ...)
6693 {
6694     register SV *sv;
6695     va_list args;
6696     va_start(args, pat);
6697     sv = vnewSVpvf(pat, &args);
6698     va_end(args);
6699     return sv;
6700 }
6701
6702 /* backend for newSVpvf() and newSVpvf_nocontext() */
6703
6704 SV *
6705 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6706 {
6707     register SV *sv;
6708     new_SV(sv);
6709     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6710     return sv;
6711 }
6712
6713 /*
6714 =for apidoc newSVnv
6715
6716 Creates a new SV and copies a floating point value into it.
6717 The reference count for the SV is set to 1.
6718
6719 =cut
6720 */
6721
6722 SV *
6723 Perl_newSVnv(pTHX_ NV n)
6724 {
6725     register SV *sv;
6726
6727     new_SV(sv);
6728     sv_setnv(sv,n);
6729     return sv;
6730 }
6731
6732 /*
6733 =for apidoc newSViv
6734
6735 Creates a new SV and copies an integer into it.  The reference count for the
6736 SV is set to 1.
6737
6738 =cut
6739 */
6740
6741 SV *
6742 Perl_newSViv(pTHX_ IV i)
6743 {
6744     register SV *sv;
6745
6746     new_SV(sv);
6747     sv_setiv(sv,i);
6748     return sv;
6749 }
6750
6751 /*
6752 =for apidoc newSVuv
6753
6754 Creates a new SV and copies an unsigned integer into it.
6755 The reference count for the SV is set to 1.
6756
6757 =cut
6758 */
6759
6760 SV *
6761 Perl_newSVuv(pTHX_ UV u)
6762 {
6763     register SV *sv;
6764
6765     new_SV(sv);
6766     sv_setuv(sv,u);
6767     return sv;
6768 }
6769
6770 /*
6771 =for apidoc newRV_noinc
6772
6773 Creates an RV wrapper for an SV.  The reference count for the original
6774 SV is B<not> incremented.
6775
6776 =cut
6777 */
6778
6779 SV *
6780 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6781 {
6782     register SV *sv;
6783
6784     new_SV(sv);
6785     sv_upgrade(sv, SVt_RV);
6786     SvTEMP_off(tmpRef);
6787     SvRV_set(sv, tmpRef);
6788     SvROK_on(sv);
6789     return sv;
6790 }
6791
6792 /* newRV_inc is the official function name to use now.
6793  * newRV_inc is in fact #defined to newRV in sv.h
6794  */
6795
6796 SV *
6797 Perl_newRV(pTHX_ SV *tmpRef)
6798 {
6799     return newRV_noinc(SvREFCNT_inc(tmpRef));
6800 }
6801
6802 /*
6803 =for apidoc newSVsv
6804
6805 Creates a new SV which is an exact duplicate of the original SV.
6806 (Uses C<sv_setsv>).
6807
6808 =cut
6809 */
6810
6811 SV *
6812 Perl_newSVsv(pTHX_ register SV *old)
6813 {
6814     register SV *sv;
6815
6816     if (!old)
6817         return Nullsv;
6818     if (SvTYPE(old) == SVTYPEMASK) {
6819         if (ckWARN_d(WARN_INTERNAL))
6820             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6821         return Nullsv;
6822     }
6823     new_SV(sv);
6824     /* SV_GMAGIC is the default for sv_setv()
6825        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6826        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6827     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6828     return sv;
6829 }
6830
6831 /*
6832 =for apidoc sv_reset
6833
6834 Underlying implementation for the C<reset> Perl function.
6835 Note that the perl-level function is vaguely deprecated.
6836
6837 =cut
6838 */
6839
6840 void
6841 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6842 {
6843     dVAR;
6844     char todo[PERL_UCHAR_MAX+1];
6845
6846     if (!stash)
6847         return;
6848
6849     if (!*s) {          /* reset ?? searches */
6850         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6851         if (mg) {
6852             PMOP *pm = (PMOP *) mg->mg_obj;
6853             while (pm) {
6854                 pm->op_pmdynflags &= ~PMdf_USED;
6855                 pm = pm->op_pmnext;
6856             }
6857         }
6858         return;
6859     }
6860
6861     /* reset variables */
6862
6863     if (!HvARRAY(stash))
6864         return;
6865
6866     Zero(todo, 256, char);
6867     while (*s) {
6868         I32 max;
6869         I32 i = (unsigned char)*s;
6870         if (s[1] == '-') {
6871             s += 2;
6872         }
6873         max = (unsigned char)*s++;
6874         for ( ; i <= max; i++) {
6875             todo[i] = 1;
6876         }
6877         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6878             HE *entry;
6879             for (entry = HvARRAY(stash)[i];
6880                  entry;
6881                  entry = HeNEXT(entry))
6882             {
6883                 register GV *gv;
6884                 register SV *sv;
6885
6886                 if (!todo[(U8)*HeKEY(entry)])
6887                     continue;
6888                 gv = (GV*)HeVAL(entry);
6889                 sv = GvSV(gv);
6890                 if (sv) {
6891                     if (SvTHINKFIRST(sv)) {
6892                         if (!SvREADONLY(sv) && SvROK(sv))
6893                             sv_unref(sv);
6894                         /* XXX Is this continue a bug? Why should THINKFIRST
6895                            exempt us from resetting arrays and hashes?  */
6896                         continue;
6897                     }
6898                     SvOK_off(sv);
6899                     if (SvTYPE(sv) >= SVt_PV) {
6900                         SvCUR_set(sv, 0);
6901                         if (SvPVX_const(sv) != Nullch)
6902                             *SvPVX(sv) = '\0';
6903                         SvTAINT(sv);
6904                     }
6905                 }
6906                 if (GvAV(gv)) {
6907                     av_clear(GvAV(gv));
6908                 }
6909                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6910 #if defined(VMS)
6911                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6912 #else /* ! VMS */
6913                     hv_clear(GvHV(gv));
6914 #  if defined(USE_ENVIRON_ARRAY)
6915                     if (gv == PL_envgv)
6916                         my_clearenv();
6917 #  endif /* USE_ENVIRON_ARRAY */
6918 #endif /* VMS */
6919                 }
6920             }
6921         }
6922     }
6923 }
6924
6925 /*
6926 =for apidoc sv_2io
6927
6928 Using various gambits, try to get an IO from an SV: the IO slot if its a
6929 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6930 named after the PV if we're a string.
6931
6932 =cut
6933 */
6934
6935 IO*
6936 Perl_sv_2io(pTHX_ SV *sv)
6937 {
6938     IO* io;
6939     GV* gv;
6940
6941     switch (SvTYPE(sv)) {
6942     case SVt_PVIO:
6943         io = (IO*)sv;
6944         break;
6945     case SVt_PVGV:
6946         gv = (GV*)sv;
6947         io = GvIO(gv);
6948         if (!io)
6949             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6950         break;
6951     default:
6952         if (!SvOK(sv))
6953             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6954         if (SvROK(sv))
6955             return sv_2io(SvRV(sv));
6956         gv = gv_fetchsv(sv, FALSE, SVt_PVIO);
6957         if (gv)
6958             io = GvIO(gv);
6959         else
6960             io = 0;
6961         if (!io)
6962             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6963         break;
6964     }
6965     return io;
6966 }
6967
6968 /*
6969 =for apidoc sv_2cv
6970
6971 Using various gambits, try to get a CV from an SV; in addition, try if
6972 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6973
6974 =cut
6975 */
6976
6977 CV *
6978 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6979 {
6980     dVAR;
6981     GV *gv = Nullgv;
6982     CV *cv = Nullcv;
6983
6984     if (!sv)
6985         return *gvp = Nullgv, Nullcv;
6986     switch (SvTYPE(sv)) {
6987     case SVt_PVCV:
6988         *st = CvSTASH(sv);
6989         *gvp = Nullgv;
6990         return (CV*)sv;
6991     case SVt_PVHV:
6992     case SVt_PVAV:
6993         *gvp = Nullgv;
6994         return Nullcv;
6995     case SVt_PVGV:
6996         gv = (GV*)sv;
6997         *gvp = gv;
6998         *st = GvESTASH(gv);
6999         goto fix_gv;
7000
7001     default:
7002         SvGETMAGIC(sv);
7003         if (SvROK(sv)) {
7004             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
7005             tryAMAGICunDEREF(to_cv);
7006
7007             sv = SvRV(sv);
7008             if (SvTYPE(sv) == SVt_PVCV) {
7009                 cv = (CV*)sv;
7010                 *gvp = Nullgv;
7011                 *st = CvSTASH(cv);
7012                 return cv;
7013             }
7014             else if(isGV(sv))
7015                 gv = (GV*)sv;
7016             else
7017                 Perl_croak(aTHX_ "Not a subroutine reference");
7018         }
7019         else if (isGV(sv))
7020             gv = (GV*)sv;
7021         else
7022             gv = gv_fetchsv(sv, lref, SVt_PVCV);
7023         *gvp = gv;
7024         if (!gv)
7025             return Nullcv;
7026         *st = GvESTASH(gv);
7027     fix_gv:
7028         if (lref && !GvCVu(gv)) {
7029             SV *tmpsv;
7030             ENTER;
7031             tmpsv = NEWSV(704,0);
7032             gv_efullname3(tmpsv, gv, Nullch);
7033             /* XXX this is probably not what they think they're getting.
7034              * It has the same effect as "sub name;", i.e. just a forward
7035              * declaration! */
7036             newSUB(start_subparse(FALSE, 0),
7037                    newSVOP(OP_CONST, 0, tmpsv),
7038                    Nullop,
7039                    Nullop);
7040             LEAVE;
7041             if (!GvCVu(gv))
7042                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
7043                            sv);
7044         }
7045         return GvCVu(gv);
7046     }
7047 }
7048
7049 /*
7050 =for apidoc sv_true
7051
7052 Returns true if the SV has a true value by Perl's rules.
7053 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
7054 instead use an in-line version.
7055
7056 =cut
7057 */
7058
7059 I32
7060 Perl_sv_true(pTHX_ register SV *sv)
7061 {
7062     if (!sv)
7063         return 0;
7064     if (SvPOK(sv)) {
7065         register const XPV* const tXpv = (XPV*)SvANY(sv);
7066         if (tXpv &&
7067                 (tXpv->xpv_cur > 1 ||
7068                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
7069             return 1;
7070         else
7071             return 0;
7072     }
7073     else {
7074         if (SvIOK(sv))
7075             return SvIVX(sv) != 0;
7076         else {
7077             if (SvNOK(sv))
7078                 return SvNVX(sv) != 0.0;
7079             else
7080                 return sv_2bool(sv);
7081         }
7082     }
7083 }
7084
7085 /*
7086 =for apidoc sv_pvn_force
7087
7088 Get a sensible string out of the SV somehow.
7089 A private implementation of the C<SvPV_force> macro for compilers which
7090 can't cope with complex macro expressions. Always use the macro instead.
7091
7092 =for apidoc sv_pvn_force_flags
7093
7094 Get a sensible string out of the SV somehow.
7095 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
7096 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
7097 implemented in terms of this function.
7098 You normally want to use the various wrapper macros instead: see
7099 C<SvPV_force> and C<SvPV_force_nomg>
7100
7101 =cut
7102 */
7103
7104 char *
7105 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
7106 {
7107
7108     if (SvTHINKFIRST(sv) && !SvROK(sv))
7109         sv_force_normal_flags(sv, 0);
7110
7111     if (SvPOK(sv)) {
7112         if (lp)
7113             *lp = SvCUR(sv);
7114     }
7115     else {
7116         char *s;
7117         STRLEN len;
7118  
7119         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
7120             const char * const ref = sv_reftype(sv,0);
7121             if (PL_op)
7122                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
7123                            ref, OP_NAME(PL_op));
7124             else
7125                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
7126         }
7127         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
7128             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
7129                 OP_NAME(PL_op));
7130         s = sv_2pv_flags(sv, &len, flags);
7131         if (lp)
7132             *lp = len;
7133
7134         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
7135             if (SvROK(sv))
7136                 sv_unref(sv);
7137             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
7138             SvGROW(sv, len + 1);
7139             Move(s,SvPVX(sv),len,char);
7140             SvCUR_set(sv, len);
7141             *SvEND(sv) = '\0';
7142         }
7143         if (!SvPOK(sv)) {
7144             SvPOK_on(sv);               /* validate pointer */
7145             SvTAINT(sv);
7146             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
7147                                   PTR2UV(sv),SvPVX_const(sv)));
7148         }
7149     }
7150     return SvPVX_mutable(sv);
7151 }
7152
7153 /*
7154 =for apidoc sv_pvbyten_force
7155
7156 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
7157
7158 =cut
7159 */
7160
7161 char *
7162 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
7163 {
7164     sv_pvn_force(sv,lp);
7165     sv_utf8_downgrade(sv,0);
7166     *lp = SvCUR(sv);
7167     return SvPVX(sv);
7168 }
7169
7170 /*
7171 =for apidoc sv_pvutf8n_force
7172
7173 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
7174
7175 =cut
7176 */
7177
7178 char *
7179 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
7180 {
7181     sv_pvn_force(sv,lp);
7182     sv_utf8_upgrade(sv);
7183     *lp = SvCUR(sv);
7184     return SvPVX(sv);
7185 }
7186
7187 /*
7188 =for apidoc sv_reftype
7189
7190 Returns a string describing what the SV is a reference to.
7191
7192 =cut
7193 */
7194
7195 char *
7196 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
7197 {
7198     /* The fact that I don't need to downcast to char * everywhere, only in ?:
7199        inside return suggests a const propagation bug in g++.  */
7200     if (ob && SvOBJECT(sv)) {
7201         char * const name = HvNAME_get(SvSTASH(sv));
7202         return name ? name : (char *) "__ANON__";
7203     }
7204     else {
7205         switch (SvTYPE(sv)) {
7206         case SVt_NULL:
7207         case SVt_IV:
7208         case SVt_NV:
7209         case SVt_RV:
7210         case SVt_PV:
7211         case SVt_PVIV:
7212         case SVt_PVNV:
7213         case SVt_PVMG:
7214         case SVt_PVBM:
7215                                 if (SvVOK(sv))
7216                                     return "VSTRING";
7217                                 if (SvROK(sv))
7218                                     return "REF";
7219                                 else
7220                                     return "SCALAR";
7221
7222         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
7223                                 /* tied lvalues should appear to be
7224                                  * scalars for backwards compatitbility */
7225                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
7226                                     ? "SCALAR" : "LVALUE");
7227         case SVt_PVAV:          return "ARRAY";
7228         case SVt_PVHV:          return "HASH";
7229         case SVt_PVCV:          return "CODE";
7230         case SVt_PVGV:          return "GLOB";
7231         case SVt_PVFM:          return "FORMAT";
7232         case SVt_PVIO:          return "IO";
7233         default:                return "UNKNOWN";
7234         }
7235     }
7236 }
7237
7238 /*
7239 =for apidoc sv_isobject
7240
7241 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7242 object.  If the SV is not an RV, or if the object is not blessed, then this
7243 will return false.
7244
7245 =cut
7246 */
7247
7248 int
7249 Perl_sv_isobject(pTHX_ SV *sv)
7250 {
7251     if (!sv)
7252         return 0;
7253     SvGETMAGIC(sv);
7254     if (!SvROK(sv))
7255         return 0;
7256     sv = (SV*)SvRV(sv);
7257     if (!SvOBJECT(sv))
7258         return 0;
7259     return 1;
7260 }
7261
7262 /*
7263 =for apidoc sv_isa
7264
7265 Returns a boolean indicating whether the SV is blessed into the specified
7266 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7267 an inheritance relationship.
7268
7269 =cut
7270 */
7271
7272 int
7273 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7274 {
7275     const char *hvname;
7276     if (!sv)
7277         return 0;
7278     SvGETMAGIC(sv);
7279     if (!SvROK(sv))
7280         return 0;
7281     sv = (SV*)SvRV(sv);
7282     if (!SvOBJECT(sv))
7283         return 0;
7284     hvname = HvNAME_get(SvSTASH(sv));
7285     if (!hvname)
7286         return 0;
7287
7288     return strEQ(hvname, name);
7289 }
7290
7291 /*
7292 =for apidoc newSVrv
7293
7294 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7295 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7296 be blessed in the specified package.  The new SV is returned and its
7297 reference count is 1.
7298
7299 =cut
7300 */
7301
7302 SV*
7303 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7304 {
7305     SV *sv;
7306
7307     new_SV(sv);
7308
7309     SV_CHECK_THINKFIRST_COW_DROP(rv);
7310     SvAMAGIC_off(rv);
7311
7312     if (SvTYPE(rv) >= SVt_PVMG) {
7313         const U32 refcnt = SvREFCNT(rv);
7314         SvREFCNT(rv) = 0;
7315         sv_clear(rv);
7316         SvFLAGS(rv) = 0;
7317         SvREFCNT(rv) = refcnt;
7318     }
7319
7320     if (SvTYPE(rv) < SVt_RV)
7321         sv_upgrade(rv, SVt_RV);
7322     else if (SvTYPE(rv) > SVt_RV) {
7323         SvPV_free(rv);
7324         SvCUR_set(rv, 0);
7325         SvLEN_set(rv, 0);
7326     }
7327
7328     SvOK_off(rv);
7329     SvRV_set(rv, sv);
7330     SvROK_on(rv);
7331
7332     if (classname) {
7333         HV* const stash = gv_stashpv(classname, TRUE);
7334         (void)sv_bless(rv, stash);
7335     }
7336     return sv;
7337 }
7338
7339 /*
7340 =for apidoc sv_setref_pv
7341
7342 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7343 argument will be upgraded to an RV.  That RV will be modified to point to
7344 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7345 into the SV.  The C<classname> argument indicates the package for the
7346 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7347 will have a reference count of 1, and the RV will be returned.
7348
7349 Do not use with other Perl types such as HV, AV, SV, CV, because those
7350 objects will become corrupted by the pointer copy process.
7351
7352 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7353
7354 =cut
7355 */
7356
7357 SV*
7358 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7359 {
7360     if (!pv) {
7361         sv_setsv(rv, &PL_sv_undef);
7362         SvSETMAGIC(rv);
7363     }
7364     else
7365         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7366     return rv;
7367 }
7368
7369 /*
7370 =for apidoc sv_setref_iv
7371
7372 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7373 argument will be upgraded to an RV.  That RV will be modified to point to
7374 the new SV.  The C<classname> argument indicates the package for the
7375 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7376 will have a reference count of 1, and the RV will be returned.
7377
7378 =cut
7379 */
7380
7381 SV*
7382 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7383 {
7384     sv_setiv(newSVrv(rv,classname), iv);
7385     return rv;
7386 }
7387
7388 /*
7389 =for apidoc sv_setref_uv
7390
7391 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7392 argument will be upgraded to an RV.  That RV will be modified to point to
7393 the new SV.  The C<classname> argument indicates the package for the
7394 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7395 will have a reference count of 1, and the RV will be returned.
7396
7397 =cut
7398 */
7399
7400 SV*
7401 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7402 {
7403     sv_setuv(newSVrv(rv,classname), uv);
7404     return rv;
7405 }
7406
7407 /*
7408 =for apidoc sv_setref_nv
7409
7410 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7411 argument will be upgraded to an RV.  That RV will be modified to point to
7412 the new SV.  The C<classname> argument indicates the package for the
7413 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7414 will have a reference count of 1, and the RV will be returned.
7415
7416 =cut
7417 */
7418
7419 SV*
7420 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7421 {
7422     sv_setnv(newSVrv(rv,classname), nv);
7423     return rv;
7424 }
7425
7426 /*
7427 =for apidoc sv_setref_pvn
7428
7429 Copies a string into a new SV, optionally blessing the SV.  The length of the
7430 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7431 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7432 argument indicates the package for the blessing.  Set C<classname> to
7433 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7434 of 1, and the RV will be returned.
7435
7436 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7437
7438 =cut
7439 */
7440
7441 SV*
7442 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7443 {
7444     sv_setpvn(newSVrv(rv,classname), pv, n);
7445     return rv;
7446 }
7447
7448 /*
7449 =for apidoc sv_bless
7450
7451 Blesses an SV into a specified package.  The SV must be an RV.  The package
7452 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7453 of the SV is unaffected.
7454
7455 =cut
7456 */
7457
7458 SV*
7459 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7460 {
7461     SV *tmpRef;
7462     if (!SvROK(sv))
7463         Perl_croak(aTHX_ "Can't bless non-reference value");
7464     tmpRef = SvRV(sv);
7465     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7466         if (SvREADONLY(tmpRef))
7467             Perl_croak(aTHX_ PL_no_modify);
7468         if (SvOBJECT(tmpRef)) {
7469             if (SvTYPE(tmpRef) != SVt_PVIO)
7470                 --PL_sv_objcount;
7471             SvREFCNT_dec(SvSTASH(tmpRef));
7472         }
7473     }
7474     SvOBJECT_on(tmpRef);
7475     if (SvTYPE(tmpRef) != SVt_PVIO)
7476         ++PL_sv_objcount;
7477     SvUPGRADE(tmpRef, SVt_PVMG);
7478     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7479
7480     if (Gv_AMG(stash))
7481         SvAMAGIC_on(sv);
7482     else
7483         SvAMAGIC_off(sv);
7484
7485     if(SvSMAGICAL(tmpRef))
7486         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7487             mg_set(tmpRef);
7488
7489
7490
7491     return sv;
7492 }
7493
7494 /* Downgrades a PVGV to a PVMG.
7495  */
7496
7497 STATIC void
7498 S_sv_unglob(pTHX_ SV *sv)
7499 {
7500     void *xpvmg;
7501
7502     assert(SvTYPE(sv) == SVt_PVGV);
7503     SvFAKE_off(sv);
7504     if (GvGP(sv))
7505         gp_free((GV*)sv);
7506     if (GvSTASH(sv)) {
7507         sv_del_backref((SV*)GvSTASH(sv), sv);
7508         GvSTASH(sv) = Nullhv;
7509     }
7510     sv_unmagic(sv, PERL_MAGIC_glob);
7511     Safefree(GvNAME(sv));
7512     GvMULTI_off(sv);
7513
7514     /* need to keep SvANY(sv) in the right arena */
7515     xpvmg = new_XPVMG();
7516     StructCopy(SvANY(sv), xpvmg, XPVMG);
7517     del_XPVGV(SvANY(sv));
7518     SvANY(sv) = xpvmg;
7519
7520     SvFLAGS(sv) &= ~SVTYPEMASK;
7521     SvFLAGS(sv) |= SVt_PVMG;
7522 }
7523
7524 /*
7525 =for apidoc sv_unref_flags
7526
7527 Unsets the RV status of the SV, and decrements the reference count of
7528 whatever was being referenced by the RV.  This can almost be thought of
7529 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7530 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7531 (otherwise the decrementing is conditional on the reference count being
7532 different from one or the reference being a readonly SV).
7533 See C<SvROK_off>.
7534
7535 =cut
7536 */
7537
7538 void
7539 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7540 {
7541     SV* const target = SvRV(ref);
7542
7543     if (SvWEAKREF(ref)) {
7544         sv_del_backref(target, ref);
7545         SvWEAKREF_off(ref);
7546         SvRV_set(ref, NULL);
7547         return;
7548     }
7549     SvRV_set(ref, NULL);
7550     SvROK_off(ref);
7551     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7552        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7553     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7554         SvREFCNT_dec(target);
7555     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7556         sv_2mortal(target);     /* Schedule for freeing later */
7557 }
7558
7559 /*
7560 =for apidoc sv_untaint
7561
7562 Untaint an SV. Use C<SvTAINTED_off> instead.
7563 =cut
7564 */
7565
7566 void
7567 Perl_sv_untaint(pTHX_ SV *sv)
7568 {
7569     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7570         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7571         if (mg)
7572             mg->mg_len &= ~1;
7573     }
7574 }
7575
7576 /*
7577 =for apidoc sv_tainted
7578
7579 Test an SV for taintedness. Use C<SvTAINTED> instead.
7580 =cut
7581 */
7582
7583 bool
7584 Perl_sv_tainted(pTHX_ SV *sv)
7585 {
7586     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7587         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7588         if (mg && (mg->mg_len & 1) )
7589             return TRUE;
7590     }
7591     return FALSE;
7592 }
7593
7594 /*
7595 =for apidoc sv_setpviv
7596
7597 Copies an integer into the given SV, also updating its string value.
7598 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7599
7600 =cut
7601 */
7602
7603 void
7604 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7605 {
7606     char buf[TYPE_CHARS(UV)];
7607     char *ebuf;
7608     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7609
7610     sv_setpvn(sv, ptr, ebuf - ptr);
7611 }
7612
7613 /*
7614 =for apidoc sv_setpviv_mg
7615
7616 Like C<sv_setpviv>, but also handles 'set' magic.
7617
7618 =cut
7619 */
7620
7621 void
7622 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7623 {
7624     sv_setpviv(sv, iv);
7625     SvSETMAGIC(sv);
7626 }
7627
7628 #if defined(PERL_IMPLICIT_CONTEXT)
7629
7630 /* pTHX_ magic can't cope with varargs, so this is a no-context
7631  * version of the main function, (which may itself be aliased to us).
7632  * Don't access this version directly.
7633  */
7634
7635 void
7636 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7637 {
7638     dTHX;
7639     va_list args;
7640     va_start(args, pat);
7641     sv_vsetpvf(sv, pat, &args);
7642     va_end(args);
7643 }
7644
7645 /* pTHX_ magic can't cope with varargs, so this is a no-context
7646  * version of the main function, (which may itself be aliased to us).
7647  * Don't access this version directly.
7648  */
7649
7650 void
7651 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7652 {
7653     dTHX;
7654     va_list args;
7655     va_start(args, pat);
7656     sv_vsetpvf_mg(sv, pat, &args);
7657     va_end(args);
7658 }
7659 #endif
7660
7661 /*
7662 =for apidoc sv_setpvf
7663
7664 Works like C<sv_catpvf> but copies the text into the SV instead of
7665 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7666
7667 =cut
7668 */
7669
7670 void
7671 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7672 {
7673     va_list args;
7674     va_start(args, pat);
7675     sv_vsetpvf(sv, pat, &args);
7676     va_end(args);
7677 }
7678
7679 /*
7680 =for apidoc sv_vsetpvf
7681
7682 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7683 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7684
7685 Usually used via its frontend C<sv_setpvf>.
7686
7687 =cut
7688 */
7689
7690 void
7691 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7692 {
7693     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7694 }
7695
7696 /*
7697 =for apidoc sv_setpvf_mg
7698
7699 Like C<sv_setpvf>, but also handles 'set' magic.
7700
7701 =cut
7702 */
7703
7704 void
7705 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7706 {
7707     va_list args;
7708     va_start(args, pat);
7709     sv_vsetpvf_mg(sv, pat, &args);
7710     va_end(args);
7711 }
7712
7713 /*
7714 =for apidoc sv_vsetpvf_mg
7715
7716 Like C<sv_vsetpvf>, but also handles 'set' magic.
7717
7718 Usually used via its frontend C<sv_setpvf_mg>.
7719
7720 =cut
7721 */
7722
7723 void
7724 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7725 {
7726     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7727     SvSETMAGIC(sv);
7728 }
7729
7730 #if defined(PERL_IMPLICIT_CONTEXT)
7731
7732 /* pTHX_ magic can't cope with varargs, so this is a no-context
7733  * version of the main function, (which may itself be aliased to us).
7734  * Don't access this version directly.
7735  */
7736
7737 void
7738 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7739 {
7740     dTHX;
7741     va_list args;
7742     va_start(args, pat);
7743     sv_vcatpvf(sv, pat, &args);
7744     va_end(args);
7745 }
7746
7747 /* pTHX_ magic can't cope with varargs, so this is a no-context
7748  * version of the main function, (which may itself be aliased to us).
7749  * Don't access this version directly.
7750  */
7751
7752 void
7753 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7754 {
7755     dTHX;
7756     va_list args;
7757     va_start(args, pat);
7758     sv_vcatpvf_mg(sv, pat, &args);
7759     va_end(args);
7760 }
7761 #endif
7762
7763 /*
7764 =for apidoc sv_catpvf
7765
7766 Processes its arguments like C<sprintf> and appends the formatted
7767 output to an SV.  If the appended data contains "wide" characters
7768 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7769 and characters >255 formatted with %c), the original SV might get
7770 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7771 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7772 valid UTF-8; if the original SV was bytes, the pattern should be too.
7773
7774 =cut */
7775
7776 void
7777 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7778 {
7779     va_list args;
7780     va_start(args, pat);
7781     sv_vcatpvf(sv, pat, &args);
7782     va_end(args);
7783 }
7784
7785 /*
7786 =for apidoc sv_vcatpvf
7787
7788 Processes its arguments like C<vsprintf> and appends the formatted output
7789 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7790
7791 Usually used via its frontend C<sv_catpvf>.
7792
7793 =cut
7794 */
7795
7796 void
7797 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7798 {
7799     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7800 }
7801
7802 /*
7803 =for apidoc sv_catpvf_mg
7804
7805 Like C<sv_catpvf>, but also handles 'set' magic.
7806
7807 =cut
7808 */
7809
7810 void
7811 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7812 {
7813     va_list args;
7814     va_start(args, pat);
7815     sv_vcatpvf_mg(sv, pat, &args);
7816     va_end(args);
7817 }
7818
7819 /*
7820 =for apidoc sv_vcatpvf_mg
7821
7822 Like C<sv_vcatpvf>, but also handles 'set' magic.
7823
7824 Usually used via its frontend C<sv_catpvf_mg>.
7825
7826 =cut
7827 */
7828
7829 void
7830 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7831 {
7832     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7833     SvSETMAGIC(sv);
7834 }
7835
7836 /*
7837 =for apidoc sv_vsetpvfn
7838
7839 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7840 appending it.
7841
7842 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7843
7844 =cut
7845 */
7846
7847 void
7848 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7849 {
7850     sv_setpvn(sv, "", 0);
7851     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7852 }
7853
7854 /* private function for use in sv_vcatpvfn via the EXPECT_NUMBER macro */
7855
7856 STATIC I32
7857 S_expect_number(pTHX_ char** pattern)
7858 {
7859     I32 var = 0;
7860     switch (**pattern) {
7861     case '1': case '2': case '3':
7862     case '4': case '5': case '6':
7863     case '7': case '8': case '9':
7864         while (isDIGIT(**pattern))
7865             var = var * 10 + (*(*pattern)++ - '0');
7866     }
7867     return var;
7868 }
7869 #define EXPECT_NUMBER(pattern, var) (var = S_expect_number(aTHX_ &pattern))
7870
7871 static char *
7872 F0convert(NV nv, char *endbuf, STRLEN *len)
7873 {
7874     const int neg = nv < 0;
7875     UV uv;
7876
7877     if (neg)
7878         nv = -nv;
7879     if (nv < UV_MAX) {
7880         char *p = endbuf;
7881         nv += 0.5;
7882         uv = (UV)nv;
7883         if (uv & 1 && uv == nv)
7884             uv--;                       /* Round to even */
7885         do {
7886             const unsigned dig = uv % 10;
7887             *--p = '0' + dig;
7888         } while (uv /= 10);
7889         if (neg)
7890             *--p = '-';
7891         *len = endbuf - p;
7892         return p;
7893     }
7894     return Nullch;
7895 }
7896
7897
7898 /*
7899 =for apidoc sv_vcatpvfn
7900
7901 Processes its arguments like C<vsprintf> and appends the formatted output
7902 to an SV.  Uses an array of SVs if the C style variable argument list is
7903 missing (NULL).  When running with taint checks enabled, indicates via
7904 C<maybe_tainted> if results are untrustworthy (often due to the use of
7905 locales).
7906
7907 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7908
7909 =cut
7910 */
7911
7912
7913 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7914                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7915                         vec_utf8 = DO_UTF8(vecsv);
7916
7917 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7918
7919 void
7920 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7921 {
7922     char *p;
7923     char *q;
7924     const char *patend;
7925     STRLEN origlen;
7926     I32 svix = 0;
7927     static const char nullstr[] = "(null)";
7928     SV *argsv = Nullsv;
7929     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7930     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7931     SV *nsv = Nullsv;
7932     /* Times 4: a decimal digit takes more than 3 binary digits.
7933      * NV_DIG: mantissa takes than many decimal digits.
7934      * Plus 32: Playing safe. */
7935     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7936     /* large enough for "%#.#f" --chip */
7937     /* what about long double NVs? --jhi */
7938
7939     PERL_UNUSED_ARG(maybe_tainted);
7940
7941     /* no matter what, this is a string now */
7942     (void)SvPV_force(sv, origlen);
7943
7944     /* special-case "", "%s", and "%-p" (SVf - see below) */
7945     if (patlen == 0)
7946         return;
7947     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7948         if (args) {
7949             const char * const s = va_arg(*args, char*);
7950             sv_catpv(sv, s ? s : nullstr);
7951         }
7952         else if (svix < svmax) {
7953             sv_catsv(sv, *svargs);
7954         }
7955         return;
7956     }
7957     if (args && patlen == 3 && pat[0] == '%' &&
7958                 pat[1] == '-' && pat[2] == 'p') {
7959         argsv = va_arg(*args, SV*);
7960         sv_catsv(sv, argsv);
7961         return;
7962     }
7963
7964 #ifndef USE_LONG_DOUBLE
7965     /* special-case "%.<number>[gf]" */
7966     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7967          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7968         unsigned digits = 0;
7969         const char *pp;
7970
7971         pp = pat + 2;
7972         while (*pp >= '0' && *pp <= '9')
7973             digits = 10 * digits + (*pp++ - '0');
7974         if (pp - pat == (int)patlen - 1) {
7975             NV nv;
7976
7977             if (svix < svmax)
7978                 nv = SvNV(*svargs);
7979             else
7980                 return;
7981             if (*pp == 'g') {
7982                 /* Add check for digits != 0 because it seems that some
7983                    gconverts are buggy in this case, and we don't yet have
7984                    a Configure test for this.  */
7985                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7986                      /* 0, point, slack */
7987                     Gconvert(nv, (int)digits, 0, ebuf);
7988                     sv_catpv(sv, ebuf);
7989                     if (*ebuf)  /* May return an empty string for digits==0 */
7990                         return;
7991                 }
7992             } else if (!digits) {
7993                 STRLEN l;
7994
7995                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7996                     sv_catpvn(sv, p, l);
7997                     return;
7998                 }
7999             }
8000         }
8001     }
8002 #endif /* !USE_LONG_DOUBLE */
8003
8004     if (!args && svix < svmax && DO_UTF8(*svargs))
8005         has_utf8 = TRUE;
8006
8007     patend = (char*)pat + patlen;
8008     for (p = (char*)pat; p < patend; p = q) {
8009         bool alt = FALSE;
8010         bool left = FALSE;
8011         bool vectorize = FALSE;
8012         bool vectorarg = FALSE;
8013         bool vec_utf8 = FALSE;
8014         char fill = ' ';
8015         char plus = 0;
8016         char intsize = 0;
8017         STRLEN width = 0;
8018         STRLEN zeros = 0;
8019         bool has_precis = FALSE;
8020         STRLEN precis = 0;
8021         I32 osvix = svix;
8022         bool is_utf8 = FALSE;  /* is this item utf8?   */
8023 #ifdef HAS_LDBL_SPRINTF_BUG
8024         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8025            with sfio - Allen <allens@cpan.org> */
8026         bool fix_ldbl_sprintf_bug = FALSE;
8027 #endif
8028
8029         char esignbuf[4];
8030         U8 utf8buf[UTF8_MAXBYTES+1];
8031         STRLEN esignlen = 0;
8032
8033         const char *eptr = Nullch;
8034         STRLEN elen = 0;
8035         SV *vecsv = Nullsv;
8036         const U8 *vecstr = Null(U8*);
8037         STRLEN veclen = 0;
8038         char c = 0;
8039         int i;
8040         unsigned base = 0;
8041         IV iv = 0;
8042         UV uv = 0;
8043         /* we need a long double target in case HAS_LONG_DOUBLE but
8044            not USE_LONG_DOUBLE
8045         */
8046 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
8047         long double nv;
8048 #else
8049         NV nv;
8050 #endif
8051         STRLEN have;
8052         STRLEN need;
8053         STRLEN gap;
8054         const char *dotstr = ".";
8055         STRLEN dotstrlen = 1;
8056         I32 efix = 0; /* explicit format parameter index */
8057         I32 ewix = 0; /* explicit width index */
8058         I32 epix = 0; /* explicit precision index */
8059         I32 evix = 0; /* explicit vector index */
8060         bool asterisk = FALSE;
8061
8062         /* echo everything up to the next format specification */
8063         for (q = p; q < patend && *q != '%'; ++q) ;
8064         if (q > p) {
8065             if (has_utf8 && !pat_utf8)
8066                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
8067             else
8068                 sv_catpvn(sv, p, q - p);
8069             p = q;
8070         }
8071         if (q++ >= patend)
8072             break;
8073
8074 /*
8075     We allow format specification elements in this order:
8076         \d+\$              explicit format parameter index
8077         [-+ 0#]+           flags
8078         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
8079         0                  flag (as above): repeated to allow "v02"     
8080         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
8081         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
8082         [hlqLV]            size
8083     [%bcdefginopsuxDFOUX] format (mandatory)
8084 */
8085
8086         if (args) {
8087 /*  
8088         As of perl5.9.3, printf format checking is on by default.
8089         Internally, perl uses %p formats to provide an escape to
8090         some extended formatting.  This block deals with those
8091         extensions: if it does not match, (char*)q is reset and
8092         the normal format processing code is used.
8093
8094         Currently defined extensions are:
8095                 %p              include pointer address (standard)      
8096                 %-p     (SVf)   include an SV (previously %_)
8097                 %-<num>p        include an SV with precision <num>      
8098                 %1p     (VDf)   include a v-string (as %vd)
8099                 %<num>p         reserved for future extensions
8100
8101         Robin Barker 2005-07-14
8102 */
8103             char* r = q; 
8104             bool sv = FALSE;    
8105             STRLEN n = 0;
8106             if (*q == '-')
8107                 sv = *q++;
8108             EXPECT_NUMBER(q, n);
8109             if (*q++ == 'p') {
8110                 if (sv) {                       /* SVf */
8111                     if (n) {
8112                         precis = n;
8113                         has_precis = TRUE;
8114                     }
8115                     argsv = va_arg(*args, SV*);
8116                     eptr = SvPVx_const(argsv, elen);
8117                     if (DO_UTF8(argsv))
8118                         is_utf8 = TRUE;
8119                     goto string;
8120                 }
8121 #if vdNUMBER
8122                 else if (n == vdNUMBER) {       /* VDf */
8123                     vectorize = TRUE;
8124                     VECTORIZE_ARGS
8125                     goto format_vd;
8126                 }
8127 #endif
8128                 else if (n) {
8129                     if (ckWARN_d(WARN_INTERNAL))
8130                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
8131                         "internal %%<num>p might conflict with future printf extensions");
8132                 }
8133             }
8134             q = r; 
8135         }
8136
8137         if (EXPECT_NUMBER(q, width)) {
8138             if (*q == '$') {
8139                 ++q;
8140                 efix = width;
8141             } else {
8142                 goto gotwidth;
8143             }
8144         }
8145
8146         /* FLAGS */
8147
8148         while (*q) {
8149             switch (*q) {
8150             case ' ':
8151             case '+':
8152                 plus = *q++;
8153                 continue;
8154
8155             case '-':
8156                 left = TRUE;
8157                 q++;
8158                 continue;
8159
8160             case '0':
8161                 fill = *q++;
8162                 continue;
8163
8164             case '#':
8165                 alt = TRUE;
8166                 q++;
8167                 continue;
8168
8169             default:
8170                 break;
8171             }
8172             break;
8173         }
8174
8175       tryasterisk:
8176         if (*q == '*') {
8177             q++;
8178             if (EXPECT_NUMBER(q, ewix))
8179                 if (*q++ != '$')
8180                     goto unknown;
8181             asterisk = TRUE;
8182         }
8183         if (*q == 'v') {
8184             q++;
8185             if (vectorize)
8186                 goto unknown;
8187             if ((vectorarg = asterisk)) {
8188                 evix = ewix;
8189                 ewix = 0;
8190                 asterisk = FALSE;
8191             }
8192             vectorize = TRUE;
8193             goto tryasterisk;
8194         }
8195
8196         if (!asterisk)
8197         {
8198             if( *q == '0' )
8199                 fill = *q++;
8200             EXPECT_NUMBER(q, width);
8201         }
8202
8203         if (vectorize) {
8204             if (vectorarg) {
8205                 if (args)
8206                     vecsv = va_arg(*args, SV*);
8207                 else
8208                     vecsv = (evix ? evix <= svmax : svix < svmax) ?
8209                         svargs[evix ? evix-1 : svix++] : &PL_sv_undef;
8210                 dotstr = SvPV_const(vecsv, dotstrlen);
8211                 if (DO_UTF8(vecsv))
8212                     is_utf8 = TRUE;
8213             }
8214             if (args) {
8215                 VECTORIZE_ARGS
8216             }
8217             else if (efix ? efix <= svmax : svix < svmax) {
8218                 vecsv = svargs[efix ? efix-1 : svix++];
8219                 vecstr = (U8*)SvPV_const(vecsv,veclen);
8220                 vec_utf8 = DO_UTF8(vecsv);
8221                 /* if this is a version object, we need to return the
8222                  * stringified representation (which the SvPVX_const has
8223                  * already done for us), but not vectorize the args
8224                  */
8225                 if ( *q == 'd' && sv_derived_from(vecsv,"version") )
8226                 {
8227                         q++; /* skip past the rest of the %vd format */
8228                         eptr = (const char *) vecstr;
8229                         elen = veclen;
8230                         vectorize=FALSE;
8231                         goto string;
8232                 }
8233             }
8234             else {
8235                 vecstr = (U8*)"";
8236                 veclen = 0;
8237             }
8238         }
8239
8240         if (asterisk) {
8241             if (args)
8242                 i = va_arg(*args, int);
8243             else
8244                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8245                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8246             left |= (i < 0);
8247             width = (i < 0) ? -i : i;
8248         }
8249       gotwidth:
8250
8251         /* PRECISION */
8252
8253         if (*q == '.') {
8254             q++;
8255             if (*q == '*') {
8256                 q++;
8257                 if (EXPECT_NUMBER(q, epix) && *q++ != '$')
8258                     goto unknown;
8259                 /* XXX: todo, support specified precision parameter */
8260                 if (epix)
8261                     goto unknown;
8262                 if (args)
8263                     i = va_arg(*args, int);
8264                 else
8265                     i = (ewix ? ewix <= svmax : svix < svmax)
8266                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8267                 precis = (i < 0) ? 0 : i;
8268             }
8269             else {
8270                 precis = 0;
8271                 while (isDIGIT(*q))
8272                     precis = precis * 10 + (*q++ - '0');
8273             }
8274             has_precis = TRUE;
8275         }
8276
8277         /* SIZE */
8278
8279         switch (*q) {
8280 #ifdef WIN32
8281         case 'I':                       /* Ix, I32x, and I64x */
8282 #  ifdef WIN64
8283             if (q[1] == '6' && q[2] == '4') {
8284                 q += 3;
8285                 intsize = 'q';
8286                 break;
8287             }
8288 #  endif
8289             if (q[1] == '3' && q[2] == '2') {
8290                 q += 3;
8291                 break;
8292             }
8293 #  ifdef WIN64
8294             intsize = 'q';
8295 #  endif
8296             q++;
8297             break;
8298 #endif
8299 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8300         case 'L':                       /* Ld */
8301             /* FALL THROUGH */
8302 #ifdef HAS_QUAD
8303         case 'q':                       /* qd */
8304 #endif
8305             intsize = 'q';
8306             q++;
8307             break;
8308 #endif
8309         case 'l':
8310 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8311             if (*(q + 1) == 'l') {      /* lld, llf */
8312                 intsize = 'q';
8313                 q += 2;
8314                 break;
8315              }
8316 #endif
8317             /* FALL THROUGH */
8318         case 'h':
8319             /* FALL THROUGH */
8320         case 'V':
8321             intsize = *q++;
8322             break;
8323         }
8324
8325         /* CONVERSION */
8326
8327         if (*q == '%') {
8328             eptr = q++;
8329             elen = 1;
8330             goto string;
8331         }
8332
8333         if (vectorize)
8334             argsv = vecsv;
8335         else if (!args) {
8336             if (efix) {
8337                 const I32 i = efix-1;
8338                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8339             } else {
8340                 argsv = (svix >= 0 && svix < svmax)
8341                     ? svargs[svix++] : &PL_sv_undef;
8342             }
8343         }
8344
8345         switch (c = *q++) {
8346
8347             /* STRINGS */
8348
8349         case 'c':
8350             uv = (args && !vectorize) ? va_arg(*args, int) : SvIVx(argsv);
8351             if ((uv > 255 ||
8352                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8353                 && !IN_BYTES) {
8354                 eptr = (char*)utf8buf;
8355                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8356                 is_utf8 = TRUE;
8357             }
8358             else {
8359                 c = (char)uv;
8360                 eptr = &c;
8361                 elen = 1;
8362             }
8363             goto string;
8364
8365         case 's':
8366             if (args && !vectorize) {
8367                 eptr = va_arg(*args, char*);
8368                 if (eptr)
8369 #ifdef MACOS_TRADITIONAL
8370                   /* On MacOS, %#s format is used for Pascal strings */
8371                   if (alt)
8372                     elen = *eptr++;
8373                   else
8374 #endif
8375                     elen = strlen(eptr);
8376                 else {
8377                     eptr = (char *)nullstr;
8378                     elen = sizeof nullstr - 1;
8379                 }
8380             }
8381             else {
8382                 eptr = SvPVx_const(argsv, elen);
8383                 if (DO_UTF8(argsv)) {
8384                     if (has_precis && precis < elen) {
8385                         I32 p = precis;
8386                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8387                         precis = p;
8388                     }
8389                     if (width) { /* fudge width (can't fudge elen) */
8390                         width += elen - sv_len_utf8(argsv);
8391                     }
8392                     is_utf8 = TRUE;
8393                 }
8394             }
8395
8396         string:
8397             vectorize = FALSE;
8398             if (has_precis && elen > precis)
8399                 elen = precis;
8400             break;
8401
8402             /* INTEGERS */
8403
8404         case 'p':
8405             if (alt || vectorize)
8406                 goto unknown;
8407             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8408             base = 16;
8409             goto integer;
8410
8411         case 'D':
8412 #ifdef IV_IS_QUAD
8413             intsize = 'q';
8414 #else
8415             intsize = 'l';
8416 #endif
8417             /* FALL THROUGH */
8418         case 'd':
8419         case 'i':
8420 #if vdNUMBER
8421         format_vd:
8422 #endif
8423             if (vectorize) {
8424                 STRLEN ulen;
8425                 if (!veclen)
8426                     continue;
8427                 if (vec_utf8)
8428                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8429                                         UTF8_ALLOW_ANYUV);
8430                 else {
8431                     uv = *vecstr;
8432                     ulen = 1;
8433                 }
8434                 vecstr += ulen;
8435                 veclen -= ulen;
8436                 if (plus)
8437                      esignbuf[esignlen++] = plus;
8438             }
8439             else if (args) {
8440                 switch (intsize) {
8441                 case 'h':       iv = (short)va_arg(*args, int); break;
8442                 case 'l':       iv = va_arg(*args, long); break;
8443                 case 'V':       iv = va_arg(*args, IV); break;
8444                 default:        iv = va_arg(*args, int); break;
8445 #ifdef HAS_QUAD
8446                 case 'q':       iv = va_arg(*args, Quad_t); break;
8447 #endif
8448                 }
8449             }
8450             else {
8451                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8452                 switch (intsize) {
8453                 case 'h':       iv = (short)tiv; break;
8454                 case 'l':       iv = (long)tiv; break;
8455                 case 'V':
8456                 default:        iv = tiv; break;
8457 #ifdef HAS_QUAD
8458                 case 'q':       iv = (Quad_t)tiv; break;
8459 #endif
8460                 }
8461             }
8462             if ( !vectorize )   /* we already set uv above */
8463             {
8464                 if (iv >= 0) {
8465                     uv = iv;
8466                     if (plus)
8467                         esignbuf[esignlen++] = plus;
8468                 }
8469                 else {
8470                     uv = -iv;
8471                     esignbuf[esignlen++] = '-';
8472                 }
8473             }
8474             base = 10;
8475             goto integer;
8476
8477         case 'U':
8478 #ifdef IV_IS_QUAD
8479             intsize = 'q';
8480 #else
8481             intsize = 'l';
8482 #endif
8483             /* FALL THROUGH */
8484         case 'u':
8485             base = 10;
8486             goto uns_integer;
8487
8488         case 'b':
8489             base = 2;
8490             goto uns_integer;
8491
8492         case 'O':
8493 #ifdef IV_IS_QUAD
8494             intsize = 'q';
8495 #else
8496             intsize = 'l';
8497 #endif
8498             /* FALL THROUGH */
8499         case 'o':
8500             base = 8;
8501             goto uns_integer;
8502
8503         case 'X':
8504         case 'x':
8505             base = 16;
8506
8507         uns_integer:
8508             if (vectorize) {
8509                 STRLEN ulen;
8510         vector:
8511                 if (!veclen)
8512                     continue;
8513                 if (vec_utf8)
8514                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8515                                         UTF8_ALLOW_ANYUV);
8516                 else {
8517                     uv = *vecstr;
8518                     ulen = 1;
8519                 }
8520                 vecstr += ulen;
8521                 veclen -= ulen;
8522             }
8523             else if (args) {
8524                 switch (intsize) {
8525                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8526                 case 'l':  uv = va_arg(*args, unsigned long); break;
8527                 case 'V':  uv = va_arg(*args, UV); break;
8528                 default:   uv = va_arg(*args, unsigned); break;
8529 #ifdef HAS_QUAD
8530                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8531 #endif
8532                 }
8533             }
8534             else {
8535                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8536                 switch (intsize) {
8537                 case 'h':       uv = (unsigned short)tuv; break;
8538                 case 'l':       uv = (unsigned long)tuv; break;
8539                 case 'V':
8540                 default:        uv = tuv; break;
8541 #ifdef HAS_QUAD
8542                 case 'q':       uv = (Uquad_t)tuv; break;
8543 #endif
8544                 }
8545             }
8546
8547         integer:
8548             {
8549                 char *ptr = ebuf + sizeof ebuf;
8550                 switch (base) {
8551                     unsigned dig;
8552                 case 16:
8553                     if (!uv)
8554                         alt = FALSE;
8555                     p = (char*)((c == 'X')
8556                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8557                     do {
8558                         dig = uv & 15;
8559                         *--ptr = p[dig];
8560                     } while (uv >>= 4);
8561                     if (alt) {
8562                         esignbuf[esignlen++] = '0';
8563                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8564                     }
8565                     break;
8566                 case 8:
8567                     do {
8568                         dig = uv & 7;
8569                         *--ptr = '0' + dig;
8570                     } while (uv >>= 3);
8571                     if (alt && *ptr != '0')
8572                         *--ptr = '0';
8573                     break;
8574                 case 2:
8575                     if (!uv)
8576                         alt = FALSE;
8577                     do {
8578                         dig = uv & 1;
8579                         *--ptr = '0' + dig;
8580                     } while (uv >>= 1);
8581                     if (alt) {
8582                         esignbuf[esignlen++] = '0';
8583                         esignbuf[esignlen++] = 'b';
8584                     }
8585                     break;
8586                 default:                /* it had better be ten or less */
8587                     do {
8588                         dig = uv % base;
8589                         *--ptr = '0' + dig;
8590                     } while (uv /= base);
8591                     break;
8592                 }
8593                 elen = (ebuf + sizeof ebuf) - ptr;
8594                 eptr = ptr;
8595                 if (has_precis) {
8596                     if (precis > elen)
8597                         zeros = precis - elen;
8598                     else if (precis == 0 && elen == 1 && *eptr == '0')
8599                         elen = 0;
8600                 }
8601             }
8602             break;
8603
8604             /* FLOATING POINT */
8605
8606         case 'F':
8607             c = 'f';            /* maybe %F isn't supported here */
8608             /* FALL THROUGH */
8609         case 'e': case 'E':
8610         case 'f':
8611         case 'g': case 'G':
8612
8613             /* This is evil, but floating point is even more evil */
8614
8615             /* for SV-style calling, we can only get NV
8616                for C-style calling, we assume %f is double;
8617                for simplicity we allow any of %Lf, %llf, %qf for long double
8618             */
8619             switch (intsize) {
8620             case 'V':
8621 #if defined(USE_LONG_DOUBLE)
8622                 intsize = 'q';
8623 #endif
8624                 break;
8625 /* [perl #20339] - we should accept and ignore %lf rather than die */
8626             case 'l':
8627                 /* FALL THROUGH */
8628             default:
8629 #if defined(USE_LONG_DOUBLE)
8630                 intsize = args ? 0 : 'q';
8631 #endif
8632                 break;
8633             case 'q':
8634 #if defined(HAS_LONG_DOUBLE)
8635                 break;
8636 #else
8637                 /* FALL THROUGH */
8638 #endif
8639             case 'h':
8640                 goto unknown;
8641             }
8642
8643             /* now we need (long double) if intsize == 'q', else (double) */
8644             nv = (args && !vectorize) ?
8645 #if LONG_DOUBLESIZE > DOUBLESIZE
8646                 intsize == 'q' ?
8647                     va_arg(*args, long double) :
8648                     va_arg(*args, double)
8649 #else
8650                     va_arg(*args, double)
8651 #endif
8652                 : SvNVx(argsv);
8653
8654             need = 0;
8655             vectorize = FALSE;
8656             if (c != 'e' && c != 'E') {
8657                 i = PERL_INT_MIN;
8658                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8659                    will cast our (long double) to (double) */
8660                 (void)Perl_frexp(nv, &i);
8661                 if (i == PERL_INT_MIN)
8662                     Perl_die(aTHX_ "panic: frexp");
8663                 if (i > 0)
8664                     need = BIT_DIGITS(i);
8665             }
8666             need += has_precis ? precis : 6; /* known default */
8667
8668             if (need < width)
8669                 need = width;
8670
8671 #ifdef HAS_LDBL_SPRINTF_BUG
8672             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8673                with sfio - Allen <allens@cpan.org> */
8674
8675 #  ifdef DBL_MAX
8676 #    define MY_DBL_MAX DBL_MAX
8677 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8678 #    if DOUBLESIZE >= 8
8679 #      define MY_DBL_MAX 1.7976931348623157E+308L
8680 #    else
8681 #      define MY_DBL_MAX 3.40282347E+38L
8682 #    endif
8683 #  endif
8684
8685 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8686 #    define MY_DBL_MAX_BUG 1L
8687 #  else
8688 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8689 #  endif
8690
8691 #  ifdef DBL_MIN
8692 #    define MY_DBL_MIN DBL_MIN
8693 #  else  /* XXX guessing! -Allen */
8694 #    if DOUBLESIZE >= 8
8695 #      define MY_DBL_MIN 2.2250738585072014E-308L
8696 #    else
8697 #      define MY_DBL_MIN 1.17549435E-38L
8698 #    endif
8699 #  endif
8700
8701             if ((intsize == 'q') && (c == 'f') &&
8702                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8703                 (need < DBL_DIG)) {
8704                 /* it's going to be short enough that
8705                  * long double precision is not needed */
8706
8707                 if ((nv <= 0L) && (nv >= -0L))
8708                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8709                 else {
8710                     /* would use Perl_fp_class as a double-check but not
8711                      * functional on IRIX - see perl.h comments */
8712
8713                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8714                         /* It's within the range that a double can represent */
8715 #if defined(DBL_MAX) && !defined(DBL_MIN)
8716                         if ((nv >= ((long double)1/DBL_MAX)) ||
8717                             (nv <= (-(long double)1/DBL_MAX)))
8718 #endif
8719                         fix_ldbl_sprintf_bug = TRUE;
8720                     }
8721                 }
8722                 if (fix_ldbl_sprintf_bug == TRUE) {
8723                     double temp;
8724
8725                     intsize = 0;
8726                     temp = (double)nv;
8727                     nv = (NV)temp;
8728                 }
8729             }
8730
8731 #  undef MY_DBL_MAX
8732 #  undef MY_DBL_MAX_BUG
8733 #  undef MY_DBL_MIN
8734
8735 #endif /* HAS_LDBL_SPRINTF_BUG */
8736
8737             need += 20; /* fudge factor */
8738             if (PL_efloatsize < need) {
8739                 Safefree(PL_efloatbuf);
8740                 PL_efloatsize = need + 20; /* more fudge */
8741                 Newx(PL_efloatbuf, PL_efloatsize, char);
8742                 PL_efloatbuf[0] = '\0';
8743             }
8744
8745             if ( !(width || left || plus || alt) && fill != '0'
8746                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8747                 /* See earlier comment about buggy Gconvert when digits,
8748                    aka precis is 0  */
8749                 if ( c == 'g' && precis) {
8750                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8751                     /* May return an empty string for digits==0 */
8752                     if (*PL_efloatbuf) {
8753                         elen = strlen(PL_efloatbuf);
8754                         goto float_converted;
8755                     }
8756                 } else if ( c == 'f' && !precis) {
8757                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8758                         break;
8759                 }
8760             }
8761             {
8762                 char *ptr = ebuf + sizeof ebuf;
8763                 *--ptr = '\0';
8764                 *--ptr = c;
8765                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8766 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8767                 if (intsize == 'q') {
8768                     /* Copy the one or more characters in a long double
8769                      * format before the 'base' ([efgEFG]) character to
8770                      * the format string. */
8771                     static char const prifldbl[] = PERL_PRIfldbl;
8772                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8773                     while (p >= prifldbl) { *--ptr = *p--; }
8774                 }
8775 #endif
8776                 if (has_precis) {
8777                     base = precis;
8778                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8779                     *--ptr = '.';
8780                 }
8781                 if (width) {
8782                     base = width;
8783                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8784                 }
8785                 if (fill == '0')
8786                     *--ptr = fill;
8787                 if (left)
8788                     *--ptr = '-';
8789                 if (plus)
8790                     *--ptr = plus;
8791                 if (alt)
8792                     *--ptr = '#';
8793                 *--ptr = '%';
8794
8795                 /* No taint.  Otherwise we are in the strange situation
8796                  * where printf() taints but print($float) doesn't.
8797                  * --jhi */
8798 #if defined(HAS_LONG_DOUBLE)
8799                 elen = ((intsize == 'q')
8800                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8801                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8802 #else
8803                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8804 #endif
8805             }
8806         float_converted:
8807             eptr = PL_efloatbuf;
8808             break;
8809
8810             /* SPECIAL */
8811
8812         case 'n':
8813             i = SvCUR(sv) - origlen;
8814             if (args && !vectorize) {
8815                 switch (intsize) {
8816                 case 'h':       *(va_arg(*args, short*)) = i; break;
8817                 default:        *(va_arg(*args, int*)) = i; break;
8818                 case 'l':       *(va_arg(*args, long*)) = i; break;
8819                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8820 #ifdef HAS_QUAD
8821                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8822 #endif
8823                 }
8824             }
8825             else
8826                 sv_setuv_mg(argsv, (UV)i);
8827             vectorize = FALSE;
8828             continue;   /* not "break" */
8829
8830             /* UNKNOWN */
8831
8832         default:
8833       unknown:
8834             if (!args
8835                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8836                 && ckWARN(WARN_PRINTF))
8837             {
8838                 SV * const msg = sv_newmortal();
8839                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8840                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8841                 if (c) {
8842                     if (isPRINT(c))
8843                         Perl_sv_catpvf(aTHX_ msg,
8844                                        "\"%%%c\"", c & 0xFF);
8845                     else
8846                         Perl_sv_catpvf(aTHX_ msg,
8847                                        "\"%%\\%03"UVof"\"",
8848                                        (UV)c & 0xFF);
8849                 } else
8850                     sv_catpv(msg, "end of string");
8851                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8852             }
8853
8854             /* output mangled stuff ... */
8855             if (c == '\0')
8856                 --q;
8857             eptr = p;
8858             elen = q - p;
8859
8860             /* ... right here, because formatting flags should not apply */
8861             SvGROW(sv, SvCUR(sv) + elen + 1);
8862             p = SvEND(sv);
8863             Copy(eptr, p, elen, char);
8864             p += elen;
8865             *p = '\0';
8866             SvCUR_set(sv, p - SvPVX_const(sv));
8867             svix = osvix;
8868             continue;   /* not "break" */
8869         }
8870
8871         /* calculate width before utf8_upgrade changes it */
8872         have = esignlen + zeros + elen;
8873         if (have < zeros)
8874             Perl_croak_nocontext(PL_memory_wrap);
8875
8876         if (is_utf8 != has_utf8) {
8877              if (is_utf8) {
8878                   if (SvCUR(sv))
8879                        sv_utf8_upgrade(sv);
8880              }
8881              else {
8882                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8883                   sv_utf8_upgrade(nsv);
8884                   eptr = SvPVX_const(nsv);
8885                   elen = SvCUR(nsv);
8886              }
8887              SvGROW(sv, SvCUR(sv) + elen + 1);
8888              p = SvEND(sv);
8889              *p = '\0';
8890         }
8891
8892         need = (have > width ? have : width);
8893         gap = need - have;
8894
8895         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8896             Perl_croak_nocontext(PL_memory_wrap);
8897         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8898         p = SvEND(sv);
8899         if (esignlen && fill == '0') {
8900             int i;
8901             for (i = 0; i < (int)esignlen; i++)
8902                 *p++ = esignbuf[i];
8903         }
8904         if (gap && !left) {
8905             memset(p, fill, gap);
8906             p += gap;
8907         }
8908         if (esignlen && fill != '0') {
8909             int i;
8910             for (i = 0; i < (int)esignlen; i++)
8911                 *p++ = esignbuf[i];
8912         }
8913         if (zeros) {
8914             int i;
8915             for (i = zeros; i; i--)
8916                 *p++ = '0';
8917         }
8918         if (elen) {
8919             Copy(eptr, p, elen, char);
8920             p += elen;
8921         }
8922         if (gap && left) {
8923             memset(p, ' ', gap);
8924             p += gap;
8925         }
8926         if (vectorize) {
8927             if (veclen) {
8928                 Copy(dotstr, p, dotstrlen, char);
8929                 p += dotstrlen;
8930             }
8931             else
8932                 vectorize = FALSE;              /* done iterating over vecstr */
8933         }
8934         if (is_utf8)
8935             has_utf8 = TRUE;
8936         if (has_utf8)
8937             SvUTF8_on(sv);
8938         *p = '\0';
8939         SvCUR_set(sv, p - SvPVX_const(sv));
8940         if (vectorize) {
8941             esignlen = 0;
8942             goto vector;
8943         }
8944     }
8945 }
8946
8947 /* =========================================================================
8948
8949 =head1 Cloning an interpreter
8950
8951 All the macros and functions in this section are for the private use of
8952 the main function, perl_clone().
8953
8954 The foo_dup() functions make an exact copy of an existing foo thinngy.
8955 During the course of a cloning, a hash table is used to map old addresses
8956 to new addresses. The table is created and manipulated with the
8957 ptr_table_* functions.
8958
8959 =cut
8960
8961 ============================================================================*/
8962
8963
8964 #if defined(USE_ITHREADS)
8965
8966 #ifndef GpREFCNT_inc
8967 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8968 #endif
8969
8970
8971 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8972 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8973 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8974 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8975 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8976 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8977 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8978 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8979 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8980 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8981 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8982 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8983 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8984
8985
8986 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8987    regcomp.c. AMS 20010712 */
8988
8989 REGEXP *
8990 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8991 {
8992     dVAR;
8993     REGEXP *ret;
8994     int i, len, npar;
8995     struct reg_substr_datum *s;
8996
8997     if (!r)
8998         return (REGEXP *)NULL;
8999
9000     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
9001         return ret;
9002
9003     len = r->offsets[0];
9004     npar = r->nparens+1;
9005
9006     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
9007     Copy(r->program, ret->program, len+1, regnode);
9008
9009     Newx(ret->startp, npar, I32);
9010     Copy(r->startp, ret->startp, npar, I32);
9011     Newx(ret->endp, npar, I32);
9012     Copy(r->startp, ret->startp, npar, I32);
9013
9014     Newx(ret->substrs, 1, struct reg_substr_data);
9015     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
9016         s->min_offset = r->substrs->data[i].min_offset;
9017         s->max_offset = r->substrs->data[i].max_offset;
9018         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
9019         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
9020     }
9021
9022     ret->regstclass = NULL;
9023     if (r->data) {
9024         struct reg_data *d;
9025         const int count = r->data->count;
9026         int i;
9027
9028         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
9029                 char, struct reg_data);
9030         Newx(d->what, count, U8);
9031
9032         d->count = count;
9033         for (i = 0; i < count; i++) {
9034             d->what[i] = r->data->what[i];
9035             switch (d->what[i]) {
9036                 /* legal options are one of: sfpont
9037                    see also regcomp.h and pregfree() */
9038             case 's':
9039                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
9040                 break;
9041             case 'p':
9042                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
9043                 break;
9044             case 'f':
9045                 /* This is cheating. */
9046                 Newx(d->data[i], 1, struct regnode_charclass_class);
9047                 StructCopy(r->data->data[i], d->data[i],
9048                             struct regnode_charclass_class);
9049                 ret->regstclass = (regnode*)d->data[i];
9050                 break;
9051             case 'o':
9052                 /* Compiled op trees are readonly, and can thus be
9053                    shared without duplication. */
9054                 OP_REFCNT_LOCK;
9055                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
9056                 OP_REFCNT_UNLOCK;
9057                 break;
9058             case 'n':
9059                 d->data[i] = r->data->data[i];
9060                 break;
9061             case 't':
9062                 d->data[i] = r->data->data[i];
9063                 OP_REFCNT_LOCK;
9064                 ((reg_trie_data*)d->data[i])->refcount++;
9065                 OP_REFCNT_UNLOCK;
9066                 break;
9067             default:
9068                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
9069             }
9070         }
9071
9072         ret->data = d;
9073     }
9074     else
9075         ret->data = NULL;
9076
9077     Newx(ret->offsets, 2*len+1, U32);
9078     Copy(r->offsets, ret->offsets, 2*len+1, U32);
9079
9080     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
9081     ret->refcnt         = r->refcnt;
9082     ret->minlen         = r->minlen;
9083     ret->prelen         = r->prelen;
9084     ret->nparens        = r->nparens;
9085     ret->lastparen      = r->lastparen;
9086     ret->lastcloseparen = r->lastcloseparen;
9087     ret->reganch        = r->reganch;
9088
9089     ret->sublen         = r->sublen;
9090
9091     if (RX_MATCH_COPIED(ret))
9092         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
9093     else
9094         ret->subbeg = Nullch;
9095 #ifdef PERL_OLD_COPY_ON_WRITE
9096     ret->saved_copy = Nullsv;
9097 #endif
9098
9099     ptr_table_store(PL_ptr_table, r, ret);
9100     return ret;
9101 }
9102
9103 /* duplicate a file handle */
9104
9105 PerlIO *
9106 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
9107 {
9108     PerlIO *ret;
9109
9110     PERL_UNUSED_ARG(type);
9111
9112     if (!fp)
9113         return (PerlIO*)NULL;
9114
9115     /* look for it in the table first */
9116     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
9117     if (ret)
9118         return ret;
9119
9120     /* create anew and remember what it is */
9121     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
9122     ptr_table_store(PL_ptr_table, fp, ret);
9123     return ret;
9124 }
9125
9126 /* duplicate a directory handle */
9127
9128 DIR *
9129 Perl_dirp_dup(pTHX_ DIR *dp)
9130 {
9131     if (!dp)
9132         return (DIR*)NULL;
9133     /* XXX TODO */
9134     return dp;
9135 }
9136
9137 /* duplicate a typeglob */
9138
9139 GP *
9140 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
9141 {
9142     GP *ret;
9143     if (!gp)
9144         return (GP*)NULL;
9145     /* look for it in the table first */
9146     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
9147     if (ret)
9148         return ret;
9149
9150     /* create anew and remember what it is */
9151     Newxz(ret, 1, GP);
9152     ptr_table_store(PL_ptr_table, gp, ret);
9153
9154     /* clone */
9155     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
9156     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
9157     ret->gp_io          = io_dup_inc(gp->gp_io, param);
9158     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
9159     ret->gp_av          = av_dup_inc(gp->gp_av, param);
9160     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
9161     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
9162     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
9163     ret->gp_cvgen       = gp->gp_cvgen;
9164     ret->gp_line        = gp->gp_line;
9165     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
9166     return ret;
9167 }
9168
9169 /* duplicate a chain of magic */
9170
9171 MAGIC *
9172 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
9173 {
9174     MAGIC *mgprev = (MAGIC*)NULL;
9175     MAGIC *mgret;
9176     if (!mg)
9177         return (MAGIC*)NULL;
9178     /* look for it in the table first */
9179     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
9180     if (mgret)
9181         return mgret;
9182
9183     for (; mg; mg = mg->mg_moremagic) {
9184         MAGIC *nmg;
9185         Newxz(nmg, 1, MAGIC);
9186         if (mgprev)
9187             mgprev->mg_moremagic = nmg;
9188         else
9189             mgret = nmg;
9190         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
9191         nmg->mg_private = mg->mg_private;
9192         nmg->mg_type    = mg->mg_type;
9193         nmg->mg_flags   = mg->mg_flags;
9194         if (mg->mg_type == PERL_MAGIC_qr) {
9195             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
9196         }
9197         else if(mg->mg_type == PERL_MAGIC_backref) {
9198             const AV * const av = (AV*) mg->mg_obj;
9199             SV **svp;
9200             I32 i;
9201             (void)SvREFCNT_inc(nmg->mg_obj = (SV*)newAV());
9202             svp = AvARRAY(av);
9203             for (i = AvFILLp(av); i >= 0; i--) {
9204                 if (!svp[i]) continue;
9205                 av_push((AV*)nmg->mg_obj,sv_dup(svp[i],param));
9206             }
9207         }
9208         else if (mg->mg_type == PERL_MAGIC_symtab) {
9209             nmg->mg_obj = mg->mg_obj;
9210         }
9211         else {
9212             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9213                               ? sv_dup_inc(mg->mg_obj, param)
9214                               : sv_dup(mg->mg_obj, param);
9215         }
9216         nmg->mg_len     = mg->mg_len;
9217         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9218         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9219             if (mg->mg_len > 0) {
9220                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9221                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9222                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9223                 {
9224                     AMT * const amtp = (AMT*)mg->mg_ptr;
9225                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9226                     I32 i;
9227                     for (i = 1; i < NofAMmeth; i++) {
9228                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9229                     }
9230                 }
9231             }
9232             else if (mg->mg_len == HEf_SVKEY)
9233                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9234         }
9235         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9236             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9237         }
9238         mgprev = nmg;
9239     }
9240     return mgret;
9241 }
9242
9243 /* create a new pointer-mapping table */
9244
9245 PTR_TBL_t *
9246 Perl_ptr_table_new(pTHX)
9247 {
9248     PTR_TBL_t *tbl;
9249     Newxz(tbl, 1, PTR_TBL_t);
9250     tbl->tbl_max        = 511;
9251     tbl->tbl_items      = 0;
9252     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9253     return tbl;
9254 }
9255
9256 #if (PTRSIZE == 8)
9257 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 3)
9258 #else
9259 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 2)
9260 #endif
9261
9262 /* 
9263    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9264    following define) and at call to new_body_inline made below in 
9265    Perl_ptr_table_store()
9266  */
9267
9268 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9269
9270 /* map an existing pointer using a table */
9271
9272 void *
9273 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9274 {
9275     PTR_TBL_ENT_t *tblent;
9276     const UV hash = PTR_TABLE_HASH(sv);
9277     assert(tbl);
9278     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9279     for (; tblent; tblent = tblent->next) {
9280         if (tblent->oldval == sv)
9281             return tblent->newval;
9282     }
9283     return (void*)NULL;
9284 }
9285
9286 /* add a new entry to a pointer-mapping table */
9287
9288 void
9289 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9290 {
9291     PTR_TBL_ENT_t *tblent, **otblent;
9292     /* XXX this may be pessimal on platforms where pointers aren't good
9293      * hash values e.g. if they grow faster in the most significant
9294      * bits */
9295     const UV hash = PTR_TABLE_HASH(oldsv);
9296     bool empty = 1;
9297
9298     assert(tbl);
9299     otblent = &tbl->tbl_ary[hash & tbl->tbl_max];
9300     for (tblent = *otblent; tblent; empty=0, tblent = tblent->next) {
9301         if (tblent->oldval == oldsv) {
9302             tblent->newval = newsv;
9303             return;
9304         }
9305     }
9306     new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9307     tblent->oldval = oldsv;
9308     tblent->newval = newsv;
9309     tblent->next = *otblent;
9310     *otblent = tblent;
9311     tbl->tbl_items++;
9312     if (!empty && tbl->tbl_items > tbl->tbl_max)
9313         ptr_table_split(tbl);
9314 }
9315
9316 /* double the hash bucket size of an existing ptr table */
9317
9318 void
9319 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9320 {
9321     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9322     const UV oldsize = tbl->tbl_max + 1;
9323     UV newsize = oldsize * 2;
9324     UV i;
9325
9326     Renew(ary, newsize, PTR_TBL_ENT_t*);
9327     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9328     tbl->tbl_max = --newsize;
9329     tbl->tbl_ary = ary;
9330     for (i=0; i < oldsize; i++, ary++) {
9331         PTR_TBL_ENT_t **curentp, **entp, *ent;
9332         if (!*ary)
9333             continue;
9334         curentp = ary + oldsize;
9335         for (entp = ary, ent = *ary; ent; ent = *entp) {
9336             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9337                 *entp = ent->next;
9338                 ent->next = *curentp;
9339                 *curentp = ent;
9340                 continue;
9341             }
9342             else
9343                 entp = &ent->next;
9344         }
9345     }
9346 }
9347
9348 /* remove all the entries from a ptr table */
9349
9350 void
9351 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9352 {
9353     register PTR_TBL_ENT_t **array;
9354     register PTR_TBL_ENT_t *entry;
9355     UV riter = 0;
9356     UV max;
9357
9358     if (!tbl || !tbl->tbl_items) {
9359         return;
9360     }
9361
9362     array = tbl->tbl_ary;
9363     entry = array[0];
9364     max = tbl->tbl_max;
9365
9366     for (;;) {
9367         if (entry) {
9368             PTR_TBL_ENT_t *oentry = entry;
9369             entry = entry->next;
9370             del_pte(oentry);
9371         }
9372         if (!entry) {
9373             if (++riter > max) {
9374                 break;
9375             }
9376             entry = array[riter];
9377         }
9378     }
9379
9380     tbl->tbl_items = 0;
9381 }
9382
9383 /* clear and free a ptr table */
9384
9385 void
9386 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9387 {
9388     if (!tbl) {
9389         return;
9390     }
9391     ptr_table_clear(tbl);
9392     Safefree(tbl->tbl_ary);
9393     Safefree(tbl);
9394 }
9395
9396
9397 void
9398 Perl_rvpv_dup(pTHX_ SV *dstr, SV *sstr, CLONE_PARAMS* param)
9399 {
9400     if (SvROK(sstr)) {
9401         SvRV_set(dstr, SvWEAKREF(sstr)
9402                        ? sv_dup(SvRV(sstr), param)
9403                        : sv_dup_inc(SvRV(sstr), param));
9404
9405     }
9406     else if (SvPVX_const(sstr)) {
9407         /* Has something there */
9408         if (SvLEN(sstr)) {
9409             /* Normal PV - clone whole allocated space */
9410             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9411             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9412                 /* Not that normal - actually sstr is copy on write.
9413                    But we are a true, independant SV, so:  */
9414                 SvREADONLY_off(dstr);
9415                 SvFAKE_off(dstr);
9416             }
9417         }
9418         else {
9419             /* Special case - not normally malloced for some reason */
9420             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9421                 /* A "shared" PV - clone it as "shared" PV */
9422                 SvPV_set(dstr,
9423                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9424                                          param)));
9425             }
9426             else {
9427                 /* Some other special case - random pointer */
9428                 SvPV_set(dstr, SvPVX(sstr));            
9429             }
9430         }
9431     }
9432     else {
9433         /* Copy the Null */
9434         if (SvTYPE(dstr) == SVt_RV)
9435             SvRV_set(dstr, NULL);
9436         else
9437             SvPV_set(dstr, 0);
9438     }
9439 }
9440
9441 /* duplicate an SV of any type (including AV, HV etc) */
9442
9443 SV *
9444 Perl_sv_dup(pTHX_ SV *sstr, CLONE_PARAMS* param)
9445 {
9446     dVAR;
9447     SV *dstr;
9448
9449     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9450         return Nullsv;
9451     /* look for it in the table first */
9452     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9453     if (dstr)
9454         return dstr;
9455
9456     if(param->flags & CLONEf_JOIN_IN) {
9457         /** We are joining here so we don't want do clone
9458             something that is bad **/
9459         const char *hvname;
9460
9461         if(SvTYPE(sstr) == SVt_PVHV &&
9462            (hvname = HvNAME_get(sstr))) {
9463             /** don't clone stashes if they already exist **/
9464             return (SV*)gv_stashpv(hvname,0);
9465         }
9466     }
9467
9468     /* create anew and remember what it is */
9469     new_SV(dstr);
9470
9471 #ifdef DEBUG_LEAKING_SCALARS
9472     dstr->sv_debug_optype = sstr->sv_debug_optype;
9473     dstr->sv_debug_line = sstr->sv_debug_line;
9474     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9475     dstr->sv_debug_cloned = 1;
9476 #  ifdef NETWARE
9477     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9478 #  else
9479     dstr->sv_debug_file = savesharedpv(sstr->sv_debug_file);
9480 #  endif
9481 #endif
9482
9483     ptr_table_store(PL_ptr_table, sstr, dstr);
9484
9485     /* clone */
9486     SvFLAGS(dstr)       = SvFLAGS(sstr);
9487     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9488     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9489
9490 #ifdef DEBUGGING
9491     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9492         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9493                       PL_watch_pvx, SvPVX_const(sstr));
9494 #endif
9495
9496     /* don't clone objects whose class has asked us not to */
9497     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9498         SvFLAGS(dstr) &= ~SVTYPEMASK;
9499         SvOBJECT_off(dstr);
9500         return dstr;
9501     }
9502
9503     switch (SvTYPE(sstr)) {
9504     case SVt_NULL:
9505         SvANY(dstr)     = NULL;
9506         break;
9507     case SVt_IV:
9508         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9509         SvIV_set(dstr, SvIVX(sstr));
9510         break;
9511     case SVt_NV:
9512         SvANY(dstr)     = new_XNV();
9513         SvNV_set(dstr, SvNVX(sstr));
9514         break;
9515     case SVt_RV:
9516         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9517         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9518         break;
9519     default:
9520         {
9521             /* These are all the types that need complex bodies allocating.  */
9522             void *new_body;
9523             const svtype sv_type = SvTYPE(sstr);
9524             const struct body_details *const sv_type_details
9525                 = bodies_by_type + sv_type;
9526
9527             switch (sv_type) {
9528             default:
9529                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9530                            (IV)SvTYPE(sstr));
9531                 break;
9532
9533             case SVt_PVGV:
9534                 if (GvUNIQUE((GV*)sstr)) {
9535                     /* Do sharing here, and fall through */
9536                 }
9537             case SVt_PVIO:
9538             case SVt_PVFM:
9539             case SVt_PVHV:
9540             case SVt_PVAV:
9541             case SVt_PVBM:
9542             case SVt_PVCV:
9543             case SVt_PVLV:
9544             case SVt_PVMG:
9545             case SVt_PVNV:
9546             case SVt_PVIV:
9547             case SVt_PV:
9548                 assert(sv_type_details->copy);
9549                 if (sv_type_details->arena) {
9550                     new_body_inline(new_body, sv_type_details->copy, sv_type);
9551                     new_body
9552                         = (void*)((char*)new_body - sv_type_details->offset);
9553                 } else {
9554                     new_body = new_NOARENA(sv_type_details);
9555                 }
9556             }
9557             assert(new_body);
9558             SvANY(dstr) = new_body;
9559
9560 #ifndef PURIFY
9561             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9562                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9563                  sv_type_details->copy, char);
9564 #else
9565             Copy(((char*)SvANY(sstr)),
9566                  ((char*)SvANY(dstr)),
9567                  sv_type_details->size + sv_type_details->offset, char);
9568 #endif
9569
9570             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9571                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9572
9573             /* The Copy above means that all the source (unduplicated) pointers
9574                are now in the destination.  We can check the flags and the
9575                pointers in either, but it's possible that there's less cache
9576                missing by always going for the destination.
9577                FIXME - instrument and check that assumption  */
9578             if (sv_type >= SVt_PVMG) {
9579                 if (SvMAGIC(dstr))
9580                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9581                 if (SvSTASH(dstr))
9582                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9583             }
9584
9585             /* The cast silences a GCC warning about unhandled types.  */
9586             switch ((int)sv_type) {
9587             case SVt_PV:
9588                 break;
9589             case SVt_PVIV:
9590                 break;
9591             case SVt_PVNV:
9592                 break;
9593             case SVt_PVMG:
9594                 break;
9595             case SVt_PVBM:
9596                 break;
9597             case SVt_PVLV:
9598                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9599                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9600                     LvTARG(dstr) = dstr;
9601                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9602                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9603                 else
9604                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9605                 break;
9606             case SVt_PVGV:
9607                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9608                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9609                 /* Don't call sv_add_backref here as it's going to be created
9610                    as part of the magic cloning of the symbol table.  */
9611                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9612                 (void)GpREFCNT_inc(GvGP(dstr));
9613                 break;
9614             case SVt_PVIO:
9615                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9616                 if (IoOFP(dstr) == IoIFP(sstr))
9617                     IoOFP(dstr) = IoIFP(dstr);
9618                 else
9619                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9620                 /* PL_rsfp_filters entries have fake IoDIRP() */
9621                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9622                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9623                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9624                     /* I have no idea why fake dirp (rsfps)
9625                        should be treated differently but otherwise
9626                        we end up with leaks -- sky*/
9627                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9628                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9629                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9630                 } else {
9631                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9632                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9633                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9634                 }
9635                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9636                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9637                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9638                 break;
9639             case SVt_PVAV:
9640                 if (AvARRAY((AV*)sstr)) {
9641                     SV **dst_ary, **src_ary;
9642                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9643
9644                     src_ary = AvARRAY((AV*)sstr);
9645                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9646                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9647                     SvPV_set(dstr, (char*)dst_ary);
9648                     AvALLOC((AV*)dstr) = dst_ary;
9649                     if (AvREAL((AV*)sstr)) {
9650                         while (items-- > 0)
9651                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9652                     }
9653                     else {
9654                         while (items-- > 0)
9655                             *dst_ary++ = sv_dup(*src_ary++, param);
9656                     }
9657                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9658                     while (items-- > 0) {
9659                         *dst_ary++ = &PL_sv_undef;
9660                     }
9661                 }
9662                 else {
9663                     SvPV_set(dstr, Nullch);
9664                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9665                 }
9666                 break;
9667             case SVt_PVHV:
9668                 {
9669                     HEK *hvname = 0;
9670
9671                     if (HvARRAY((HV*)sstr)) {
9672                         STRLEN i = 0;
9673                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9674                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9675                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9676                         char *darray;
9677                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9678                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9679                             char);
9680                         HvARRAY(dstr) = (HE**)darray;
9681                         while (i <= sxhv->xhv_max) {
9682                             const HE *source = HvARRAY(sstr)[i];
9683                             HvARRAY(dstr)[i] = source
9684                                 ? he_dup(source, sharekeys, param) : 0;
9685                             ++i;
9686                         }
9687                         if (SvOOK(sstr)) {
9688                             struct xpvhv_aux *saux = HvAUX(sstr);
9689                             struct xpvhv_aux *daux = HvAUX(dstr);
9690                             /* This flag isn't copied.  */
9691                             /* SvOOK_on(hv) attacks the IV flags.  */
9692                             SvFLAGS(dstr) |= SVf_OOK;
9693
9694                             hvname = saux->xhv_name;
9695                             daux->xhv_name
9696                                 = hvname ? hek_dup(hvname, param) : hvname;
9697
9698                             daux->xhv_riter = saux->xhv_riter;
9699                             daux->xhv_eiter = saux->xhv_eiter
9700                                 ? he_dup(saux->xhv_eiter,
9701                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9702                         }
9703                     }
9704                     else {
9705                         SvPV_set(dstr, Nullch);
9706                     }
9707                     /* Record stashes for possible cloning in Perl_clone(). */
9708                     if(hvname)
9709                         av_push(param->stashes, dstr);
9710                 }
9711                 break;
9712             case SVt_PVFM:
9713             case SVt_PVCV:
9714                 /* NOTE: not refcounted */
9715                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9716                 OP_REFCNT_LOCK;
9717                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9718                 OP_REFCNT_UNLOCK;
9719                 if (CvCONST(dstr)) {
9720                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9721                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9722                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9723                 }
9724                 /* don't dup if copying back - CvGV isn't refcounted, so the
9725                  * duped GV may never be freed. A bit of a hack! DAPM */
9726                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9727                     Nullgv : gv_dup(CvGV(dstr), param) ;
9728                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9729                     CvDEPTH(dstr) = 0;
9730                 }
9731                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9732                 CvOUTSIDE(dstr) =
9733                     CvWEAKOUTSIDE(sstr)
9734                     ? cv_dup(    CvOUTSIDE(dstr), param)
9735                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9736                 if (!CvXSUB(dstr))
9737                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9738                 break;
9739             }
9740         }
9741     }
9742
9743     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9744         ++PL_sv_objcount;
9745
9746     return dstr;
9747  }
9748
9749 /* duplicate a context */
9750
9751 PERL_CONTEXT *
9752 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9753 {
9754     PERL_CONTEXT *ncxs;
9755
9756     if (!cxs)
9757         return (PERL_CONTEXT*)NULL;
9758
9759     /* look for it in the table first */
9760     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9761     if (ncxs)
9762         return ncxs;
9763
9764     /* create anew and remember what it is */
9765     Newxz(ncxs, max + 1, PERL_CONTEXT);
9766     ptr_table_store(PL_ptr_table, cxs, ncxs);
9767
9768     while (ix >= 0) {
9769         PERL_CONTEXT *cx = &cxs[ix];
9770         PERL_CONTEXT *ncx = &ncxs[ix];
9771         ncx->cx_type    = cx->cx_type;
9772         if (CxTYPE(cx) == CXt_SUBST) {
9773             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9774         }
9775         else {
9776             ncx->blk_oldsp      = cx->blk_oldsp;
9777             ncx->blk_oldcop     = cx->blk_oldcop;
9778             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9779             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9780             ncx->blk_oldpm      = cx->blk_oldpm;
9781             ncx->blk_gimme      = cx->blk_gimme;
9782             switch (CxTYPE(cx)) {
9783             case CXt_SUB:
9784                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9785                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9786                                            : cv_dup(cx->blk_sub.cv,param));
9787                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9788                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9789                                            : Nullav);
9790                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9791                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9792                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9793                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9794                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9795                 break;
9796             case CXt_EVAL:
9797                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9798                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9799                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9800                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9801                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9802                 ncx->blk_eval.retop = cx->blk_eval.retop;
9803                 break;
9804             case CXt_LOOP:
9805                 ncx->blk_loop.label     = cx->blk_loop.label;
9806                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9807                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9808                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9809                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9810                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9811                                            ? cx->blk_loop.iterdata
9812                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9813                 ncx->blk_loop.oldcomppad
9814                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9815                                             cx->blk_loop.oldcomppad);
9816                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9817                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9818                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9819                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9820                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9821                 break;
9822             case CXt_FORMAT:
9823                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9824                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9825                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9826                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9827                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9828                 break;
9829             case CXt_BLOCK:
9830             case CXt_NULL:
9831                 break;
9832             }
9833         }
9834         --ix;
9835     }
9836     return ncxs;
9837 }
9838
9839 /* duplicate a stack info structure */
9840
9841 PERL_SI *
9842 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9843 {
9844     PERL_SI *nsi;
9845
9846     if (!si)
9847         return (PERL_SI*)NULL;
9848
9849     /* look for it in the table first */
9850     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9851     if (nsi)
9852         return nsi;
9853
9854     /* create anew and remember what it is */
9855     Newxz(nsi, 1, PERL_SI);
9856     ptr_table_store(PL_ptr_table, si, nsi);
9857
9858     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9859     nsi->si_cxix        = si->si_cxix;
9860     nsi->si_cxmax       = si->si_cxmax;
9861     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9862     nsi->si_type        = si->si_type;
9863     nsi->si_prev        = si_dup(si->si_prev, param);
9864     nsi->si_next        = si_dup(si->si_next, param);
9865     nsi->si_markoff     = si->si_markoff;
9866
9867     return nsi;
9868 }
9869
9870 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9871 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9872 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9873 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9874 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9875 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9876 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9877 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9878 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9879 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9880 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9881 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9882 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9883 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9884
9885 /* XXXXX todo */
9886 #define pv_dup_inc(p)   SAVEPV(p)
9887 #define pv_dup(p)       SAVEPV(p)
9888 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9889
9890 /* map any object to the new equivent - either something in the
9891  * ptr table, or something in the interpreter structure
9892  */
9893
9894 void *
9895 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9896 {
9897     void *ret;
9898
9899     if (!v)
9900         return (void*)NULL;
9901
9902     /* look for it in the table first */
9903     ret = ptr_table_fetch(PL_ptr_table, v);
9904     if (ret)
9905         return ret;
9906
9907     /* see if it is part of the interpreter structure */
9908     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9909         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9910     else {
9911         ret = v;
9912     }
9913
9914     return ret;
9915 }
9916
9917 /* duplicate the save stack */
9918
9919 ANY *
9920 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9921 {
9922     ANY * const ss      = proto_perl->Tsavestack;
9923     const I32 max       = proto_perl->Tsavestack_max;
9924     I32 ix              = proto_perl->Tsavestack_ix;
9925     ANY *nss;
9926     SV *sv;
9927     GV *gv;
9928     AV *av;
9929     HV *hv;
9930     void* ptr;
9931     int intval;
9932     long longval;
9933     GP *gp;
9934     IV iv;
9935     char *c = NULL;
9936     void (*dptr) (void*);
9937     void (*dxptr) (pTHX_ void*);
9938
9939     Newxz(nss, max, ANY);
9940
9941     while (ix > 0) {
9942         I32 i = POPINT(ss,ix);
9943         TOPINT(nss,ix) = i;
9944         switch (i) {
9945         case SAVEt_ITEM:                        /* normal string */
9946             sv = (SV*)POPPTR(ss,ix);
9947             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9948             sv = (SV*)POPPTR(ss,ix);
9949             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9950             break;
9951         case SAVEt_SV:                          /* scalar reference */
9952             sv = (SV*)POPPTR(ss,ix);
9953             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9954             gv = (GV*)POPPTR(ss,ix);
9955             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9956             break;
9957         case SAVEt_GENERIC_PVREF:               /* generic char* */
9958             c = (char*)POPPTR(ss,ix);
9959             TOPPTR(nss,ix) = pv_dup(c);
9960             ptr = POPPTR(ss,ix);
9961             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9962             break;
9963         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9964             c = (char*)POPPTR(ss,ix);
9965             TOPPTR(nss,ix) = savesharedpv(c);
9966             ptr = POPPTR(ss,ix);
9967             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9968             break;
9969         case SAVEt_GENERIC_SVREF:               /* generic sv */
9970         case SAVEt_SVREF:                       /* scalar reference */
9971             sv = (SV*)POPPTR(ss,ix);
9972             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9973             ptr = POPPTR(ss,ix);
9974             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9975             break;
9976         case SAVEt_AV:                          /* array reference */
9977             av = (AV*)POPPTR(ss,ix);
9978             TOPPTR(nss,ix) = av_dup_inc(av, param);
9979             gv = (GV*)POPPTR(ss,ix);
9980             TOPPTR(nss,ix) = gv_dup(gv, param);
9981             break;
9982         case SAVEt_HV:                          /* hash reference */
9983             hv = (HV*)POPPTR(ss,ix);
9984             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9985             gv = (GV*)POPPTR(ss,ix);
9986             TOPPTR(nss,ix) = gv_dup(gv, param);
9987             break;
9988         case SAVEt_INT:                         /* int reference */
9989             ptr = POPPTR(ss,ix);
9990             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9991             intval = (int)POPINT(ss,ix);
9992             TOPINT(nss,ix) = intval;
9993             break;
9994         case SAVEt_LONG:                        /* long reference */
9995             ptr = POPPTR(ss,ix);
9996             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9997             longval = (long)POPLONG(ss,ix);
9998             TOPLONG(nss,ix) = longval;
9999             break;
10000         case SAVEt_I32:                         /* I32 reference */
10001         case SAVEt_I16:                         /* I16 reference */
10002         case SAVEt_I8:                          /* I8 reference */
10003             ptr = POPPTR(ss,ix);
10004             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10005             i = POPINT(ss,ix);
10006             TOPINT(nss,ix) = i;
10007             break;
10008         case SAVEt_IV:                          /* IV reference */
10009             ptr = POPPTR(ss,ix);
10010             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10011             iv = POPIV(ss,ix);
10012             TOPIV(nss,ix) = iv;
10013             break;
10014         case SAVEt_SPTR:                        /* SV* reference */
10015             ptr = POPPTR(ss,ix);
10016             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10017             sv = (SV*)POPPTR(ss,ix);
10018             TOPPTR(nss,ix) = sv_dup(sv, param);
10019             break;
10020         case SAVEt_VPTR:                        /* random* reference */
10021             ptr = POPPTR(ss,ix);
10022             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10023             ptr = POPPTR(ss,ix);
10024             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10025             break;
10026         case SAVEt_PPTR:                        /* char* reference */
10027             ptr = POPPTR(ss,ix);
10028             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10029             c = (char*)POPPTR(ss,ix);
10030             TOPPTR(nss,ix) = pv_dup(c);
10031             break;
10032         case SAVEt_HPTR:                        /* HV* reference */
10033             ptr = POPPTR(ss,ix);
10034             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10035             hv = (HV*)POPPTR(ss,ix);
10036             TOPPTR(nss,ix) = hv_dup(hv, param);
10037             break;
10038         case SAVEt_APTR:                        /* AV* reference */
10039             ptr = POPPTR(ss,ix);
10040             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10041             av = (AV*)POPPTR(ss,ix);
10042             TOPPTR(nss,ix) = av_dup(av, param);
10043             break;
10044         case SAVEt_NSTAB:
10045             gv = (GV*)POPPTR(ss,ix);
10046             TOPPTR(nss,ix) = gv_dup(gv, param);
10047             break;
10048         case SAVEt_GP:                          /* scalar reference */
10049             gp = (GP*)POPPTR(ss,ix);
10050             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
10051             (void)GpREFCNT_inc(gp);
10052             gv = (GV*)POPPTR(ss,ix);
10053             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
10054             c = (char*)POPPTR(ss,ix);
10055             TOPPTR(nss,ix) = pv_dup(c);
10056             iv = POPIV(ss,ix);
10057             TOPIV(nss,ix) = iv;
10058             iv = POPIV(ss,ix);
10059             TOPIV(nss,ix) = iv;
10060             break;
10061         case SAVEt_FREESV:
10062         case SAVEt_MORTALIZESV:
10063             sv = (SV*)POPPTR(ss,ix);
10064             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10065             break;
10066         case SAVEt_FREEOP:
10067             ptr = POPPTR(ss,ix);
10068             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
10069                 /* these are assumed to be refcounted properly */
10070                 OP *o;
10071                 switch (((OP*)ptr)->op_type) {
10072                 case OP_LEAVESUB:
10073                 case OP_LEAVESUBLV:
10074                 case OP_LEAVEEVAL:
10075                 case OP_LEAVE:
10076                 case OP_SCOPE:
10077                 case OP_LEAVEWRITE:
10078                     TOPPTR(nss,ix) = ptr;
10079                     o = (OP*)ptr;
10080                     OpREFCNT_inc(o);
10081                     break;
10082                 default:
10083                     TOPPTR(nss,ix) = Nullop;
10084                     break;
10085                 }
10086             }
10087             else
10088                 TOPPTR(nss,ix) = Nullop;
10089             break;
10090         case SAVEt_FREEPV:
10091             c = (char*)POPPTR(ss,ix);
10092             TOPPTR(nss,ix) = pv_dup_inc(c);
10093             break;
10094         case SAVEt_CLEARSV:
10095             longval = POPLONG(ss,ix);
10096             TOPLONG(nss,ix) = longval;
10097             break;
10098         case SAVEt_DELETE:
10099             hv = (HV*)POPPTR(ss,ix);
10100             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10101             c = (char*)POPPTR(ss,ix);
10102             TOPPTR(nss,ix) = pv_dup_inc(c);
10103             i = POPINT(ss,ix);
10104             TOPINT(nss,ix) = i;
10105             break;
10106         case SAVEt_DESTRUCTOR:
10107             ptr = POPPTR(ss,ix);
10108             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10109             dptr = POPDPTR(ss,ix);
10110             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
10111                                         any_dup(FPTR2DPTR(void *, dptr),
10112                                                 proto_perl));
10113             break;
10114         case SAVEt_DESTRUCTOR_X:
10115             ptr = POPPTR(ss,ix);
10116             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10117             dxptr = POPDXPTR(ss,ix);
10118             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
10119                                          any_dup(FPTR2DPTR(void *, dxptr),
10120                                                  proto_perl));
10121             break;
10122         case SAVEt_REGCONTEXT:
10123         case SAVEt_ALLOC:
10124             i = POPINT(ss,ix);
10125             TOPINT(nss,ix) = i;
10126             ix -= i;
10127             break;
10128         case SAVEt_STACK_POS:           /* Position on Perl stack */
10129             i = POPINT(ss,ix);
10130             TOPINT(nss,ix) = i;
10131             break;
10132         case SAVEt_AELEM:               /* array element */
10133             sv = (SV*)POPPTR(ss,ix);
10134             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10135             i = POPINT(ss,ix);
10136             TOPINT(nss,ix) = i;
10137             av = (AV*)POPPTR(ss,ix);
10138             TOPPTR(nss,ix) = av_dup_inc(av, param);
10139             break;
10140         case SAVEt_HELEM:               /* hash element */
10141             sv = (SV*)POPPTR(ss,ix);
10142             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10143             sv = (SV*)POPPTR(ss,ix);
10144             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10145             hv = (HV*)POPPTR(ss,ix);
10146             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10147             break;
10148         case SAVEt_OP:
10149             ptr = POPPTR(ss,ix);
10150             TOPPTR(nss,ix) = ptr;
10151             break;
10152         case SAVEt_HINTS:
10153             i = POPINT(ss,ix);
10154             TOPINT(nss,ix) = i;
10155             break;
10156         case SAVEt_COMPPAD:
10157             av = (AV*)POPPTR(ss,ix);
10158             TOPPTR(nss,ix) = av_dup(av, param);
10159             break;
10160         case SAVEt_PADSV:
10161             longval = (long)POPLONG(ss,ix);
10162             TOPLONG(nss,ix) = longval;
10163             ptr = POPPTR(ss,ix);
10164             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10165             sv = (SV*)POPPTR(ss,ix);
10166             TOPPTR(nss,ix) = sv_dup(sv, param);
10167             break;
10168         case SAVEt_BOOL:
10169             ptr = POPPTR(ss,ix);
10170             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10171             longval = (long)POPBOOL(ss,ix);
10172             TOPBOOL(nss,ix) = (bool)longval;
10173             break;
10174         case SAVEt_SET_SVFLAGS:
10175             i = POPINT(ss,ix);
10176             TOPINT(nss,ix) = i;
10177             i = POPINT(ss,ix);
10178             TOPINT(nss,ix) = i;
10179             sv = (SV*)POPPTR(ss,ix);
10180             TOPPTR(nss,ix) = sv_dup(sv, param);
10181             break;
10182         default:
10183             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
10184         }
10185     }
10186
10187     return nss;
10188 }
10189
10190
10191 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
10192  * flag to the result. This is done for each stash before cloning starts,
10193  * so we know which stashes want their objects cloned */
10194
10195 static void
10196 do_mark_cloneable_stash(pTHX_ SV *sv)
10197 {
10198     const HEK * const hvname = HvNAME_HEK((HV*)sv);
10199     if (hvname) {
10200         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
10201         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
10202         if (cloner && GvCV(cloner)) {
10203             dSP;
10204             UV status;
10205
10206             ENTER;
10207             SAVETMPS;
10208             PUSHMARK(SP);
10209             XPUSHs(sv_2mortal(newSVhek(hvname)));
10210             PUTBACK;
10211             call_sv((SV*)GvCV(cloner), G_SCALAR);
10212             SPAGAIN;
10213             status = POPu;
10214             PUTBACK;
10215             FREETMPS;
10216             LEAVE;
10217             if (status)
10218                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
10219         }
10220     }
10221 }
10222
10223
10224
10225 /*
10226 =for apidoc perl_clone
10227
10228 Create and return a new interpreter by cloning the current one.
10229
10230 perl_clone takes these flags as parameters:
10231
10232 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10233 without it we only clone the data and zero the stacks,
10234 with it we copy the stacks and the new perl interpreter is
10235 ready to run at the exact same point as the previous one.
10236 The pseudo-fork code uses COPY_STACKS while the
10237 threads->new doesn't.
10238
10239 CLONEf_KEEP_PTR_TABLE
10240 perl_clone keeps a ptr_table with the pointer of the old
10241 variable as a key and the new variable as a value,
10242 this allows it to check if something has been cloned and not
10243 clone it again but rather just use the value and increase the
10244 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10245 the ptr_table using the function
10246 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10247 reason to keep it around is if you want to dup some of your own
10248 variable who are outside the graph perl scans, example of this
10249 code is in threads.xs create
10250
10251 CLONEf_CLONE_HOST
10252 This is a win32 thing, it is ignored on unix, it tells perls
10253 win32host code (which is c++) to clone itself, this is needed on
10254 win32 if you want to run two threads at the same time,
10255 if you just want to do some stuff in a separate perl interpreter
10256 and then throw it away and return to the original one,
10257 you don't need to do anything.
10258
10259 =cut
10260 */
10261
10262 /* XXX the above needs expanding by someone who actually understands it ! */
10263 EXTERN_C PerlInterpreter *
10264 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10265
10266 PerlInterpreter *
10267 perl_clone(PerlInterpreter *proto_perl, UV flags)
10268 {
10269    dVAR;
10270 #ifdef PERL_IMPLICIT_SYS
10271
10272    /* perlhost.h so we need to call into it
10273    to clone the host, CPerlHost should have a c interface, sky */
10274
10275    if (flags & CLONEf_CLONE_HOST) {
10276        return perl_clone_host(proto_perl,flags);
10277    }
10278    return perl_clone_using(proto_perl, flags,
10279                             proto_perl->IMem,
10280                             proto_perl->IMemShared,
10281                             proto_perl->IMemParse,
10282                             proto_perl->IEnv,
10283                             proto_perl->IStdIO,
10284                             proto_perl->ILIO,
10285                             proto_perl->IDir,
10286                             proto_perl->ISock,
10287                             proto_perl->IProc);
10288 }
10289
10290 PerlInterpreter *
10291 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10292                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10293                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10294                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10295                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10296                  struct IPerlProc* ipP)
10297 {
10298     /* XXX many of the string copies here can be optimized if they're
10299      * constants; they need to be allocated as common memory and just
10300      * their pointers copied. */
10301
10302     IV i;
10303     CLONE_PARAMS clone_params;
10304     CLONE_PARAMS* param = &clone_params;
10305
10306     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10307     /* for each stash, determine whether its objects should be cloned */
10308     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10309     PERL_SET_THX(my_perl);
10310
10311 #  ifdef DEBUGGING
10312     Poison(my_perl, 1, PerlInterpreter);
10313     PL_op = Nullop;
10314     PL_curcop = (COP *)Nullop;
10315     PL_markstack = 0;
10316     PL_scopestack = 0;
10317     PL_savestack = 0;
10318     PL_savestack_ix = 0;
10319     PL_savestack_max = -1;
10320     PL_sig_pending = 0;
10321     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10322 #  else /* !DEBUGGING */
10323     Zero(my_perl, 1, PerlInterpreter);
10324 #  endif        /* DEBUGGING */
10325
10326     /* host pointers */
10327     PL_Mem              = ipM;
10328     PL_MemShared        = ipMS;
10329     PL_MemParse         = ipMP;
10330     PL_Env              = ipE;
10331     PL_StdIO            = ipStd;
10332     PL_LIO              = ipLIO;
10333     PL_Dir              = ipD;
10334     PL_Sock             = ipS;
10335     PL_Proc             = ipP;
10336 #else           /* !PERL_IMPLICIT_SYS */
10337     IV i;
10338     CLONE_PARAMS clone_params;
10339     CLONE_PARAMS* param = &clone_params;
10340     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10341     /* for each stash, determine whether its objects should be cloned */
10342     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10343     PERL_SET_THX(my_perl);
10344
10345 #    ifdef DEBUGGING
10346     Poison(my_perl, 1, PerlInterpreter);
10347     PL_op = Nullop;
10348     PL_curcop = (COP *)Nullop;
10349     PL_markstack = 0;
10350     PL_scopestack = 0;
10351     PL_savestack = 0;
10352     PL_savestack_ix = 0;
10353     PL_savestack_max = -1;
10354     PL_sig_pending = 0;
10355     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10356 #    else       /* !DEBUGGING */
10357     Zero(my_perl, 1, PerlInterpreter);
10358 #    endif      /* DEBUGGING */
10359 #endif          /* PERL_IMPLICIT_SYS */
10360     param->flags = flags;
10361     param->proto_perl = proto_perl;
10362
10363     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10364     Zero(&PL_body_roots, 1, PL_body_roots);
10365     
10366     PL_nice_chunk       = NULL;
10367     PL_nice_chunk_size  = 0;
10368     PL_sv_count         = 0;
10369     PL_sv_objcount      = 0;
10370     PL_sv_root          = Nullsv;
10371     PL_sv_arenaroot     = Nullsv;
10372
10373     PL_debug            = proto_perl->Idebug;
10374
10375     PL_hash_seed        = proto_perl->Ihash_seed;
10376     PL_rehash_seed      = proto_perl->Irehash_seed;
10377
10378 #ifdef USE_REENTRANT_API
10379     /* XXX: things like -Dm will segfault here in perlio, but doing
10380      *  PERL_SET_CONTEXT(proto_perl);
10381      * breaks too many other things
10382      */
10383     Perl_reentrant_init(aTHX);
10384 #endif
10385
10386     /* create SV map for pointer relocation */
10387     PL_ptr_table = ptr_table_new();
10388
10389     /* initialize these special pointers as early as possible */
10390     SvANY(&PL_sv_undef)         = NULL;
10391     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10392     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10393     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10394
10395     SvANY(&PL_sv_no)            = new_XPVNV();
10396     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10397     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10398                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10399     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10400     SvCUR_set(&PL_sv_no, 0);
10401     SvLEN_set(&PL_sv_no, 1);
10402     SvIV_set(&PL_sv_no, 0);
10403     SvNV_set(&PL_sv_no, 0);
10404     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10405
10406     SvANY(&PL_sv_yes)           = new_XPVNV();
10407     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10408     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10409                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10410     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10411     SvCUR_set(&PL_sv_yes, 1);
10412     SvLEN_set(&PL_sv_yes, 2);
10413     SvIV_set(&PL_sv_yes, 1);
10414     SvNV_set(&PL_sv_yes, 1);
10415     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10416
10417     /* create (a non-shared!) shared string table */
10418     PL_strtab           = newHV();
10419     HvSHAREKEYS_off(PL_strtab);
10420     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10421     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10422
10423     PL_compiling = proto_perl->Icompiling;
10424
10425     /* These two PVs will be free'd special way so must set them same way op.c does */
10426     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10427     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10428
10429     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10430     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10431
10432     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10433     if (!specialWARN(PL_compiling.cop_warnings))
10434         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10435     if (!specialCopIO(PL_compiling.cop_io))
10436         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10437     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10438
10439     /* pseudo environmental stuff */
10440     PL_origargc         = proto_perl->Iorigargc;
10441     PL_origargv         = proto_perl->Iorigargv;
10442
10443     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10444
10445     /* Set tainting stuff before PerlIO_debug can possibly get called */
10446     PL_tainting         = proto_perl->Itainting;
10447     PL_taint_warn       = proto_perl->Itaint_warn;
10448
10449 #ifdef PERLIO_LAYERS
10450     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10451     PerlIO_clone(aTHX_ proto_perl, param);
10452 #endif
10453
10454     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10455     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10456     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10457     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10458     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10459     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10460
10461     /* switches */
10462     PL_minus_c          = proto_perl->Iminus_c;
10463     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10464     PL_localpatches     = proto_perl->Ilocalpatches;
10465     PL_splitstr         = proto_perl->Isplitstr;
10466     PL_preprocess       = proto_perl->Ipreprocess;
10467     PL_minus_n          = proto_perl->Iminus_n;
10468     PL_minus_p          = proto_perl->Iminus_p;
10469     PL_minus_l          = proto_perl->Iminus_l;
10470     PL_minus_a          = proto_perl->Iminus_a;
10471     PL_minus_F          = proto_perl->Iminus_F;
10472     PL_doswitches       = proto_perl->Idoswitches;
10473     PL_dowarn           = proto_perl->Idowarn;
10474     PL_doextract        = proto_perl->Idoextract;
10475     PL_sawampersand     = proto_perl->Isawampersand;
10476     PL_unsafe           = proto_perl->Iunsafe;
10477     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10478     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10479     PL_perldb           = proto_perl->Iperldb;
10480     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10481     PL_exit_flags       = proto_perl->Iexit_flags;
10482
10483     /* magical thingies */
10484     /* XXX time(&PL_basetime) when asked for? */
10485     PL_basetime         = proto_perl->Ibasetime;
10486     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10487
10488     PL_maxsysfd         = proto_perl->Imaxsysfd;
10489     PL_multiline        = proto_perl->Imultiline;
10490     PL_statusvalue      = proto_perl->Istatusvalue;
10491 #ifdef VMS
10492     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10493 #else
10494     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10495 #endif
10496     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10497
10498     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10499     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10500     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10501
10502     /* Clone the regex array */
10503     PL_regex_padav = newAV();
10504     {
10505         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10506         SV** const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10507         IV i;
10508         av_push(PL_regex_padav,
10509                 sv_dup_inc(regexen[0],param));
10510         for(i = 1; i <= len; i++) {
10511             if(SvREPADTMP(regexen[i])) {
10512               av_push(PL_regex_padav, sv_dup_inc(regexen[i], param));
10513             } else {
10514                 av_push(PL_regex_padav,
10515                     SvREFCNT_inc(
10516                         newSViv(PTR2IV(re_dup(INT2PTR(REGEXP *,
10517                              SvIVX(regexen[i])), param)))
10518                        ));
10519             }
10520         }
10521     }
10522     PL_regex_pad = AvARRAY(PL_regex_padav);
10523
10524     /* shortcuts to various I/O objects */
10525     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10526     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10527     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10528     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10529     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10530     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10531
10532     /* shortcuts to regexp stuff */
10533     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10534
10535     /* shortcuts to misc objects */
10536     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10537
10538     /* shortcuts to debugging objects */
10539     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10540     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10541     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10542     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10543     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10544     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10545     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10546     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10547     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10548
10549     /* symbol tables */
10550     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10551     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10552     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10553     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10554     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10555
10556     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10557     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10558     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10559     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10560     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10561     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10562
10563     PL_sub_generation   = proto_perl->Isub_generation;
10564
10565     /* funky return mechanisms */
10566     PL_forkprocess      = proto_perl->Iforkprocess;
10567
10568     /* subprocess state */
10569     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10570
10571     /* internal state */
10572     PL_maxo             = proto_perl->Imaxo;
10573     if (proto_perl->Iop_mask)
10574         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10575     else
10576         PL_op_mask      = Nullch;
10577     /* PL_asserting        = proto_perl->Iasserting; */
10578
10579     /* current interpreter roots */
10580     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10581     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10582     PL_main_start       = proto_perl->Imain_start;
10583     PL_eval_root        = proto_perl->Ieval_root;
10584     PL_eval_start       = proto_perl->Ieval_start;
10585
10586     /* runtime control stuff */
10587     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10588     PL_copline          = proto_perl->Icopline;
10589
10590     PL_filemode         = proto_perl->Ifilemode;
10591     PL_lastfd           = proto_perl->Ilastfd;
10592     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10593     PL_Argv             = NULL;
10594     PL_Cmd              = Nullch;
10595     PL_gensym           = proto_perl->Igensym;
10596     PL_preambled        = proto_perl->Ipreambled;
10597     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10598     PL_laststatval      = proto_perl->Ilaststatval;
10599     PL_laststype        = proto_perl->Ilaststype;
10600     PL_mess_sv          = Nullsv;
10601
10602     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10603
10604     /* interpreter atexit processing */
10605     PL_exitlistlen      = proto_perl->Iexitlistlen;
10606     if (PL_exitlistlen) {
10607         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10608         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10609     }
10610     else
10611         PL_exitlist     = (PerlExitListEntry*)NULL;
10612     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10613     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10614     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10615
10616     PL_profiledata      = NULL;
10617     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10618     /* PL_rsfp_filters entries have fake IoDIRP() */
10619     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10620
10621     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10622
10623     PAD_CLONE_VARS(proto_perl, param);
10624
10625 #ifdef HAVE_INTERP_INTERN
10626     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10627 #endif
10628
10629     /* more statics moved here */
10630     PL_generation       = proto_perl->Igeneration;
10631     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10632
10633     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10634     PL_in_clean_all     = proto_perl->Iin_clean_all;
10635
10636     PL_uid              = proto_perl->Iuid;
10637     PL_euid             = proto_perl->Ieuid;
10638     PL_gid              = proto_perl->Igid;
10639     PL_egid             = proto_perl->Iegid;
10640     PL_nomemok          = proto_perl->Inomemok;
10641     PL_an               = proto_perl->Ian;
10642     PL_evalseq          = proto_perl->Ievalseq;
10643     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10644     PL_origalen         = proto_perl->Iorigalen;
10645 #ifdef PERL_USES_PL_PIDSTATUS
10646     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10647 #endif
10648     PL_osname           = SAVEPV(proto_perl->Iosname);
10649     PL_sighandlerp      = proto_perl->Isighandlerp;
10650
10651     PL_runops           = proto_perl->Irunops;
10652
10653     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10654
10655 #ifdef CSH
10656     PL_cshlen           = proto_perl->Icshlen;
10657     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10658 #endif
10659
10660     PL_lex_state        = proto_perl->Ilex_state;
10661     PL_lex_defer        = proto_perl->Ilex_defer;
10662     PL_lex_expect       = proto_perl->Ilex_expect;
10663     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10664     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10665     PL_lex_starts       = proto_perl->Ilex_starts;
10666     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10667     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10668     PL_lex_op           = proto_perl->Ilex_op;
10669     PL_lex_inpat        = proto_perl->Ilex_inpat;
10670     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10671     PL_lex_brackets     = proto_perl->Ilex_brackets;
10672     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10673     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10674     PL_lex_casemods     = proto_perl->Ilex_casemods;
10675     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10676     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10677
10678     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10679     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10680     PL_nexttoke         = proto_perl->Inexttoke;
10681
10682     /* XXX This is probably masking the deeper issue of why
10683      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10684      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10685      * (A little debugging with a watchpoint on it may help.)
10686      */
10687     if (SvANY(proto_perl->Ilinestr)) {
10688         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10689         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10690         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10691         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10692         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10693         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10694         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10695         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10696         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10697     }
10698     else {
10699         PL_linestr = NEWSV(65,79);
10700         sv_upgrade(PL_linestr,SVt_PVIV);
10701         sv_setpvn(PL_linestr,"",0);
10702         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10703     }
10704     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10705     PL_pending_ident    = proto_perl->Ipending_ident;
10706     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10707
10708     PL_expect           = proto_perl->Iexpect;
10709
10710     PL_multi_start      = proto_perl->Imulti_start;
10711     PL_multi_end        = proto_perl->Imulti_end;
10712     PL_multi_open       = proto_perl->Imulti_open;
10713     PL_multi_close      = proto_perl->Imulti_close;
10714
10715     PL_error_count      = proto_perl->Ierror_count;
10716     PL_subline          = proto_perl->Isubline;
10717     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10718
10719     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10720     if (SvANY(proto_perl->Ilinestr)) {
10721         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10722         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10723         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10724         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10725         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10726     }
10727     else {
10728         PL_last_uni     = SvPVX(PL_linestr);
10729         PL_last_lop     = SvPVX(PL_linestr);
10730         PL_last_lop_op  = 0;
10731     }
10732     PL_in_my            = proto_perl->Iin_my;
10733     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10734 #ifdef FCRYPT
10735     PL_cryptseen        = proto_perl->Icryptseen;
10736 #endif
10737
10738     PL_hints            = proto_perl->Ihints;
10739
10740     PL_amagic_generation        = proto_perl->Iamagic_generation;
10741
10742 #ifdef USE_LOCALE_COLLATE
10743     PL_collation_ix     = proto_perl->Icollation_ix;
10744     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10745     PL_collation_standard       = proto_perl->Icollation_standard;
10746     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10747     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10748 #endif /* USE_LOCALE_COLLATE */
10749
10750 #ifdef USE_LOCALE_NUMERIC
10751     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10752     PL_numeric_standard = proto_perl->Inumeric_standard;
10753     PL_numeric_local    = proto_perl->Inumeric_local;
10754     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10755 #endif /* !USE_LOCALE_NUMERIC */
10756
10757     /* utf8 character classes */
10758     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10759     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10760     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10761     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10762     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10763     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10764     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10765     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10766     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10767     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10768     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10769     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10770     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10771     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10772     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10773     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10774     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10775     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10776     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10777     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10778
10779     /* Did the locale setup indicate UTF-8? */
10780     PL_utf8locale       = proto_perl->Iutf8locale;
10781     /* Unicode features (see perlrun/-C) */
10782     PL_unicode          = proto_perl->Iunicode;
10783
10784     /* Pre-5.8 signals control */
10785     PL_signals          = proto_perl->Isignals;
10786
10787     /* times() ticks per second */
10788     PL_clocktick        = proto_perl->Iclocktick;
10789
10790     /* Recursion stopper for PerlIO_find_layer */
10791     PL_in_load_module   = proto_perl->Iin_load_module;
10792
10793     /* sort() routine */
10794     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10795
10796     /* Not really needed/useful since the reenrant_retint is "volatile",
10797      * but do it for consistency's sake. */
10798     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10799
10800     /* Hooks to shared SVs and locks. */
10801     PL_sharehook        = proto_perl->Isharehook;
10802     PL_lockhook         = proto_perl->Ilockhook;
10803     PL_unlockhook       = proto_perl->Iunlockhook;
10804     PL_threadhook       = proto_perl->Ithreadhook;
10805
10806     PL_runops_std       = proto_perl->Irunops_std;
10807     PL_runops_dbg       = proto_perl->Irunops_dbg;
10808
10809 #ifdef THREADS_HAVE_PIDS
10810     PL_ppid             = proto_perl->Ippid;
10811 #endif
10812
10813     /* swatch cache */
10814     PL_last_swash_hv    = Nullhv;       /* reinits on demand */
10815     PL_last_swash_klen  = 0;
10816     PL_last_swash_key[0]= '\0';
10817     PL_last_swash_tmps  = (U8*)NULL;
10818     PL_last_swash_slen  = 0;
10819
10820     PL_glob_index       = proto_perl->Iglob_index;
10821     PL_srand_called     = proto_perl->Isrand_called;
10822     PL_uudmap['M']      = 0;            /* reinits on demand */
10823     PL_bitcount         = Nullch;       /* reinits on demand */
10824
10825     if (proto_perl->Ipsig_pend) {
10826         Newxz(PL_psig_pend, SIG_SIZE, int);
10827     }
10828     else {
10829         PL_psig_pend    = (int*)NULL;
10830     }
10831
10832     if (proto_perl->Ipsig_ptr) {
10833         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10834         Newxz(PL_psig_name, SIG_SIZE, SV*);
10835         for (i = 1; i < SIG_SIZE; i++) {
10836             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10837             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10838         }
10839     }
10840     else {
10841         PL_psig_ptr     = (SV**)NULL;
10842         PL_psig_name    = (SV**)NULL;
10843     }
10844
10845     /* thrdvar.h stuff */
10846
10847     if (flags & CLONEf_COPY_STACKS) {
10848         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10849         PL_tmps_ix              = proto_perl->Ttmps_ix;
10850         PL_tmps_max             = proto_perl->Ttmps_max;
10851         PL_tmps_floor           = proto_perl->Ttmps_floor;
10852         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10853         i = 0;
10854         while (i <= PL_tmps_ix) {
10855             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10856             ++i;
10857         }
10858
10859         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10860         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10861         Newxz(PL_markstack, i, I32);
10862         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10863                                                   - proto_perl->Tmarkstack);
10864         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10865                                                   - proto_perl->Tmarkstack);
10866         Copy(proto_perl->Tmarkstack, PL_markstack,
10867              PL_markstack_ptr - PL_markstack + 1, I32);
10868
10869         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10870          * NOTE: unlike the others! */
10871         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10872         PL_scopestack_max       = proto_perl->Tscopestack_max;
10873         Newxz(PL_scopestack, PL_scopestack_max, I32);
10874         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10875
10876         /* NOTE: si_dup() looks at PL_markstack */
10877         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10878
10879         /* PL_curstack          = PL_curstackinfo->si_stack; */
10880         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10881         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10882
10883         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10884         PL_stack_base           = AvARRAY(PL_curstack);
10885         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10886                                                    - proto_perl->Tstack_base);
10887         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10888
10889         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10890          * NOTE: unlike the others! */
10891         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10892         PL_savestack_max        = proto_perl->Tsavestack_max;
10893         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10894         PL_savestack            = ss_dup(proto_perl, param);
10895     }
10896     else {
10897         init_stacks();
10898         ENTER;                  /* perl_destruct() wants to LEAVE; */
10899     }
10900
10901     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10902     PL_top_env          = &PL_start_env;
10903
10904     PL_op               = proto_perl->Top;
10905
10906     PL_Sv               = Nullsv;
10907     PL_Xpv              = (XPV*)NULL;
10908     PL_na               = proto_perl->Tna;
10909
10910     PL_statbuf          = proto_perl->Tstatbuf;
10911     PL_statcache        = proto_perl->Tstatcache;
10912     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10913     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10914 #ifdef HAS_TIMES
10915     PL_timesbuf         = proto_perl->Ttimesbuf;
10916 #endif
10917
10918     PL_tainted          = proto_perl->Ttainted;
10919     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10920     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10921     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10922     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10923     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10924     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10925     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10926     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10927     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10928
10929     PL_restartop        = proto_perl->Trestartop;
10930     PL_in_eval          = proto_perl->Tin_eval;
10931     PL_delaymagic       = proto_perl->Tdelaymagic;
10932     PL_dirty            = proto_perl->Tdirty;
10933     PL_localizing       = proto_perl->Tlocalizing;
10934
10935     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10936     PL_hv_fetch_ent_mh  = Nullhe;
10937     PL_modcount         = proto_perl->Tmodcount;
10938     PL_lastgotoprobe    = Nullop;
10939     PL_dumpindent       = proto_perl->Tdumpindent;
10940
10941     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10942     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10943     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10944     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10945     PL_efloatbuf        = Nullch;               /* reinits on demand */
10946     PL_efloatsize       = 0;                    /* reinits on demand */
10947
10948     /* regex stuff */
10949
10950     PL_screamfirst      = NULL;
10951     PL_screamnext       = NULL;
10952     PL_maxscream        = -1;                   /* reinits on demand */
10953     PL_lastscream       = Nullsv;
10954
10955     PL_watchaddr        = NULL;
10956     PL_watchok          = Nullch;
10957
10958     PL_regdummy         = proto_perl->Tregdummy;
10959     PL_regprecomp       = Nullch;
10960     PL_regnpar          = 0;
10961     PL_regsize          = 0;
10962     PL_colorset         = 0;            /* reinits PL_colors[] */
10963     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10964     PL_reginput         = Nullch;
10965     PL_regbol           = Nullch;
10966     PL_regeol           = Nullch;
10967     PL_regstartp        = (I32*)NULL;
10968     PL_regendp          = (I32*)NULL;
10969     PL_reglastparen     = (U32*)NULL;
10970     PL_reglastcloseparen        = (U32*)NULL;
10971     PL_regtill          = Nullch;
10972     PL_reg_start_tmp    = (char**)NULL;
10973     PL_reg_start_tmpl   = 0;
10974     PL_regdata          = (struct reg_data*)NULL;
10975     PL_bostr            = Nullch;
10976     PL_reg_flags        = 0;
10977     PL_reg_eval_set     = 0;
10978     PL_regnarrate       = 0;
10979     PL_regprogram       = (regnode*)NULL;
10980     PL_regindent        = 0;
10981     PL_regcc            = (CURCUR*)NULL;
10982     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10983     PL_reg_re           = (regexp*)NULL;
10984     PL_reg_ganch        = Nullch;
10985     PL_reg_sv           = Nullsv;
10986     PL_reg_match_utf8   = FALSE;
10987     PL_reg_magic        = (MAGIC*)NULL;
10988     PL_reg_oldpos       = 0;
10989     PL_reg_oldcurpm     = (PMOP*)NULL;
10990     PL_reg_curpm        = (PMOP*)NULL;
10991     PL_reg_oldsaved     = Nullch;
10992     PL_reg_oldsavedlen  = 0;
10993 #ifdef PERL_OLD_COPY_ON_WRITE
10994     PL_nrs              = Nullsv;
10995 #endif
10996     PL_reg_maxiter      = 0;
10997     PL_reg_leftiter     = 0;
10998     PL_reg_poscache     = Nullch;
10999     PL_reg_poscache_size= 0;
11000
11001     /* RE engine - function pointers */
11002     PL_regcompp         = proto_perl->Tregcompp;
11003     PL_regexecp         = proto_perl->Tregexecp;
11004     PL_regint_start     = proto_perl->Tregint_start;
11005     PL_regint_string    = proto_perl->Tregint_string;
11006     PL_regfree          = proto_perl->Tregfree;
11007
11008     PL_reginterp_cnt    = 0;
11009     PL_reg_starttry     = 0;
11010
11011     /* Pluggable optimizer */
11012     PL_peepp            = proto_perl->Tpeepp;
11013
11014     PL_stashcache       = newHV();
11015
11016     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
11017         ptr_table_free(PL_ptr_table);
11018         PL_ptr_table = NULL;
11019     }
11020
11021     /* Call the ->CLONE method, if it exists, for each of the stashes
11022        identified by sv_dup() above.
11023     */
11024     while(av_len(param->stashes) != -1) {
11025         HV* const stash = (HV*) av_shift(param->stashes);
11026         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
11027         if (cloner && GvCV(cloner)) {
11028             dSP;
11029             ENTER;
11030             SAVETMPS;
11031             PUSHMARK(SP);
11032             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
11033             PUTBACK;
11034             call_sv((SV*)GvCV(cloner), G_DISCARD);
11035             FREETMPS;
11036             LEAVE;
11037         }
11038     }
11039
11040     SvREFCNT_dec(param->stashes);
11041
11042     /* orphaned? eg threads->new inside BEGIN or use */
11043     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
11044         (void)SvREFCNT_inc(PL_compcv);
11045         SAVEFREESV(PL_compcv);
11046     }
11047
11048     return my_perl;
11049 }
11050
11051 #endif /* USE_ITHREADS */
11052
11053 /*
11054 =head1 Unicode Support
11055
11056 =for apidoc sv_recode_to_utf8
11057
11058 The encoding is assumed to be an Encode object, on entry the PV
11059 of the sv is assumed to be octets in that encoding, and the sv
11060 will be converted into Unicode (and UTF-8).
11061
11062 If the sv already is UTF-8 (or if it is not POK), or if the encoding
11063 is not a reference, nothing is done to the sv.  If the encoding is not
11064 an C<Encode::XS> Encoding object, bad things will happen.
11065 (See F<lib/encoding.pm> and L<Encode>).
11066
11067 The PV of the sv is returned.
11068
11069 =cut */
11070
11071 char *
11072 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
11073 {
11074     dVAR;
11075     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
11076         SV *uni;
11077         STRLEN len;
11078         const char *s;
11079         dSP;
11080         ENTER;
11081         SAVETMPS;
11082         save_re_context();
11083         PUSHMARK(sp);
11084         EXTEND(SP, 3);
11085         XPUSHs(encoding);
11086         XPUSHs(sv);
11087 /*
11088   NI-S 2002/07/09
11089   Passing sv_yes is wrong - it needs to be or'ed set of constants
11090   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
11091   remove converted chars from source.
11092
11093   Both will default the value - let them.
11094
11095         XPUSHs(&PL_sv_yes);
11096 */
11097         PUTBACK;
11098         call_method("decode", G_SCALAR);
11099         SPAGAIN;
11100         uni = POPs;
11101         PUTBACK;
11102         s = SvPV_const(uni, len);
11103         if (s != SvPVX_const(sv)) {
11104             SvGROW(sv, len + 1);
11105             Move(s, SvPVX(sv), len + 1, char);
11106             SvCUR_set(sv, len);
11107         }
11108         FREETMPS;
11109         LEAVE;
11110         SvUTF8_on(sv);
11111         return SvPVX(sv);
11112     }
11113     return SvPOKp(sv) ? SvPVX(sv) : NULL;
11114 }
11115
11116 /*
11117 =for apidoc sv_cat_decode
11118
11119 The encoding is assumed to be an Encode object, the PV of the ssv is
11120 assumed to be octets in that encoding and decoding the input starts
11121 from the position which (PV + *offset) pointed to.  The dsv will be
11122 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
11123 when the string tstr appears in decoding output or the input ends on
11124 the PV of the ssv. The value which the offset points will be modified
11125 to the last input position on the ssv.
11126
11127 Returns TRUE if the terminator was found, else returns FALSE.
11128
11129 =cut */
11130
11131 bool
11132 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
11133                    SV *ssv, int *offset, char *tstr, int tlen)
11134 {
11135     dVAR;
11136     bool ret = FALSE;
11137     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
11138         SV *offsv;
11139         dSP;
11140         ENTER;
11141         SAVETMPS;
11142         save_re_context();
11143         PUSHMARK(sp);
11144         EXTEND(SP, 6);
11145         XPUSHs(encoding);
11146         XPUSHs(dsv);
11147         XPUSHs(ssv);
11148         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
11149         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
11150         PUTBACK;
11151         call_method("cat_decode", G_SCALAR);
11152         SPAGAIN;
11153         ret = SvTRUE(TOPs);
11154         *offset = SvIV(offsv);
11155         PUTBACK;
11156         FREETMPS;
11157         LEAVE;
11158     }
11159     else
11160         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
11161     return ret;
11162
11163 }
11164
11165 /* ---------------------------------------------------------------------
11166  *
11167  * support functions for report_uninit()
11168  */
11169
11170 /* the maxiumum size of array or hash where we will scan looking
11171  * for the undefined element that triggered the warning */
11172
11173 #define FUV_MAX_SEARCH_SIZE 1000
11174
11175 /* Look for an entry in the hash whose value has the same SV as val;
11176  * If so, return a mortal copy of the key. */
11177
11178 STATIC SV*
11179 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
11180 {
11181     dVAR;
11182     register HE **array;
11183     I32 i;
11184
11185     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
11186                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
11187         return Nullsv;
11188
11189     array = HvARRAY(hv);
11190
11191     for (i=HvMAX(hv); i>0; i--) {
11192         register HE *entry;
11193         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
11194             if (HeVAL(entry) != val)
11195                 continue;
11196             if (    HeVAL(entry) == &PL_sv_undef ||
11197                     HeVAL(entry) == &PL_sv_placeholder)
11198                 continue;
11199             if (!HeKEY(entry))
11200                 return Nullsv;
11201             if (HeKLEN(entry) == HEf_SVKEY)
11202                 return sv_mortalcopy(HeKEY_sv(entry));
11203             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
11204         }
11205     }
11206     return Nullsv;
11207 }
11208
11209 /* Look for an entry in the array whose value has the same SV as val;
11210  * If so, return the index, otherwise return -1. */
11211
11212 STATIC I32
11213 S_find_array_subscript(pTHX_ AV *av, SV* val)
11214 {
11215     SV** svp;
11216     I32 i;
11217     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
11218                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
11219         return -1;
11220
11221     svp = AvARRAY(av);
11222     for (i=AvFILLp(av); i>=0; i--) {
11223         if (svp[i] == val && svp[i] != &PL_sv_undef)
11224             return i;
11225     }
11226     return -1;
11227 }
11228
11229 /* S_varname(): return the name of a variable, optionally with a subscript.
11230  * If gv is non-zero, use the name of that global, along with gvtype (one
11231  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11232  * targ.  Depending on the value of the subscript_type flag, return:
11233  */
11234
11235 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11236 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11237 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11238 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11239
11240 STATIC SV*
11241 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11242         SV* keyname, I32 aindex, int subscript_type)
11243 {
11244
11245     SV * const name = sv_newmortal();
11246     if (gv) {
11247         char buffer[2];
11248         buffer[0] = gvtype;
11249         buffer[1] = 0;
11250
11251         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11252
11253         gv_fullname4(name, gv, buffer, 0);
11254
11255         if ((unsigned int)SvPVX(name)[1] <= 26) {
11256             buffer[0] = '^';
11257             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11258
11259             /* Swap the 1 unprintable control character for the 2 byte pretty
11260                version - ie substr($name, 1, 1) = $buffer; */
11261             sv_insert(name, 1, 1, buffer, 2);
11262         }
11263     }
11264     else {
11265         U32 unused;
11266         CV * const cv = find_runcv(&unused);
11267         SV *sv;
11268         AV *av;
11269
11270         if (!cv || !CvPADLIST(cv))
11271             return Nullsv;
11272         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11273         sv = *av_fetch(av, targ, FALSE);
11274         /* SvLEN in a pad name is not to be trusted */
11275         sv_setpv(name, SvPV_nolen_const(sv));
11276     }
11277
11278     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11279         SV * const sv = NEWSV(0,0);
11280         *SvPVX(name) = '$';
11281         Perl_sv_catpvf(aTHX_ name, "{%s}",
11282             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11283         SvREFCNT_dec(sv);
11284     }
11285     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11286         *SvPVX(name) = '$';
11287         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11288     }
11289     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11290         sv_insert(name, 0, 0,  "within ", 7);
11291
11292     return name;
11293 }
11294
11295
11296 /*
11297 =for apidoc find_uninit_var
11298
11299 Find the name of the undefined variable (if any) that caused the operator o
11300 to issue a "Use of uninitialized value" warning.
11301 If match is true, only return a name if it's value matches uninit_sv.
11302 So roughly speaking, if a unary operator (such as OP_COS) generates a
11303 warning, then following the direct child of the op may yield an
11304 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11305 other hand, with OP_ADD there are two branches to follow, so we only print
11306 the variable name if we get an exact match.
11307
11308 The name is returned as a mortal SV.
11309
11310 Assumes that PL_op is the op that originally triggered the error, and that
11311 PL_comppad/PL_curpad points to the currently executing pad.
11312
11313 =cut
11314 */
11315
11316 STATIC SV *
11317 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11318 {
11319     dVAR;
11320     SV *sv;
11321     AV *av;
11322     GV *gv;
11323     OP *o, *o2, *kid;
11324
11325     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11326                             uninit_sv == &PL_sv_placeholder)))
11327         return Nullsv;
11328
11329     switch (obase->op_type) {
11330
11331     case OP_RV2AV:
11332     case OP_RV2HV:
11333     case OP_PADAV:
11334     case OP_PADHV:
11335       {
11336         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11337         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11338         I32 index = 0;
11339         SV *keysv = Nullsv;
11340         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11341
11342         if (pad) { /* @lex, %lex */
11343             sv = PAD_SVl(obase->op_targ);
11344             gv = Nullgv;
11345         }
11346         else {
11347             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11348             /* @global, %global */
11349                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11350                 if (!gv)
11351                     break;
11352                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11353             }
11354             else /* @{expr}, %{expr} */
11355                 return find_uninit_var(cUNOPx(obase)->op_first,
11356                                                     uninit_sv, match);
11357         }
11358
11359         /* attempt to find a match within the aggregate */
11360         if (hash) {
11361             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11362             if (keysv)
11363                 subscript_type = FUV_SUBSCRIPT_HASH;
11364         }
11365         else {
11366             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11367             if (index >= 0)
11368                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11369         }
11370
11371         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11372             break;
11373
11374         return varname(gv, hash ? '%' : '@', obase->op_targ,
11375                                     keysv, index, subscript_type);
11376       }
11377
11378     case OP_PADSV:
11379         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11380             break;
11381         return varname(Nullgv, '$', obase->op_targ,
11382                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11383
11384     case OP_GVSV:
11385         gv = cGVOPx_gv(obase);
11386         if (!gv || (match && GvSV(gv) != uninit_sv))
11387             break;
11388         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11389
11390     case OP_AELEMFAST:
11391         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11392             if (match) {
11393                 SV **svp;
11394                 av = (AV*)PAD_SV(obase->op_targ);
11395                 if (!av || SvRMAGICAL(av))
11396                     break;
11397                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11398                 if (!svp || *svp != uninit_sv)
11399                     break;
11400             }
11401             return varname(Nullgv, '$', obase->op_targ,
11402                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11403         }
11404         else {
11405             gv = cGVOPx_gv(obase);
11406             if (!gv)
11407                 break;
11408             if (match) {
11409                 SV **svp;
11410                 av = GvAV(gv);
11411                 if (!av || SvRMAGICAL(av))
11412                     break;
11413                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11414                 if (!svp || *svp != uninit_sv)
11415                     break;
11416             }
11417             return varname(gv, '$', 0,
11418                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11419         }
11420         break;
11421
11422     case OP_EXISTS:
11423         o = cUNOPx(obase)->op_first;
11424         if (!o || o->op_type != OP_NULL ||
11425                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11426             break;
11427         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11428
11429     case OP_AELEM:
11430     case OP_HELEM:
11431         if (PL_op == obase)
11432             /* $a[uninit_expr] or $h{uninit_expr} */
11433             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11434
11435         gv = Nullgv;
11436         o = cBINOPx(obase)->op_first;
11437         kid = cBINOPx(obase)->op_last;
11438
11439         /* get the av or hv, and optionally the gv */
11440         sv = Nullsv;
11441         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11442             sv = PAD_SV(o->op_targ);
11443         }
11444         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11445                 && cUNOPo->op_first->op_type == OP_GV)
11446         {
11447             gv = cGVOPx_gv(cUNOPo->op_first);
11448             if (!gv)
11449                 break;
11450             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11451         }
11452         if (!sv)
11453             break;
11454
11455         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11456             /* index is constant */
11457             if (match) {
11458                 if (SvMAGICAL(sv))
11459                     break;
11460                 if (obase->op_type == OP_HELEM) {
11461                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11462                     if (!he || HeVAL(he) != uninit_sv)
11463                         break;
11464                 }
11465                 else {
11466                     SV ** const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11467                     if (!svp || *svp != uninit_sv)
11468                         break;
11469                 }
11470             }
11471             if (obase->op_type == OP_HELEM)
11472                 return varname(gv, '%', o->op_targ,
11473                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11474             else
11475                 return varname(gv, '@', o->op_targ, Nullsv,
11476                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11477             ;
11478         }
11479         else  {
11480             /* index is an expression;
11481              * attempt to find a match within the aggregate */
11482             if (obase->op_type == OP_HELEM) {
11483                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11484                 if (keysv)
11485                     return varname(gv, '%', o->op_targ,
11486                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11487             }
11488             else {
11489                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11490                 if (index >= 0)
11491                     return varname(gv, '@', o->op_targ,
11492                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11493             }
11494             if (match)
11495                 break;
11496             return varname(gv,
11497                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11498                 ? '@' : '%',
11499                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11500         }
11501
11502         break;
11503
11504     case OP_AASSIGN:
11505         /* only examine RHS */
11506         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11507
11508     case OP_OPEN:
11509         o = cUNOPx(obase)->op_first;
11510         if (o->op_type == OP_PUSHMARK)
11511             o = o->op_sibling;
11512
11513         if (!o->op_sibling) {
11514             /* one-arg version of open is highly magical */
11515
11516             if (o->op_type == OP_GV) { /* open FOO; */
11517                 gv = cGVOPx_gv(o);
11518                 if (match && GvSV(gv) != uninit_sv)
11519                     break;
11520                 return varname(gv, '$', 0,
11521                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11522             }
11523             /* other possibilities not handled are:
11524              * open $x; or open my $x;  should return '${*$x}'
11525              * open expr;               should return '$'.expr ideally
11526              */
11527              break;
11528         }
11529         goto do_op;
11530
11531     /* ops where $_ may be an implicit arg */
11532     case OP_TRANS:
11533     case OP_SUBST:
11534     case OP_MATCH:
11535         if ( !(obase->op_flags & OPf_STACKED)) {
11536             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11537                                  ? PAD_SVl(obase->op_targ)
11538                                  : DEFSV))
11539             {
11540                 sv = sv_newmortal();
11541                 sv_setpvn(sv, "$_", 2);
11542                 return sv;
11543             }
11544         }
11545         goto do_op;
11546
11547     case OP_PRTF:
11548     case OP_PRINT:
11549         /* skip filehandle as it can't produce 'undef' warning  */
11550         o = cUNOPx(obase)->op_first;
11551         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11552             o = o->op_sibling->op_sibling;
11553         goto do_op2;
11554
11555
11556     case OP_RV2SV:
11557     case OP_CUSTOM:
11558     case OP_ENTERSUB:
11559         match = 1; /* XS or custom code could trigger random warnings */
11560         goto do_op;
11561
11562     case OP_SCHOMP:
11563     case OP_CHOMP:
11564         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11565             return sv_2mortal(newSVpvn("${$/}", 5));
11566         /* FALL THROUGH */
11567
11568     default:
11569     do_op:
11570         if (!(obase->op_flags & OPf_KIDS))
11571             break;
11572         o = cUNOPx(obase)->op_first;
11573         
11574     do_op2:
11575         if (!o)
11576             break;
11577
11578         /* if all except one arg are constant, or have no side-effects,
11579          * or are optimized away, then it's unambiguous */
11580         o2 = Nullop;
11581         for (kid=o; kid; kid = kid->op_sibling) {
11582             if (kid &&
11583                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11584                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11585                   || (kid->op_type == OP_PUSHMARK)
11586                 )
11587             )
11588                 continue;
11589             if (o2) { /* more than one found */
11590                 o2 = Nullop;
11591                 break;
11592             }
11593             o2 = kid;
11594         }
11595         if (o2)
11596             return find_uninit_var(o2, uninit_sv, match);
11597
11598         /* scan all args */
11599         while (o) {
11600             sv = find_uninit_var(o, uninit_sv, 1);
11601             if (sv)
11602                 return sv;
11603             o = o->op_sibling;
11604         }
11605         break;
11606     }
11607     return Nullsv;
11608 }
11609
11610
11611 /*
11612 =for apidoc report_uninit
11613
11614 Print appropriate "Use of uninitialized variable" warning
11615
11616 =cut
11617 */
11618
11619 void
11620 Perl_report_uninit(pTHX_ SV* uninit_sv)
11621 {
11622     if (PL_op) {
11623         SV* varname = Nullsv;
11624         if (uninit_sv) {
11625             varname = find_uninit_var(PL_op, uninit_sv,0);
11626             if (varname)
11627                 sv_insert(varname, 0, 0, " ", 1);
11628         }
11629         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11630                 varname ? SvPV_nolen_const(varname) : "",
11631                 " in ", OP_DESC(PL_op));
11632     }
11633     else
11634         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11635                     "", "", "");
11636 }
11637
11638 /*
11639  * Local variables:
11640  * c-indentation-style: bsd
11641  * c-basic-offset: 4
11642  * indent-tabs-mode: t
11643  * End:
11644  *
11645  * ex: set ts=8 sts=4 sw=4 noet:
11646  */