Fix typo in description.
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = Nullav;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void **arena_root   = &PL_body_arenaroots[sv_type];
644     void **root         = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void **r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void **thing_copy = (void **)thing;     \
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      + relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
813      - relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      + relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
819      - relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      + relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
835      - relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      + relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
841      - relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126     /* If NV 0.0 is store as all bits 0 then Zero() already creates a correct
1127        0.0 for us.  */
1128         if (old_type_details->zero_nv)
1129             SvNV_set(sv, 0);
1130 #endif
1131
1132         if (new_type == SVt_PVIO)
1133             IoPAGE_LEN(sv)      = 60;
1134         if (old_type < SVt_RV)
1135             SvPV_set(sv, 0);
1136         break;
1137     default:
1138         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1139     }
1140
1141     if (old_type_details->size) {
1142         /* If the old body had an allocated size, then we need to free it.  */
1143 #ifdef PURIFY
1144         my_safefree(old_body);
1145 #else
1146         del_body((void*)((char*)old_body + old_type_details->offset),
1147                  &PL_body_roots[old_type]);
1148 #endif
1149     }
1150 }
1151
1152 /*
1153 =for apidoc sv_backoff
1154
1155 Remove any string offset. You should normally use the C<SvOOK_off> macro
1156 wrapper instead.
1157
1158 =cut
1159 */
1160
1161 int
1162 Perl_sv_backoff(pTHX_ register SV *sv)
1163 {
1164     assert(SvOOK(sv));
1165     assert(SvTYPE(sv) != SVt_PVHV);
1166     assert(SvTYPE(sv) != SVt_PVAV);
1167     if (SvIVX(sv)) {
1168         const char * const s = SvPVX_const(sv);
1169         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1170         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1171         SvIV_set(sv, 0);
1172         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1173     }
1174     SvFLAGS(sv) &= ~SVf_OOK;
1175     return 0;
1176 }
1177
1178 /*
1179 =for apidoc sv_grow
1180
1181 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1182 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1183 Use the C<SvGROW> wrapper instead.
1184
1185 =cut
1186 */
1187
1188 char *
1189 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1190 {
1191     register char *s;
1192
1193 #ifdef HAS_64K_LIMIT
1194     if (newlen >= 0x10000) {
1195         PerlIO_printf(Perl_debug_log,
1196                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1197         my_exit(1);
1198     }
1199 #endif /* HAS_64K_LIMIT */
1200     if (SvROK(sv))
1201         sv_unref(sv);
1202     if (SvTYPE(sv) < SVt_PV) {
1203         sv_upgrade(sv, SVt_PV);
1204         s = SvPVX_mutable(sv);
1205     }
1206     else if (SvOOK(sv)) {       /* pv is offset? */
1207         sv_backoff(sv);
1208         s = SvPVX_mutable(sv);
1209         if (newlen > SvLEN(sv))
1210             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1211 #ifdef HAS_64K_LIMIT
1212         if (newlen >= 0x10000)
1213             newlen = 0xFFFF;
1214 #endif
1215     }
1216     else
1217         s = SvPVX_mutable(sv);
1218
1219     if (newlen > SvLEN(sv)) {           /* need more room? */
1220         newlen = PERL_STRLEN_ROUNDUP(newlen);
1221         if (SvLEN(sv) && s) {
1222 #ifdef MYMALLOC
1223             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1224             if (newlen <= l) {
1225                 SvLEN_set(sv, l);
1226                 return s;
1227             } else
1228 #endif
1229             s = saferealloc(s, newlen);
1230         }
1231         else {
1232             s = safemalloc(newlen);
1233             if (SvPVX_const(sv) && SvCUR(sv)) {
1234                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1235             }
1236         }
1237         SvPV_set(sv, s);
1238         SvLEN_set(sv, newlen);
1239     }
1240     return s;
1241 }
1242
1243 /*
1244 =for apidoc sv_setiv
1245
1246 Copies an integer into the given SV, upgrading first if necessary.
1247 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1248
1249 =cut
1250 */
1251
1252 void
1253 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1254 {
1255     SV_CHECK_THINKFIRST_COW_DROP(sv);
1256     switch (SvTYPE(sv)) {
1257     case SVt_NULL:
1258         sv_upgrade(sv, SVt_IV);
1259         break;
1260     case SVt_NV:
1261         sv_upgrade(sv, SVt_PVNV);
1262         break;
1263     case SVt_RV:
1264     case SVt_PV:
1265         sv_upgrade(sv, SVt_PVIV);
1266         break;
1267
1268     case SVt_PVGV:
1269     case SVt_PVAV:
1270     case SVt_PVHV:
1271     case SVt_PVCV:
1272     case SVt_PVFM:
1273     case SVt_PVIO:
1274         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1275                    OP_DESC(PL_op));
1276     }
1277     (void)SvIOK_only(sv);                       /* validate number */
1278     SvIV_set(sv, i);
1279     SvTAINT(sv);
1280 }
1281
1282 /*
1283 =for apidoc sv_setiv_mg
1284
1285 Like C<sv_setiv>, but also handles 'set' magic.
1286
1287 =cut
1288 */
1289
1290 void
1291 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1292 {
1293     sv_setiv(sv,i);
1294     SvSETMAGIC(sv);
1295 }
1296
1297 /*
1298 =for apidoc sv_setuv
1299
1300 Copies an unsigned integer into the given SV, upgrading first if necessary.
1301 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1302
1303 =cut
1304 */
1305
1306 void
1307 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1308 {
1309     /* With these two if statements:
1310        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1311
1312        without
1313        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1314
1315        If you wish to remove them, please benchmark to see what the effect is
1316     */
1317     if (u <= (UV)IV_MAX) {
1318        sv_setiv(sv, (IV)u);
1319        return;
1320     }
1321     sv_setiv(sv, 0);
1322     SvIsUV_on(sv);
1323     SvUV_set(sv, u);
1324 }
1325
1326 /*
1327 =for apidoc sv_setuv_mg
1328
1329 Like C<sv_setuv>, but also handles 'set' magic.
1330
1331 =cut
1332 */
1333
1334 void
1335 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1336 {
1337     sv_setiv(sv, 0);
1338     SvIsUV_on(sv);
1339     sv_setuv(sv,u);
1340     SvSETMAGIC(sv);
1341 }
1342
1343 /*
1344 =for apidoc sv_setnv
1345
1346 Copies a double into the given SV, upgrading first if necessary.
1347 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1354 {
1355     SV_CHECK_THINKFIRST_COW_DROP(sv);
1356     switch (SvTYPE(sv)) {
1357     case SVt_NULL:
1358     case SVt_IV:
1359         sv_upgrade(sv, SVt_NV);
1360         break;
1361     case SVt_RV:
1362     case SVt_PV:
1363     case SVt_PVIV:
1364         sv_upgrade(sv, SVt_PVNV);
1365         break;
1366
1367     case SVt_PVGV:
1368     case SVt_PVAV:
1369     case SVt_PVHV:
1370     case SVt_PVCV:
1371     case SVt_PVFM:
1372     case SVt_PVIO:
1373         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1374                    OP_NAME(PL_op));
1375     }
1376     SvNV_set(sv, num);
1377     (void)SvNOK_only(sv);                       /* validate number */
1378     SvTAINT(sv);
1379 }
1380
1381 /*
1382 =for apidoc sv_setnv_mg
1383
1384 Like C<sv_setnv>, but also handles 'set' magic.
1385
1386 =cut
1387 */
1388
1389 void
1390 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1391 {
1392     sv_setnv(sv,num);
1393     SvSETMAGIC(sv);
1394 }
1395
1396 /* Print an "isn't numeric" warning, using a cleaned-up,
1397  * printable version of the offending string
1398  */
1399
1400 STATIC void
1401 S_not_a_number(pTHX_ SV *sv)
1402 {
1403      SV *dsv;
1404      char tmpbuf[64];
1405      const char *pv;
1406
1407      if (DO_UTF8(sv)) {
1408           dsv = sv_2mortal(newSVpvn("", 0));
1409           pv = sv_uni_display(dsv, sv, 10, 0);
1410      } else {
1411           char *d = tmpbuf;
1412           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1413           /* each *s can expand to 4 chars + "...\0",
1414              i.e. need room for 8 chars */
1415         
1416           const char *s, *end;
1417           for (s = SvPVX_const(sv), end = s + SvCUR(sv); s < end && d < limit;
1418                s++) {
1419                int ch = *s & 0xFF;
1420                if (ch & 128 && !isPRINT_LC(ch)) {
1421                     *d++ = 'M';
1422                     *d++ = '-';
1423                     ch &= 127;
1424                }
1425                if (ch == '\n') {
1426                     *d++ = '\\';
1427                     *d++ = 'n';
1428                }
1429                else if (ch == '\r') {
1430                     *d++ = '\\';
1431                     *d++ = 'r';
1432                }
1433                else if (ch == '\f') {
1434                     *d++ = '\\';
1435                     *d++ = 'f';
1436                }
1437                else if (ch == '\\') {
1438                     *d++ = '\\';
1439                     *d++ = '\\';
1440                }
1441                else if (ch == '\0') {
1442                     *d++ = '\\';
1443                     *d++ = '0';
1444                }
1445                else if (isPRINT_LC(ch))
1446                     *d++ = ch;
1447                else {
1448                     *d++ = '^';
1449                     *d++ = toCTRL(ch);
1450                }
1451           }
1452           if (s < end) {
1453                *d++ = '.';
1454                *d++ = '.';
1455                *d++ = '.';
1456           }
1457           *d = '\0';
1458           pv = tmpbuf;
1459     }
1460
1461     if (PL_op)
1462         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1463                     "Argument \"%s\" isn't numeric in %s", pv,
1464                     OP_DESC(PL_op));
1465     else
1466         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1467                     "Argument \"%s\" isn't numeric", pv);
1468 }
1469
1470 /*
1471 =for apidoc looks_like_number
1472
1473 Test if the content of an SV looks like a number (or is a number).
1474 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1475 non-numeric warning), even if your atof() doesn't grok them.
1476
1477 =cut
1478 */
1479
1480 I32
1481 Perl_looks_like_number(pTHX_ SV *sv)
1482 {
1483     register const char *sbegin;
1484     STRLEN len;
1485
1486     if (SvPOK(sv)) {
1487         sbegin = SvPVX_const(sv);
1488         len = SvCUR(sv);
1489     }
1490     else if (SvPOKp(sv))
1491         sbegin = SvPV_const(sv, len);
1492     else
1493         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1494     return grok_number(sbegin, len, NULL);
1495 }
1496
1497 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1498    until proven guilty, assume that things are not that bad... */
1499
1500 /*
1501    NV_PRESERVES_UV:
1502
1503    As 64 bit platforms often have an NV that doesn't preserve all bits of
1504    an IV (an assumption perl has been based on to date) it becomes necessary
1505    to remove the assumption that the NV always carries enough precision to
1506    recreate the IV whenever needed, and that the NV is the canonical form.
1507    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1508    precision as a side effect of conversion (which would lead to insanity
1509    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1510    1) to distinguish between IV/UV/NV slots that have cached a valid
1511       conversion where precision was lost and IV/UV/NV slots that have a
1512       valid conversion which has lost no precision
1513    2) to ensure that if a numeric conversion to one form is requested that
1514       would lose precision, the precise conversion (or differently
1515       imprecise conversion) is also performed and cached, to prevent
1516       requests for different numeric formats on the same SV causing
1517       lossy conversion chains. (lossless conversion chains are perfectly
1518       acceptable (still))
1519
1520
1521    flags are used:
1522    SvIOKp is true if the IV slot contains a valid value
1523    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1524    SvNOKp is true if the NV slot contains a valid value
1525    SvNOK  is true only if the NV value is accurate
1526
1527    so
1528    while converting from PV to NV, check to see if converting that NV to an
1529    IV(or UV) would lose accuracy over a direct conversion from PV to
1530    IV(or UV). If it would, cache both conversions, return NV, but mark
1531    SV as IOK NOKp (ie not NOK).
1532
1533    While converting from PV to IV, check to see if converting that IV to an
1534    NV would lose accuracy over a direct conversion from PV to NV. If it
1535    would, cache both conversions, flag similarly.
1536
1537    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1538    correctly because if IV & NV were set NV *always* overruled.
1539    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1540    changes - now IV and NV together means that the two are interchangeable:
1541    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1542
1543    The benefit of this is that operations such as pp_add know that if
1544    SvIOK is true for both left and right operands, then integer addition
1545    can be used instead of floating point (for cases where the result won't
1546    overflow). Before, floating point was always used, which could lead to
1547    loss of precision compared with integer addition.
1548
1549    * making IV and NV equal status should make maths accurate on 64 bit
1550      platforms
1551    * may speed up maths somewhat if pp_add and friends start to use
1552      integers when possible instead of fp. (Hopefully the overhead in
1553      looking for SvIOK and checking for overflow will not outweigh the
1554      fp to integer speedup)
1555    * will slow down integer operations (callers of SvIV) on "inaccurate"
1556      values, as the change from SvIOK to SvIOKp will cause a call into
1557      sv_2iv each time rather than a macro access direct to the IV slot
1558    * should speed up number->string conversion on integers as IV is
1559      favoured when IV and NV are equally accurate
1560
1561    ####################################################################
1562    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1563    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1564    On the other hand, SvUOK is true iff UV.
1565    ####################################################################
1566
1567    Your mileage will vary depending your CPU's relative fp to integer
1568    performance ratio.
1569 */
1570
1571 #ifndef NV_PRESERVES_UV
1572 #  define IS_NUMBER_UNDERFLOW_IV 1
1573 #  define IS_NUMBER_UNDERFLOW_UV 2
1574 #  define IS_NUMBER_IV_AND_UV    2
1575 #  define IS_NUMBER_OVERFLOW_IV  4
1576 #  define IS_NUMBER_OVERFLOW_UV  5
1577
1578 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1579
1580 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1581 STATIC int
1582 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1583 {
1584     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1585     if (SvNVX(sv) < (NV)IV_MIN) {
1586         (void)SvIOKp_on(sv);
1587         (void)SvNOK_on(sv);
1588         SvIV_set(sv, IV_MIN);
1589         return IS_NUMBER_UNDERFLOW_IV;
1590     }
1591     if (SvNVX(sv) > (NV)UV_MAX) {
1592         (void)SvIOKp_on(sv);
1593         (void)SvNOK_on(sv);
1594         SvIsUV_on(sv);
1595         SvUV_set(sv, UV_MAX);
1596         return IS_NUMBER_OVERFLOW_UV;
1597     }
1598     (void)SvIOKp_on(sv);
1599     (void)SvNOK_on(sv);
1600     /* Can't use strtol etc to convert this string.  (See truth table in
1601        sv_2iv  */
1602     if (SvNVX(sv) <= (UV)IV_MAX) {
1603         SvIV_set(sv, I_V(SvNVX(sv)));
1604         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1605             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1606         } else {
1607             /* Integer is imprecise. NOK, IOKp */
1608         }
1609         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1610     }
1611     SvIsUV_on(sv);
1612     SvUV_set(sv, U_V(SvNVX(sv)));
1613     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1614         if (SvUVX(sv) == UV_MAX) {
1615             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1616                possibly be preserved by NV. Hence, it must be overflow.
1617                NOK, IOKp */
1618             return IS_NUMBER_OVERFLOW_UV;
1619         }
1620         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1621     } else {
1622         /* Integer is imprecise. NOK, IOKp */
1623     }
1624     return IS_NUMBER_OVERFLOW_IV;
1625 }
1626 #endif /* !NV_PRESERVES_UV*/
1627
1628 /*
1629 =for apidoc sv_2iv_flags
1630
1631 Return the integer value of an SV, doing any necessary string
1632 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1633 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1634
1635 =cut
1636 */
1637
1638 IV
1639 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1640 {
1641     if (!sv)
1642         return 0;
1643     if (SvGMAGICAL(sv)) {
1644         if (flags & SV_GMAGIC)
1645             mg_get(sv);
1646         if (SvIOKp(sv))
1647             return SvIVX(sv);
1648         if (SvNOKp(sv)) {
1649             return I_V(SvNVX(sv));
1650         }
1651         if (SvPOKp(sv) && SvLEN(sv))
1652             return asIV(sv);
1653         if (!SvROK(sv)) {
1654             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1655                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1656                     report_uninit(sv);
1657             }
1658             return 0;
1659         }
1660     }
1661     if (SvTHINKFIRST(sv)) {
1662         if (SvROK(sv)) {
1663             if (SvAMAGIC(sv)) {
1664                 SV * const tmpstr=AMG_CALLun(sv,numer);
1665                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1666                     return SvIV(tmpstr);
1667                 }
1668             }
1669             return PTR2IV(SvRV(sv));
1670         }
1671         if (SvIsCOW(sv)) {
1672             sv_force_normal_flags(sv, 0);
1673         }
1674         if (SvREADONLY(sv) && !SvOK(sv)) {
1675             if (ckWARN(WARN_UNINITIALIZED))
1676                 report_uninit(sv);
1677             return 0;
1678         }
1679     }
1680     if (SvIOKp(sv)) {
1681         if (SvIsUV(sv)) {
1682             return (IV)(SvUVX(sv));
1683         }
1684         else {
1685             return SvIVX(sv);
1686         }
1687     }
1688     if (SvNOKp(sv)) {
1689         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1690          * without also getting a cached IV/UV from it at the same time
1691          * (ie PV->NV conversion should detect loss of accuracy and cache
1692          * IV or UV at same time to avoid this.  NWC */
1693
1694         if (SvTYPE(sv) == SVt_NV)
1695             sv_upgrade(sv, SVt_PVNV);
1696
1697         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1698         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1699            certainly cast into the IV range at IV_MAX, whereas the correct
1700            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1701            cases go to UV */
1702         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1703             SvIV_set(sv, I_V(SvNVX(sv)));
1704             if (SvNVX(sv) == (NV) SvIVX(sv)
1705 #ifndef NV_PRESERVES_UV
1706                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1707                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1708                 /* Don't flag it as "accurately an integer" if the number
1709                    came from a (by definition imprecise) NV operation, and
1710                    we're outside the range of NV integer precision */
1711 #endif
1712                 ) {
1713                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1714                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1715                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1716                                       PTR2UV(sv),
1717                                       SvNVX(sv),
1718                                       SvIVX(sv)));
1719
1720             } else {
1721                 /* IV not precise.  No need to convert from PV, as NV
1722                    conversion would already have cached IV if it detected
1723                    that PV->IV would be better than PV->NV->IV
1724                    flags already correct - don't set public IOK.  */
1725                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1726                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1727                                       PTR2UV(sv),
1728                                       SvNVX(sv),
1729                                       SvIVX(sv)));
1730             }
1731             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1732                but the cast (NV)IV_MIN rounds to a the value less (more
1733                negative) than IV_MIN which happens to be equal to SvNVX ??
1734                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1735                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1736                (NV)UVX == NVX are both true, but the values differ. :-(
1737                Hopefully for 2s complement IV_MIN is something like
1738                0x8000000000000000 which will be exact. NWC */
1739         }
1740         else {
1741             SvUV_set(sv, U_V(SvNVX(sv)));
1742             if (
1743                 (SvNVX(sv) == (NV) SvUVX(sv))
1744 #ifndef  NV_PRESERVES_UV
1745                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1746                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1747                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1748                 /* Don't flag it as "accurately an integer" if the number
1749                    came from a (by definition imprecise) NV operation, and
1750                    we're outside the range of NV integer precision */
1751 #endif
1752                 )
1753                 SvIOK_on(sv);
1754             SvIsUV_on(sv);
1755           ret_iv_max:
1756             DEBUG_c(PerlIO_printf(Perl_debug_log,
1757                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1758                                   PTR2UV(sv),
1759                                   SvUVX(sv),
1760                                   SvUVX(sv)));
1761             return (IV)SvUVX(sv);
1762         }
1763     }
1764     else if (SvPOKp(sv) && SvLEN(sv)) {
1765         UV value;
1766         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1767         /* We want to avoid a possible problem when we cache an IV which
1768            may be later translated to an NV, and the resulting NV is not
1769            the same as the direct translation of the initial string
1770            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1771            be careful to ensure that the value with the .456 is around if the
1772            NV value is requested in the future).
1773         
1774            This means that if we cache such an IV, we need to cache the
1775            NV as well.  Moreover, we trade speed for space, and do not
1776            cache the NV if we are sure it's not needed.
1777          */
1778
1779         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1780         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1781              == IS_NUMBER_IN_UV) {
1782             /* It's definitely an integer, only upgrade to PVIV */
1783             if (SvTYPE(sv) < SVt_PVIV)
1784                 sv_upgrade(sv, SVt_PVIV);
1785             (void)SvIOK_on(sv);
1786         } else if (SvTYPE(sv) < SVt_PVNV)
1787             sv_upgrade(sv, SVt_PVNV);
1788
1789         /* If NV preserves UV then we only use the UV value if we know that
1790            we aren't going to call atof() below. If NVs don't preserve UVs
1791            then the value returned may have more precision than atof() will
1792            return, even though value isn't perfectly accurate.  */
1793         if ((numtype & (IS_NUMBER_IN_UV
1794 #ifdef NV_PRESERVES_UV
1795                         | IS_NUMBER_NOT_INT
1796 #endif
1797             )) == IS_NUMBER_IN_UV) {
1798             /* This won't turn off the public IOK flag if it was set above  */
1799             (void)SvIOKp_on(sv);
1800
1801             if (!(numtype & IS_NUMBER_NEG)) {
1802                 /* positive */;
1803                 if (value <= (UV)IV_MAX) {
1804                     SvIV_set(sv, (IV)value);
1805                 } else {
1806                     SvUV_set(sv, value);
1807                     SvIsUV_on(sv);
1808                 }
1809             } else {
1810                 /* 2s complement assumption  */
1811                 if (value <= (UV)IV_MIN) {
1812                     SvIV_set(sv, -(IV)value);
1813                 } else {
1814                     /* Too negative for an IV.  This is a double upgrade, but
1815                        I'm assuming it will be rare.  */
1816                     if (SvTYPE(sv) < SVt_PVNV)
1817                         sv_upgrade(sv, SVt_PVNV);
1818                     SvNOK_on(sv);
1819                     SvIOK_off(sv);
1820                     SvIOKp_on(sv);
1821                     SvNV_set(sv, -(NV)value);
1822                     SvIV_set(sv, IV_MIN);
1823                 }
1824             }
1825         }
1826         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1827            will be in the previous block to set the IV slot, and the next
1828            block to set the NV slot.  So no else here.  */
1829         
1830         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1831             != IS_NUMBER_IN_UV) {
1832             /* It wasn't an (integer that doesn't overflow the UV). */
1833             SvNV_set(sv, Atof(SvPVX_const(sv)));
1834
1835             if (! numtype && ckWARN(WARN_NUMERIC))
1836                 not_a_number(sv);
1837
1838 #if defined(USE_LONG_DOUBLE)
1839             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1840                                   PTR2UV(sv), SvNVX(sv)));
1841 #else
1842             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1843                                   PTR2UV(sv), SvNVX(sv)));
1844 #endif
1845
1846
1847 #ifdef NV_PRESERVES_UV
1848             (void)SvIOKp_on(sv);
1849             (void)SvNOK_on(sv);
1850             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1851                 SvIV_set(sv, I_V(SvNVX(sv)));
1852                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1853                     SvIOK_on(sv);
1854                 } else {
1855                     /* Integer is imprecise. NOK, IOKp */
1856                 }
1857                 /* UV will not work better than IV */
1858             } else {
1859                 if (SvNVX(sv) > (NV)UV_MAX) {
1860                     SvIsUV_on(sv);
1861                     /* Integer is inaccurate. NOK, IOKp, is UV */
1862                     SvUV_set(sv, UV_MAX);
1863                     SvIsUV_on(sv);
1864                 } else {
1865                     SvUV_set(sv, U_V(SvNVX(sv)));
1866                     /* 0xFFFFFFFFFFFFFFFF not an issue in here */
1867                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1868                         SvIOK_on(sv);
1869                         SvIsUV_on(sv);
1870                     } else {
1871                         /* Integer is imprecise. NOK, IOKp, is UV */
1872                         SvIsUV_on(sv);
1873                     }
1874                 }
1875                 goto ret_iv_max;
1876             }
1877 #else /* NV_PRESERVES_UV */
1878             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1879                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1880                 /* The IV slot will have been set from value returned by
1881                    grok_number above.  The NV slot has just been set using
1882                    Atof.  */
1883                 SvNOK_on(sv);
1884                 assert (SvIOKp(sv));
1885             } else {
1886                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1887                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1888                     /* Small enough to preserve all bits. */
1889                     (void)SvIOKp_on(sv);
1890                     SvNOK_on(sv);
1891                     SvIV_set(sv, I_V(SvNVX(sv)));
1892                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1893                         SvIOK_on(sv);
1894                     /* Assumption: first non-preserved integer is < IV_MAX,
1895                        this NV is in the preserved range, therefore: */
1896                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1897                           < (UV)IV_MAX)) {
1898                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1899                     }
1900                 } else {
1901                     /* IN_UV NOT_INT
1902                          0      0       already failed to read UV.
1903                          0      1       already failed to read UV.
1904                          1      0       you won't get here in this case. IV/UV
1905                                         slot set, public IOK, Atof() unneeded.
1906                          1      1       already read UV.
1907                        so there's no point in sv_2iuv_non_preserve() attempting
1908                        to use atol, strtol, strtoul etc.  */
1909                     if (sv_2iuv_non_preserve (sv, numtype)
1910                         >= IS_NUMBER_OVERFLOW_IV)
1911                     goto ret_iv_max;
1912                 }
1913             }
1914 #endif /* NV_PRESERVES_UV */
1915         }
1916     } else  {
1917         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
1918             report_uninit(sv);
1919         if (SvTYPE(sv) < SVt_IV)
1920             /* Typically the caller expects that sv_any is not NULL now.  */
1921             sv_upgrade(sv, SVt_IV);
1922         return 0;
1923     }
1924     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1925         PTR2UV(sv),SvIVX(sv)));
1926     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1927 }
1928
1929 /*
1930 =for apidoc sv_2uv_flags
1931
1932 Return the unsigned integer value of an SV, doing any necessary string
1933 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1934 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1935
1936 =cut
1937 */
1938
1939 UV
1940 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1941 {
1942     if (!sv)
1943         return 0;
1944     if (SvGMAGICAL(sv)) {
1945         if (flags & SV_GMAGIC)
1946             mg_get(sv);
1947         if (SvIOKp(sv))
1948             return SvUVX(sv);
1949         if (SvNOKp(sv))
1950             return U_V(SvNVX(sv));
1951         if (SvPOKp(sv) && SvLEN(sv))
1952             return asUV(sv);
1953         if (!SvROK(sv)) {
1954             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1955                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1956                     report_uninit(sv);
1957             }
1958             return 0;
1959         }
1960     }
1961     if (SvTHINKFIRST(sv)) {
1962         if (SvROK(sv)) {
1963           SV* tmpstr;
1964           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
1965                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
1966               return SvUV(tmpstr);
1967           return PTR2UV(SvRV(sv));
1968         }
1969         if (SvIsCOW(sv)) {
1970             sv_force_normal_flags(sv, 0);
1971         }
1972         if (SvREADONLY(sv) && !SvOK(sv)) {
1973             if (ckWARN(WARN_UNINITIALIZED))
1974                 report_uninit(sv);
1975             return 0;
1976         }
1977     }
1978     if (SvIOKp(sv)) {
1979         if (SvIsUV(sv)) {
1980             return SvUVX(sv);
1981         }
1982         else {
1983             return (UV)SvIVX(sv);
1984         }
1985     }
1986     if (SvNOKp(sv)) {
1987         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1988          * without also getting a cached IV/UV from it at the same time
1989          * (ie PV->NV conversion should detect loss of accuracy and cache
1990          * IV or UV at same time to avoid this. */
1991         /* IV-over-UV optimisation - choose to cache IV if possible */
1992
1993         if (SvTYPE(sv) == SVt_NV)
1994             sv_upgrade(sv, SVt_PVNV);
1995
1996         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1997         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1998             SvIV_set(sv, I_V(SvNVX(sv)));
1999             if (SvNVX(sv) == (NV) SvIVX(sv)
2000 #ifndef NV_PRESERVES_UV
2001                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
2002                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
2003                 /* Don't flag it as "accurately an integer" if the number
2004                    came from a (by definition imprecise) NV operation, and
2005                    we're outside the range of NV integer precision */
2006 #endif
2007                 ) {
2008                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
2009                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2010                                       "0x%"UVxf" uv(%"NVgf" => %"IVdf") (precise)\n",
2011                                       PTR2UV(sv),
2012                                       SvNVX(sv),
2013                                       SvIVX(sv)));
2014
2015             } else {
2016                 /* IV not precise.  No need to convert from PV, as NV
2017                    conversion would already have cached IV if it detected
2018                    that PV->IV would be better than PV->NV->IV
2019                    flags already correct - don't set public IOK.  */
2020                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2021                                       "0x%"UVxf" uv(%"NVgf" => %"IVdf") (imprecise)\n",
2022                                       PTR2UV(sv),
2023                                       SvNVX(sv),
2024                                       SvIVX(sv)));
2025             }
2026             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
2027                but the cast (NV)IV_MIN rounds to a the value less (more
2028                negative) than IV_MIN which happens to be equal to SvNVX ??
2029                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
2030                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
2031                (NV)UVX == NVX are both true, but the values differ. :-(
2032                Hopefully for 2s complement IV_MIN is something like
2033                0x8000000000000000 which will be exact. NWC */
2034         }
2035         else {
2036             SvUV_set(sv, U_V(SvNVX(sv)));
2037             if (
2038                 (SvNVX(sv) == (NV) SvUVX(sv))
2039 #ifndef  NV_PRESERVES_UV
2040                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
2041                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
2042                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
2043                 /* Don't flag it as "accurately an integer" if the number
2044                    came from a (by definition imprecise) NV operation, and
2045                    we're outside the range of NV integer precision */
2046 #endif
2047                 )
2048                 SvIOK_on(sv);
2049             SvIsUV_on(sv);
2050             DEBUG_c(PerlIO_printf(Perl_debug_log,
2051                                   "0x%"UVxf" 2uv(%"UVuf" => %"IVdf") (as unsigned)\n",
2052                                   PTR2UV(sv),
2053                                   SvUVX(sv),
2054                                   SvUVX(sv)));
2055         }
2056     }
2057     else if (SvPOKp(sv) && SvLEN(sv)) {
2058         UV value;
2059         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2060
2061         /* We want to avoid a possible problem when we cache a UV which
2062            may be later translated to an NV, and the resulting NV is not
2063            the translation of the initial data.
2064         
2065            This means that if we cache such a UV, we need to cache the
2066            NV as well.  Moreover, we trade speed for space, and do not
2067            cache the NV if not needed.
2068          */
2069
2070         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
2071         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2072              == IS_NUMBER_IN_UV) {
2073             /* It's definitely an integer, only upgrade to PVIV */
2074             if (SvTYPE(sv) < SVt_PVIV)
2075                 sv_upgrade(sv, SVt_PVIV);
2076             (void)SvIOK_on(sv);
2077         } else if (SvTYPE(sv) < SVt_PVNV)
2078             sv_upgrade(sv, SVt_PVNV);
2079
2080         /* If NV preserves UV then we only use the UV value if we know that
2081            we aren't going to call atof() below. If NVs don't preserve UVs
2082            then the value returned may have more precision than atof() will
2083            return, even though it isn't accurate.  */
2084         if ((numtype & (IS_NUMBER_IN_UV
2085 #ifdef NV_PRESERVES_UV
2086                         | IS_NUMBER_NOT_INT
2087 #endif
2088             )) == IS_NUMBER_IN_UV) {
2089             /* This won't turn off the public IOK flag if it was set above  */
2090             (void)SvIOKp_on(sv);
2091
2092             if (!(numtype & IS_NUMBER_NEG)) {
2093                 /* positive */;
2094                 if (value <= (UV)IV_MAX) {
2095                     SvIV_set(sv, (IV)value);
2096                 } else {
2097                     /* it didn't overflow, and it was positive. */
2098                     SvUV_set(sv, value);
2099                     SvIsUV_on(sv);
2100                 }
2101             } else {
2102                 /* 2s complement assumption  */
2103                 if (value <= (UV)IV_MIN) {
2104                     SvIV_set(sv, -(IV)value);
2105                 } else {
2106                     /* Too negative for an IV.  This is a double upgrade, but
2107                        I'm assuming it will be rare.  */
2108                     if (SvTYPE(sv) < SVt_PVNV)
2109                         sv_upgrade(sv, SVt_PVNV);
2110                     SvNOK_on(sv);
2111                     SvIOK_off(sv);
2112                     SvIOKp_on(sv);
2113                     SvNV_set(sv, -(NV)value);
2114                     SvIV_set(sv, IV_MIN);
2115                 }
2116             }
2117         }
2118         
2119         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2120             != IS_NUMBER_IN_UV) {
2121             /* It wasn't an integer, or it overflowed the UV. */
2122             SvNV_set(sv, Atof(SvPVX_const(sv)));
2123
2124             if (! numtype && ckWARN(WARN_NUMERIC))
2125                     not_a_number(sv);
2126
2127 #if defined(USE_LONG_DOUBLE)
2128             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%" PERL_PRIgldbl ")\n",
2129                                   PTR2UV(sv), SvNVX(sv)));
2130 #else
2131             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"NVgf")\n",
2132                                   PTR2UV(sv), SvNVX(sv)));
2133 #endif
2134
2135 #ifdef NV_PRESERVES_UV
2136             (void)SvIOKp_on(sv);
2137             (void)SvNOK_on(sv);
2138             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2139                 SvIV_set(sv, I_V(SvNVX(sv)));
2140                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
2141                     SvIOK_on(sv);
2142                 } else {
2143                     /* Integer is imprecise. NOK, IOKp */
2144                 }
2145                 /* UV will not work better than IV */
2146             } else {
2147                 if (SvNVX(sv) > (NV)UV_MAX) {
2148                     SvIsUV_on(sv);
2149                     /* Integer is inaccurate. NOK, IOKp, is UV */
2150                     SvUV_set(sv, UV_MAX);
2151                     SvIsUV_on(sv);
2152                 } else {
2153                     SvUV_set(sv, U_V(SvNVX(sv)));
2154                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
2155                        NV preservse UV so can do correct comparison.  */
2156                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
2157                         SvIOK_on(sv);
2158                         SvIsUV_on(sv);
2159                     } else {
2160                         /* Integer is imprecise. NOK, IOKp, is UV */
2161                         SvIsUV_on(sv);
2162                     }
2163                 }
2164             }
2165 #else /* NV_PRESERVES_UV */
2166             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2167                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
2168                 /* The UV slot will have been set from value returned by
2169                    grok_number above.  The NV slot has just been set using
2170                    Atof.  */
2171                 SvNOK_on(sv);
2172                 assert (SvIOKp(sv));
2173             } else {
2174                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
2175                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2176                     /* Small enough to preserve all bits. */
2177                     (void)SvIOKp_on(sv);
2178                     SvNOK_on(sv);
2179                     SvIV_set(sv, I_V(SvNVX(sv)));
2180                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
2181                         SvIOK_on(sv);
2182                     /* Assumption: first non-preserved integer is < IV_MAX,
2183                        this NV is in the preserved range, therefore: */
2184                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
2185                           < (UV)IV_MAX)) {
2186                         Perl_croak(aTHX_ "sv_2uv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
2187                     }
2188                 } else
2189                     sv_2iuv_non_preserve (sv, numtype);
2190             }
2191 #endif /* NV_PRESERVES_UV */
2192         }
2193     }
2194     else  {
2195         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2196             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2197                 report_uninit(sv);
2198         }
2199         if (SvTYPE(sv) < SVt_IV)
2200             /* Typically the caller expects that sv_any is not NULL now.  */
2201             sv_upgrade(sv, SVt_IV);
2202         return 0;
2203     }
2204
2205     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2206                           PTR2UV(sv),SvUVX(sv)));
2207     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2208 }
2209
2210 /*
2211 =for apidoc sv_2nv
2212
2213 Return the num value of an SV, doing any necessary string or integer
2214 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2215 macros.
2216
2217 =cut
2218 */
2219
2220 NV
2221 Perl_sv_2nv(pTHX_ register SV *sv)
2222 {
2223     if (!sv)
2224         return 0.0;
2225     if (SvGMAGICAL(sv)) {
2226         mg_get(sv);
2227         if (SvNOKp(sv))
2228             return SvNVX(sv);
2229         if (SvPOKp(sv) && SvLEN(sv)) {
2230             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2231                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2232                 not_a_number(sv);
2233             return Atof(SvPVX_const(sv));
2234         }
2235         if (SvIOKp(sv)) {
2236             if (SvIsUV(sv))
2237                 return (NV)SvUVX(sv);
2238             else
2239                 return (NV)SvIVX(sv);
2240         }       
2241         if (!SvROK(sv)) {
2242             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2243                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2244                     report_uninit(sv);
2245             }
2246             return (NV)0;
2247         }
2248     }
2249     if (SvTHINKFIRST(sv)) {
2250         if (SvROK(sv)) {
2251           SV* tmpstr;
2252           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
2253                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
2254               return SvNV(tmpstr);
2255           return PTR2NV(SvRV(sv));
2256         }
2257         if (SvIsCOW(sv)) {
2258             sv_force_normal_flags(sv, 0);
2259         }
2260         if (SvREADONLY(sv) && !SvOK(sv)) {
2261             if (ckWARN(WARN_UNINITIALIZED))
2262                 report_uninit(sv);
2263             return 0.0;
2264         }
2265     }
2266     if (SvTYPE(sv) < SVt_NV) {
2267         if (SvTYPE(sv) == SVt_IV)
2268             sv_upgrade(sv, SVt_PVNV);
2269         else
2270             sv_upgrade(sv, SVt_NV);
2271 #ifdef USE_LONG_DOUBLE
2272         DEBUG_c({
2273             STORE_NUMERIC_LOCAL_SET_STANDARD();
2274             PerlIO_printf(Perl_debug_log,
2275                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2276                           PTR2UV(sv), SvNVX(sv));
2277             RESTORE_NUMERIC_LOCAL();
2278         });
2279 #else
2280         DEBUG_c({
2281             STORE_NUMERIC_LOCAL_SET_STANDARD();
2282             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2283                           PTR2UV(sv), SvNVX(sv));
2284             RESTORE_NUMERIC_LOCAL();
2285         });
2286 #endif
2287     }
2288     else if (SvTYPE(sv) < SVt_PVNV)
2289         sv_upgrade(sv, SVt_PVNV);
2290     if (SvNOKp(sv)) {
2291         return SvNVX(sv);
2292     }
2293     if (SvIOKp(sv)) {
2294         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2295 #ifdef NV_PRESERVES_UV
2296         SvNOK_on(sv);
2297 #else
2298         /* Only set the public NV OK flag if this NV preserves the IV  */
2299         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2300         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2301                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2302             SvNOK_on(sv);
2303         else
2304             SvNOKp_on(sv);
2305 #endif
2306     }
2307     else if (SvPOKp(sv) && SvLEN(sv)) {
2308         UV value;
2309         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2310         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2311             not_a_number(sv);
2312 #ifdef NV_PRESERVES_UV
2313         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2314             == IS_NUMBER_IN_UV) {
2315             /* It's definitely an integer */
2316             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2317         } else
2318             SvNV_set(sv, Atof(SvPVX_const(sv)));
2319         SvNOK_on(sv);
2320 #else
2321         SvNV_set(sv, Atof(SvPVX_const(sv)));
2322         /* Only set the public NV OK flag if this NV preserves the value in
2323            the PV at least as well as an IV/UV would.
2324            Not sure how to do this 100% reliably. */
2325         /* if that shift count is out of range then Configure's test is
2326            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2327            UV_BITS */
2328         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2329             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2330             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2331         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2332             /* Can't use strtol etc to convert this string, so don't try.
2333                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2334             SvNOK_on(sv);
2335         } else {
2336             /* value has been set.  It may not be precise.  */
2337             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2338                 /* 2s complement assumption for (UV)IV_MIN  */
2339                 SvNOK_on(sv); /* Integer is too negative.  */
2340             } else {
2341                 SvNOKp_on(sv);
2342                 SvIOKp_on(sv);
2343
2344                 if (numtype & IS_NUMBER_NEG) {
2345                     SvIV_set(sv, -(IV)value);
2346                 } else if (value <= (UV)IV_MAX) {
2347                     SvIV_set(sv, (IV)value);
2348                 } else {
2349                     SvUV_set(sv, value);
2350                     SvIsUV_on(sv);
2351                 }
2352
2353                 if (numtype & IS_NUMBER_NOT_INT) {
2354                     /* I believe that even if the original PV had decimals,
2355                        they are lost beyond the limit of the FP precision.
2356                        However, neither is canonical, so both only get p
2357                        flags.  NWC, 2000/11/25 */
2358                     /* Both already have p flags, so do nothing */
2359                 } else {
2360                     const NV nv = SvNVX(sv);
2361                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2362                         if (SvIVX(sv) == I_V(nv)) {
2363                             SvNOK_on(sv);
2364                             SvIOK_on(sv);
2365                         } else {
2366                             SvIOK_on(sv);
2367                             /* It had no "." so it must be integer.  */
2368                         }
2369                     } else {
2370                         /* between IV_MAX and NV(UV_MAX).
2371                            Could be slightly > UV_MAX */
2372
2373                         if (numtype & IS_NUMBER_NOT_INT) {
2374                             /* UV and NV both imprecise.  */
2375                         } else {
2376                             const UV nv_as_uv = U_V(nv);
2377
2378                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2379                                 SvNOK_on(sv);
2380                                 SvIOK_on(sv);
2381                             } else {
2382                                 SvIOK_on(sv);
2383                             }
2384                         }
2385                     }
2386                 }
2387             }
2388         }
2389 #endif /* NV_PRESERVES_UV */
2390     }
2391     else  {
2392         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2393             report_uninit(sv);
2394         if (SvTYPE(sv) < SVt_NV)
2395             /* Typically the caller expects that sv_any is not NULL now.  */
2396             /* XXX Ilya implies that this is a bug in callers that assume this
2397                and ideally should be fixed.  */
2398             sv_upgrade(sv, SVt_NV);
2399         return 0.0;
2400     }
2401 #if defined(USE_LONG_DOUBLE)
2402     DEBUG_c({
2403         STORE_NUMERIC_LOCAL_SET_STANDARD();
2404         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2405                       PTR2UV(sv), SvNVX(sv));
2406         RESTORE_NUMERIC_LOCAL();
2407     });
2408 #else
2409     DEBUG_c({
2410         STORE_NUMERIC_LOCAL_SET_STANDARD();
2411         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2412                       PTR2UV(sv), SvNVX(sv));
2413         RESTORE_NUMERIC_LOCAL();
2414     });
2415 #endif
2416     return SvNVX(sv);
2417 }
2418
2419 /* asIV(): extract an integer from the string value of an SV.
2420  * Caller must validate PVX  */
2421
2422 STATIC IV
2423 S_asIV(pTHX_ SV *sv)
2424 {
2425     UV value;
2426     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2427
2428     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2429         == IS_NUMBER_IN_UV) {
2430         /* It's definitely an integer */
2431         if (numtype & IS_NUMBER_NEG) {
2432             if (value < (UV)IV_MIN)
2433                 return -(IV)value;
2434         } else {
2435             if (value < (UV)IV_MAX)
2436                 return (IV)value;
2437         }
2438     }
2439     if (!numtype) {
2440         if (ckWARN(WARN_NUMERIC))
2441             not_a_number(sv);
2442     }
2443     return I_V(Atof(SvPVX_const(sv)));
2444 }
2445
2446 /* asUV(): extract an unsigned integer from the string value of an SV
2447  * Caller must validate PVX  */
2448
2449 STATIC UV
2450 S_asUV(pTHX_ SV *sv)
2451 {
2452     UV value;
2453     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2454
2455     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2456         == IS_NUMBER_IN_UV) {
2457         /* It's definitely an integer */
2458         if (!(numtype & IS_NUMBER_NEG))
2459             return value;
2460     }
2461     if (!numtype) {
2462         if (ckWARN(WARN_NUMERIC))
2463             not_a_number(sv);
2464     }
2465     return U_V(Atof(SvPVX_const(sv)));
2466 }
2467
2468 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2469  * UV as a string towards the end of buf, and return pointers to start and
2470  * end of it.
2471  *
2472  * We assume that buf is at least TYPE_CHARS(UV) long.
2473  */
2474
2475 static char *
2476 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2477 {
2478     char *ptr = buf + TYPE_CHARS(UV);
2479     char * const ebuf = ptr;
2480     int sign;
2481
2482     if (is_uv)
2483         sign = 0;
2484     else if (iv >= 0) {
2485         uv = iv;
2486         sign = 0;
2487     } else {
2488         uv = -iv;
2489         sign = 1;
2490     }
2491     do {
2492         *--ptr = '0' + (char)(uv % 10);
2493     } while (uv /= 10);
2494     if (sign)
2495         *--ptr = '-';
2496     *peob = ebuf;
2497     return ptr;
2498 }
2499
2500 /*
2501 =for apidoc sv_2pv_flags
2502
2503 Returns a pointer to the string value of an SV, and sets *lp to its length.
2504 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2505 if necessary.
2506 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2507 usually end up here too.
2508
2509 =cut
2510 */
2511
2512 char *
2513 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2514 {
2515     register char *s;
2516     int olderrno;
2517     SV *tsv, *origsv;
2518     char tbuf[64];      /* Must fit sprintf/Gconvert of longest IV/NV */
2519     char *tmpbuf = tbuf;
2520     STRLEN len = 0;     /* Hush gcc. len is always initialised before use.  */
2521
2522     if (!sv) {
2523         if (lp)
2524             *lp = 0;
2525         return (char *)"";
2526     }
2527     if (SvGMAGICAL(sv)) {
2528         if (flags & SV_GMAGIC)
2529             mg_get(sv);
2530         if (SvPOKp(sv)) {
2531             if (lp)
2532                 *lp = SvCUR(sv);
2533             if (flags & SV_MUTABLE_RETURN)
2534                 return SvPVX_mutable(sv);
2535             if (flags & SV_CONST_RETURN)
2536                 return (char *)SvPVX_const(sv);
2537             return SvPVX(sv);
2538         }
2539         if (SvIOKp(sv)) {
2540             len = SvIsUV(sv) ? my_sprintf(tmpbuf,"%"UVuf, (UV)SvUVX(sv))
2541                 : my_sprintf(tmpbuf,"%"IVdf, (IV)SvIVX(sv));
2542             tsv = Nullsv;
2543             goto tokensave_has_len;
2544         }
2545         if (SvNOKp(sv)) {
2546             Gconvert(SvNVX(sv), NV_DIG, 0, tmpbuf);
2547             tsv = Nullsv;
2548             goto tokensave;
2549         }
2550         if (!SvROK(sv)) {
2551             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2552                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2553                     report_uninit(sv);
2554             }
2555             if (lp)
2556                 *lp = 0;
2557             return (char *)"";
2558         }
2559     }
2560     if (SvTHINKFIRST(sv)) {
2561         if (SvROK(sv)) {
2562             SV* tmpstr;
2563             register const char *typestr;
2564             if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,string)) &&
2565                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2566                 /* Unwrap this:  */
2567                 /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr); */
2568
2569                 char *pv;
2570                 if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2571                     if (flags & SV_CONST_RETURN) {
2572                         pv = (char *) SvPVX_const(tmpstr);
2573                     } else {
2574                         pv = (flags & SV_MUTABLE_RETURN)
2575                             ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2576                     }
2577                     if (lp)
2578                         *lp = SvCUR(tmpstr);
2579                 } else {
2580                     pv = sv_2pv_flags(tmpstr, lp, flags);
2581                 }
2582                 if (SvUTF8(tmpstr))
2583                     SvUTF8_on(sv);
2584                 else
2585                     SvUTF8_off(sv);
2586                 return pv;
2587             }
2588             origsv = sv;
2589             sv = (SV*)SvRV(sv);
2590             if (!sv)
2591                 typestr = "NULLREF";
2592             else {
2593                 MAGIC *mg;
2594                 
2595                 switch (SvTYPE(sv)) {
2596                 case SVt_PVMG:
2597                     if ( ((SvFLAGS(sv) &
2598                            (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2599                           == (SVs_OBJECT|SVs_SMG))
2600                          && (mg = mg_find(sv, PERL_MAGIC_qr))) {
2601                         const regexp *re = (regexp *)mg->mg_obj;
2602
2603                         if (!mg->mg_ptr) {
2604                             const char *fptr = "msix";
2605                             char reflags[6];
2606                             char ch;
2607                             int left = 0;
2608                             int right = 4;
2609                             char need_newline = 0;
2610                             U16 reganch = (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2611
2612                             while((ch = *fptr++)) {
2613                                 if(reganch & 1) {
2614                                     reflags[left++] = ch;
2615                                 }
2616                                 else {
2617                                     reflags[right--] = ch;
2618                                 }
2619                                 reganch >>= 1;
2620                             }
2621                             if(left != 4) {
2622                                 reflags[left] = '-';
2623                                 left = 5;
2624                             }
2625
2626                             mg->mg_len = re->prelen + 4 + left;
2627                             /*
2628                              * If /x was used, we have to worry about a regex
2629                              * ending with a comment later being embedded
2630                              * within another regex. If so, we don't want this
2631                              * regex's "commentization" to leak out to the
2632                              * right part of the enclosing regex, we must cap
2633                              * it with a newline.
2634                              *
2635                              * So, if /x was used, we scan backwards from the
2636                              * end of the regex. If we find a '#' before we
2637                              * find a newline, we need to add a newline
2638                              * ourself. If we find a '\n' first (or if we
2639                              * don't find '#' or '\n'), we don't need to add
2640                              * anything.  -jfriedl
2641                              */
2642                             if (PMf_EXTENDED & re->reganch)
2643                             {
2644                                 const char *endptr = re->precomp + re->prelen;
2645                                 while (endptr >= re->precomp)
2646                                 {
2647                                     const char c = *(endptr--);
2648                                     if (c == '\n')
2649                                         break; /* don't need another */
2650                                     if (c == '#') {
2651                                         /* we end while in a comment, so we
2652                                            need a newline */
2653                                         mg->mg_len++; /* save space for it */
2654                                         need_newline = 1; /* note to add it */
2655                                         break;
2656                                     }
2657                                 }
2658                             }
2659
2660                             Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2661                             Copy("(?", mg->mg_ptr, 2, char);
2662                             Copy(reflags, mg->mg_ptr+2, left, char);
2663                             Copy(":", mg->mg_ptr+left+2, 1, char);
2664                             Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2665                             if (need_newline)
2666                                 mg->mg_ptr[mg->mg_len - 2] = '\n';
2667                             mg->mg_ptr[mg->mg_len - 1] = ')';
2668                             mg->mg_ptr[mg->mg_len] = 0;
2669                         }
2670                         PL_reginterp_cnt += re->program[0].next_off;
2671
2672                         if (re->reganch & ROPT_UTF8)
2673                             SvUTF8_on(origsv);
2674                         else
2675                             SvUTF8_off(origsv);
2676                         if (lp)
2677                             *lp = mg->mg_len;
2678                         return mg->mg_ptr;
2679                     }
2680                                         /* Fall through */
2681                 case SVt_NULL:
2682                 case SVt_IV:
2683                 case SVt_NV:
2684                 case SVt_RV:
2685                 case SVt_PV:
2686                 case SVt_PVIV:
2687                 case SVt_PVNV:
2688                 case SVt_PVBM:  typestr = SvROK(sv) ? "REF" : "SCALAR"; break;
2689                 case SVt_PVLV:  typestr = SvROK(sv) ? "REF"
2690                                 /* tied lvalues should appear to be
2691                                  * scalars for backwards compatitbility */
2692                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
2693                                     ? "SCALAR" : "LVALUE";      break;
2694                 case SVt_PVAV:  typestr = "ARRAY";      break;
2695                 case SVt_PVHV:  typestr = "HASH";       break;
2696                 case SVt_PVCV:  typestr = "CODE";       break;
2697                 case SVt_PVGV:  typestr = "GLOB";       break;
2698                 case SVt_PVFM:  typestr = "FORMAT";     break;
2699                 case SVt_PVIO:  typestr = "IO";         break;
2700                 default:        typestr = "UNKNOWN";    break;
2701                 }
2702                 tsv = NEWSV(0,0);
2703                 if (SvOBJECT(sv)) {
2704                     const char * const name = HvNAME_get(SvSTASH(sv));
2705                     Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2706                                    name ? name : "__ANON__" , typestr, PTR2UV(sv));
2707                 }
2708                 else
2709                     Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr, PTR2UV(sv));
2710                 goto tokensaveref;
2711             }
2712             if (lp)
2713                 *lp = strlen(typestr);
2714             return (char *)typestr;
2715         }
2716         if (SvREADONLY(sv) && !SvOK(sv)) {
2717             if (ckWARN(WARN_UNINITIALIZED))
2718                 report_uninit(sv);
2719             if (lp)
2720                 *lp = 0;
2721             return (char *)"";
2722         }
2723     }
2724     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2725         /* I'm assuming that if both IV and NV are equally valid then
2726            converting the IV is going to be more efficient */
2727         const U32 isIOK = SvIOK(sv);
2728         const U32 isUIOK = SvIsUV(sv);
2729         char buf[TYPE_CHARS(UV)];
2730         char *ebuf, *ptr;
2731
2732         if (SvTYPE(sv) < SVt_PVIV)
2733             sv_upgrade(sv, SVt_PVIV);
2734         if (isUIOK)
2735             ptr = uiv_2buf(buf, 0, SvUVX(sv), 1, &ebuf);
2736         else
2737             ptr = uiv_2buf(buf, SvIVX(sv), 0, 0, &ebuf);
2738         /* inlined from sv_setpvn */
2739         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2740         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2741         SvCUR_set(sv, ebuf - ptr);
2742         s = SvEND(sv);
2743         *s = '\0';
2744         if (isIOK)
2745             SvIOK_on(sv);
2746         else
2747             SvIOKp_on(sv);
2748         if (isUIOK)
2749             SvIsUV_on(sv);
2750     }
2751     else if (SvNOKp(sv)) {
2752         if (SvTYPE(sv) < SVt_PVNV)
2753             sv_upgrade(sv, SVt_PVNV);
2754         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2755         s = SvGROW_mutable(sv, NV_DIG + 20);
2756         olderrno = errno;       /* some Xenix systems wipe out errno here */
2757 #ifdef apollo
2758         if (SvNVX(sv) == 0.0)
2759             (void)strcpy(s,"0");
2760         else
2761 #endif /*apollo*/
2762         {
2763             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2764         }
2765         errno = olderrno;
2766 #ifdef FIXNEGATIVEZERO
2767         if (*s == '-' && s[1] == '0' && !s[2])
2768             strcpy(s,"0");
2769 #endif
2770         while (*s) s++;
2771 #ifdef hcx
2772         if (s[-1] == '.')
2773             *--s = '\0';
2774 #endif
2775     }
2776     else {
2777         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2778             report_uninit(sv);
2779         if (lp)
2780         *lp = 0;
2781         if (SvTYPE(sv) < SVt_PV)
2782             /* Typically the caller expects that sv_any is not NULL now.  */
2783             sv_upgrade(sv, SVt_PV);
2784         return (char *)"";
2785     }
2786     {
2787         const STRLEN len = s - SvPVX_const(sv);
2788         if (lp) 
2789             *lp = len;
2790         SvCUR_set(sv, len);
2791     }
2792     SvPOK_on(sv);
2793     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2794                           PTR2UV(sv),SvPVX_const(sv)));
2795     if (flags & SV_CONST_RETURN)
2796         return (char *)SvPVX_const(sv);
2797     if (flags & SV_MUTABLE_RETURN)
2798         return SvPVX_mutable(sv);
2799     return SvPVX(sv);
2800
2801   tokensave:
2802     len = strlen(tmpbuf);
2803  tokensave_has_len:
2804     assert (!tsv);
2805     if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2806         /* Sneaky stuff here */
2807
2808       tokensaveref:
2809         if (!tsv)
2810             tsv = newSVpvn(tmpbuf, len);
2811         sv_2mortal(tsv);
2812         if (lp)
2813             *lp = SvCUR(tsv);
2814         return SvPVX(tsv);
2815     }
2816     else {
2817         dVAR;
2818
2819 #ifdef FIXNEGATIVEZERO
2820         if (len == 2 && tmpbuf[0] == '-' && tmpbuf[1] == '0') {
2821             tmpbuf[0] = '0';
2822             tmpbuf[1] = 0;
2823             len = 1;
2824         }
2825 #endif
2826         SvUPGRADE(sv, SVt_PV);
2827         if (lp)
2828             *lp = len;
2829         s = SvGROW_mutable(sv, len + 1);
2830         SvCUR_set(sv, len);
2831         SvPOKp_on(sv);
2832         return memcpy(s, tmpbuf, len + 1);
2833     }
2834 }
2835
2836 /*
2837 =for apidoc sv_copypv
2838
2839 Copies a stringified representation of the source SV into the
2840 destination SV.  Automatically performs any necessary mg_get and
2841 coercion of numeric values into strings.  Guaranteed to preserve
2842 UTF-8 flag even from overloaded objects.  Similar in nature to
2843 sv_2pv[_flags] but operates directly on an SV instead of just the
2844 string.  Mostly uses sv_2pv_flags to do its work, except when that
2845 would lose the UTF-8'ness of the PV.
2846
2847 =cut
2848 */
2849
2850 void
2851 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2852 {
2853     STRLEN len;
2854     const char * const s = SvPV_const(ssv,len);
2855     sv_setpvn(dsv,s,len);
2856     if (SvUTF8(ssv))
2857         SvUTF8_on(dsv);
2858     else
2859         SvUTF8_off(dsv);
2860 }
2861
2862 /*
2863 =for apidoc sv_2pvbyte
2864
2865 Return a pointer to the byte-encoded representation of the SV, and set *lp
2866 to its length.  May cause the SV to be downgraded from UTF-8 as a
2867 side-effect.
2868
2869 Usually accessed via the C<SvPVbyte> macro.
2870
2871 =cut
2872 */
2873
2874 char *
2875 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2876 {
2877     sv_utf8_downgrade(sv,0);
2878     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2879 }
2880
2881 /*
2882 =for apidoc sv_2pvutf8
2883
2884 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2885 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2886
2887 Usually accessed via the C<SvPVutf8> macro.
2888
2889 =cut
2890 */
2891
2892 char *
2893 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2894 {
2895     sv_utf8_upgrade(sv);
2896     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2897 }
2898
2899
2900 /*
2901 =for apidoc sv_2bool
2902
2903 This function is only called on magical items, and is only used by
2904 sv_true() or its macro equivalent.
2905
2906 =cut
2907 */
2908
2909 bool
2910 Perl_sv_2bool(pTHX_ register SV *sv)
2911 {
2912     SvGETMAGIC(sv);
2913
2914     if (!SvOK(sv))
2915         return 0;
2916     if (SvROK(sv)) {
2917         SV* tmpsv;
2918         if (SvAMAGIC(sv) && (tmpsv=AMG_CALLun(sv,bool_)) &&
2919                 (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2920             return (bool)SvTRUE(tmpsv);
2921       return SvRV(sv) != 0;
2922     }
2923     if (SvPOKp(sv)) {
2924         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2925         if (Xpvtmp &&
2926                 (*sv->sv_u.svu_pv > '0' ||
2927                 Xpvtmp->xpv_cur > 1 ||
2928                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2929             return 1;
2930         else
2931             return 0;
2932     }
2933     else {
2934         if (SvIOKp(sv))
2935             return SvIVX(sv) != 0;
2936         else {
2937             if (SvNOKp(sv))
2938                 return SvNVX(sv) != 0.0;
2939             else
2940                 return FALSE;
2941         }
2942     }
2943 }
2944
2945 /*
2946 =for apidoc sv_utf8_upgrade
2947
2948 Converts the PV of an SV to its UTF-8-encoded form.
2949 Forces the SV to string form if it is not already.
2950 Always sets the SvUTF8 flag to avoid future validity checks even
2951 if all the bytes have hibit clear.
2952
2953 This is not as a general purpose byte encoding to Unicode interface:
2954 use the Encode extension for that.
2955
2956 =for apidoc sv_utf8_upgrade_flags
2957
2958 Converts the PV of an SV to its UTF-8-encoded form.
2959 Forces the SV to string form if it is not already.
2960 Always sets the SvUTF8 flag to avoid future validity checks even
2961 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2962 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2963 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2964
2965 This is not as a general purpose byte encoding to Unicode interface:
2966 use the Encode extension for that.
2967
2968 =cut
2969 */
2970
2971 STRLEN
2972 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2973 {
2974     if (sv == &PL_sv_undef)
2975         return 0;
2976     if (!SvPOK(sv)) {
2977         STRLEN len = 0;
2978         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2979             (void) sv_2pv_flags(sv,&len, flags);
2980             if (SvUTF8(sv))
2981                 return len;
2982         } else {
2983             (void) SvPV_force(sv,len);
2984         }
2985     }
2986
2987     if (SvUTF8(sv)) {
2988         return SvCUR(sv);
2989     }
2990
2991     if (SvIsCOW(sv)) {
2992         sv_force_normal_flags(sv, 0);
2993     }
2994
2995     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2996         sv_recode_to_utf8(sv, PL_encoding);
2997     else { /* Assume Latin-1/EBCDIC */
2998         /* This function could be much more efficient if we
2999          * had a FLAG in SVs to signal if there are any hibit
3000          * chars in the PV.  Given that there isn't such a flag
3001          * make the loop as fast as possible. */
3002         const U8 *s = (U8 *) SvPVX_const(sv);
3003         const U8 * const e = (U8 *) SvEND(sv);
3004         const U8 *t = s;
3005         int hibit = 0;
3006         
3007         while (t < e) {
3008             const U8 ch = *t++;
3009             if ((hibit = !NATIVE_IS_INVARIANT(ch)))
3010                 break;
3011         }
3012         if (hibit) {
3013             STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
3014             U8 * const recoded = bytes_to_utf8((U8*)s, &len);
3015
3016             SvPV_free(sv); /* No longer using what was there before. */
3017
3018             SvPV_set(sv, (char*)recoded);
3019             SvCUR_set(sv, len - 1);
3020             SvLEN_set(sv, len); /* No longer know the real size. */
3021         }
3022         /* Mark as UTF-8 even if no hibit - saves scanning loop */
3023         SvUTF8_on(sv);
3024     }
3025     return SvCUR(sv);
3026 }
3027
3028 /*
3029 =for apidoc sv_utf8_downgrade
3030
3031 Attempts to convert the PV of an SV from characters to bytes.
3032 If the PV contains a character beyond byte, this conversion will fail;
3033 in this case, either returns false or, if C<fail_ok> is not
3034 true, croaks.
3035
3036 This is not as a general purpose Unicode to byte encoding interface:
3037 use the Encode extension for that.
3038
3039 =cut
3040 */
3041
3042 bool
3043 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
3044 {
3045     if (SvPOKp(sv) && SvUTF8(sv)) {
3046         if (SvCUR(sv)) {
3047             U8 *s;
3048             STRLEN len;
3049
3050             if (SvIsCOW(sv)) {
3051                 sv_force_normal_flags(sv, 0);
3052             }
3053             s = (U8 *) SvPV(sv, len);
3054             if (!utf8_to_bytes(s, &len)) {
3055                 if (fail_ok)
3056                     return FALSE;
3057                 else {
3058                     if (PL_op)
3059                         Perl_croak(aTHX_ "Wide character in %s",
3060                                    OP_DESC(PL_op));
3061                     else
3062                         Perl_croak(aTHX_ "Wide character");
3063                 }
3064             }
3065             SvCUR_set(sv, len);
3066         }
3067     }
3068     SvUTF8_off(sv);
3069     return TRUE;
3070 }
3071
3072 /*
3073 =for apidoc sv_utf8_encode
3074
3075 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
3076 flag off so that it looks like octets again.
3077
3078 =cut
3079 */
3080
3081 void
3082 Perl_sv_utf8_encode(pTHX_ register SV *sv)
3083 {
3084     (void) sv_utf8_upgrade(sv);
3085     if (SvIsCOW(sv)) {
3086         sv_force_normal_flags(sv, 0);
3087     }
3088     if (SvREADONLY(sv)) {
3089         Perl_croak(aTHX_ PL_no_modify);
3090     }
3091     SvUTF8_off(sv);
3092 }
3093
3094 /*
3095 =for apidoc sv_utf8_decode
3096
3097 If the PV of the SV is an octet sequence in UTF-8
3098 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
3099 so that it looks like a character. If the PV contains only single-byte
3100 characters, the C<SvUTF8> flag stays being off.
3101 Scans PV for validity and returns false if the PV is invalid UTF-8.
3102
3103 =cut
3104 */
3105
3106 bool
3107 Perl_sv_utf8_decode(pTHX_ register SV *sv)
3108 {
3109     if (SvPOKp(sv)) {
3110         const U8 *c;
3111         const U8 *e;
3112
3113         /* The octets may have got themselves encoded - get them back as
3114          * bytes
3115          */
3116         if (!sv_utf8_downgrade(sv, TRUE))
3117             return FALSE;
3118
3119         /* it is actually just a matter of turning the utf8 flag on, but
3120          * we want to make sure everything inside is valid utf8 first.
3121          */
3122         c = (const U8 *) SvPVX_const(sv);
3123         if (!is_utf8_string(c, SvCUR(sv)+1))
3124             return FALSE;
3125         e = (const U8 *) SvEND(sv);
3126         while (c < e) {
3127             const U8 ch = *c++;
3128             if (!UTF8_IS_INVARIANT(ch)) {
3129                 SvUTF8_on(sv);
3130                 break;
3131             }
3132         }
3133     }
3134     return TRUE;
3135 }
3136
3137 /*
3138 =for apidoc sv_setsv
3139
3140 Copies the contents of the source SV C<ssv> into the destination SV
3141 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3142 function if the source SV needs to be reused. Does not handle 'set' magic.
3143 Loosely speaking, it performs a copy-by-value, obliterating any previous
3144 content of the destination.
3145
3146 You probably want to use one of the assortment of wrappers, such as
3147 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3148 C<SvSetMagicSV_nosteal>.
3149
3150 =for apidoc sv_setsv_flags
3151
3152 Copies the contents of the source SV C<ssv> into the destination SV
3153 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3154 function if the source SV needs to be reused. Does not handle 'set' magic.
3155 Loosely speaking, it performs a copy-by-value, obliterating any previous
3156 content of the destination.
3157 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
3158 C<ssv> if appropriate, else not. If the C<flags> parameter has the
3159 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
3160 and C<sv_setsv_nomg> are implemented in terms of this function.
3161
3162 You probably want to use one of the assortment of wrappers, such as
3163 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3164 C<SvSetMagicSV_nosteal>.
3165
3166 This is the primary function for copying scalars, and most other
3167 copy-ish functions and macros use this underneath.
3168
3169 =cut
3170 */
3171
3172 void
3173 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
3174 {
3175     register U32 sflags;
3176     register int dtype;
3177     register int stype;
3178
3179     if (sstr == dstr)
3180         return;
3181     SV_CHECK_THINKFIRST_COW_DROP(dstr);
3182     if (!sstr)
3183         sstr = &PL_sv_undef;
3184     stype = SvTYPE(sstr);
3185     dtype = SvTYPE(dstr);
3186
3187     SvAMAGIC_off(dstr);
3188     if ( SvVOK(dstr) )
3189     {
3190         /* need to nuke the magic */
3191         mg_free(dstr);
3192         SvRMAGICAL_off(dstr);
3193     }
3194
3195     /* There's a lot of redundancy below but we're going for speed here */
3196
3197     switch (stype) {
3198     case SVt_NULL:
3199       undef_sstr:
3200         if (dtype != SVt_PVGV) {
3201             (void)SvOK_off(dstr);
3202             return;
3203         }
3204         break;
3205     case SVt_IV:
3206         if (SvIOK(sstr)) {
3207             switch (dtype) {
3208             case SVt_NULL:
3209                 sv_upgrade(dstr, SVt_IV);
3210                 break;
3211             case SVt_NV:
3212                 sv_upgrade(dstr, SVt_PVNV);
3213                 break;
3214             case SVt_RV:
3215             case SVt_PV:
3216                 sv_upgrade(dstr, SVt_PVIV);
3217                 break;
3218             }
3219             (void)SvIOK_only(dstr);
3220             SvIV_set(dstr,  SvIVX(sstr));
3221             if (SvIsUV(sstr))
3222                 SvIsUV_on(dstr);
3223             if (SvTAINTED(sstr))
3224                 SvTAINT(dstr);
3225             return;
3226         }
3227         goto undef_sstr;
3228
3229     case SVt_NV:
3230         if (SvNOK(sstr)) {
3231             switch (dtype) {
3232             case SVt_NULL:
3233             case SVt_IV:
3234                 sv_upgrade(dstr, SVt_NV);
3235                 break;
3236             case SVt_RV:
3237             case SVt_PV:
3238             case SVt_PVIV:
3239                 sv_upgrade(dstr, SVt_PVNV);
3240                 break;
3241             }
3242             SvNV_set(dstr, SvNVX(sstr));
3243             (void)SvNOK_only(dstr);
3244             if (SvTAINTED(sstr))
3245                 SvTAINT(dstr);
3246             return;
3247         }
3248         goto undef_sstr;
3249
3250     case SVt_RV:
3251         if (dtype < SVt_RV)
3252             sv_upgrade(dstr, SVt_RV);
3253         else if (dtype == SVt_PVGV &&
3254                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
3255             sstr = SvRV(sstr);
3256             if (sstr == dstr) {
3257                 if (GvIMPORTED(dstr) != GVf_IMPORTED
3258                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3259                 {
3260                     GvIMPORTED_on(dstr);
3261                 }
3262                 GvMULTI_on(dstr);
3263                 return;
3264             }
3265             goto glob_assign;
3266         }
3267         break;
3268     case SVt_PVFM:
3269 #ifdef PERL_OLD_COPY_ON_WRITE
3270         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3271             if (dtype < SVt_PVIV)
3272                 sv_upgrade(dstr, SVt_PVIV);
3273             break;
3274         }
3275         /* Fall through */
3276 #endif
3277     case SVt_PV:
3278         if (dtype < SVt_PV)
3279             sv_upgrade(dstr, SVt_PV);
3280         break;
3281     case SVt_PVIV:
3282         if (dtype < SVt_PVIV)
3283             sv_upgrade(dstr, SVt_PVIV);
3284         break;
3285     case SVt_PVNV:
3286         if (dtype < SVt_PVNV)
3287             sv_upgrade(dstr, SVt_PVNV);
3288         break;
3289     case SVt_PVAV:
3290     case SVt_PVHV:
3291     case SVt_PVCV:
3292     case SVt_PVIO:
3293         {
3294         const char * const type = sv_reftype(sstr,0);
3295         if (PL_op)
3296             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3297         else
3298             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3299         }
3300         break;
3301
3302     case SVt_PVGV:
3303         if (dtype <= SVt_PVGV) {
3304   glob_assign:
3305             if (dtype != SVt_PVGV) {
3306                 const char * const name = GvNAME(sstr);
3307                 const STRLEN len = GvNAMELEN(sstr);
3308                 /* don't upgrade SVt_PVLV: it can hold a glob */
3309                 if (dtype != SVt_PVLV)
3310                     sv_upgrade(dstr, SVt_PVGV);
3311                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3312                 GvSTASH(dstr) = GvSTASH(sstr);
3313                 if (GvSTASH(dstr))
3314                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3315                 GvNAME(dstr) = savepvn(name, len);
3316                 GvNAMELEN(dstr) = len;
3317                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3318             }
3319
3320 #ifdef GV_UNIQUE_CHECK
3321                 if (GvUNIQUE((GV*)dstr)) {
3322                     Perl_croak(aTHX_ PL_no_modify);
3323                 }
3324 #endif
3325
3326             (void)SvOK_off(dstr);
3327             GvINTRO_off(dstr);          /* one-shot flag */
3328             gp_free((GV*)dstr);
3329             GvGP(dstr) = gp_ref(GvGP(sstr));
3330             if (SvTAINTED(sstr))
3331                 SvTAINT(dstr);
3332             if (GvIMPORTED(dstr) != GVf_IMPORTED
3333                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3334             {
3335                 GvIMPORTED_on(dstr);
3336             }
3337             GvMULTI_on(dstr);
3338             return;
3339         }
3340         /* FALL THROUGH */
3341
3342     default:
3343         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3344             mg_get(sstr);
3345             if ((int)SvTYPE(sstr) != stype) {
3346                 stype = SvTYPE(sstr);
3347                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3348                     goto glob_assign;
3349             }
3350         }
3351         if (stype == SVt_PVLV)
3352             SvUPGRADE(dstr, SVt_PVNV);
3353         else
3354             SvUPGRADE(dstr, (U32)stype);
3355     }
3356
3357     sflags = SvFLAGS(sstr);
3358
3359     if (sflags & SVf_ROK) {
3360         if (dtype >= SVt_PV) {
3361             if (dtype == SVt_PVGV) {
3362                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3363                 SV *dref = 0;
3364                 const int intro = GvINTRO(dstr);
3365
3366 #ifdef GV_UNIQUE_CHECK
3367                 if (GvUNIQUE((GV*)dstr)) {
3368                     Perl_croak(aTHX_ PL_no_modify);
3369                 }
3370 #endif
3371
3372                 if (intro) {
3373                     GvINTRO_off(dstr);  /* one-shot flag */
3374                     GvLINE(dstr) = CopLINE(PL_curcop);
3375                     GvEGV(dstr) = (GV*)dstr;
3376                 }
3377                 GvMULTI_on(dstr);
3378                 switch (SvTYPE(sref)) {
3379                 case SVt_PVAV:
3380                     if (intro)
3381                         SAVEGENERICSV(GvAV(dstr));
3382                     else
3383                         dref = (SV*)GvAV(dstr);
3384                     GvAV(dstr) = (AV*)sref;
3385                     if (!GvIMPORTED_AV(dstr)
3386                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3387                     {
3388                         GvIMPORTED_AV_on(dstr);
3389                     }
3390                     break;
3391                 case SVt_PVHV:
3392                     if (intro)
3393                         SAVEGENERICSV(GvHV(dstr));
3394                     else
3395                         dref = (SV*)GvHV(dstr);
3396                     GvHV(dstr) = (HV*)sref;
3397                     if (!GvIMPORTED_HV(dstr)
3398                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3399                     {
3400                         GvIMPORTED_HV_on(dstr);
3401                     }
3402                     break;
3403                 case SVt_PVCV:
3404                     if (intro) {
3405                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3406                             SvREFCNT_dec(GvCV(dstr));
3407                             GvCV(dstr) = Nullcv;
3408                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3409                             PL_sub_generation++;
3410                         }
3411                         SAVEGENERICSV(GvCV(dstr));
3412                     }
3413                     else
3414                         dref = (SV*)GvCV(dstr);
3415                     if (GvCV(dstr) != (CV*)sref) {
3416                         CV* const cv = GvCV(dstr);
3417                         if (cv) {
3418                             if (!GvCVGEN((GV*)dstr) &&
3419                                 (CvROOT(cv) || CvXSUB(cv)))
3420                             {
3421                                 /* Redefining a sub - warning is mandatory if
3422                                    it was a const and its value changed. */
3423                                 if (ckWARN(WARN_REDEFINE)
3424                                     || (CvCONST(cv)
3425                                         && (!CvCONST((CV*)sref)
3426                                             || sv_cmp(cv_const_sv(cv),
3427                                                       cv_const_sv((CV*)sref)))))
3428                                 {
3429                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3430                                         CvCONST(cv)
3431                                         ? "Constant subroutine %s::%s redefined"
3432                                         : "Subroutine %s::%s redefined",
3433                                         HvNAME_get(GvSTASH((GV*)dstr)),
3434                                         GvENAME((GV*)dstr));
3435                                 }
3436                             }
3437                             if (!intro)
3438                                 cv_ckproto(cv, (GV*)dstr,
3439                                            SvPOK(sref)
3440                                            ? SvPVX_const(sref) : Nullch);
3441                         }
3442                         GvCV(dstr) = (CV*)sref;
3443                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3444                         GvASSUMECV_on(dstr);
3445                         PL_sub_generation++;
3446                     }
3447                     if (!GvIMPORTED_CV(dstr)
3448                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3449                     {
3450                         GvIMPORTED_CV_on(dstr);
3451                     }
3452                     break;
3453                 case SVt_PVIO:
3454                     if (intro)
3455                         SAVEGENERICSV(GvIOp(dstr));
3456                     else
3457                         dref = (SV*)GvIOp(dstr);
3458                     GvIOp(dstr) = (IO*)sref;
3459                     break;
3460                 case SVt_PVFM:
3461                     if (intro)
3462                         SAVEGENERICSV(GvFORM(dstr));
3463                     else
3464                         dref = (SV*)GvFORM(dstr);
3465                     GvFORM(dstr) = (CV*)sref;
3466                     break;
3467                 default:
3468                     if (intro)
3469                         SAVEGENERICSV(GvSV(dstr));
3470                     else
3471                         dref = (SV*)GvSV(dstr);
3472                     GvSV(dstr) = sref;
3473                     if (!GvIMPORTED_SV(dstr)
3474                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3475                     {
3476                         GvIMPORTED_SV_on(dstr);
3477                     }
3478                     break;
3479                 }
3480                 if (dref)
3481                     SvREFCNT_dec(dref);
3482                 if (SvTAINTED(sstr))
3483                     SvTAINT(dstr);
3484                 return;
3485             }
3486             if (SvPVX_const(dstr)) {
3487                 SvPV_free(dstr);
3488                 SvLEN_set(dstr, 0);
3489                 SvCUR_set(dstr, 0);
3490             }
3491         }
3492         (void)SvOK_off(dstr);
3493         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3494         SvROK_on(dstr);
3495         if (sflags & SVp_NOK) {
3496             SvNOKp_on(dstr);
3497             /* Only set the public OK flag if the source has public OK.  */
3498             if (sflags & SVf_NOK)
3499                 SvFLAGS(dstr) |= SVf_NOK;
3500             SvNV_set(dstr, SvNVX(sstr));
3501         }
3502         if (sflags & SVp_IOK) {
3503             (void)SvIOKp_on(dstr);
3504             if (sflags & SVf_IOK)
3505                 SvFLAGS(dstr) |= SVf_IOK;
3506             if (sflags & SVf_IVisUV)
3507                 SvIsUV_on(dstr);
3508             SvIV_set(dstr, SvIVX(sstr));
3509         }
3510         if (SvAMAGIC(sstr)) {
3511             SvAMAGIC_on(dstr);
3512         }
3513     }
3514     else if (sflags & SVp_POK) {
3515         bool isSwipe = 0;
3516
3517         /*
3518          * Check to see if we can just swipe the string.  If so, it's a
3519          * possible small lose on short strings, but a big win on long ones.
3520          * It might even be a win on short strings if SvPVX_const(dstr)
3521          * has to be allocated and SvPVX_const(sstr) has to be freed.
3522          */
3523
3524         /* Whichever path we take through the next code, we want this true,
3525            and doing it now facilitates the COW check.  */
3526         (void)SvPOK_only(dstr);
3527
3528         if (
3529             /* We're not already COW  */
3530             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3531 #ifndef PERL_OLD_COPY_ON_WRITE
3532              /* or we are, but dstr isn't a suitable target.  */
3533              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3534 #endif
3535              )
3536             &&
3537             !(isSwipe =
3538                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3539                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3540                  (!(flags & SV_NOSTEAL)) &&
3541                                         /* and we're allowed to steal temps */
3542                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3543                  SvLEN(sstr)    &&        /* and really is a string */
3544                                 /* and won't be needed again, potentially */
3545               !(PL_op && PL_op->op_type == OP_AASSIGN))
3546 #ifdef PERL_OLD_COPY_ON_WRITE
3547             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3548                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3549                  && SvTYPE(sstr) >= SVt_PVIV)
3550 #endif
3551             ) {
3552             /* Failed the swipe test, and it's not a shared hash key either.
3553                Have to copy the string.  */
3554             STRLEN len = SvCUR(sstr);
3555             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3556             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3557             SvCUR_set(dstr, len);
3558             *SvEND(dstr) = '\0';
3559         } else {
3560             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3561                be true in here.  */
3562             /* Either it's a shared hash key, or it's suitable for
3563                copy-on-write or we can swipe the string.  */
3564             if (DEBUG_C_TEST) {
3565                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3566                 sv_dump(sstr);
3567                 sv_dump(dstr);
3568             }
3569 #ifdef PERL_OLD_COPY_ON_WRITE
3570             if (!isSwipe) {
3571                 /* I believe I should acquire a global SV mutex if
3572                    it's a COW sv (not a shared hash key) to stop
3573                    it going un copy-on-write.
3574                    If the source SV has gone un copy on write between up there
3575                    and down here, then (assert() that) it is of the correct
3576                    form to make it copy on write again */
3577                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3578                     != (SVf_FAKE | SVf_READONLY)) {
3579                     SvREADONLY_on(sstr);
3580                     SvFAKE_on(sstr);
3581                     /* Make the source SV into a loop of 1.
3582                        (about to become 2) */
3583                     SV_COW_NEXT_SV_SET(sstr, sstr);
3584                 }
3585             }
3586 #endif
3587             /* Initial code is common.  */
3588             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3589                 SvPV_free(dstr);
3590             }
3591
3592             if (!isSwipe) {
3593                 /* making another shared SV.  */
3594                 STRLEN cur = SvCUR(sstr);
3595                 STRLEN len = SvLEN(sstr);
3596 #ifdef PERL_OLD_COPY_ON_WRITE
3597                 if (len) {
3598                     assert (SvTYPE(dstr) >= SVt_PVIV);
3599                     /* SvIsCOW_normal */
3600                     /* splice us in between source and next-after-source.  */
3601                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3602                     SV_COW_NEXT_SV_SET(sstr, dstr);
3603                     SvPV_set(dstr, SvPVX_mutable(sstr));
3604                 } else
3605 #endif
3606                 {
3607                     /* SvIsCOW_shared_hash */
3608                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3609                                           "Copy on write: Sharing hash\n"));
3610
3611                     assert (SvTYPE(dstr) >= SVt_PV);
3612                     SvPV_set(dstr,
3613                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3614                 }
3615                 SvLEN_set(dstr, len);
3616                 SvCUR_set(dstr, cur);
3617                 SvREADONLY_on(dstr);
3618                 SvFAKE_on(dstr);
3619                 /* Relesase a global SV mutex.  */
3620             }
3621             else
3622                 {       /* Passes the swipe test.  */
3623                 SvPV_set(dstr, SvPVX_mutable(sstr));
3624                 SvLEN_set(dstr, SvLEN(sstr));
3625                 SvCUR_set(dstr, SvCUR(sstr));
3626
3627                 SvTEMP_off(dstr);
3628                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3629                 SvPV_set(sstr, Nullch);
3630                 SvLEN_set(sstr, 0);
3631                 SvCUR_set(sstr, 0);
3632                 SvTEMP_off(sstr);
3633             }
3634         }
3635         if (sflags & SVf_UTF8)
3636             SvUTF8_on(dstr);
3637         if (sflags & SVp_NOK) {
3638             SvNOKp_on(dstr);
3639             if (sflags & SVf_NOK)
3640                 SvFLAGS(dstr) |= SVf_NOK;
3641             SvNV_set(dstr, SvNVX(sstr));
3642         }
3643         if (sflags & SVp_IOK) {
3644             (void)SvIOKp_on(dstr);
3645             if (sflags & SVf_IOK)
3646                 SvFLAGS(dstr) |= SVf_IOK;
3647             if (sflags & SVf_IVisUV)
3648                 SvIsUV_on(dstr);
3649             SvIV_set(dstr, SvIVX(sstr));
3650         }
3651         if (SvVOK(sstr)) {
3652             MAGIC *smg = mg_find(sstr,PERL_MAGIC_vstring);
3653             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3654                         smg->mg_ptr, smg->mg_len);
3655             SvRMAGICAL_on(dstr);
3656         }
3657     }
3658     else if (sflags & SVp_IOK) {
3659         if (sflags & SVf_IOK)
3660             (void)SvIOK_only(dstr);
3661         else {
3662             (void)SvOK_off(dstr);
3663             (void)SvIOKp_on(dstr);
3664         }
3665         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3666         if (sflags & SVf_IVisUV)
3667             SvIsUV_on(dstr);
3668         SvIV_set(dstr, SvIVX(sstr));
3669         if (sflags & SVp_NOK) {
3670             if (sflags & SVf_NOK)
3671                 (void)SvNOK_on(dstr);
3672             else
3673                 (void)SvNOKp_on(dstr);
3674             SvNV_set(dstr, SvNVX(sstr));
3675         }
3676     }
3677     else if (sflags & SVp_NOK) {
3678         if (sflags & SVf_NOK)
3679             (void)SvNOK_only(dstr);
3680         else {
3681             (void)SvOK_off(dstr);
3682             SvNOKp_on(dstr);
3683         }
3684         SvNV_set(dstr, SvNVX(sstr));
3685     }
3686     else {
3687         if (dtype == SVt_PVGV) {
3688             if (ckWARN(WARN_MISC))
3689                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3690         }
3691         else
3692             (void)SvOK_off(dstr);
3693     }
3694     if (SvTAINTED(sstr))
3695         SvTAINT(dstr);
3696 }
3697
3698 /*
3699 =for apidoc sv_setsv_mg
3700
3701 Like C<sv_setsv>, but also handles 'set' magic.
3702
3703 =cut
3704 */
3705
3706 void
3707 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3708 {
3709     sv_setsv(dstr,sstr);
3710     SvSETMAGIC(dstr);
3711 }
3712
3713 #ifdef PERL_OLD_COPY_ON_WRITE
3714 SV *
3715 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3716 {
3717     STRLEN cur = SvCUR(sstr);
3718     STRLEN len = SvLEN(sstr);
3719     register char *new_pv;
3720
3721     if (DEBUG_C_TEST) {
3722         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3723                       sstr, dstr);
3724         sv_dump(sstr);
3725         if (dstr)
3726                     sv_dump(dstr);
3727     }
3728
3729     if (dstr) {
3730         if (SvTHINKFIRST(dstr))
3731             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3732         else if (SvPVX_const(dstr))
3733             Safefree(SvPVX_const(dstr));
3734     }
3735     else
3736         new_SV(dstr);
3737     SvUPGRADE(dstr, SVt_PVIV);
3738
3739     assert (SvPOK(sstr));
3740     assert (SvPOKp(sstr));
3741     assert (!SvIOK(sstr));
3742     assert (!SvIOKp(sstr));
3743     assert (!SvNOK(sstr));
3744     assert (!SvNOKp(sstr));
3745
3746     if (SvIsCOW(sstr)) {
3747
3748         if (SvLEN(sstr) == 0) {
3749             /* source is a COW shared hash key.  */
3750             DEBUG_C(PerlIO_printf(Perl_debug_log,
3751                                   "Fast copy on write: Sharing hash\n"));
3752             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3753             goto common_exit;
3754         }
3755         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3756     } else {
3757         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3758         SvUPGRADE(sstr, SVt_PVIV);
3759         SvREADONLY_on(sstr);
3760         SvFAKE_on(sstr);
3761         DEBUG_C(PerlIO_printf(Perl_debug_log,
3762                               "Fast copy on write: Converting sstr to COW\n"));
3763         SV_COW_NEXT_SV_SET(dstr, sstr);
3764     }
3765     SV_COW_NEXT_SV_SET(sstr, dstr);
3766     new_pv = SvPVX_mutable(sstr);
3767
3768   common_exit:
3769     SvPV_set(dstr, new_pv);
3770     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3771     if (SvUTF8(sstr))
3772         SvUTF8_on(dstr);
3773     SvLEN_set(dstr, len);
3774     SvCUR_set(dstr, cur);
3775     if (DEBUG_C_TEST) {
3776         sv_dump(dstr);
3777     }
3778     return dstr;
3779 }
3780 #endif
3781
3782 /*
3783 =for apidoc sv_setpvn
3784
3785 Copies a string into an SV.  The C<len> parameter indicates the number of
3786 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3787 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3788
3789 =cut
3790 */
3791
3792 void
3793 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3794 {
3795     register char *dptr;
3796
3797     SV_CHECK_THINKFIRST_COW_DROP(sv);
3798     if (!ptr) {
3799         (void)SvOK_off(sv);
3800         return;
3801     }
3802     else {
3803         /* len is STRLEN which is unsigned, need to copy to signed */
3804         const IV iv = len;
3805         if (iv < 0)
3806             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3807     }
3808     SvUPGRADE(sv, SVt_PV);
3809
3810     dptr = SvGROW(sv, len + 1);
3811     Move(ptr,dptr,len,char);
3812     dptr[len] = '\0';
3813     SvCUR_set(sv, len);
3814     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3815     SvTAINT(sv);
3816 }
3817
3818 /*
3819 =for apidoc sv_setpvn_mg
3820
3821 Like C<sv_setpvn>, but also handles 'set' magic.
3822
3823 =cut
3824 */
3825
3826 void
3827 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3828 {
3829     sv_setpvn(sv,ptr,len);
3830     SvSETMAGIC(sv);
3831 }
3832
3833 /*
3834 =for apidoc sv_setpv
3835
3836 Copies a string into an SV.  The string must be null-terminated.  Does not
3837 handle 'set' magic.  See C<sv_setpv_mg>.
3838
3839 =cut
3840 */
3841
3842 void
3843 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3844 {
3845     register STRLEN len;
3846
3847     SV_CHECK_THINKFIRST_COW_DROP(sv);
3848     if (!ptr) {
3849         (void)SvOK_off(sv);
3850         return;
3851     }
3852     len = strlen(ptr);
3853     SvUPGRADE(sv, SVt_PV);
3854
3855     SvGROW(sv, len + 1);
3856     Move(ptr,SvPVX(sv),len+1,char);
3857     SvCUR_set(sv, len);
3858     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3859     SvTAINT(sv);
3860 }
3861
3862 /*
3863 =for apidoc sv_setpv_mg
3864
3865 Like C<sv_setpv>, but also handles 'set' magic.
3866
3867 =cut
3868 */
3869
3870 void
3871 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3872 {
3873     sv_setpv(sv,ptr);
3874     SvSETMAGIC(sv);
3875 }
3876
3877 /*
3878 =for apidoc sv_usepvn
3879
3880 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3881 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3882 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3883 string length, C<len>, must be supplied.  This function will realloc the
3884 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3885 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3886 See C<sv_usepvn_mg>.
3887
3888 =cut
3889 */
3890
3891 void
3892 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3893 {
3894     STRLEN allocate;
3895     SV_CHECK_THINKFIRST_COW_DROP(sv);
3896     SvUPGRADE(sv, SVt_PV);
3897     if (!ptr) {
3898         (void)SvOK_off(sv);
3899         return;
3900     }
3901     if (SvPVX_const(sv))
3902         SvPV_free(sv);
3903
3904     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3905     ptr = saferealloc (ptr, allocate);
3906     SvPV_set(sv, ptr);
3907     SvCUR_set(sv, len);
3908     SvLEN_set(sv, allocate);
3909     *SvEND(sv) = '\0';
3910     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3911     SvTAINT(sv);
3912 }
3913
3914 /*
3915 =for apidoc sv_usepvn_mg
3916
3917 Like C<sv_usepvn>, but also handles 'set' magic.
3918
3919 =cut
3920 */
3921
3922 void
3923 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3924 {
3925     sv_usepvn(sv,ptr,len);
3926     SvSETMAGIC(sv);
3927 }
3928
3929 #ifdef PERL_OLD_COPY_ON_WRITE
3930 /* Need to do this *after* making the SV normal, as we need the buffer
3931    pointer to remain valid until after we've copied it.  If we let go too early,
3932    another thread could invalidate it by unsharing last of the same hash key
3933    (which it can do by means other than releasing copy-on-write Svs)
3934    or by changing the other copy-on-write SVs in the loop.  */
3935 STATIC void
3936 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3937 {
3938     if (len) { /* this SV was SvIsCOW_normal(sv) */
3939          /* we need to find the SV pointing to us.  */
3940         SV * const current = SV_COW_NEXT_SV(after);
3941
3942         if (current == sv) {
3943             /* The SV we point to points back to us (there were only two of us
3944                in the loop.)
3945                Hence other SV is no longer copy on write either.  */
3946             SvFAKE_off(after);
3947             SvREADONLY_off(after);
3948         } else {
3949             /* We need to follow the pointers around the loop.  */
3950             SV *next;
3951             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3952                 assert (next);
3953                 current = next;
3954                  /* don't loop forever if the structure is bust, and we have
3955                     a pointer into a closed loop.  */
3956                 assert (current != after);
3957                 assert (SvPVX_const(current) == pvx);
3958             }
3959             /* Make the SV before us point to the SV after us.  */
3960             SV_COW_NEXT_SV_SET(current, after);
3961         }
3962     } else {
3963         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3964     }
3965 }
3966
3967 int
3968 Perl_sv_release_IVX(pTHX_ register SV *sv)
3969 {
3970     if (SvIsCOW(sv))
3971         sv_force_normal_flags(sv, 0);
3972     SvOOK_off(sv);
3973     return 0;
3974 }
3975 #endif
3976 /*
3977 =for apidoc sv_force_normal_flags
3978
3979 Undo various types of fakery on an SV: if the PV is a shared string, make
3980 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3981 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3982 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3983 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3984 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3985 set to some other value.) In addition, the C<flags> parameter gets passed to
3986 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3987 with flags set to 0.
3988
3989 =cut
3990 */
3991
3992 void
3993 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3994 {
3995 #ifdef PERL_OLD_COPY_ON_WRITE
3996     if (SvREADONLY(sv)) {
3997         /* At this point I believe I should acquire a global SV mutex.  */
3998         if (SvFAKE(sv)) {
3999             const char * const pvx = SvPVX_const(sv);
4000             const STRLEN len = SvLEN(sv);
4001             const STRLEN cur = SvCUR(sv);
4002             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
4003             if (DEBUG_C_TEST) {
4004                 PerlIO_printf(Perl_debug_log,
4005                               "Copy on write: Force normal %ld\n",
4006                               (long) flags);
4007                 sv_dump(sv);
4008             }
4009             SvFAKE_off(sv);
4010             SvREADONLY_off(sv);
4011             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
4012             SvPV_set(sv, (char*)0);
4013             SvLEN_set(sv, 0);
4014             if (flags & SV_COW_DROP_PV) {
4015                 /* OK, so we don't need to copy our buffer.  */
4016                 SvPOK_off(sv);
4017             } else {
4018                 SvGROW(sv, cur + 1);
4019                 Move(pvx,SvPVX(sv),cur,char);
4020                 SvCUR_set(sv, cur);
4021                 *SvEND(sv) = '\0';
4022             }
4023             sv_release_COW(sv, pvx, len, next);
4024             if (DEBUG_C_TEST) {
4025                 sv_dump(sv);
4026             }
4027         }
4028         else if (IN_PERL_RUNTIME)
4029             Perl_croak(aTHX_ PL_no_modify);
4030         /* At this point I believe that I can drop the global SV mutex.  */
4031     }
4032 #else
4033     if (SvREADONLY(sv)) {
4034         if (SvFAKE(sv)) {
4035             const char * const pvx = SvPVX_const(sv);
4036             const STRLEN len = SvCUR(sv);
4037             SvFAKE_off(sv);
4038             SvREADONLY_off(sv);
4039             SvPV_set(sv, Nullch);
4040             SvLEN_set(sv, 0);
4041             SvGROW(sv, len + 1);
4042             Move(pvx,SvPVX(sv),len,char);
4043             *SvEND(sv) = '\0';
4044             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
4045         }
4046         else if (IN_PERL_RUNTIME)
4047             Perl_croak(aTHX_ PL_no_modify);
4048     }
4049 #endif
4050     if (SvROK(sv))
4051         sv_unref_flags(sv, flags);
4052     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
4053         sv_unglob(sv);
4054 }
4055
4056 /*
4057 =for apidoc sv_chop
4058
4059 Efficient removal of characters from the beginning of the string buffer.
4060 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
4061 the string buffer.  The C<ptr> becomes the first character of the adjusted
4062 string. Uses the "OOK hack".
4063 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
4064 refer to the same chunk of data.
4065
4066 =cut
4067 */
4068
4069 void
4070 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
4071 {
4072     register STRLEN delta;
4073     if (!ptr || !SvPOKp(sv))
4074         return;
4075     delta = ptr - SvPVX_const(sv);
4076     SV_CHECK_THINKFIRST(sv);
4077     if (SvTYPE(sv) < SVt_PVIV)
4078         sv_upgrade(sv,SVt_PVIV);
4079
4080     if (!SvOOK(sv)) {
4081         if (!SvLEN(sv)) { /* make copy of shared string */
4082             const char *pvx = SvPVX_const(sv);
4083             const STRLEN len = SvCUR(sv);
4084             SvGROW(sv, len + 1);
4085             Move(pvx,SvPVX(sv),len,char);
4086             *SvEND(sv) = '\0';
4087         }
4088         SvIV_set(sv, 0);
4089         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
4090            and we do that anyway inside the SvNIOK_off
4091         */
4092         SvFLAGS(sv) |= SVf_OOK;
4093     }
4094     SvNIOK_off(sv);
4095     SvLEN_set(sv, SvLEN(sv) - delta);
4096     SvCUR_set(sv, SvCUR(sv) - delta);
4097     SvPV_set(sv, SvPVX(sv) + delta);
4098     SvIV_set(sv, SvIVX(sv) + delta);
4099 }
4100
4101 /*
4102 =for apidoc sv_catpvn
4103
4104 Concatenates the string onto the end of the string which is in the SV.  The
4105 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4106 status set, then the bytes appended should be valid UTF-8.
4107 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
4108
4109 =for apidoc sv_catpvn_flags
4110
4111 Concatenates the string onto the end of the string which is in the SV.  The
4112 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4113 status set, then the bytes appended should be valid UTF-8.
4114 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
4115 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
4116 in terms of this function.
4117
4118 =cut
4119 */
4120
4121 void
4122 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
4123 {
4124     STRLEN dlen;
4125     const char *dstr = SvPV_force_flags(dsv, dlen, flags);
4126
4127     SvGROW(dsv, dlen + slen + 1);
4128     if (sstr == dstr)
4129         sstr = SvPVX_const(dsv);
4130     Move(sstr, SvPVX(dsv) + dlen, slen, char);
4131     SvCUR_set(dsv, SvCUR(dsv) + slen);
4132     *SvEND(dsv) = '\0';
4133     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
4134     SvTAINT(dsv);
4135     if (flags & SV_SMAGIC)
4136         SvSETMAGIC(dsv);
4137 }
4138
4139 /*
4140 =for apidoc sv_catsv
4141
4142 Concatenates the string from SV C<ssv> onto the end of the string in
4143 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
4144 not 'set' magic.  See C<sv_catsv_mg>.
4145
4146 =for apidoc sv_catsv_flags
4147
4148 Concatenates the string from SV C<ssv> onto the end of the string in
4149 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
4150 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
4151 and C<sv_catsv_nomg> are implemented in terms of this function.
4152
4153 =cut */
4154
4155 void
4156 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
4157 {
4158     const char *spv;
4159     STRLEN slen;
4160     if (ssv) {
4161         if ((spv = SvPV_const(ssv, slen))) {
4162             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
4163                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
4164                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
4165                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
4166                 dsv->sv_flags doesn't have that bit set.
4167                 Andy Dougherty  12 Oct 2001
4168             */
4169             const I32 sutf8 = DO_UTF8(ssv);
4170             I32 dutf8;
4171
4172             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
4173                 mg_get(dsv);
4174             dutf8 = DO_UTF8(dsv);
4175
4176             if (dutf8 != sutf8) {
4177                 if (dutf8) {
4178                     /* Not modifying source SV, so taking a temporary copy. */
4179                     SV* csv = sv_2mortal(newSVpvn(spv, slen));
4180
4181                     sv_utf8_upgrade(csv);
4182                     spv = SvPV_const(csv, slen);
4183                 }
4184                 else
4185                     sv_utf8_upgrade_nomg(dsv);
4186             }
4187             sv_catpvn_nomg(dsv, spv, slen);
4188         }
4189     }
4190     if (flags & SV_SMAGIC)
4191         SvSETMAGIC(dsv);
4192 }
4193
4194 /*
4195 =for apidoc sv_catpv
4196
4197 Concatenates the string onto the end of the string which is in the SV.
4198 If the SV has the UTF-8 status set, then the bytes appended should be
4199 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
4200
4201 =cut */
4202
4203 void
4204 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
4205 {
4206     register STRLEN len;
4207     STRLEN tlen;
4208     char *junk;
4209
4210     if (!ptr)
4211         return;
4212     junk = SvPV_force(sv, tlen);
4213     len = strlen(ptr);
4214     SvGROW(sv, tlen + len + 1);
4215     if (ptr == junk)
4216         ptr = SvPVX_const(sv);
4217     Move(ptr,SvPVX(sv)+tlen,len+1,char);
4218     SvCUR_set(sv, SvCUR(sv) + len);
4219     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
4220     SvTAINT(sv);
4221 }
4222
4223 /*
4224 =for apidoc sv_catpv_mg
4225
4226 Like C<sv_catpv>, but also handles 'set' magic.
4227
4228 =cut
4229 */
4230
4231 void
4232 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
4233 {
4234     sv_catpv(sv,ptr);
4235     SvSETMAGIC(sv);
4236 }
4237
4238 /*
4239 =for apidoc newSV
4240
4241 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
4242 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
4243 macro.
4244
4245 =cut
4246 */
4247
4248 SV *
4249 Perl_newSV(pTHX_ STRLEN len)
4250 {
4251     register SV *sv;
4252
4253     new_SV(sv);
4254     if (len) {
4255         sv_upgrade(sv, SVt_PV);
4256         SvGROW(sv, len + 1);
4257     }
4258     return sv;
4259 }
4260 /*
4261 =for apidoc sv_magicext
4262
4263 Adds magic to an SV, upgrading it if necessary. Applies the
4264 supplied vtable and returns a pointer to the magic added.
4265
4266 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4267 In particular, you can add magic to SvREADONLY SVs, and add more than
4268 one instance of the same 'how'.
4269
4270 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4271 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4272 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4273 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4274
4275 (This is now used as a subroutine by C<sv_magic>.)
4276
4277 =cut
4278 */
4279 MAGIC * 
4280 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4281                  const char* name, I32 namlen)
4282 {
4283     MAGIC* mg;
4284
4285     if (SvTYPE(sv) < SVt_PVMG) {
4286         SvUPGRADE(sv, SVt_PVMG);
4287     }
4288     Newxz(mg, 1, MAGIC);
4289     mg->mg_moremagic = SvMAGIC(sv);
4290     SvMAGIC_set(sv, mg);
4291
4292     /* Sometimes a magic contains a reference loop, where the sv and
4293        object refer to each other.  To prevent a reference loop that
4294        would prevent such objects being freed, we look for such loops
4295        and if we find one we avoid incrementing the object refcount.
4296
4297        Note we cannot do this to avoid self-tie loops as intervening RV must
4298        have its REFCNT incremented to keep it in existence.
4299
4300     */
4301     if (!obj || obj == sv ||
4302         how == PERL_MAGIC_arylen ||
4303         how == PERL_MAGIC_qr ||
4304         how == PERL_MAGIC_symtab ||
4305         (SvTYPE(obj) == SVt_PVGV &&
4306             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4307             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4308             GvFORM(obj) == (CV*)sv)))
4309     {
4310         mg->mg_obj = obj;
4311     }
4312     else {
4313         mg->mg_obj = SvREFCNT_inc(obj);
4314         mg->mg_flags |= MGf_REFCOUNTED;
4315     }
4316
4317     /* Normal self-ties simply pass a null object, and instead of
4318        using mg_obj directly, use the SvTIED_obj macro to produce a
4319        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4320        with an RV obj pointing to the glob containing the PVIO.  In
4321        this case, to avoid a reference loop, we need to weaken the
4322        reference.
4323     */
4324
4325     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4326         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4327     {
4328       sv_rvweaken(obj);
4329     }
4330
4331     mg->mg_type = how;
4332     mg->mg_len = namlen;
4333     if (name) {
4334         if (namlen > 0)
4335             mg->mg_ptr = savepvn(name, namlen);
4336         else if (namlen == HEf_SVKEY)
4337             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4338         else
4339             mg->mg_ptr = (char *) name;
4340     }
4341     mg->mg_virtual = vtable;
4342
4343     mg_magical(sv);
4344     if (SvGMAGICAL(sv))
4345         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4346     return mg;
4347 }
4348
4349 /*
4350 =for apidoc sv_magic
4351
4352 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4353 then adds a new magic item of type C<how> to the head of the magic list.
4354
4355 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4356 handling of the C<name> and C<namlen> arguments.
4357
4358 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4359 to add more than one instance of the same 'how'.
4360
4361 =cut
4362 */
4363
4364 void
4365 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4366 {
4367     const MGVTBL *vtable;
4368     MAGIC* mg;
4369
4370 #ifdef PERL_OLD_COPY_ON_WRITE
4371     if (SvIsCOW(sv))
4372         sv_force_normal_flags(sv, 0);
4373 #endif
4374     if (SvREADONLY(sv)) {
4375         if (
4376             /* its okay to attach magic to shared strings; the subsequent
4377              * upgrade to PVMG will unshare the string */
4378             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4379
4380             && IN_PERL_RUNTIME
4381             && how != PERL_MAGIC_regex_global
4382             && how != PERL_MAGIC_bm
4383             && how != PERL_MAGIC_fm
4384             && how != PERL_MAGIC_sv
4385             && how != PERL_MAGIC_backref
4386            )
4387         {
4388             Perl_croak(aTHX_ PL_no_modify);
4389         }
4390     }
4391     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4392         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4393             /* sv_magic() refuses to add a magic of the same 'how' as an
4394                existing one
4395              */
4396             if (how == PERL_MAGIC_taint)
4397                 mg->mg_len |= 1;
4398             return;
4399         }
4400     }
4401
4402     switch (how) {
4403     case PERL_MAGIC_sv:
4404         vtable = &PL_vtbl_sv;
4405         break;
4406     case PERL_MAGIC_overload:
4407         vtable = &PL_vtbl_amagic;
4408         break;
4409     case PERL_MAGIC_overload_elem:
4410         vtable = &PL_vtbl_amagicelem;
4411         break;
4412     case PERL_MAGIC_overload_table:
4413         vtable = &PL_vtbl_ovrld;
4414         break;
4415     case PERL_MAGIC_bm:
4416         vtable = &PL_vtbl_bm;
4417         break;
4418     case PERL_MAGIC_regdata:
4419         vtable = &PL_vtbl_regdata;
4420         break;
4421     case PERL_MAGIC_regdatum:
4422         vtable = &PL_vtbl_regdatum;
4423         break;
4424     case PERL_MAGIC_env:
4425         vtable = &PL_vtbl_env;
4426         break;
4427     case PERL_MAGIC_fm:
4428         vtable = &PL_vtbl_fm;
4429         break;
4430     case PERL_MAGIC_envelem:
4431         vtable = &PL_vtbl_envelem;
4432         break;
4433     case PERL_MAGIC_regex_global:
4434         vtable = &PL_vtbl_mglob;
4435         break;
4436     case PERL_MAGIC_isa:
4437         vtable = &PL_vtbl_isa;
4438         break;
4439     case PERL_MAGIC_isaelem:
4440         vtable = &PL_vtbl_isaelem;
4441         break;
4442     case PERL_MAGIC_nkeys:
4443         vtable = &PL_vtbl_nkeys;
4444         break;
4445     case PERL_MAGIC_dbfile:
4446         vtable = NULL;
4447         break;
4448     case PERL_MAGIC_dbline:
4449         vtable = &PL_vtbl_dbline;
4450         break;
4451 #ifdef USE_LOCALE_COLLATE
4452     case PERL_MAGIC_collxfrm:
4453         vtable = &PL_vtbl_collxfrm;
4454         break;
4455 #endif /* USE_LOCALE_COLLATE */
4456     case PERL_MAGIC_tied:
4457         vtable = &PL_vtbl_pack;
4458         break;
4459     case PERL_MAGIC_tiedelem:
4460     case PERL_MAGIC_tiedscalar:
4461         vtable = &PL_vtbl_packelem;
4462         break;
4463     case PERL_MAGIC_qr:
4464         vtable = &PL_vtbl_regexp;
4465         break;
4466     case PERL_MAGIC_sig:
4467         vtable = &PL_vtbl_sig;
4468         break;
4469     case PERL_MAGIC_sigelem:
4470         vtable = &PL_vtbl_sigelem;
4471         break;
4472     case PERL_MAGIC_taint:
4473         vtable = &PL_vtbl_taint;
4474         break;
4475     case PERL_MAGIC_uvar:
4476         vtable = &PL_vtbl_uvar;
4477         break;
4478     case PERL_MAGIC_vec:
4479         vtable = &PL_vtbl_vec;
4480         break;
4481     case PERL_MAGIC_arylen_p:
4482     case PERL_MAGIC_rhash:
4483     case PERL_MAGIC_symtab:
4484     case PERL_MAGIC_vstring:
4485         vtable = NULL;
4486         break;
4487     case PERL_MAGIC_utf8:
4488         vtable = &PL_vtbl_utf8;
4489         break;
4490     case PERL_MAGIC_substr:
4491         vtable = &PL_vtbl_substr;
4492         break;
4493     case PERL_MAGIC_defelem:
4494         vtable = &PL_vtbl_defelem;
4495         break;
4496     case PERL_MAGIC_glob:
4497         vtable = &PL_vtbl_glob;
4498         break;
4499     case PERL_MAGIC_arylen:
4500         vtable = &PL_vtbl_arylen;
4501         break;
4502     case PERL_MAGIC_pos:
4503         vtable = &PL_vtbl_pos;
4504         break;
4505     case PERL_MAGIC_backref:
4506         vtable = &PL_vtbl_backref;
4507         break;
4508     case PERL_MAGIC_ext:
4509         /* Reserved for use by extensions not perl internals.           */
4510         /* Useful for attaching extension internal data to perl vars.   */
4511         /* Note that multiple extensions may clash if magical scalars   */
4512         /* etc holding private data from one are passed to another.     */
4513         vtable = NULL;
4514         break;
4515     default:
4516         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4517     }
4518
4519     /* Rest of work is done else where */
4520     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4521
4522     switch (how) {
4523     case PERL_MAGIC_taint:
4524         mg->mg_len = 1;
4525         break;
4526     case PERL_MAGIC_ext:
4527     case PERL_MAGIC_dbfile:
4528         SvRMAGICAL_on(sv);
4529         break;
4530     }
4531 }
4532
4533 /*
4534 =for apidoc sv_unmagic
4535
4536 Removes all magic of type C<type> from an SV.
4537
4538 =cut
4539 */
4540
4541 int
4542 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4543 {
4544     MAGIC* mg;
4545     MAGIC** mgp;
4546     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4547         return 0;
4548     mgp = &SvMAGIC(sv);
4549     for (mg = *mgp; mg; mg = *mgp) {
4550         if (mg->mg_type == type) {
4551             const MGVTBL* const vtbl = mg->mg_virtual;
4552             *mgp = mg->mg_moremagic;
4553             if (vtbl && vtbl->svt_free)
4554                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4555             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4556                 if (mg->mg_len > 0)
4557                     Safefree(mg->mg_ptr);
4558                 else if (mg->mg_len == HEf_SVKEY)
4559                     SvREFCNT_dec((SV*)mg->mg_ptr);
4560                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4561                     Safefree(mg->mg_ptr);
4562             }
4563             if (mg->mg_flags & MGf_REFCOUNTED)
4564                 SvREFCNT_dec(mg->mg_obj);
4565             Safefree(mg);
4566         }
4567         else
4568             mgp = &mg->mg_moremagic;
4569     }
4570     if (!SvMAGIC(sv)) {
4571         SvMAGICAL_off(sv);
4572        SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4573     }
4574
4575     return 0;
4576 }
4577
4578 /*
4579 =for apidoc sv_rvweaken
4580
4581 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4582 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4583 push a back-reference to this RV onto the array of backreferences
4584 associated with that magic.
4585
4586 =cut
4587 */
4588
4589 SV *
4590 Perl_sv_rvweaken(pTHX_ SV *sv)
4591 {
4592     SV *tsv;
4593     if (!SvOK(sv))  /* let undefs pass */
4594         return sv;
4595     if (!SvROK(sv))
4596         Perl_croak(aTHX_ "Can't weaken a nonreference");
4597     else if (SvWEAKREF(sv)) {
4598         if (ckWARN(WARN_MISC))
4599             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4600         return sv;
4601     }
4602     tsv = SvRV(sv);
4603     Perl_sv_add_backref(aTHX_ tsv, sv);
4604     SvWEAKREF_on(sv);
4605     SvREFCNT_dec(tsv);
4606     return sv;
4607 }
4608
4609 /* Give tsv backref magic if it hasn't already got it, then push a
4610  * back-reference to sv onto the array associated with the backref magic.
4611  */
4612
4613 void
4614 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4615 {
4616     AV *av;
4617     MAGIC *mg;
4618     if (SvMAGICAL(tsv) && (mg = mg_find(tsv, PERL_MAGIC_backref)))
4619         av = (AV*)mg->mg_obj;
4620     else {
4621         av = newAV();
4622         sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4623         /* av now has a refcnt of 2, which avoids it getting freed
4624          * before us during global cleanup. The extra ref is removed
4625          * by magic_killbackrefs() when tsv is being freed */
4626     }
4627     if (AvFILLp(av) >= AvMAX(av)) {
4628         av_extend(av, AvFILLp(av)+1);
4629     }
4630     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4631 }
4632
4633 /* delete a back-reference to ourselves from the backref magic associated
4634  * with the SV we point to.
4635  */
4636
4637 STATIC void
4638 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4639 {
4640     AV *av;
4641     SV **svp;
4642     I32 i;
4643     MAGIC *mg = NULL;
4644     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref))) {
4645         if (PL_in_clean_all)
4646             return;
4647     }
4648     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref)))
4649         Perl_croak(aTHX_ "panic: del_backref");
4650     av = (AV *)mg->mg_obj;
4651     svp = AvARRAY(av);
4652     /* We shouldn't be in here more than once, but for paranoia reasons lets
4653        not assume this.  */
4654     for (i = AvFILLp(av); i >= 0; i--) {
4655         if (svp[i] == sv) {
4656             const SSize_t fill = AvFILLp(av);
4657             if (i != fill) {
4658                 /* We weren't the last entry.
4659                    An unordered list has this property that you can take the
4660                    last element off the end to fill the hole, and it's still
4661                    an unordered list :-)
4662                 */
4663                 svp[i] = svp[fill];
4664             }
4665             svp[fill] = Nullsv;
4666             AvFILLp(av) = fill - 1;
4667         }
4668     }
4669 }
4670
4671 /*
4672 =for apidoc sv_insert
4673
4674 Inserts a string at the specified offset/length within the SV. Similar to
4675 the Perl substr() function.
4676
4677 =cut
4678 */
4679
4680 void
4681 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4682 {
4683     register char *big;
4684     register char *mid;
4685     register char *midend;
4686     register char *bigend;
4687     register I32 i;
4688     STRLEN curlen;
4689
4690
4691     if (!bigstr)
4692         Perl_croak(aTHX_ "Can't modify non-existent substring");
4693     SvPV_force(bigstr, curlen);
4694     (void)SvPOK_only_UTF8(bigstr);
4695     if (offset + len > curlen) {
4696         SvGROW(bigstr, offset+len+1);
4697         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4698         SvCUR_set(bigstr, offset+len);
4699     }
4700
4701     SvTAINT(bigstr);
4702     i = littlelen - len;
4703     if (i > 0) {                        /* string might grow */
4704         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4705         mid = big + offset + len;
4706         midend = bigend = big + SvCUR(bigstr);
4707         bigend += i;
4708         *bigend = '\0';
4709         while (midend > mid)            /* shove everything down */
4710             *--bigend = *--midend;
4711         Move(little,big+offset,littlelen,char);
4712         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4713         SvSETMAGIC(bigstr);
4714         return;
4715     }
4716     else if (i == 0) {
4717         Move(little,SvPVX(bigstr)+offset,len,char);
4718         SvSETMAGIC(bigstr);
4719         return;
4720     }
4721
4722     big = SvPVX(bigstr);
4723     mid = big + offset;
4724     midend = mid + len;
4725     bigend = big + SvCUR(bigstr);
4726
4727     if (midend > bigend)
4728         Perl_croak(aTHX_ "panic: sv_insert");
4729
4730     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4731         if (littlelen) {
4732             Move(little, mid, littlelen,char);
4733             mid += littlelen;
4734         }
4735         i = bigend - midend;
4736         if (i > 0) {
4737             Move(midend, mid, i,char);
4738             mid += i;
4739         }
4740         *mid = '\0';
4741         SvCUR_set(bigstr, mid - big);
4742     }
4743     else if ((i = mid - big)) { /* faster from front */
4744         midend -= littlelen;
4745         mid = midend;
4746         sv_chop(bigstr,midend-i);
4747         big += i;
4748         while (i--)
4749             *--midend = *--big;
4750         if (littlelen)
4751             Move(little, mid, littlelen,char);
4752     }
4753     else if (littlelen) {
4754         midend -= littlelen;
4755         sv_chop(bigstr,midend);
4756         Move(little,midend,littlelen,char);
4757     }
4758     else {
4759         sv_chop(bigstr,midend);
4760     }
4761     SvSETMAGIC(bigstr);
4762 }
4763
4764 /*
4765 =for apidoc sv_replace
4766
4767 Make the first argument a copy of the second, then delete the original.
4768 The target SV physically takes over ownership of the body of the source SV
4769 and inherits its flags; however, the target keeps any magic it owns,
4770 and any magic in the source is discarded.
4771 Note that this is a rather specialist SV copying operation; most of the
4772 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4773
4774 =cut
4775 */
4776
4777 void
4778 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4779 {
4780     const U32 refcnt = SvREFCNT(sv);
4781     SV_CHECK_THINKFIRST_COW_DROP(sv);
4782     if (SvREFCNT(nsv) != 1) {
4783         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4784                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4785     }
4786     if (SvMAGICAL(sv)) {
4787         if (SvMAGICAL(nsv))
4788             mg_free(nsv);
4789         else
4790             sv_upgrade(nsv, SVt_PVMG);
4791         SvMAGIC_set(nsv, SvMAGIC(sv));
4792         SvFLAGS(nsv) |= SvMAGICAL(sv);
4793         SvMAGICAL_off(sv);
4794         SvMAGIC_set(sv, NULL);
4795     }
4796     SvREFCNT(sv) = 0;
4797     sv_clear(sv);
4798     assert(!SvREFCNT(sv));
4799 #ifdef DEBUG_LEAKING_SCALARS
4800     sv->sv_flags  = nsv->sv_flags;
4801     sv->sv_any    = nsv->sv_any;
4802     sv->sv_refcnt = nsv->sv_refcnt;
4803     sv->sv_u      = nsv->sv_u;
4804 #else
4805     StructCopy(nsv,sv,SV);
4806 #endif
4807     /* Currently could join these into one piece of pointer arithmetic, but
4808        it would be unclear.  */
4809     if(SvTYPE(sv) == SVt_IV)
4810         SvANY(sv)
4811             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4812     else if (SvTYPE(sv) == SVt_RV) {
4813         SvANY(sv) = &sv->sv_u.svu_rv;
4814     }
4815         
4816
4817 #ifdef PERL_OLD_COPY_ON_WRITE
4818     if (SvIsCOW_normal(nsv)) {
4819         /* We need to follow the pointers around the loop to make the
4820            previous SV point to sv, rather than nsv.  */
4821         SV *next;
4822         SV *current = nsv;
4823         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4824             assert(next);
4825             current = next;
4826             assert(SvPVX_const(current) == SvPVX_const(nsv));
4827         }
4828         /* Make the SV before us point to the SV after us.  */
4829         if (DEBUG_C_TEST) {
4830             PerlIO_printf(Perl_debug_log, "previous is\n");
4831             sv_dump(current);
4832             PerlIO_printf(Perl_debug_log,
4833                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4834                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4835         }
4836         SV_COW_NEXT_SV_SET(current, sv);
4837     }
4838 #endif
4839     SvREFCNT(sv) = refcnt;
4840     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4841     SvREFCNT(nsv) = 0;
4842     del_SV(nsv);
4843 }
4844
4845 /*
4846 =for apidoc sv_clear
4847
4848 Clear an SV: call any destructors, free up any memory used by the body,
4849 and free the body itself. The SV's head is I<not> freed, although
4850 its type is set to all 1's so that it won't inadvertently be assumed
4851 to be live during global destruction etc.
4852 This function should only be called when REFCNT is zero. Most of the time
4853 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4854 instead.
4855
4856 =cut
4857 */
4858
4859 void
4860 Perl_sv_clear(pTHX_ register SV *sv)
4861 {
4862     dVAR;
4863     const U32 type = SvTYPE(sv);
4864     const struct body_details *const sv_type_details
4865         = bodies_by_type + type;
4866
4867     assert(sv);
4868     assert(SvREFCNT(sv) == 0);
4869
4870     if (type <= SVt_IV)
4871         return;
4872
4873     if (SvOBJECT(sv)) {
4874         if (PL_defstash) {              /* Still have a symbol table? */
4875             dSP;
4876             HV* stash;
4877             do {        
4878                 CV* destructor;
4879                 stash = SvSTASH(sv);
4880                 destructor = StashHANDLER(stash,DESTROY);
4881                 if (destructor) {
4882                     SV* const tmpref = newRV(sv);
4883                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4884                     ENTER;
4885                     PUSHSTACKi(PERLSI_DESTROY);
4886                     EXTEND(SP, 2);
4887                     PUSHMARK(SP);
4888                     PUSHs(tmpref);
4889                     PUTBACK;
4890                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4891                 
4892                 
4893                     POPSTACK;
4894                     SPAGAIN;
4895                     LEAVE;
4896                     if(SvREFCNT(tmpref) < 2) {
4897                         /* tmpref is not kept alive! */
4898                         SvREFCNT(sv)--;
4899                         SvRV_set(tmpref, NULL);
4900                         SvROK_off(tmpref);
4901                     }
4902                     SvREFCNT_dec(tmpref);
4903                 }
4904             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4905
4906
4907             if (SvREFCNT(sv)) {
4908                 if (PL_in_clean_objs)
4909                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4910                           HvNAME_get(stash));
4911                 /* DESTROY gave object new lease on life */
4912                 return;
4913             }
4914         }
4915
4916         if (SvOBJECT(sv)) {
4917             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4918             SvOBJECT_off(sv);   /* Curse the object. */
4919             if (type != SVt_PVIO)
4920                 --PL_sv_objcount;       /* XXX Might want something more general */
4921         }
4922     }
4923     if (type >= SVt_PVMG) {
4924         if (SvMAGIC(sv))
4925             mg_free(sv);
4926         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4927             SvREFCNT_dec(SvSTASH(sv));
4928     }
4929     switch (type) {
4930     case SVt_PVIO:
4931         if (IoIFP(sv) &&
4932             IoIFP(sv) != PerlIO_stdin() &&
4933             IoIFP(sv) != PerlIO_stdout() &&
4934             IoIFP(sv) != PerlIO_stderr())
4935         {
4936             io_close((IO*)sv, FALSE);
4937         }
4938         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4939             PerlDir_close(IoDIRP(sv));
4940         IoDIRP(sv) = (DIR*)NULL;
4941         Safefree(IoTOP_NAME(sv));
4942         Safefree(IoFMT_NAME(sv));
4943         Safefree(IoBOTTOM_NAME(sv));
4944         goto freescalar;
4945     case SVt_PVBM:
4946         goto freescalar;
4947     case SVt_PVCV:
4948     case SVt_PVFM:
4949         cv_undef((CV*)sv);
4950         goto freescalar;
4951     case SVt_PVHV:
4952         hv_undef((HV*)sv);
4953         break;
4954     case SVt_PVAV:
4955         av_undef((AV*)sv);
4956         break;
4957     case SVt_PVLV:
4958         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4959             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4960             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4961             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4962         }
4963         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4964             SvREFCNT_dec(LvTARG(sv));
4965         goto freescalar;
4966     case SVt_PVGV:
4967         gp_free((GV*)sv);
4968         Safefree(GvNAME(sv));
4969         /* If we're in a stash, we don't own a reference to it. However it does
4970            have a back reference to us, which needs to be cleared.  */
4971         if (GvSTASH(sv))
4972             sv_del_backref((SV*)GvSTASH(sv), sv);
4973     case SVt_PVMG:
4974     case SVt_PVNV:
4975     case SVt_PVIV:
4976       freescalar:
4977         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4978         if (SvOOK(sv)) {
4979             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4980             /* Don't even bother with turning off the OOK flag.  */
4981         }
4982     case SVt_PV:
4983     case SVt_RV:
4984         if (SvROK(sv)) {
4985             SV *target = SvRV(sv);
4986             if (SvWEAKREF(sv))
4987                 sv_del_backref(target, sv);
4988             else
4989                 SvREFCNT_dec(target);
4990         }
4991 #ifdef PERL_OLD_COPY_ON_WRITE
4992         else if (SvPVX_const(sv)) {
4993             if (SvIsCOW(sv)) {
4994                 /* I believe I need to grab the global SV mutex here and
4995                    then recheck the COW status.  */
4996                 if (DEBUG_C_TEST) {
4997                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4998                     sv_dump(sv);
4999                 }
5000                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
5001                                SV_COW_NEXT_SV(sv));
5002                 /* And drop it here.  */
5003                 SvFAKE_off(sv);
5004             } else if (SvLEN(sv)) {
5005                 Safefree(SvPVX_const(sv));
5006             }
5007         }
5008 #else
5009         else if (SvPVX_const(sv) && SvLEN(sv))
5010             Safefree(SvPVX_mutable(sv));
5011         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
5012             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
5013             SvFAKE_off(sv);
5014         }
5015 #endif
5016         break;
5017     case SVt_NV:
5018         break;
5019     }
5020
5021     SvFLAGS(sv) &= SVf_BREAK;
5022     SvFLAGS(sv) |= SVTYPEMASK;
5023
5024     if (sv_type_details->arena) {
5025         del_body(((char *)SvANY(sv) + sv_type_details->offset),
5026                  &PL_body_roots[type]);
5027     }
5028     else if (sv_type_details->size) {
5029         my_safefree(SvANY(sv));
5030     }
5031 }
5032
5033 /*
5034 =for apidoc sv_newref
5035
5036 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
5037 instead.
5038
5039 =cut
5040 */
5041
5042 SV *
5043 Perl_sv_newref(pTHX_ SV *sv)
5044 {
5045     if (sv)
5046         (SvREFCNT(sv))++;
5047     return sv;
5048 }
5049
5050 /*
5051 =for apidoc sv_free
5052
5053 Decrement an SV's reference count, and if it drops to zero, call
5054 C<sv_clear> to invoke destructors and free up any memory used by
5055 the body; finally, deallocate the SV's head itself.
5056 Normally called via a wrapper macro C<SvREFCNT_dec>.
5057
5058 =cut
5059 */
5060
5061 void
5062 Perl_sv_free(pTHX_ SV *sv)
5063 {
5064     dVAR;
5065     if (!sv)
5066         return;
5067     if (SvREFCNT(sv) == 0) {
5068         if (SvFLAGS(sv) & SVf_BREAK)
5069             /* this SV's refcnt has been artificially decremented to
5070              * trigger cleanup */
5071             return;
5072         if (PL_in_clean_all) /* All is fair */
5073             return;
5074         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5075             /* make sure SvREFCNT(sv)==0 happens very seldom */
5076             SvREFCNT(sv) = (~(U32)0)/2;
5077             return;
5078         }
5079         if (ckWARN_d(WARN_INTERNAL)) {
5080             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
5081                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
5082                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5083 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
5084             Perl_dump_sv_child(aTHX_ sv);
5085 #endif
5086         }
5087         return;
5088     }
5089     if (--(SvREFCNT(sv)) > 0)
5090         return;
5091     Perl_sv_free2(aTHX_ sv);
5092 }
5093
5094 void
5095 Perl_sv_free2(pTHX_ SV *sv)
5096 {
5097     dVAR;
5098 #ifdef DEBUGGING
5099     if (SvTEMP(sv)) {
5100         if (ckWARN_d(WARN_DEBUGGING))
5101             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
5102                         "Attempt to free temp prematurely: SV 0x%"UVxf
5103                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5104         return;
5105     }
5106 #endif
5107     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5108         /* make sure SvREFCNT(sv)==0 happens very seldom */
5109         SvREFCNT(sv) = (~(U32)0)/2;
5110         return;
5111     }
5112     sv_clear(sv);
5113     if (! SvREFCNT(sv))
5114         del_SV(sv);
5115 }
5116
5117 /*
5118 =for apidoc sv_len
5119
5120 Returns the length of the string in the SV. Handles magic and type
5121 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
5122
5123 =cut
5124 */
5125
5126 STRLEN
5127 Perl_sv_len(pTHX_ register SV *sv)
5128 {
5129     STRLEN len;
5130
5131     if (!sv)
5132         return 0;
5133
5134     if (SvGMAGICAL(sv))
5135         len = mg_length(sv);
5136     else
5137         (void)SvPV_const(sv, len);
5138     return len;
5139 }
5140
5141 /*
5142 =for apidoc sv_len_utf8
5143
5144 Returns the number of characters in the string in an SV, counting wide
5145 UTF-8 bytes as a single character. Handles magic and type coercion.
5146
5147 =cut
5148 */
5149
5150 /*
5151  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
5152  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
5153  * (Note that the mg_len is not the length of the mg_ptr field.)
5154  *
5155  */
5156
5157 STRLEN
5158 Perl_sv_len_utf8(pTHX_ register SV *sv)
5159 {
5160     if (!sv)
5161         return 0;
5162
5163     if (SvGMAGICAL(sv))
5164         return mg_length(sv);
5165     else
5166     {
5167         STRLEN len, ulen;
5168         const U8 *s = (U8*)SvPV_const(sv, len);
5169         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
5170
5171         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
5172             ulen = mg->mg_len;
5173 #ifdef PERL_UTF8_CACHE_ASSERT
5174             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
5175 #endif
5176         }
5177         else {
5178             ulen = Perl_utf8_length(aTHX_ s, s + len);
5179             if (!mg && !SvREADONLY(sv)) {
5180                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5181                 mg = mg_find(sv, PERL_MAGIC_utf8);
5182                 assert(mg);
5183             }
5184             if (mg)
5185                 mg->mg_len = ulen;
5186         }
5187         return ulen;
5188     }
5189 }
5190
5191 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
5192  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5193  * between UTF-8 and byte offsets.  There are two (substr offset and substr
5194  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
5195  * and byte offset) cache positions.
5196  *
5197  * The mg_len field is used by sv_len_utf8(), see its comments.
5198  * Note that the mg_len is not the length of the mg_ptr field.
5199  *
5200  */
5201 STATIC bool
5202 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
5203                    I32 offsetp, const U8 *s, const U8 *start)
5204 {
5205     bool found = FALSE;
5206
5207     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5208         if (!*mgp)
5209             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
5210         assert(*mgp);
5211
5212         if ((*mgp)->mg_ptr)
5213             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5214         else {
5215             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5216             (*mgp)->mg_ptr = (char *) *cachep;
5217         }
5218         assert(*cachep);
5219
5220         (*cachep)[i]   = offsetp;
5221         (*cachep)[i+1] = s - start;
5222         found = TRUE;
5223     }
5224
5225     return found;
5226 }
5227
5228 /*
5229  * S_utf8_mg_pos() is used to query and update mg_ptr field of
5230  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5231  * between UTF-8 and byte offsets.  See also the comments of
5232  * S_utf8_mg_pos_init().
5233  *
5234  */
5235 STATIC bool
5236 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
5237 {
5238     bool found = FALSE;
5239
5240     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5241         if (!*mgp)
5242             *mgp = mg_find(sv, PERL_MAGIC_utf8);
5243         if (*mgp && (*mgp)->mg_ptr) {
5244             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5245             ASSERT_UTF8_CACHE(*cachep);
5246             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
5247                  found = TRUE;
5248             else {                      /* We will skip to the right spot. */
5249                  STRLEN forw  = 0;
5250                  STRLEN backw = 0;
5251                  const U8* p = NULL;
5252
5253                  /* The assumption is that going backward is half
5254                   * the speed of going forward (that's where the
5255                   * 2 * backw in the below comes from).  (The real
5256                   * figure of course depends on the UTF-8 data.) */
5257
5258                  if ((*cachep)[i] > (STRLEN)uoff) {
5259                       forw  = uoff;
5260                       backw = (*cachep)[i] - (STRLEN)uoff;
5261
5262                       if (forw < 2 * backw)
5263                            p = start;
5264                       else
5265                            p = start + (*cachep)[i+1];
5266                  }
5267                  /* Try this only for the substr offset (i == 0),
5268                   * not for the substr length (i == 2). */
5269                  else if (i == 0) { /* (*cachep)[i] < uoff */
5270                       const STRLEN ulen = sv_len_utf8(sv);
5271
5272                       if ((STRLEN)uoff < ulen) {
5273                            forw  = (STRLEN)uoff - (*cachep)[i];
5274                            backw = ulen - (STRLEN)uoff;
5275
5276                            if (forw < 2 * backw)
5277                                 p = start + (*cachep)[i+1];
5278                            else
5279                                 p = send;
5280                       }
5281
5282                       /* If the string is not long enough for uoff,
5283                        * we could extend it, but not at this low a level. */
5284                  }
5285
5286                  if (p) {
5287                       if (forw < 2 * backw) {
5288                            while (forw--)
5289                                 p += UTF8SKIP(p);
5290                       }
5291                       else {
5292                            while (backw--) {
5293                                 p--;
5294                                 while (UTF8_IS_CONTINUATION(*p))
5295                                      p--;
5296                            }
5297                       }
5298
5299                       /* Update the cache. */
5300                       (*cachep)[i]   = (STRLEN)uoff;
5301                       (*cachep)[i+1] = p - start;
5302
5303                       /* Drop the stale "length" cache */
5304                       if (i == 0) {
5305                           (*cachep)[2] = 0;
5306                           (*cachep)[3] = 0;
5307                       }
5308
5309                       found = TRUE;
5310                  }
5311             }
5312             if (found) {        /* Setup the return values. */
5313                  *offsetp = (*cachep)[i+1];
5314                  *sp = start + *offsetp;
5315                  if (*sp >= send) {
5316                       *sp = send;
5317                       *offsetp = send - start;
5318                  }
5319                  else if (*sp < start) {
5320                       *sp = start;
5321                       *offsetp = 0;
5322                  }
5323             }
5324         }
5325 #ifdef PERL_UTF8_CACHE_ASSERT
5326         if (found) {
5327              U8 *s = start;
5328              I32 n = uoff;
5329
5330              while (n-- && s < send)
5331                   s += UTF8SKIP(s);
5332
5333              if (i == 0) {
5334                   assert(*offsetp == s - start);
5335                   assert((*cachep)[0] == (STRLEN)uoff);
5336                   assert((*cachep)[1] == *offsetp);
5337              }
5338              ASSERT_UTF8_CACHE(*cachep);
5339         }
5340 #endif
5341     }
5342
5343     return found;
5344 }
5345
5346 /*
5347 =for apidoc sv_pos_u2b
5348
5349 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5350 the start of the string, to a count of the equivalent number of bytes; if
5351 lenp is non-zero, it does the same to lenp, but this time starting from
5352 the offset, rather than from the start of the string. Handles magic and
5353 type coercion.
5354
5355 =cut
5356 */
5357
5358 /*
5359  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5360  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5361  * byte offsets.  See also the comments of S_utf8_mg_pos().
5362  *
5363  */
5364
5365 void
5366 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5367 {
5368     const U8 *start;
5369     STRLEN len;
5370
5371     if (!sv)
5372         return;
5373
5374     start = (U8*)SvPV_const(sv, len);
5375     if (len) {
5376         STRLEN boffset = 0;
5377         STRLEN *cache = 0;
5378         const U8 *s = start;
5379         I32 uoffset = *offsetp;
5380         const U8 * const send = s + len;
5381         MAGIC *mg = 0;
5382         bool found = FALSE;
5383
5384          if (utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send))
5385              found = TRUE;
5386          if (!found && uoffset > 0) {
5387               while (s < send && uoffset--)
5388                    s += UTF8SKIP(s);
5389               if (s >= send)
5390                    s = send;
5391               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5392                   boffset = cache[1];
5393               *offsetp = s - start;
5394          }
5395          if (lenp) {
5396               found = FALSE;
5397               start = s;
5398               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5399                   *lenp -= boffset;
5400                   found = TRUE;
5401               }
5402               if (!found && *lenp > 0) {
5403                    I32 ulen = *lenp;
5404                    if (ulen > 0)
5405                         while (s < send && ulen--)
5406                              s += UTF8SKIP(s);
5407                    if (s >= send)
5408                         s = send;
5409                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5410               }
5411               *lenp = s - start;
5412          }
5413          ASSERT_UTF8_CACHE(cache);
5414     }
5415     else {
5416          *offsetp = 0;
5417          if (lenp)
5418               *lenp = 0;
5419     }
5420
5421     return;
5422 }
5423
5424 /*
5425 =for apidoc sv_pos_b2u
5426
5427 Converts the value pointed to by offsetp from a count of bytes from the
5428 start of the string, to a count of the equivalent number of UTF-8 chars.
5429 Handles magic and type coercion.
5430
5431 =cut
5432 */
5433
5434 /*
5435  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5436  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5437  * byte offsets.  See also the comments of S_utf8_mg_pos().
5438  *
5439  */
5440
5441 void
5442 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5443 {
5444     const U8* s;
5445     STRLEN len;
5446
5447     if (!sv)
5448         return;
5449
5450     s = (const U8*)SvPV_const(sv, len);
5451     if ((I32)len < *offsetp)
5452         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5453     else {
5454         const U8* send = s + *offsetp;
5455         MAGIC* mg = NULL;
5456         STRLEN *cache = NULL;
5457
5458         len = 0;
5459
5460         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5461             mg = mg_find(sv, PERL_MAGIC_utf8);
5462             if (mg && mg->mg_ptr) {
5463                 cache = (STRLEN *) mg->mg_ptr;
5464                 if (cache[1] == (STRLEN)*offsetp) {
5465                     /* An exact match. */
5466                     *offsetp = cache[0];
5467
5468                     return;
5469                 }
5470                 else if (cache[1] < (STRLEN)*offsetp) {
5471                     /* We already know part of the way. */
5472                     len = cache[0];
5473                     s  += cache[1];
5474                     /* Let the below loop do the rest. */
5475                 }
5476                 else { /* cache[1] > *offsetp */
5477                     /* We already know all of the way, now we may
5478                      * be able to walk back.  The same assumption
5479                      * is made as in S_utf8_mg_pos(), namely that
5480                      * walking backward is twice slower than
5481                      * walking forward. */
5482                     const STRLEN forw  = *offsetp;
5483                     STRLEN backw = cache[1] - *offsetp;
5484
5485                     if (!(forw < 2 * backw)) {
5486                         const U8 *p = s + cache[1];
5487                         STRLEN ubackw = 0;
5488                         
5489                         cache[1] -= backw;
5490
5491                         while (backw--) {
5492                             p--;
5493                             while (UTF8_IS_CONTINUATION(*p)) {
5494                                 p--;
5495                                 backw--;
5496                             }
5497                             ubackw++;
5498                         }
5499
5500                         cache[0] -= ubackw;
5501                         *offsetp = cache[0];
5502
5503                         /* Drop the stale "length" cache */
5504                         cache[2] = 0;
5505                         cache[3] = 0;
5506
5507                         return;
5508                     }
5509                 }
5510             }
5511             ASSERT_UTF8_CACHE(cache);
5512         }
5513
5514         while (s < send) {
5515             STRLEN n = 1;
5516
5517             /* Call utf8n_to_uvchr() to validate the sequence
5518              * (unless a simple non-UTF character) */
5519             if (!UTF8_IS_INVARIANT(*s))
5520                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5521             if (n > 0) {
5522                 s += n;
5523                 len++;
5524             }
5525             else
5526                 break;
5527         }
5528
5529         if (!SvREADONLY(sv)) {
5530             if (!mg) {
5531                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5532                 mg = mg_find(sv, PERL_MAGIC_utf8);
5533             }
5534             assert(mg);
5535
5536             if (!mg->mg_ptr) {
5537                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5538                 mg->mg_ptr = (char *) cache;
5539             }
5540             assert(cache);
5541
5542             cache[0] = len;
5543             cache[1] = *offsetp;
5544             /* Drop the stale "length" cache */
5545             cache[2] = 0;
5546             cache[3] = 0;
5547         }
5548
5549         *offsetp = len;
5550     }
5551     return;
5552 }
5553
5554 /*
5555 =for apidoc sv_eq
5556
5557 Returns a boolean indicating whether the strings in the two SVs are
5558 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5559 coerce its args to strings if necessary.
5560
5561 =cut
5562 */
5563
5564 I32
5565 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5566 {
5567     const char *pv1;
5568     STRLEN cur1;
5569     const char *pv2;
5570     STRLEN cur2;
5571     I32  eq     = 0;
5572     char *tpv   = Nullch;
5573     SV* svrecode = Nullsv;
5574
5575     if (!sv1) {
5576         pv1 = "";
5577         cur1 = 0;
5578     }
5579     else
5580         pv1 = SvPV_const(sv1, cur1);
5581
5582     if (!sv2){
5583         pv2 = "";
5584         cur2 = 0;
5585     }
5586     else
5587         pv2 = SvPV_const(sv2, cur2);
5588
5589     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5590         /* Differing utf8ness.
5591          * Do not UTF8size the comparands as a side-effect. */
5592          if (PL_encoding) {
5593               if (SvUTF8(sv1)) {
5594                    svrecode = newSVpvn(pv2, cur2);
5595                    sv_recode_to_utf8(svrecode, PL_encoding);
5596                    pv2 = SvPV_const(svrecode, cur2);
5597               }
5598               else {
5599                    svrecode = newSVpvn(pv1, cur1);
5600                    sv_recode_to_utf8(svrecode, PL_encoding);
5601                    pv1 = SvPV_const(svrecode, cur1);
5602               }
5603               /* Now both are in UTF-8. */
5604               if (cur1 != cur2) {
5605                    SvREFCNT_dec(svrecode);
5606                    return FALSE;
5607               }
5608          }
5609          else {
5610               bool is_utf8 = TRUE;
5611
5612               if (SvUTF8(sv1)) {
5613                    /* sv1 is the UTF-8 one,
5614                     * if is equal it must be downgrade-able */
5615                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5616                                                      &cur1, &is_utf8);
5617                    if (pv != pv1)
5618                         pv1 = tpv = pv;
5619               }
5620               else {
5621                    /* sv2 is the UTF-8 one,
5622                     * if is equal it must be downgrade-able */
5623                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5624                                                       &cur2, &is_utf8);
5625                    if (pv != pv2)
5626                         pv2 = tpv = pv;
5627               }
5628               if (is_utf8) {
5629                    /* Downgrade not possible - cannot be eq */
5630                    assert (tpv == 0);
5631                    return FALSE;
5632               }
5633          }
5634     }
5635
5636     if (cur1 == cur2)
5637         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5638         
5639     if (svrecode)
5640          SvREFCNT_dec(svrecode);
5641
5642     if (tpv)
5643         Safefree(tpv);
5644
5645     return eq;
5646 }
5647
5648 /*
5649 =for apidoc sv_cmp
5650
5651 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5652 string in C<sv1> is less than, equal to, or greater than the string in
5653 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5654 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5655
5656 =cut
5657 */
5658
5659 I32
5660 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5661 {
5662     STRLEN cur1, cur2;
5663     const char *pv1, *pv2;
5664     char *tpv = Nullch;
5665     I32  cmp;
5666     SV *svrecode = Nullsv;
5667
5668     if (!sv1) {
5669         pv1 = "";
5670         cur1 = 0;
5671     }
5672     else
5673         pv1 = SvPV_const(sv1, cur1);
5674
5675     if (!sv2) {
5676         pv2 = "";
5677         cur2 = 0;
5678     }
5679     else
5680         pv2 = SvPV_const(sv2, cur2);
5681
5682     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5683         /* Differing utf8ness.
5684          * Do not UTF8size the comparands as a side-effect. */
5685         if (SvUTF8(sv1)) {
5686             if (PL_encoding) {
5687                  svrecode = newSVpvn(pv2, cur2);
5688                  sv_recode_to_utf8(svrecode, PL_encoding);
5689                  pv2 = SvPV_const(svrecode, cur2);
5690             }
5691             else {
5692                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5693             }
5694         }
5695         else {
5696             if (PL_encoding) {
5697                  svrecode = newSVpvn(pv1, cur1);
5698                  sv_recode_to_utf8(svrecode, PL_encoding);
5699                  pv1 = SvPV_const(svrecode, cur1);
5700             }
5701             else {
5702                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5703             }
5704         }
5705     }
5706
5707     if (!cur1) {
5708         cmp = cur2 ? -1 : 0;
5709     } else if (!cur2) {
5710         cmp = 1;
5711     } else {
5712         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5713
5714         if (retval) {
5715             cmp = retval < 0 ? -1 : 1;
5716         } else if (cur1 == cur2) {
5717             cmp = 0;
5718         } else {
5719             cmp = cur1 < cur2 ? -1 : 1;
5720         }
5721     }
5722
5723     if (svrecode)
5724          SvREFCNT_dec(svrecode);
5725
5726     if (tpv)
5727         Safefree(tpv);
5728
5729     return cmp;
5730 }
5731
5732 /*
5733 =for apidoc sv_cmp_locale
5734
5735 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5736 'use bytes' aware, handles get magic, and will coerce its args to strings
5737 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5738
5739 =cut
5740 */
5741
5742 I32
5743 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5744 {
5745 #ifdef USE_LOCALE_COLLATE
5746
5747     char *pv1, *pv2;
5748     STRLEN len1, len2;
5749     I32 retval;
5750
5751     if (PL_collation_standard)
5752         goto raw_compare;
5753
5754     len1 = 0;
5755     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5756     len2 = 0;
5757     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5758
5759     if (!pv1 || !len1) {
5760         if (pv2 && len2)
5761             return -1;
5762         else
5763             goto raw_compare;
5764     }
5765     else {
5766         if (!pv2 || !len2)
5767             return 1;
5768     }
5769
5770     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5771
5772     if (retval)
5773         return retval < 0 ? -1 : 1;
5774
5775     /*
5776      * When the result of collation is equality, that doesn't mean
5777      * that there are no differences -- some locales exclude some
5778      * characters from consideration.  So to avoid false equalities,
5779      * we use the raw string as a tiebreaker.
5780      */
5781
5782   raw_compare:
5783     /* FALL THROUGH */
5784
5785 #endif /* USE_LOCALE_COLLATE */
5786
5787     return sv_cmp(sv1, sv2);
5788 }
5789
5790
5791 #ifdef USE_LOCALE_COLLATE
5792
5793 /*
5794 =for apidoc sv_collxfrm
5795
5796 Add Collate Transform magic to an SV if it doesn't already have it.
5797
5798 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5799 scalar data of the variable, but transformed to such a format that a normal
5800 memory comparison can be used to compare the data according to the locale
5801 settings.
5802
5803 =cut
5804 */
5805
5806 char *
5807 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5808 {
5809     MAGIC *mg;
5810
5811     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5812     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5813         const char *s;
5814         char *xf;
5815         STRLEN len, xlen;
5816
5817         if (mg)
5818             Safefree(mg->mg_ptr);
5819         s = SvPV_const(sv, len);
5820         if ((xf = mem_collxfrm(s, len, &xlen))) {
5821             if (SvREADONLY(sv)) {
5822                 SAVEFREEPV(xf);
5823                 *nxp = xlen;
5824                 return xf + sizeof(PL_collation_ix);
5825             }
5826             if (! mg) {
5827                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5828                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5829                 assert(mg);
5830             }
5831             mg->mg_ptr = xf;
5832             mg->mg_len = xlen;
5833         }
5834         else {
5835             if (mg) {
5836                 mg->mg_ptr = NULL;
5837                 mg->mg_len = -1;
5838             }
5839         }
5840     }
5841     if (mg && mg->mg_ptr) {
5842         *nxp = mg->mg_len;
5843         return mg->mg_ptr + sizeof(PL_collation_ix);
5844     }
5845     else {
5846         *nxp = 0;
5847         return NULL;
5848     }
5849 }
5850
5851 #endif /* USE_LOCALE_COLLATE */
5852
5853 /*
5854 =for apidoc sv_gets
5855
5856 Get a line from the filehandle and store it into the SV, optionally
5857 appending to the currently-stored string.
5858
5859 =cut
5860 */
5861
5862 char *
5863 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5864 {
5865     const char *rsptr;
5866     STRLEN rslen;
5867     register STDCHAR rslast;
5868     register STDCHAR *bp;
5869     register I32 cnt;
5870     I32 i = 0;
5871     I32 rspara = 0;
5872     I32 recsize;
5873
5874     if (SvTHINKFIRST(sv))
5875         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5876     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5877        from <>.
5878        However, perlbench says it's slower, because the existing swipe code
5879        is faster than copy on write.
5880        Swings and roundabouts.  */
5881     SvUPGRADE(sv, SVt_PV);
5882
5883     SvSCREAM_off(sv);
5884
5885     if (append) {
5886         if (PerlIO_isutf8(fp)) {
5887             if (!SvUTF8(sv)) {
5888                 sv_utf8_upgrade_nomg(sv);
5889                 sv_pos_u2b(sv,&append,0);
5890             }
5891         } else if (SvUTF8(sv)) {
5892             SV * const tsv = NEWSV(0,0);
5893             sv_gets(tsv, fp, 0);
5894             sv_utf8_upgrade_nomg(tsv);
5895             SvCUR_set(sv,append);
5896             sv_catsv(sv,tsv);
5897             sv_free(tsv);
5898             goto return_string_or_null;
5899         }
5900     }
5901
5902     SvPOK_only(sv);
5903     if (PerlIO_isutf8(fp))
5904         SvUTF8_on(sv);
5905
5906     if (IN_PERL_COMPILETIME) {
5907         /* we always read code in line mode */
5908         rsptr = "\n";
5909         rslen = 1;
5910     }
5911     else if (RsSNARF(PL_rs)) {
5912         /* If it is a regular disk file use size from stat() as estimate
5913            of amount we are going to read - may result in malloc-ing
5914            more memory than we realy need if layers bellow reduce
5915            size we read (e.g. CRLF or a gzip layer)
5916          */
5917         Stat_t st;
5918         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5919             const Off_t offset = PerlIO_tell(fp);
5920             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5921                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5922             }
5923         }
5924         rsptr = NULL;
5925         rslen = 0;
5926     }
5927     else if (RsRECORD(PL_rs)) {
5928       I32 bytesread;
5929       char *buffer;
5930
5931       /* Grab the size of the record we're getting */
5932       recsize = SvIV(SvRV(PL_rs));
5933       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5934       /* Go yank in */
5935 #ifdef VMS
5936       /* VMS wants read instead of fread, because fread doesn't respect */
5937       /* RMS record boundaries. This is not necessarily a good thing to be */
5938       /* doing, but we've got no other real choice - except avoid stdio
5939          as implementation - perhaps write a :vms layer ?
5940        */
5941       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5942 #else
5943       bytesread = PerlIO_read(fp, buffer, recsize);
5944 #endif
5945       if (bytesread < 0)
5946           bytesread = 0;
5947       SvCUR_set(sv, bytesread += append);
5948       buffer[bytesread] = '\0';
5949       goto return_string_or_null;
5950     }
5951     else if (RsPARA(PL_rs)) {
5952         rsptr = "\n\n";
5953         rslen = 2;
5954         rspara = 1;
5955     }
5956     else {
5957         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5958         if (PerlIO_isutf8(fp)) {
5959             rsptr = SvPVutf8(PL_rs, rslen);
5960         }
5961         else {
5962             if (SvUTF8(PL_rs)) {
5963                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5964                     Perl_croak(aTHX_ "Wide character in $/");
5965                 }
5966             }
5967             rsptr = SvPV_const(PL_rs, rslen);
5968         }
5969     }
5970
5971     rslast = rslen ? rsptr[rslen - 1] : '\0';
5972
5973     if (rspara) {               /* have to do this both before and after */
5974         do {                    /* to make sure file boundaries work right */
5975             if (PerlIO_eof(fp))
5976                 return 0;
5977             i = PerlIO_getc(fp);
5978             if (i != '\n') {
5979                 if (i == -1)
5980                     return 0;
5981                 PerlIO_ungetc(fp,i);
5982                 break;
5983             }
5984         } while (i != EOF);
5985     }
5986
5987     /* See if we know enough about I/O mechanism to cheat it ! */
5988
5989     /* This used to be #ifdef test - it is made run-time test for ease
5990        of abstracting out stdio interface. One call should be cheap
5991        enough here - and may even be a macro allowing compile
5992        time optimization.
5993      */
5994
5995     if (PerlIO_fast_gets(fp)) {
5996
5997     /*
5998      * We're going to steal some values from the stdio struct
5999      * and put EVERYTHING in the innermost loop into registers.
6000      */
6001     register STDCHAR *ptr;
6002     STRLEN bpx;
6003     I32 shortbuffered;
6004
6005 #if defined(VMS) && defined(PERLIO_IS_STDIO)
6006     /* An ungetc()d char is handled separately from the regular
6007      * buffer, so we getc() it back out and stuff it in the buffer.
6008      */
6009     i = PerlIO_getc(fp);
6010     if (i == EOF) return 0;
6011     *(--((*fp)->_ptr)) = (unsigned char) i;
6012     (*fp)->_cnt++;
6013 #endif
6014
6015     /* Here is some breathtakingly efficient cheating */
6016
6017     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
6018     /* make sure we have the room */
6019     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
6020         /* Not room for all of it
6021            if we are looking for a separator and room for some
6022          */
6023         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
6024             /* just process what we have room for */
6025             shortbuffered = cnt - SvLEN(sv) + append + 1;
6026             cnt -= shortbuffered;
6027         }
6028         else {
6029             shortbuffered = 0;
6030             /* remember that cnt can be negative */
6031             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
6032         }
6033     }
6034     else
6035         shortbuffered = 0;
6036     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
6037     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
6038     DEBUG_P(PerlIO_printf(Perl_debug_log,
6039         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6040     DEBUG_P(PerlIO_printf(Perl_debug_log,
6041         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6042                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6043                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
6044     for (;;) {
6045       screamer:
6046         if (cnt > 0) {
6047             if (rslen) {
6048                 while (cnt > 0) {                    /* this     |  eat */
6049                     cnt--;
6050                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
6051                         goto thats_all_folks;        /* screams  |  sed :-) */
6052                 }
6053             }
6054             else {
6055                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
6056                 bp += cnt;                           /* screams  |  dust */
6057                 ptr += cnt;                          /* louder   |  sed :-) */
6058                 cnt = 0;
6059             }
6060         }
6061         
6062         if (shortbuffered) {            /* oh well, must extend */
6063             cnt = shortbuffered;
6064             shortbuffered = 0;
6065             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
6066             SvCUR_set(sv, bpx);
6067             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
6068             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
6069             continue;
6070         }
6071
6072         DEBUG_P(PerlIO_printf(Perl_debug_log,
6073                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
6074                               PTR2UV(ptr),(long)cnt));
6075         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
6076 #if 0
6077         DEBUG_P(PerlIO_printf(Perl_debug_log,
6078             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6079             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6080             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6081 #endif
6082         /* This used to call 'filbuf' in stdio form, but as that behaves like
6083            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
6084            another abstraction.  */
6085         i   = PerlIO_getc(fp);          /* get more characters */
6086 #if 0
6087         DEBUG_P(PerlIO_printf(Perl_debug_log,
6088             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6089             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6090             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6091 #endif
6092         cnt = PerlIO_get_cnt(fp);
6093         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
6094         DEBUG_P(PerlIO_printf(Perl_debug_log,
6095             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6096
6097         if (i == EOF)                   /* all done for ever? */
6098             goto thats_really_all_folks;
6099
6100         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
6101         SvCUR_set(sv, bpx);
6102         SvGROW(sv, bpx + cnt + 2);
6103         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
6104
6105         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
6106
6107         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
6108             goto thats_all_folks;
6109     }
6110
6111 thats_all_folks:
6112     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
6113           memNE((char*)bp - rslen, rsptr, rslen))
6114         goto screamer;                          /* go back to the fray */
6115 thats_really_all_folks:
6116     if (shortbuffered)
6117         cnt += shortbuffered;
6118         DEBUG_P(PerlIO_printf(Perl_debug_log,
6119             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6120     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
6121     DEBUG_P(PerlIO_printf(Perl_debug_log,
6122         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6123         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6124         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6125     *bp = '\0';
6126     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
6127     DEBUG_P(PerlIO_printf(Perl_debug_log,
6128         "Screamer: done, len=%ld, string=|%.*s|\n",
6129         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
6130     }
6131    else
6132     {
6133        /*The big, slow, and stupid way. */
6134 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
6135         STDCHAR *buf = 0;
6136         Newx(buf, 8192, STDCHAR);
6137         assert(buf);
6138 #else
6139         STDCHAR buf[8192];
6140 #endif
6141
6142 screamer2:
6143         if (rslen) {
6144             register const STDCHAR *bpe = buf + sizeof(buf);
6145             bp = buf;
6146             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
6147                 ; /* keep reading */
6148             cnt = bp - buf;
6149         }
6150         else {
6151             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
6152             /* Accomodate broken VAXC compiler, which applies U8 cast to
6153              * both args of ?: operator, causing EOF to change into 255
6154              */
6155             if (cnt > 0)
6156                  i = (U8)buf[cnt - 1];
6157             else
6158                  i = EOF;
6159         }
6160
6161         if (cnt < 0)
6162             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
6163         if (append)
6164              sv_catpvn(sv, (char *) buf, cnt);
6165         else
6166              sv_setpvn(sv, (char *) buf, cnt);
6167
6168         if (i != EOF &&                 /* joy */
6169             (!rslen ||
6170              SvCUR(sv) < rslen ||
6171              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
6172         {
6173             append = -1;
6174             /*
6175              * If we're reading from a TTY and we get a short read,
6176              * indicating that the user hit his EOF character, we need
6177              * to notice it now, because if we try to read from the TTY
6178              * again, the EOF condition will disappear.
6179              *
6180              * The comparison of cnt to sizeof(buf) is an optimization
6181              * that prevents unnecessary calls to feof().
6182              *
6183              * - jik 9/25/96
6184              */
6185             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
6186                 goto screamer2;
6187         }
6188
6189 #ifdef USE_HEAP_INSTEAD_OF_STACK
6190         Safefree(buf);
6191 #endif
6192     }
6193
6194     if (rspara) {               /* have to do this both before and after */
6195         while (i != EOF) {      /* to make sure file boundaries work right */
6196             i = PerlIO_getc(fp);
6197             if (i != '\n') {
6198                 PerlIO_ungetc(fp,i);
6199                 break;
6200             }
6201         }
6202     }
6203
6204 return_string_or_null:
6205     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
6206 }
6207
6208 /*
6209 =for apidoc sv_inc
6210
6211 Auto-increment of the value in the SV, doing string to numeric conversion
6212 if necessary. Handles 'get' magic.
6213
6214 =cut
6215 */
6216
6217 void
6218 Perl_sv_inc(pTHX_ register SV *sv)
6219 {
6220     register char *d;
6221     int flags;
6222
6223     if (!sv)
6224         return;
6225     SvGETMAGIC(sv);
6226     if (SvTHINKFIRST(sv)) {
6227         if (SvIsCOW(sv))
6228             sv_force_normal_flags(sv, 0);
6229         if (SvREADONLY(sv)) {
6230             if (IN_PERL_RUNTIME)
6231                 Perl_croak(aTHX_ PL_no_modify);
6232         }
6233         if (SvROK(sv)) {
6234             IV i;
6235             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
6236                 return;
6237             i = PTR2IV(SvRV(sv));
6238             sv_unref(sv);
6239             sv_setiv(sv, i);
6240         }
6241     }
6242     flags = SvFLAGS(sv);
6243     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
6244         /* It's (privately or publicly) a float, but not tested as an
6245            integer, so test it to see. */
6246         (void) SvIV(sv);
6247         flags = SvFLAGS(sv);
6248     }
6249     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6250         /* It's publicly an integer, or privately an integer-not-float */
6251 #ifdef PERL_PRESERVE_IVUV
6252       oops_its_int:
6253 #endif
6254         if (SvIsUV(sv)) {
6255             if (SvUVX(sv) == UV_MAX)
6256                 sv_setnv(sv, UV_MAX_P1);
6257             else
6258                 (void)SvIOK_only_UV(sv);
6259                 SvUV_set(sv, SvUVX(sv) + 1);
6260         } else {
6261             if (SvIVX(sv) == IV_MAX)
6262                 sv_setuv(sv, (UV)IV_MAX + 1);
6263             else {
6264                 (void)SvIOK_only(sv);
6265                 SvIV_set(sv, SvIVX(sv) + 1);
6266             }   
6267         }
6268         return;
6269     }
6270     if (flags & SVp_NOK) {
6271         (void)SvNOK_only(sv);
6272         SvNV_set(sv, SvNVX(sv) + 1.0);
6273         return;
6274     }
6275
6276     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6277         if ((flags & SVTYPEMASK) < SVt_PVIV)
6278             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6279         (void)SvIOK_only(sv);
6280         SvIV_set(sv, 1);
6281         return;
6282     }
6283     d = SvPVX(sv);
6284     while (isALPHA(*d)) d++;
6285     while (isDIGIT(*d)) d++;
6286     if (*d) {
6287 #ifdef PERL_PRESERVE_IVUV
6288         /* Got to punt this as an integer if needs be, but we don't issue
6289            warnings. Probably ought to make the sv_iv_please() that does
6290            the conversion if possible, and silently.  */
6291         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6292         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6293             /* Need to try really hard to see if it's an integer.
6294                9.22337203685478e+18 is an integer.
6295                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6296                so $a="9.22337203685478e+18"; $a+0; $a++
6297                needs to be the same as $a="9.22337203685478e+18"; $a++
6298                or we go insane. */
6299         
6300             (void) sv_2iv(sv);
6301             if (SvIOK(sv))
6302                 goto oops_its_int;
6303
6304             /* sv_2iv *should* have made this an NV */
6305             if (flags & SVp_NOK) {
6306                 (void)SvNOK_only(sv);
6307                 SvNV_set(sv, SvNVX(sv) + 1.0);
6308                 return;
6309             }
6310             /* I don't think we can get here. Maybe I should assert this
6311                And if we do get here I suspect that sv_setnv will croak. NWC
6312                Fall through. */
6313 #if defined(USE_LONG_DOUBLE)
6314             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6315                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6316 #else
6317             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6318                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6319 #endif
6320         }
6321 #endif /* PERL_PRESERVE_IVUV */
6322         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6323         return;
6324     }
6325     d--;
6326     while (d >= SvPVX_const(sv)) {
6327         if (isDIGIT(*d)) {
6328             if (++*d <= '9')
6329                 return;
6330             *(d--) = '0';
6331         }
6332         else {
6333 #ifdef EBCDIC
6334             /* MKS: The original code here died if letters weren't consecutive.
6335              * at least it didn't have to worry about non-C locales.  The
6336              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6337              * arranged in order (although not consecutively) and that only
6338              * [A-Za-z] are accepted by isALPHA in the C locale.
6339              */
6340             if (*d != 'z' && *d != 'Z') {
6341                 do { ++*d; } while (!isALPHA(*d));
6342                 return;
6343             }
6344             *(d--) -= 'z' - 'a';
6345 #else
6346             ++*d;
6347             if (isALPHA(*d))
6348                 return;
6349             *(d--) -= 'z' - 'a' + 1;
6350 #endif
6351         }
6352     }
6353     /* oh,oh, the number grew */
6354     SvGROW(sv, SvCUR(sv) + 2);
6355     SvCUR_set(sv, SvCUR(sv) + 1);
6356     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6357         *d = d[-1];
6358     if (isDIGIT(d[1]))
6359         *d = '1';
6360     else
6361         *d = d[1];
6362 }
6363
6364 /*
6365 =for apidoc sv_dec
6366
6367 Auto-decrement of the value in the SV, doing string to numeric conversion
6368 if necessary. Handles 'get' magic.
6369
6370 =cut
6371 */
6372
6373 void
6374 Perl_sv_dec(pTHX_ register SV *sv)
6375 {
6376     int flags;
6377
6378     if (!sv)
6379         return;
6380     SvGETMAGIC(sv);
6381     if (SvTHINKFIRST(sv)) {
6382         if (SvIsCOW(sv))
6383             sv_force_normal_flags(sv, 0);
6384         if (SvREADONLY(sv)) {
6385             if (IN_PERL_RUNTIME)
6386                 Perl_croak(aTHX_ PL_no_modify);
6387         }
6388         if (SvROK(sv)) {
6389             IV i;
6390             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6391                 return;
6392             i = PTR2IV(SvRV(sv));
6393             sv_unref(sv);
6394             sv_setiv(sv, i);
6395         }
6396     }
6397     /* Unlike sv_inc we don't have to worry about string-never-numbers
6398        and keeping them magic. But we mustn't warn on punting */
6399     flags = SvFLAGS(sv);
6400     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6401         /* It's publicly an integer, or privately an integer-not-float */
6402 #ifdef PERL_PRESERVE_IVUV
6403       oops_its_int:
6404 #endif
6405         if (SvIsUV(sv)) {
6406             if (SvUVX(sv) == 0) {
6407                 (void)SvIOK_only(sv);
6408                 SvIV_set(sv, -1);
6409             }
6410             else {
6411                 (void)SvIOK_only_UV(sv);
6412                 SvUV_set(sv, SvUVX(sv) - 1);
6413             }   
6414         } else {
6415             if (SvIVX(sv) == IV_MIN)
6416                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6417             else {
6418                 (void)SvIOK_only(sv);
6419                 SvIV_set(sv, SvIVX(sv) - 1);
6420             }   
6421         }
6422         return;
6423     }
6424     if (flags & SVp_NOK) {
6425         SvNV_set(sv, SvNVX(sv) - 1.0);
6426         (void)SvNOK_only(sv);
6427         return;
6428     }
6429     if (!(flags & SVp_POK)) {
6430         if ((flags & SVTYPEMASK) < SVt_PVIV)
6431             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6432         SvIV_set(sv, -1);
6433         (void)SvIOK_only(sv);
6434         return;
6435     }
6436 #ifdef PERL_PRESERVE_IVUV
6437     {
6438         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6439         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6440             /* Need to try really hard to see if it's an integer.
6441                9.22337203685478e+18 is an integer.
6442                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6443                so $a="9.22337203685478e+18"; $a+0; $a--
6444                needs to be the same as $a="9.22337203685478e+18"; $a--
6445                or we go insane. */
6446         
6447             (void) sv_2iv(sv);
6448             if (SvIOK(sv))
6449                 goto oops_its_int;
6450
6451             /* sv_2iv *should* have made this an NV */
6452             if (flags & SVp_NOK) {
6453                 (void)SvNOK_only(sv);
6454                 SvNV_set(sv, SvNVX(sv) - 1.0);
6455                 return;
6456             }
6457             /* I don't think we can get here. Maybe I should assert this
6458                And if we do get here I suspect that sv_setnv will croak. NWC
6459                Fall through. */
6460 #if defined(USE_LONG_DOUBLE)
6461             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6462                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6463 #else
6464             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6465                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6466 #endif
6467         }
6468     }
6469 #endif /* PERL_PRESERVE_IVUV */
6470     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6471 }
6472
6473 /*
6474 =for apidoc sv_mortalcopy
6475
6476 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6477 The new SV is marked as mortal. It will be destroyed "soon", either by an
6478 explicit call to FREETMPS, or by an implicit call at places such as
6479 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6480
6481 =cut
6482 */
6483
6484 /* Make a string that will exist for the duration of the expression
6485  * evaluation.  Actually, it may have to last longer than that, but
6486  * hopefully we won't free it until it has been assigned to a
6487  * permanent location. */
6488
6489 SV *
6490 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6491 {
6492     register SV *sv;
6493
6494     new_SV(sv);
6495     sv_setsv(sv,oldstr);
6496     EXTEND_MORTAL(1);
6497     PL_tmps_stack[++PL_tmps_ix] = sv;
6498     SvTEMP_on(sv);
6499     return sv;
6500 }
6501
6502 /*
6503 =for apidoc sv_newmortal
6504
6505 Creates a new null SV which is mortal.  The reference count of the SV is
6506 set to 1. It will be destroyed "soon", either by an explicit call to
6507 FREETMPS, or by an implicit call at places such as statement boundaries.
6508 See also C<sv_mortalcopy> and C<sv_2mortal>.
6509
6510 =cut
6511 */
6512
6513 SV *
6514 Perl_sv_newmortal(pTHX)
6515 {
6516     register SV *sv;
6517
6518     new_SV(sv);
6519     SvFLAGS(sv) = SVs_TEMP;
6520     EXTEND_MORTAL(1);
6521     PL_tmps_stack[++PL_tmps_ix] = sv;
6522     return sv;
6523 }
6524
6525 /*
6526 =for apidoc sv_2mortal
6527
6528 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6529 by an explicit call to FREETMPS, or by an implicit call at places such as
6530 statement boundaries.  SvTEMP() is turned on which means that the SV's
6531 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6532 and C<sv_mortalcopy>.
6533
6534 =cut
6535 */
6536
6537 SV *
6538 Perl_sv_2mortal(pTHX_ register SV *sv)
6539 {
6540     dVAR;
6541     if (!sv)
6542         return sv;
6543     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6544         return sv;
6545     EXTEND_MORTAL(1);
6546     PL_tmps_stack[++PL_tmps_ix] = sv;
6547     SvTEMP_on(sv);
6548     return sv;
6549 }
6550
6551 /*
6552 =for apidoc newSVpv
6553
6554 Creates a new SV and copies a string into it.  The reference count for the
6555 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6556 strlen().  For efficiency, consider using C<newSVpvn> instead.
6557
6558 =cut
6559 */
6560
6561 SV *
6562 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6563 {
6564     register SV *sv;
6565
6566     new_SV(sv);
6567     sv_setpvn(sv,s,len ? len : strlen(s));
6568     return sv;
6569 }
6570
6571 /*
6572 =for apidoc newSVpvn
6573
6574 Creates a new SV and copies a string into it.  The reference count for the
6575 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6576 string.  You are responsible for ensuring that the source string is at least
6577 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6578
6579 =cut
6580 */
6581
6582 SV *
6583 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6584 {
6585     register SV *sv;
6586
6587     new_SV(sv);
6588     sv_setpvn(sv,s,len);
6589     return sv;
6590 }
6591
6592
6593 /*
6594 =for apidoc newSVhek
6595
6596 Creates a new SV from the hash key structure.  It will generate scalars that
6597 point to the shared string table where possible. Returns a new (undefined)
6598 SV if the hek is NULL.
6599
6600 =cut
6601 */
6602
6603 SV *
6604 Perl_newSVhek(pTHX_ const HEK *hek)
6605 {
6606     if (!hek) {
6607         SV *sv;
6608
6609         new_SV(sv);
6610         return sv;
6611     }
6612
6613     if (HEK_LEN(hek) == HEf_SVKEY) {
6614         return newSVsv(*(SV**)HEK_KEY(hek));
6615     } else {
6616         const int flags = HEK_FLAGS(hek);
6617         if (flags & HVhek_WASUTF8) {
6618             /* Trouble :-)
6619                Andreas would like keys he put in as utf8 to come back as utf8
6620             */
6621             STRLEN utf8_len = HEK_LEN(hek);
6622             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6623             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6624
6625             SvUTF8_on (sv);
6626             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6627             return sv;
6628         } else if (flags & HVhek_REHASH) {
6629             /* We don't have a pointer to the hv, so we have to replicate the
6630                flag into every HEK. This hv is using custom a hasing
6631                algorithm. Hence we can't return a shared string scalar, as
6632                that would contain the (wrong) hash value, and might get passed
6633                into an hv routine with a regular hash  */
6634
6635             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6636             if (HEK_UTF8(hek))
6637                 SvUTF8_on (sv);
6638             return sv;
6639         }
6640         /* This will be overwhelminly the most common case.  */
6641         return newSVpvn_share(HEK_KEY(hek),
6642                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6643                               HEK_HASH(hek));
6644     }
6645 }
6646
6647 /*
6648 =for apidoc newSVpvn_share
6649
6650 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6651 table. If the string does not already exist in the table, it is created
6652 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6653 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6654 otherwise the hash is computed.  The idea here is that as the string table
6655 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6656 hash lookup will avoid string compare.
6657
6658 =cut
6659 */
6660
6661 SV *
6662 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6663 {
6664     register SV *sv;
6665     bool is_utf8 = FALSE;
6666     if (len < 0) {
6667         STRLEN tmplen = -len;
6668         is_utf8 = TRUE;
6669         /* See the note in hv.c:hv_fetch() --jhi */
6670         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6671         len = tmplen;
6672     }
6673     if (!hash)
6674         PERL_HASH(hash, src, len);
6675     new_SV(sv);
6676     sv_upgrade(sv, SVt_PV);
6677     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6678     SvCUR_set(sv, len);
6679     SvLEN_set(sv, 0);
6680     SvREADONLY_on(sv);
6681     SvFAKE_on(sv);
6682     SvPOK_on(sv);
6683     if (is_utf8)
6684         SvUTF8_on(sv);
6685     return sv;
6686 }
6687
6688
6689 #if defined(PERL_IMPLICIT_CONTEXT)
6690
6691 /* pTHX_ magic can't cope with varargs, so this is a no-context
6692  * version of the main function, (which may itself be aliased to us).
6693  * Don't access this version directly.
6694  */
6695
6696 SV *
6697 Perl_newSVpvf_nocontext(const char* pat, ...)
6698 {
6699     dTHX;
6700     register SV *sv;
6701     va_list args;
6702     va_start(args, pat);
6703     sv = vnewSVpvf(pat, &args);
6704     va_end(args);
6705     return sv;
6706 }
6707 #endif
6708
6709 /*
6710 =for apidoc newSVpvf
6711
6712 Creates a new SV and initializes it with the string formatted like
6713 C<sprintf>.
6714
6715 =cut
6716 */
6717
6718 SV *
6719 Perl_newSVpvf(pTHX_ const char* pat, ...)
6720 {
6721     register SV *sv;
6722     va_list args;
6723     va_start(args, pat);
6724     sv = vnewSVpvf(pat, &args);
6725     va_end(args);
6726     return sv;
6727 }
6728
6729 /* backend for newSVpvf() and newSVpvf_nocontext() */
6730
6731 SV *
6732 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6733 {
6734     register SV *sv;
6735     new_SV(sv);
6736     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6737     return sv;
6738 }
6739
6740 /*
6741 =for apidoc newSVnv
6742
6743 Creates a new SV and copies a floating point value into it.
6744 The reference count for the SV is set to 1.
6745
6746 =cut
6747 */
6748
6749 SV *
6750 Perl_newSVnv(pTHX_ NV n)
6751 {
6752     register SV *sv;
6753
6754     new_SV(sv);
6755     sv_setnv(sv,n);
6756     return sv;
6757 }
6758
6759 /*
6760 =for apidoc newSViv
6761
6762 Creates a new SV and copies an integer into it.  The reference count for the
6763 SV is set to 1.
6764
6765 =cut
6766 */
6767
6768 SV *
6769 Perl_newSViv(pTHX_ IV i)
6770 {
6771     register SV *sv;
6772
6773     new_SV(sv);
6774     sv_setiv(sv,i);
6775     return sv;
6776 }
6777
6778 /*
6779 =for apidoc newSVuv
6780
6781 Creates a new SV and copies an unsigned integer into it.
6782 The reference count for the SV is set to 1.
6783
6784 =cut
6785 */
6786
6787 SV *
6788 Perl_newSVuv(pTHX_ UV u)
6789 {
6790     register SV *sv;
6791
6792     new_SV(sv);
6793     sv_setuv(sv,u);
6794     return sv;
6795 }
6796
6797 /*
6798 =for apidoc newRV_noinc
6799
6800 Creates an RV wrapper for an SV.  The reference count for the original
6801 SV is B<not> incremented.
6802
6803 =cut
6804 */
6805
6806 SV *
6807 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6808 {
6809     register SV *sv;
6810
6811     new_SV(sv);
6812     sv_upgrade(sv, SVt_RV);
6813     SvTEMP_off(tmpRef);
6814     SvRV_set(sv, tmpRef);
6815     SvROK_on(sv);
6816     return sv;
6817 }
6818
6819 /* newRV_inc is the official function name to use now.
6820  * newRV_inc is in fact #defined to newRV in sv.h
6821  */
6822
6823 SV *
6824 Perl_newRV(pTHX_ SV *tmpRef)
6825 {
6826     return newRV_noinc(SvREFCNT_inc(tmpRef));
6827 }
6828
6829 /*
6830 =for apidoc newSVsv
6831
6832 Creates a new SV which is an exact duplicate of the original SV.
6833 (Uses C<sv_setsv>).
6834
6835 =cut
6836 */
6837
6838 SV *
6839 Perl_newSVsv(pTHX_ register SV *old)
6840 {
6841     register SV *sv;
6842
6843     if (!old)
6844         return Nullsv;
6845     if (SvTYPE(old) == SVTYPEMASK) {
6846         if (ckWARN_d(WARN_INTERNAL))
6847             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6848         return Nullsv;
6849     }
6850     new_SV(sv);
6851     /* SV_GMAGIC is the default for sv_setv()
6852        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6853        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6854     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6855     return sv;
6856 }
6857
6858 /*
6859 =for apidoc sv_reset
6860
6861 Underlying implementation for the C<reset> Perl function.
6862 Note that the perl-level function is vaguely deprecated.
6863
6864 =cut
6865 */
6866
6867 void
6868 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6869 {
6870     dVAR;
6871     char todo[PERL_UCHAR_MAX+1];
6872
6873     if (!stash)
6874         return;
6875
6876     if (!*s) {          /* reset ?? searches */
6877         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6878         if (mg) {
6879             PMOP *pm = (PMOP *) mg->mg_obj;
6880             while (pm) {
6881                 pm->op_pmdynflags &= ~PMdf_USED;
6882                 pm = pm->op_pmnext;
6883             }
6884         }
6885         return;
6886     }
6887
6888     /* reset variables */
6889
6890     if (!HvARRAY(stash))
6891         return;
6892
6893     Zero(todo, 256, char);
6894     while (*s) {
6895         I32 max;
6896         I32 i = (unsigned char)*s;
6897         if (s[1] == '-') {
6898             s += 2;
6899         }
6900         max = (unsigned char)*s++;
6901         for ( ; i <= max; i++) {
6902             todo[i] = 1;
6903         }
6904         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6905             HE *entry;
6906             for (entry = HvARRAY(stash)[i];
6907                  entry;
6908                  entry = HeNEXT(entry))
6909             {
6910                 register GV *gv;
6911                 register SV *sv;
6912
6913                 if (!todo[(U8)*HeKEY(entry)])
6914                     continue;
6915                 gv = (GV*)HeVAL(entry);
6916                 sv = GvSV(gv);
6917                 if (sv) {
6918                     if (SvTHINKFIRST(sv)) {
6919                         if (!SvREADONLY(sv) && SvROK(sv))
6920                             sv_unref(sv);
6921                         /* XXX Is this continue a bug? Why should THINKFIRST
6922                            exempt us from resetting arrays and hashes?  */
6923                         continue;
6924                     }
6925                     SvOK_off(sv);
6926                     if (SvTYPE(sv) >= SVt_PV) {
6927                         SvCUR_set(sv, 0);
6928                         if (SvPVX_const(sv) != Nullch)
6929                             *SvPVX(sv) = '\0';
6930                         SvTAINT(sv);
6931                     }
6932                 }
6933                 if (GvAV(gv)) {
6934                     av_clear(GvAV(gv));
6935                 }
6936                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6937 #if defined(VMS)
6938                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6939 #else /* ! VMS */
6940                     hv_clear(GvHV(gv));
6941 #  if defined(USE_ENVIRON_ARRAY)
6942                     if (gv == PL_envgv)
6943                         my_clearenv();
6944 #  endif /* USE_ENVIRON_ARRAY */
6945 #endif /* VMS */
6946                 }
6947             }
6948         }
6949     }
6950 }
6951
6952 /*
6953 =for apidoc sv_2io
6954
6955 Using various gambits, try to get an IO from an SV: the IO slot if its a
6956 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6957 named after the PV if we're a string.
6958
6959 =cut
6960 */
6961
6962 IO*
6963 Perl_sv_2io(pTHX_ SV *sv)
6964 {
6965     IO* io;
6966     GV* gv;
6967
6968     switch (SvTYPE(sv)) {
6969     case SVt_PVIO:
6970         io = (IO*)sv;
6971         break;
6972     case SVt_PVGV:
6973         gv = (GV*)sv;
6974         io = GvIO(gv);
6975         if (!io)
6976             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6977         break;
6978     default:
6979         if (!SvOK(sv))
6980             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6981         if (SvROK(sv))
6982             return sv_2io(SvRV(sv));
6983         gv = gv_fetchsv(sv, FALSE, SVt_PVIO);
6984         if (gv)
6985             io = GvIO(gv);
6986         else
6987             io = 0;
6988         if (!io)
6989             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6990         break;
6991     }
6992     return io;
6993 }
6994
6995 /*
6996 =for apidoc sv_2cv
6997
6998 Using various gambits, try to get a CV from an SV; in addition, try if
6999 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
7000
7001 =cut
7002 */
7003
7004 CV *
7005 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
7006 {
7007     dVAR;
7008     GV *gv = Nullgv;
7009     CV *cv = Nullcv;
7010
7011     if (!sv)
7012         return *gvp = Nullgv, Nullcv;
7013     switch (SvTYPE(sv)) {
7014     case SVt_PVCV:
7015         *st = CvSTASH(sv);
7016         *gvp = Nullgv;
7017         return (CV*)sv;
7018     case SVt_PVHV:
7019     case SVt_PVAV:
7020         *gvp = Nullgv;
7021         return Nullcv;
7022     case SVt_PVGV:
7023         gv = (GV*)sv;
7024         *gvp = gv;
7025         *st = GvESTASH(gv);
7026         goto fix_gv;
7027
7028     default:
7029         SvGETMAGIC(sv);
7030         if (SvROK(sv)) {
7031             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
7032             tryAMAGICunDEREF(to_cv);
7033
7034             sv = SvRV(sv);
7035             if (SvTYPE(sv) == SVt_PVCV) {
7036                 cv = (CV*)sv;
7037                 *gvp = Nullgv;
7038                 *st = CvSTASH(cv);
7039                 return cv;
7040             }
7041             else if(isGV(sv))
7042                 gv = (GV*)sv;
7043             else
7044                 Perl_croak(aTHX_ "Not a subroutine reference");
7045         }
7046         else if (isGV(sv))
7047             gv = (GV*)sv;
7048         else
7049             gv = gv_fetchsv(sv, lref, SVt_PVCV);
7050         *gvp = gv;
7051         if (!gv)
7052             return Nullcv;
7053         *st = GvESTASH(gv);
7054     fix_gv:
7055         if (lref && !GvCVu(gv)) {
7056             SV *tmpsv;
7057             ENTER;
7058             tmpsv = NEWSV(704,0);
7059             gv_efullname3(tmpsv, gv, Nullch);
7060             /* XXX this is probably not what they think they're getting.
7061              * It has the same effect as "sub name;", i.e. just a forward
7062              * declaration! */
7063             newSUB(start_subparse(FALSE, 0),
7064                    newSVOP(OP_CONST, 0, tmpsv),
7065                    Nullop,
7066                    Nullop);
7067             LEAVE;
7068             if (!GvCVu(gv))
7069                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
7070                            sv);
7071         }
7072         return GvCVu(gv);
7073     }
7074 }
7075
7076 /*
7077 =for apidoc sv_true
7078
7079 Returns true if the SV has a true value by Perl's rules.
7080 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
7081 instead use an in-line version.
7082
7083 =cut
7084 */
7085
7086 I32
7087 Perl_sv_true(pTHX_ register SV *sv)
7088 {
7089     if (!sv)
7090         return 0;
7091     if (SvPOK(sv)) {
7092         register const XPV* const tXpv = (XPV*)SvANY(sv);
7093         if (tXpv &&
7094                 (tXpv->xpv_cur > 1 ||
7095                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
7096             return 1;
7097         else
7098             return 0;
7099     }
7100     else {
7101         if (SvIOK(sv))
7102             return SvIVX(sv) != 0;
7103         else {
7104             if (SvNOK(sv))
7105                 return SvNVX(sv) != 0.0;
7106             else
7107                 return sv_2bool(sv);
7108         }
7109     }
7110 }
7111
7112 /*
7113 =for apidoc sv_pvn_force
7114
7115 Get a sensible string out of the SV somehow.
7116 A private implementation of the C<SvPV_force> macro for compilers which
7117 can't cope with complex macro expressions. Always use the macro instead.
7118
7119 =for apidoc sv_pvn_force_flags
7120
7121 Get a sensible string out of the SV somehow.
7122 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
7123 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
7124 implemented in terms of this function.
7125 You normally want to use the various wrapper macros instead: see
7126 C<SvPV_force> and C<SvPV_force_nomg>
7127
7128 =cut
7129 */
7130
7131 char *
7132 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
7133 {
7134
7135     if (SvTHINKFIRST(sv) && !SvROK(sv))
7136         sv_force_normal_flags(sv, 0);
7137
7138     if (SvPOK(sv)) {
7139         if (lp)
7140             *lp = SvCUR(sv);
7141     }
7142     else {
7143         char *s;
7144         STRLEN len;
7145  
7146         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
7147             const char * const ref = sv_reftype(sv,0);
7148             if (PL_op)
7149                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
7150                            ref, OP_NAME(PL_op));
7151             else
7152                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
7153         }
7154         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
7155             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
7156                 OP_NAME(PL_op));
7157         s = sv_2pv_flags(sv, &len, flags);
7158         if (lp)
7159             *lp = len;
7160
7161         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
7162             if (SvROK(sv))
7163                 sv_unref(sv);
7164             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
7165             SvGROW(sv, len + 1);
7166             Move(s,SvPVX(sv),len,char);
7167             SvCUR_set(sv, len);
7168             *SvEND(sv) = '\0';
7169         }
7170         if (!SvPOK(sv)) {
7171             SvPOK_on(sv);               /* validate pointer */
7172             SvTAINT(sv);
7173             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
7174                                   PTR2UV(sv),SvPVX_const(sv)));
7175         }
7176     }
7177     return SvPVX_mutable(sv);
7178 }
7179
7180 /*
7181 =for apidoc sv_pvbyten_force
7182
7183 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
7184
7185 =cut
7186 */
7187
7188 char *
7189 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
7190 {
7191     sv_pvn_force(sv,lp);
7192     sv_utf8_downgrade(sv,0);
7193     *lp = SvCUR(sv);
7194     return SvPVX(sv);
7195 }
7196
7197 /*
7198 =for apidoc sv_pvutf8n_force
7199
7200 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
7201
7202 =cut
7203 */
7204
7205 char *
7206 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
7207 {
7208     sv_pvn_force(sv,lp);
7209     sv_utf8_upgrade(sv);
7210     *lp = SvCUR(sv);
7211     return SvPVX(sv);
7212 }
7213
7214 /*
7215 =for apidoc sv_reftype
7216
7217 Returns a string describing what the SV is a reference to.
7218
7219 =cut
7220 */
7221
7222 char *
7223 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
7224 {
7225     /* The fact that I don't need to downcast to char * everywhere, only in ?:
7226        inside return suggests a const propagation bug in g++.  */
7227     if (ob && SvOBJECT(sv)) {
7228         char * const name = HvNAME_get(SvSTASH(sv));
7229         return name ? name : (char *) "__ANON__";
7230     }
7231     else {
7232         switch (SvTYPE(sv)) {
7233         case SVt_NULL:
7234         case SVt_IV:
7235         case SVt_NV:
7236         case SVt_RV:
7237         case SVt_PV:
7238         case SVt_PVIV:
7239         case SVt_PVNV:
7240         case SVt_PVMG:
7241         case SVt_PVBM:
7242                                 if (SvVOK(sv))
7243                                     return "VSTRING";
7244                                 if (SvROK(sv))
7245                                     return "REF";
7246                                 else
7247                                     return "SCALAR";
7248
7249         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
7250                                 /* tied lvalues should appear to be
7251                                  * scalars for backwards compatitbility */
7252                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
7253                                     ? "SCALAR" : "LVALUE");
7254         case SVt_PVAV:          return "ARRAY";
7255         case SVt_PVHV:          return "HASH";
7256         case SVt_PVCV:          return "CODE";
7257         case SVt_PVGV:          return "GLOB";
7258         case SVt_PVFM:          return "FORMAT";
7259         case SVt_PVIO:          return "IO";
7260         default:                return "UNKNOWN";
7261         }
7262     }
7263 }
7264
7265 /*
7266 =for apidoc sv_isobject
7267
7268 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7269 object.  If the SV is not an RV, or if the object is not blessed, then this
7270 will return false.
7271
7272 =cut
7273 */
7274
7275 int
7276 Perl_sv_isobject(pTHX_ SV *sv)
7277 {
7278     if (!sv)
7279         return 0;
7280     SvGETMAGIC(sv);
7281     if (!SvROK(sv))
7282         return 0;
7283     sv = (SV*)SvRV(sv);
7284     if (!SvOBJECT(sv))
7285         return 0;
7286     return 1;
7287 }
7288
7289 /*
7290 =for apidoc sv_isa
7291
7292 Returns a boolean indicating whether the SV is blessed into the specified
7293 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7294 an inheritance relationship.
7295
7296 =cut
7297 */
7298
7299 int
7300 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7301 {
7302     const char *hvname;
7303     if (!sv)
7304         return 0;
7305     SvGETMAGIC(sv);
7306     if (!SvROK(sv))
7307         return 0;
7308     sv = (SV*)SvRV(sv);
7309     if (!SvOBJECT(sv))
7310         return 0;
7311     hvname = HvNAME_get(SvSTASH(sv));
7312     if (!hvname)
7313         return 0;
7314
7315     return strEQ(hvname, name);
7316 }
7317
7318 /*
7319 =for apidoc newSVrv
7320
7321 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7322 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7323 be blessed in the specified package.  The new SV is returned and its
7324 reference count is 1.
7325
7326 =cut
7327 */
7328
7329 SV*
7330 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7331 {
7332     SV *sv;
7333
7334     new_SV(sv);
7335
7336     SV_CHECK_THINKFIRST_COW_DROP(rv);
7337     SvAMAGIC_off(rv);
7338
7339     if (SvTYPE(rv) >= SVt_PVMG) {
7340         const U32 refcnt = SvREFCNT(rv);
7341         SvREFCNT(rv) = 0;
7342         sv_clear(rv);
7343         SvFLAGS(rv) = 0;
7344         SvREFCNT(rv) = refcnt;
7345     }
7346
7347     if (SvTYPE(rv) < SVt_RV)
7348         sv_upgrade(rv, SVt_RV);
7349     else if (SvTYPE(rv) > SVt_RV) {
7350         SvPV_free(rv);
7351         SvCUR_set(rv, 0);
7352         SvLEN_set(rv, 0);
7353     }
7354
7355     SvOK_off(rv);
7356     SvRV_set(rv, sv);
7357     SvROK_on(rv);
7358
7359     if (classname) {
7360         HV* const stash = gv_stashpv(classname, TRUE);
7361         (void)sv_bless(rv, stash);
7362     }
7363     return sv;
7364 }
7365
7366 /*
7367 =for apidoc sv_setref_pv
7368
7369 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7370 argument will be upgraded to an RV.  That RV will be modified to point to
7371 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7372 into the SV.  The C<classname> argument indicates the package for the
7373 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7374 will have a reference count of 1, and the RV will be returned.
7375
7376 Do not use with other Perl types such as HV, AV, SV, CV, because those
7377 objects will become corrupted by the pointer copy process.
7378
7379 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7380
7381 =cut
7382 */
7383
7384 SV*
7385 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7386 {
7387     if (!pv) {
7388         sv_setsv(rv, &PL_sv_undef);
7389         SvSETMAGIC(rv);
7390     }
7391     else
7392         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7393     return rv;
7394 }
7395
7396 /*
7397 =for apidoc sv_setref_iv
7398
7399 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7400 argument will be upgraded to an RV.  That RV will be modified to point to
7401 the new SV.  The C<classname> argument indicates the package for the
7402 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7403 will have a reference count of 1, and the RV will be returned.
7404
7405 =cut
7406 */
7407
7408 SV*
7409 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7410 {
7411     sv_setiv(newSVrv(rv,classname), iv);
7412     return rv;
7413 }
7414
7415 /*
7416 =for apidoc sv_setref_uv
7417
7418 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7419 argument will be upgraded to an RV.  That RV will be modified to point to
7420 the new SV.  The C<classname> argument indicates the package for the
7421 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7422 will have a reference count of 1, and the RV will be returned.
7423
7424 =cut
7425 */
7426
7427 SV*
7428 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7429 {
7430     sv_setuv(newSVrv(rv,classname), uv);
7431     return rv;
7432 }
7433
7434 /*
7435 =for apidoc sv_setref_nv
7436
7437 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7438 argument will be upgraded to an RV.  That RV will be modified to point to
7439 the new SV.  The C<classname> argument indicates the package for the
7440 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7441 will have a reference count of 1, and the RV will be returned.
7442
7443 =cut
7444 */
7445
7446 SV*
7447 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7448 {
7449     sv_setnv(newSVrv(rv,classname), nv);
7450     return rv;
7451 }
7452
7453 /*
7454 =for apidoc sv_setref_pvn
7455
7456 Copies a string into a new SV, optionally blessing the SV.  The length of the
7457 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7458 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7459 argument indicates the package for the blessing.  Set C<classname> to
7460 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7461 of 1, and the RV will be returned.
7462
7463 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7464
7465 =cut
7466 */
7467
7468 SV*
7469 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7470 {
7471     sv_setpvn(newSVrv(rv,classname), pv, n);
7472     return rv;
7473 }
7474
7475 /*
7476 =for apidoc sv_bless
7477
7478 Blesses an SV into a specified package.  The SV must be an RV.  The package
7479 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7480 of the SV is unaffected.
7481
7482 =cut
7483 */
7484
7485 SV*
7486 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7487 {
7488     SV *tmpRef;
7489     if (!SvROK(sv))
7490         Perl_croak(aTHX_ "Can't bless non-reference value");
7491     tmpRef = SvRV(sv);
7492     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7493         if (SvREADONLY(tmpRef))
7494             Perl_croak(aTHX_ PL_no_modify);
7495         if (SvOBJECT(tmpRef)) {
7496             if (SvTYPE(tmpRef) != SVt_PVIO)
7497                 --PL_sv_objcount;
7498             SvREFCNT_dec(SvSTASH(tmpRef));
7499         }
7500     }
7501     SvOBJECT_on(tmpRef);
7502     if (SvTYPE(tmpRef) != SVt_PVIO)
7503         ++PL_sv_objcount;
7504     SvUPGRADE(tmpRef, SVt_PVMG);
7505     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7506
7507     if (Gv_AMG(stash))
7508         SvAMAGIC_on(sv);
7509     else
7510         SvAMAGIC_off(sv);
7511
7512     if(SvSMAGICAL(tmpRef))
7513         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7514             mg_set(tmpRef);
7515
7516
7517
7518     return sv;
7519 }
7520
7521 /* Downgrades a PVGV to a PVMG.
7522  */
7523
7524 STATIC void
7525 S_sv_unglob(pTHX_ SV *sv)
7526 {
7527     void *xpvmg;
7528
7529     assert(SvTYPE(sv) == SVt_PVGV);
7530     SvFAKE_off(sv);
7531     if (GvGP(sv))
7532         gp_free((GV*)sv);
7533     if (GvSTASH(sv)) {
7534         sv_del_backref((SV*)GvSTASH(sv), sv);
7535         GvSTASH(sv) = Nullhv;
7536     }
7537     sv_unmagic(sv, PERL_MAGIC_glob);
7538     Safefree(GvNAME(sv));
7539     GvMULTI_off(sv);
7540
7541     /* need to keep SvANY(sv) in the right arena */
7542     xpvmg = new_XPVMG();
7543     StructCopy(SvANY(sv), xpvmg, XPVMG);
7544     del_XPVGV(SvANY(sv));
7545     SvANY(sv) = xpvmg;
7546
7547     SvFLAGS(sv) &= ~SVTYPEMASK;
7548     SvFLAGS(sv) |= SVt_PVMG;
7549 }
7550
7551 /*
7552 =for apidoc sv_unref_flags
7553
7554 Unsets the RV status of the SV, and decrements the reference count of
7555 whatever was being referenced by the RV.  This can almost be thought of
7556 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7557 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7558 (otherwise the decrementing is conditional on the reference count being
7559 different from one or the reference being a readonly SV).
7560 See C<SvROK_off>.
7561
7562 =cut
7563 */
7564
7565 void
7566 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7567 {
7568     SV* const target = SvRV(ref);
7569
7570     if (SvWEAKREF(ref)) {
7571         sv_del_backref(target, ref);
7572         SvWEAKREF_off(ref);
7573         SvRV_set(ref, NULL);
7574         return;
7575     }
7576     SvRV_set(ref, NULL);
7577     SvROK_off(ref);
7578     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7579        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7580     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7581         SvREFCNT_dec(target);
7582     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7583         sv_2mortal(target);     /* Schedule for freeing later */
7584 }
7585
7586 /*
7587 =for apidoc sv_untaint
7588
7589 Untaint an SV. Use C<SvTAINTED_off> instead.
7590 =cut
7591 */
7592
7593 void
7594 Perl_sv_untaint(pTHX_ SV *sv)
7595 {
7596     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7597         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7598         if (mg)
7599             mg->mg_len &= ~1;
7600     }
7601 }
7602
7603 /*
7604 =for apidoc sv_tainted
7605
7606 Test an SV for taintedness. Use C<SvTAINTED> instead.
7607 =cut
7608 */
7609
7610 bool
7611 Perl_sv_tainted(pTHX_ SV *sv)
7612 {
7613     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7614         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7615         if (mg && (mg->mg_len & 1) )
7616             return TRUE;
7617     }
7618     return FALSE;
7619 }
7620
7621 /*
7622 =for apidoc sv_setpviv
7623
7624 Copies an integer into the given SV, also updating its string value.
7625 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7626
7627 =cut
7628 */
7629
7630 void
7631 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7632 {
7633     char buf[TYPE_CHARS(UV)];
7634     char *ebuf;
7635     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7636
7637     sv_setpvn(sv, ptr, ebuf - ptr);
7638 }
7639
7640 /*
7641 =for apidoc sv_setpviv_mg
7642
7643 Like C<sv_setpviv>, but also handles 'set' magic.
7644
7645 =cut
7646 */
7647
7648 void
7649 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7650 {
7651     sv_setpviv(sv, iv);
7652     SvSETMAGIC(sv);
7653 }
7654
7655 #if defined(PERL_IMPLICIT_CONTEXT)
7656
7657 /* pTHX_ magic can't cope with varargs, so this is a no-context
7658  * version of the main function, (which may itself be aliased to us).
7659  * Don't access this version directly.
7660  */
7661
7662 void
7663 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7664 {
7665     dTHX;
7666     va_list args;
7667     va_start(args, pat);
7668     sv_vsetpvf(sv, pat, &args);
7669     va_end(args);
7670 }
7671
7672 /* pTHX_ magic can't cope with varargs, so this is a no-context
7673  * version of the main function, (which may itself be aliased to us).
7674  * Don't access this version directly.
7675  */
7676
7677 void
7678 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7679 {
7680     dTHX;
7681     va_list args;
7682     va_start(args, pat);
7683     sv_vsetpvf_mg(sv, pat, &args);
7684     va_end(args);
7685 }
7686 #endif
7687
7688 /*
7689 =for apidoc sv_setpvf
7690
7691 Works like C<sv_catpvf> but copies the text into the SV instead of
7692 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7693
7694 =cut
7695 */
7696
7697 void
7698 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7699 {
7700     va_list args;
7701     va_start(args, pat);
7702     sv_vsetpvf(sv, pat, &args);
7703     va_end(args);
7704 }
7705
7706 /*
7707 =for apidoc sv_vsetpvf
7708
7709 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7710 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7711
7712 Usually used via its frontend C<sv_setpvf>.
7713
7714 =cut
7715 */
7716
7717 void
7718 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7719 {
7720     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7721 }
7722
7723 /*
7724 =for apidoc sv_setpvf_mg
7725
7726 Like C<sv_setpvf>, but also handles 'set' magic.
7727
7728 =cut
7729 */
7730
7731 void
7732 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7733 {
7734     va_list args;
7735     va_start(args, pat);
7736     sv_vsetpvf_mg(sv, pat, &args);
7737     va_end(args);
7738 }
7739
7740 /*
7741 =for apidoc sv_vsetpvf_mg
7742
7743 Like C<sv_vsetpvf>, but also handles 'set' magic.
7744
7745 Usually used via its frontend C<sv_setpvf_mg>.
7746
7747 =cut
7748 */
7749
7750 void
7751 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7752 {
7753     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7754     SvSETMAGIC(sv);
7755 }
7756
7757 #if defined(PERL_IMPLICIT_CONTEXT)
7758
7759 /* pTHX_ magic can't cope with varargs, so this is a no-context
7760  * version of the main function, (which may itself be aliased to us).
7761  * Don't access this version directly.
7762  */
7763
7764 void
7765 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7766 {
7767     dTHX;
7768     va_list args;
7769     va_start(args, pat);
7770     sv_vcatpvf(sv, pat, &args);
7771     va_end(args);
7772 }
7773
7774 /* pTHX_ magic can't cope with varargs, so this is a no-context
7775  * version of the main function, (which may itself be aliased to us).
7776  * Don't access this version directly.
7777  */
7778
7779 void
7780 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7781 {
7782     dTHX;
7783     va_list args;
7784     va_start(args, pat);
7785     sv_vcatpvf_mg(sv, pat, &args);
7786     va_end(args);
7787 }
7788 #endif
7789
7790 /*
7791 =for apidoc sv_catpvf
7792
7793 Processes its arguments like C<sprintf> and appends the formatted
7794 output to an SV.  If the appended data contains "wide" characters
7795 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7796 and characters >255 formatted with %c), the original SV might get
7797 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7798 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7799 valid UTF-8; if the original SV was bytes, the pattern should be too.
7800
7801 =cut */
7802
7803 void
7804 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7805 {
7806     va_list args;
7807     va_start(args, pat);
7808     sv_vcatpvf(sv, pat, &args);
7809     va_end(args);
7810 }
7811
7812 /*
7813 =for apidoc sv_vcatpvf
7814
7815 Processes its arguments like C<vsprintf> and appends the formatted output
7816 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7817
7818 Usually used via its frontend C<sv_catpvf>.
7819
7820 =cut
7821 */
7822
7823 void
7824 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7825 {
7826     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7827 }
7828
7829 /*
7830 =for apidoc sv_catpvf_mg
7831
7832 Like C<sv_catpvf>, but also handles 'set' magic.
7833
7834 =cut
7835 */
7836
7837 void
7838 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7839 {
7840     va_list args;
7841     va_start(args, pat);
7842     sv_vcatpvf_mg(sv, pat, &args);
7843     va_end(args);
7844 }
7845
7846 /*
7847 =for apidoc sv_vcatpvf_mg
7848
7849 Like C<sv_vcatpvf>, but also handles 'set' magic.
7850
7851 Usually used via its frontend C<sv_catpvf_mg>.
7852
7853 =cut
7854 */
7855
7856 void
7857 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7858 {
7859     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7860     SvSETMAGIC(sv);
7861 }
7862
7863 /*
7864 =for apidoc sv_vsetpvfn
7865
7866 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7867 appending it.
7868
7869 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7870
7871 =cut
7872 */
7873
7874 void
7875 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7876 {
7877     sv_setpvn(sv, "", 0);
7878     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7879 }
7880
7881 /* private function for use in sv_vcatpvfn via the EXPECT_NUMBER macro */
7882
7883 STATIC I32
7884 S_expect_number(pTHX_ char** pattern)
7885 {
7886     I32 var = 0;
7887     switch (**pattern) {
7888     case '1': case '2': case '3':
7889     case '4': case '5': case '6':
7890     case '7': case '8': case '9':
7891         while (isDIGIT(**pattern))
7892             var = var * 10 + (*(*pattern)++ - '0');
7893     }
7894     return var;
7895 }
7896 #define EXPECT_NUMBER(pattern, var) (var = S_expect_number(aTHX_ &pattern))
7897
7898 static char *
7899 F0convert(NV nv, char *endbuf, STRLEN *len)
7900 {
7901     const int neg = nv < 0;
7902     UV uv;
7903
7904     if (neg)
7905         nv = -nv;
7906     if (nv < UV_MAX) {
7907         char *p = endbuf;
7908         nv += 0.5;
7909         uv = (UV)nv;
7910         if (uv & 1 && uv == nv)
7911             uv--;                       /* Round to even */
7912         do {
7913             const unsigned dig = uv % 10;
7914             *--p = '0' + dig;
7915         } while (uv /= 10);
7916         if (neg)
7917             *--p = '-';
7918         *len = endbuf - p;
7919         return p;
7920     }
7921     return Nullch;
7922 }
7923
7924
7925 /*
7926 =for apidoc sv_vcatpvfn
7927
7928 Processes its arguments like C<vsprintf> and appends the formatted output
7929 to an SV.  Uses an array of SVs if the C style variable argument list is
7930 missing (NULL).  When running with taint checks enabled, indicates via
7931 C<maybe_tainted> if results are untrustworthy (often due to the use of
7932 locales).
7933
7934 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7935
7936 =cut
7937 */
7938
7939
7940 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7941                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7942                         vec_utf8 = DO_UTF8(vecsv);
7943
7944 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7945
7946 void
7947 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7948 {
7949     char *p;
7950     char *q;
7951     const char *patend;
7952     STRLEN origlen;
7953     I32 svix = 0;
7954     static const char nullstr[] = "(null)";
7955     SV *argsv = Nullsv;
7956     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7957     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7958     SV *nsv = Nullsv;
7959     /* Times 4: a decimal digit takes more than 3 binary digits.
7960      * NV_DIG: mantissa takes than many decimal digits.
7961      * Plus 32: Playing safe. */
7962     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7963     /* large enough for "%#.#f" --chip */
7964     /* what about long double NVs? --jhi */
7965
7966     PERL_UNUSED_ARG(maybe_tainted);
7967
7968     /* no matter what, this is a string now */
7969     (void)SvPV_force(sv, origlen);
7970
7971     /* special-case "", "%s", and "%-p" (SVf - see below) */
7972     if (patlen == 0)
7973         return;
7974     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7975         if (args) {
7976             const char * const s = va_arg(*args, char*);
7977             sv_catpv(sv, s ? s : nullstr);
7978         }
7979         else if (svix < svmax) {
7980             sv_catsv(sv, *svargs);
7981         }
7982         return;
7983     }
7984     if (args && patlen == 3 && pat[0] == '%' &&
7985                 pat[1] == '-' && pat[2] == 'p') {
7986         argsv = va_arg(*args, SV*);
7987         sv_catsv(sv, argsv);
7988         return;
7989     }
7990
7991 #ifndef USE_LONG_DOUBLE
7992     /* special-case "%.<number>[gf]" */
7993     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7994          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7995         unsigned digits = 0;
7996         const char *pp;
7997
7998         pp = pat + 2;
7999         while (*pp >= '0' && *pp <= '9')
8000             digits = 10 * digits + (*pp++ - '0');
8001         if (pp - pat == (int)patlen - 1) {
8002             NV nv;
8003
8004             if (svix < svmax)
8005                 nv = SvNV(*svargs);
8006             else
8007                 return;
8008             if (*pp == 'g') {
8009                 /* Add check for digits != 0 because it seems that some
8010                    gconverts are buggy in this case, and we don't yet have
8011                    a Configure test for this.  */
8012                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
8013                      /* 0, point, slack */
8014                     Gconvert(nv, (int)digits, 0, ebuf);
8015                     sv_catpv(sv, ebuf);
8016                     if (*ebuf)  /* May return an empty string for digits==0 */
8017                         return;
8018                 }
8019             } else if (!digits) {
8020                 STRLEN l;
8021
8022                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
8023                     sv_catpvn(sv, p, l);
8024                     return;
8025                 }
8026             }
8027         }
8028     }
8029 #endif /* !USE_LONG_DOUBLE */
8030
8031     if (!args && svix < svmax && DO_UTF8(*svargs))
8032         has_utf8 = TRUE;
8033
8034     patend = (char*)pat + patlen;
8035     for (p = (char*)pat; p < patend; p = q) {
8036         bool alt = FALSE;
8037         bool left = FALSE;
8038         bool vectorize = FALSE;
8039         bool vectorarg = FALSE;
8040         bool vec_utf8 = FALSE;
8041         char fill = ' ';
8042         char plus = 0;
8043         char intsize = 0;
8044         STRLEN width = 0;
8045         STRLEN zeros = 0;
8046         bool has_precis = FALSE;
8047         STRLEN precis = 0;
8048         I32 osvix = svix;
8049         bool is_utf8 = FALSE;  /* is this item utf8?   */
8050 #ifdef HAS_LDBL_SPRINTF_BUG
8051         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8052            with sfio - Allen <allens@cpan.org> */
8053         bool fix_ldbl_sprintf_bug = FALSE;
8054 #endif
8055
8056         char esignbuf[4];
8057         U8 utf8buf[UTF8_MAXBYTES+1];
8058         STRLEN esignlen = 0;
8059
8060         const char *eptr = Nullch;
8061         STRLEN elen = 0;
8062         SV *vecsv = Nullsv;
8063         const U8 *vecstr = Null(U8*);
8064         STRLEN veclen = 0;
8065         char c = 0;
8066         int i;
8067         unsigned base = 0;
8068         IV iv = 0;
8069         UV uv = 0;
8070         /* we need a long double target in case HAS_LONG_DOUBLE but
8071            not USE_LONG_DOUBLE
8072         */
8073 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
8074         long double nv;
8075 #else
8076         NV nv;
8077 #endif
8078         STRLEN have;
8079         STRLEN need;
8080         STRLEN gap;
8081         const char *dotstr = ".";
8082         STRLEN dotstrlen = 1;
8083         I32 efix = 0; /* explicit format parameter index */
8084         I32 ewix = 0; /* explicit width index */
8085         I32 epix = 0; /* explicit precision index */
8086         I32 evix = 0; /* explicit vector index */
8087         bool asterisk = FALSE;
8088
8089         /* echo everything up to the next format specification */
8090         for (q = p; q < patend && *q != '%'; ++q) ;
8091         if (q > p) {
8092             if (has_utf8 && !pat_utf8)
8093                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
8094             else
8095                 sv_catpvn(sv, p, q - p);
8096             p = q;
8097         }
8098         if (q++ >= patend)
8099             break;
8100
8101 /*
8102     We allow format specification elements in this order:
8103         \d+\$              explicit format parameter index
8104         [-+ 0#]+           flags
8105         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
8106         0                  flag (as above): repeated to allow "v02"     
8107         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
8108         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
8109         [hlqLV]            size
8110     [%bcdefginopsuxDFOUX] format (mandatory)
8111 */
8112
8113         if (args) {
8114 /*  
8115         As of perl5.9.3, printf format checking is on by default.
8116         Internally, perl uses %p formats to provide an escape to
8117         some extended formatting.  This block deals with those
8118         extensions: if it does not match, (char*)q is reset and
8119         the normal format processing code is used.
8120
8121         Currently defined extensions are:
8122                 %p              include pointer address (standard)      
8123                 %-p     (SVf)   include an SV (previously %_)
8124                 %-<num>p        include an SV with precision <num>      
8125                 %1p     (VDf)   include a v-string (as %vd)
8126                 %<num>p         reserved for future extensions
8127
8128         Robin Barker 2005-07-14
8129 */
8130             char* r = q; 
8131             bool sv = FALSE;    
8132             STRLEN n = 0;
8133             if (*q == '-')
8134                 sv = *q++;
8135             EXPECT_NUMBER(q, n);
8136             if (*q++ == 'p') {
8137                 if (sv) {                       /* SVf */
8138                     if (n) {
8139                         precis = n;
8140                         has_precis = TRUE;
8141                     }
8142                     argsv = va_arg(*args, SV*);
8143                     eptr = SvPVx_const(argsv, elen);
8144                     if (DO_UTF8(argsv))
8145                         is_utf8 = TRUE;
8146                     goto string;
8147                 }
8148 #if vdNUMBER
8149                 else if (n == vdNUMBER) {       /* VDf */
8150                     vectorize = TRUE;
8151                     VECTORIZE_ARGS
8152                     goto format_vd;
8153                 }
8154 #endif
8155                 else if (n) {
8156                     if (ckWARN_d(WARN_INTERNAL))
8157                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
8158                         "internal %%<num>p might conflict with future printf extensions");
8159                 }
8160             }
8161             q = r; 
8162         }
8163
8164         if (EXPECT_NUMBER(q, width)) {
8165             if (*q == '$') {
8166                 ++q;
8167                 efix = width;
8168             } else {
8169                 goto gotwidth;
8170             }
8171         }
8172
8173         /* FLAGS */
8174
8175         while (*q) {
8176             switch (*q) {
8177             case ' ':
8178             case '+':
8179                 plus = *q++;
8180                 continue;
8181
8182             case '-':
8183                 left = TRUE;
8184                 q++;
8185                 continue;
8186
8187             case '0':
8188                 fill = *q++;
8189                 continue;
8190
8191             case '#':
8192                 alt = TRUE;
8193                 q++;
8194                 continue;
8195
8196             default:
8197                 break;
8198             }
8199             break;
8200         }
8201
8202       tryasterisk:
8203         if (*q == '*') {
8204             q++;
8205             if (EXPECT_NUMBER(q, ewix))
8206                 if (*q++ != '$')
8207                     goto unknown;
8208             asterisk = TRUE;
8209         }
8210         if (*q == 'v') {
8211             q++;
8212             if (vectorize)
8213                 goto unknown;
8214             if ((vectorarg = asterisk)) {
8215                 evix = ewix;
8216                 ewix = 0;
8217                 asterisk = FALSE;
8218             }
8219             vectorize = TRUE;
8220             goto tryasterisk;
8221         }
8222
8223         if (!asterisk)
8224         {
8225             if( *q == '0' )
8226                 fill = *q++;
8227             EXPECT_NUMBER(q, width);
8228         }
8229
8230         if (vectorize) {
8231             if (vectorarg) {
8232                 if (args)
8233                     vecsv = va_arg(*args, SV*);
8234                 else
8235                     vecsv = (evix ? evix <= svmax : svix < svmax) ?
8236                         svargs[evix ? evix-1 : svix++] : &PL_sv_undef;
8237                 dotstr = SvPV_const(vecsv, dotstrlen);
8238                 if (DO_UTF8(vecsv))
8239                     is_utf8 = TRUE;
8240             }
8241             if (args) {
8242                 VECTORIZE_ARGS
8243             }
8244             else if (efix ? efix <= svmax : svix < svmax) {
8245                 vecsv = svargs[efix ? efix-1 : svix++];
8246                 vecstr = (U8*)SvPV_const(vecsv,veclen);
8247                 vec_utf8 = DO_UTF8(vecsv);
8248                 /* if this is a version object, we need to return the
8249                  * stringified representation (which the SvPVX_const has
8250                  * already done for us), but not vectorize the args
8251                  */
8252                 if ( *q == 'd' && sv_derived_from(vecsv,"version") )
8253                 {
8254                         q++; /* skip past the rest of the %vd format */
8255                         eptr = (const char *) vecstr;
8256                         elen = veclen;
8257                         vectorize=FALSE;
8258                         goto string;
8259                 }
8260             }
8261             else {
8262                 vecstr = (U8*)"";
8263                 veclen = 0;
8264             }
8265         }
8266
8267         if (asterisk) {
8268             if (args)
8269                 i = va_arg(*args, int);
8270             else
8271                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8272                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8273             left |= (i < 0);
8274             width = (i < 0) ? -i : i;
8275         }
8276       gotwidth:
8277
8278         /* PRECISION */
8279
8280         if (*q == '.') {
8281             q++;
8282             if (*q == '*') {
8283                 q++;
8284                 if (EXPECT_NUMBER(q, epix) && *q++ != '$')
8285                     goto unknown;
8286                 /* XXX: todo, support specified precision parameter */
8287                 if (epix)
8288                     goto unknown;
8289                 if (args)
8290                     i = va_arg(*args, int);
8291                 else
8292                     i = (ewix ? ewix <= svmax : svix < svmax)
8293                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8294                 precis = (i < 0) ? 0 : i;
8295             }
8296             else {
8297                 precis = 0;
8298                 while (isDIGIT(*q))
8299                     precis = precis * 10 + (*q++ - '0');
8300             }
8301             has_precis = TRUE;
8302         }
8303
8304         /* SIZE */
8305
8306         switch (*q) {
8307 #ifdef WIN32
8308         case 'I':                       /* Ix, I32x, and I64x */
8309 #  ifdef WIN64
8310             if (q[1] == '6' && q[2] == '4') {
8311                 q += 3;
8312                 intsize = 'q';
8313                 break;
8314             }
8315 #  endif
8316             if (q[1] == '3' && q[2] == '2') {
8317                 q += 3;
8318                 break;
8319             }
8320 #  ifdef WIN64
8321             intsize = 'q';
8322 #  endif
8323             q++;
8324             break;
8325 #endif
8326 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8327         case 'L':                       /* Ld */
8328             /* FALL THROUGH */
8329 #ifdef HAS_QUAD
8330         case 'q':                       /* qd */
8331 #endif
8332             intsize = 'q';
8333             q++;
8334             break;
8335 #endif
8336         case 'l':
8337 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8338             if (*(q + 1) == 'l') {      /* lld, llf */
8339                 intsize = 'q';
8340                 q += 2;
8341                 break;
8342              }
8343 #endif
8344             /* FALL THROUGH */
8345         case 'h':
8346             /* FALL THROUGH */
8347         case 'V':
8348             intsize = *q++;
8349             break;
8350         }
8351
8352         /* CONVERSION */
8353
8354         if (*q == '%') {
8355             eptr = q++;
8356             elen = 1;
8357             goto string;
8358         }
8359
8360         if (vectorize)
8361             argsv = vecsv;
8362         else if (!args) {
8363             if (efix) {
8364                 const I32 i = efix-1;
8365                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8366             } else {
8367                 argsv = (svix >= 0 && svix < svmax)
8368                     ? svargs[svix++] : &PL_sv_undef;
8369             }
8370         }
8371
8372         switch (c = *q++) {
8373
8374             /* STRINGS */
8375
8376         case 'c':
8377             uv = (args && !vectorize) ? va_arg(*args, int) : SvIVx(argsv);
8378             if ((uv > 255 ||
8379                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8380                 && !IN_BYTES) {
8381                 eptr = (char*)utf8buf;
8382                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8383                 is_utf8 = TRUE;
8384             }
8385             else {
8386                 c = (char)uv;
8387                 eptr = &c;
8388                 elen = 1;
8389             }
8390             goto string;
8391
8392         case 's':
8393             if (args && !vectorize) {
8394                 eptr = va_arg(*args, char*);
8395                 if (eptr)
8396 #ifdef MACOS_TRADITIONAL
8397                   /* On MacOS, %#s format is used for Pascal strings */
8398                   if (alt)
8399                     elen = *eptr++;
8400                   else
8401 #endif
8402                     elen = strlen(eptr);
8403                 else {
8404                     eptr = (char *)nullstr;
8405                     elen = sizeof nullstr - 1;
8406                 }
8407             }
8408             else {
8409                 eptr = SvPVx_const(argsv, elen);
8410                 if (DO_UTF8(argsv)) {
8411                     if (has_precis && precis < elen) {
8412                         I32 p = precis;
8413                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8414                         precis = p;
8415                     }
8416                     if (width) { /* fudge width (can't fudge elen) */
8417                         width += elen - sv_len_utf8(argsv);
8418                     }
8419                     is_utf8 = TRUE;
8420                 }
8421             }
8422
8423         string:
8424             vectorize = FALSE;
8425             if (has_precis && elen > precis)
8426                 elen = precis;
8427             break;
8428
8429             /* INTEGERS */
8430
8431         case 'p':
8432             if (alt || vectorize)
8433                 goto unknown;
8434             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8435             base = 16;
8436             goto integer;
8437
8438         case 'D':
8439 #ifdef IV_IS_QUAD
8440             intsize = 'q';
8441 #else
8442             intsize = 'l';
8443 #endif
8444             /* FALL THROUGH */
8445         case 'd':
8446         case 'i':
8447 #if vdNUMBER
8448         format_vd:
8449 #endif
8450             if (vectorize) {
8451                 STRLEN ulen;
8452                 if (!veclen)
8453                     continue;
8454                 if (vec_utf8)
8455                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8456                                         UTF8_ALLOW_ANYUV);
8457                 else {
8458                     uv = *vecstr;
8459                     ulen = 1;
8460                 }
8461                 vecstr += ulen;
8462                 veclen -= ulen;
8463                 if (plus)
8464                      esignbuf[esignlen++] = plus;
8465             }
8466             else if (args) {
8467                 switch (intsize) {
8468                 case 'h':       iv = (short)va_arg(*args, int); break;
8469                 case 'l':       iv = va_arg(*args, long); break;
8470                 case 'V':       iv = va_arg(*args, IV); break;
8471                 default:        iv = va_arg(*args, int); break;
8472 #ifdef HAS_QUAD
8473                 case 'q':       iv = va_arg(*args, Quad_t); break;
8474 #endif
8475                 }
8476             }
8477             else {
8478                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8479                 switch (intsize) {
8480                 case 'h':       iv = (short)tiv; break;
8481                 case 'l':       iv = (long)tiv; break;
8482                 case 'V':
8483                 default:        iv = tiv; break;
8484 #ifdef HAS_QUAD
8485                 case 'q':       iv = (Quad_t)tiv; break;
8486 #endif
8487                 }
8488             }
8489             if ( !vectorize )   /* we already set uv above */
8490             {
8491                 if (iv >= 0) {
8492                     uv = iv;
8493                     if (plus)
8494                         esignbuf[esignlen++] = plus;
8495                 }
8496                 else {
8497                     uv = -iv;
8498                     esignbuf[esignlen++] = '-';
8499                 }
8500             }
8501             base = 10;
8502             goto integer;
8503
8504         case 'U':
8505 #ifdef IV_IS_QUAD
8506             intsize = 'q';
8507 #else
8508             intsize = 'l';
8509 #endif
8510             /* FALL THROUGH */
8511         case 'u':
8512             base = 10;
8513             goto uns_integer;
8514
8515         case 'b':
8516             base = 2;
8517             goto uns_integer;
8518
8519         case 'O':
8520 #ifdef IV_IS_QUAD
8521             intsize = 'q';
8522 #else
8523             intsize = 'l';
8524 #endif
8525             /* FALL THROUGH */
8526         case 'o':
8527             base = 8;
8528             goto uns_integer;
8529
8530         case 'X':
8531         case 'x':
8532             base = 16;
8533
8534         uns_integer:
8535             if (vectorize) {
8536                 STRLEN ulen;
8537         vector:
8538                 if (!veclen)
8539                     continue;
8540                 if (vec_utf8)
8541                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8542                                         UTF8_ALLOW_ANYUV);
8543                 else {
8544                     uv = *vecstr;
8545                     ulen = 1;
8546                 }
8547                 vecstr += ulen;
8548                 veclen -= ulen;
8549             }
8550             else if (args) {
8551                 switch (intsize) {
8552                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8553                 case 'l':  uv = va_arg(*args, unsigned long); break;
8554                 case 'V':  uv = va_arg(*args, UV); break;
8555                 default:   uv = va_arg(*args, unsigned); break;
8556 #ifdef HAS_QUAD
8557                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8558 #endif
8559                 }
8560             }
8561             else {
8562                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8563                 switch (intsize) {
8564                 case 'h':       uv = (unsigned short)tuv; break;
8565                 case 'l':       uv = (unsigned long)tuv; break;
8566                 case 'V':
8567                 default:        uv = tuv; break;
8568 #ifdef HAS_QUAD
8569                 case 'q':       uv = (Uquad_t)tuv; break;
8570 #endif
8571                 }
8572             }
8573
8574         integer:
8575             {
8576                 char *ptr = ebuf + sizeof ebuf;
8577                 switch (base) {
8578                     unsigned dig;
8579                 case 16:
8580                     if (!uv)
8581                         alt = FALSE;
8582                     p = (char*)((c == 'X')
8583                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8584                     do {
8585                         dig = uv & 15;
8586                         *--ptr = p[dig];
8587                     } while (uv >>= 4);
8588                     if (alt) {
8589                         esignbuf[esignlen++] = '0';
8590                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8591                     }
8592                     break;
8593                 case 8:
8594                     do {
8595                         dig = uv & 7;
8596                         *--ptr = '0' + dig;
8597                     } while (uv >>= 3);
8598                     if (alt && *ptr != '0')
8599                         *--ptr = '0';
8600                     break;
8601                 case 2:
8602                     if (!uv)
8603                         alt = FALSE;
8604                     do {
8605                         dig = uv & 1;
8606                         *--ptr = '0' + dig;
8607                     } while (uv >>= 1);
8608                     if (alt) {
8609                         esignbuf[esignlen++] = '0';
8610                         esignbuf[esignlen++] = 'b';
8611                     }
8612                     break;
8613                 default:                /* it had better be ten or less */
8614                     do {
8615                         dig = uv % base;
8616                         *--ptr = '0' + dig;
8617                     } while (uv /= base);
8618                     break;
8619                 }
8620                 elen = (ebuf + sizeof ebuf) - ptr;
8621                 eptr = ptr;
8622                 if (has_precis) {
8623                     if (precis > elen)
8624                         zeros = precis - elen;
8625                     else if (precis == 0 && elen == 1 && *eptr == '0')
8626                         elen = 0;
8627                 }
8628             }
8629             break;
8630
8631             /* FLOATING POINT */
8632
8633         case 'F':
8634             c = 'f';            /* maybe %F isn't supported here */
8635             /* FALL THROUGH */
8636         case 'e': case 'E':
8637         case 'f':
8638         case 'g': case 'G':
8639
8640             /* This is evil, but floating point is even more evil */
8641
8642             /* for SV-style calling, we can only get NV
8643                for C-style calling, we assume %f is double;
8644                for simplicity we allow any of %Lf, %llf, %qf for long double
8645             */
8646             switch (intsize) {
8647             case 'V':
8648 #if defined(USE_LONG_DOUBLE)
8649                 intsize = 'q';
8650 #endif
8651                 break;
8652 /* [perl #20339] - we should accept and ignore %lf rather than die */
8653             case 'l':
8654                 /* FALL THROUGH */
8655             default:
8656 #if defined(USE_LONG_DOUBLE)
8657                 intsize = args ? 0 : 'q';
8658 #endif
8659                 break;
8660             case 'q':
8661 #if defined(HAS_LONG_DOUBLE)
8662                 break;
8663 #else
8664                 /* FALL THROUGH */
8665 #endif
8666             case 'h':
8667                 goto unknown;
8668             }
8669
8670             /* now we need (long double) if intsize == 'q', else (double) */
8671             nv = (args && !vectorize) ?
8672 #if LONG_DOUBLESIZE > DOUBLESIZE
8673                 intsize == 'q' ?
8674                     va_arg(*args, long double) :
8675                     va_arg(*args, double)
8676 #else
8677                     va_arg(*args, double)
8678 #endif
8679                 : SvNVx(argsv);
8680
8681             need = 0;
8682             vectorize = FALSE;
8683             if (c != 'e' && c != 'E') {
8684                 i = PERL_INT_MIN;
8685                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8686                    will cast our (long double) to (double) */
8687                 (void)Perl_frexp(nv, &i);
8688                 if (i == PERL_INT_MIN)
8689                     Perl_die(aTHX_ "panic: frexp");
8690                 if (i > 0)
8691                     need = BIT_DIGITS(i);
8692             }
8693             need += has_precis ? precis : 6; /* known default */
8694
8695             if (need < width)
8696                 need = width;
8697
8698 #ifdef HAS_LDBL_SPRINTF_BUG
8699             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8700                with sfio - Allen <allens@cpan.org> */
8701
8702 #  ifdef DBL_MAX
8703 #    define MY_DBL_MAX DBL_MAX
8704 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8705 #    if DOUBLESIZE >= 8
8706 #      define MY_DBL_MAX 1.7976931348623157E+308L
8707 #    else
8708 #      define MY_DBL_MAX 3.40282347E+38L
8709 #    endif
8710 #  endif
8711
8712 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8713 #    define MY_DBL_MAX_BUG 1L
8714 #  else
8715 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8716 #  endif
8717
8718 #  ifdef DBL_MIN
8719 #    define MY_DBL_MIN DBL_MIN
8720 #  else  /* XXX guessing! -Allen */
8721 #    if DOUBLESIZE >= 8
8722 #      define MY_DBL_MIN 2.2250738585072014E-308L
8723 #    else
8724 #      define MY_DBL_MIN 1.17549435E-38L
8725 #    endif
8726 #  endif
8727
8728             if ((intsize == 'q') && (c == 'f') &&
8729                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8730                 (need < DBL_DIG)) {
8731                 /* it's going to be short enough that
8732                  * long double precision is not needed */
8733
8734                 if ((nv <= 0L) && (nv >= -0L))
8735                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8736                 else {
8737                     /* would use Perl_fp_class as a double-check but not
8738                      * functional on IRIX - see perl.h comments */
8739
8740                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8741                         /* It's within the range that a double can represent */
8742 #if defined(DBL_MAX) && !defined(DBL_MIN)
8743                         if ((nv >= ((long double)1/DBL_MAX)) ||
8744                             (nv <= (-(long double)1/DBL_MAX)))
8745 #endif
8746                         fix_ldbl_sprintf_bug = TRUE;
8747                     }
8748                 }
8749                 if (fix_ldbl_sprintf_bug == TRUE) {
8750                     double temp;
8751
8752                     intsize = 0;
8753                     temp = (double)nv;
8754                     nv = (NV)temp;
8755                 }
8756             }
8757
8758 #  undef MY_DBL_MAX
8759 #  undef MY_DBL_MAX_BUG
8760 #  undef MY_DBL_MIN
8761
8762 #endif /* HAS_LDBL_SPRINTF_BUG */
8763
8764             need += 20; /* fudge factor */
8765             if (PL_efloatsize < need) {
8766                 Safefree(PL_efloatbuf);
8767                 PL_efloatsize = need + 20; /* more fudge */
8768                 Newx(PL_efloatbuf, PL_efloatsize, char);
8769                 PL_efloatbuf[0] = '\0';
8770             }
8771
8772             if ( !(width || left || plus || alt) && fill != '0'
8773                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8774                 /* See earlier comment about buggy Gconvert when digits,
8775                    aka precis is 0  */
8776                 if ( c == 'g' && precis) {
8777                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8778                     /* May return an empty string for digits==0 */
8779                     if (*PL_efloatbuf) {
8780                         elen = strlen(PL_efloatbuf);
8781                         goto float_converted;
8782                     }
8783                 } else if ( c == 'f' && !precis) {
8784                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8785                         break;
8786                 }
8787             }
8788             {
8789                 char *ptr = ebuf + sizeof ebuf;
8790                 *--ptr = '\0';
8791                 *--ptr = c;
8792                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8793 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8794                 if (intsize == 'q') {
8795                     /* Copy the one or more characters in a long double
8796                      * format before the 'base' ([efgEFG]) character to
8797                      * the format string. */
8798                     static char const prifldbl[] = PERL_PRIfldbl;
8799                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8800                     while (p >= prifldbl) { *--ptr = *p--; }
8801                 }
8802 #endif
8803                 if (has_precis) {
8804                     base = precis;
8805                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8806                     *--ptr = '.';
8807                 }
8808                 if (width) {
8809                     base = width;
8810                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8811                 }
8812                 if (fill == '0')
8813                     *--ptr = fill;
8814                 if (left)
8815                     *--ptr = '-';
8816                 if (plus)
8817                     *--ptr = plus;
8818                 if (alt)
8819                     *--ptr = '#';
8820                 *--ptr = '%';
8821
8822                 /* No taint.  Otherwise we are in the strange situation
8823                  * where printf() taints but print($float) doesn't.
8824                  * --jhi */
8825 #if defined(HAS_LONG_DOUBLE)
8826                 elen = ((intsize == 'q')
8827                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8828                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8829 #else
8830                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8831 #endif
8832             }
8833         float_converted:
8834             eptr = PL_efloatbuf;
8835             break;
8836
8837             /* SPECIAL */
8838
8839         case 'n':
8840             i = SvCUR(sv) - origlen;
8841             if (args && !vectorize) {
8842                 switch (intsize) {
8843                 case 'h':       *(va_arg(*args, short*)) = i; break;
8844                 default:        *(va_arg(*args, int*)) = i; break;
8845                 case 'l':       *(va_arg(*args, long*)) = i; break;
8846                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8847 #ifdef HAS_QUAD
8848                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8849 #endif
8850                 }
8851             }
8852             else
8853                 sv_setuv_mg(argsv, (UV)i);
8854             vectorize = FALSE;
8855             continue;   /* not "break" */
8856
8857             /* UNKNOWN */
8858
8859         default:
8860       unknown:
8861             if (!args
8862                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8863                 && ckWARN(WARN_PRINTF))
8864             {
8865                 SV * const msg = sv_newmortal();
8866                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8867                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8868                 if (c) {
8869                     if (isPRINT(c))
8870                         Perl_sv_catpvf(aTHX_ msg,
8871                                        "\"%%%c\"", c & 0xFF);
8872                     else
8873                         Perl_sv_catpvf(aTHX_ msg,
8874                                        "\"%%\\%03"UVof"\"",
8875                                        (UV)c & 0xFF);
8876                 } else
8877                     sv_catpv(msg, "end of string");
8878                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8879             }
8880
8881             /* output mangled stuff ... */
8882             if (c == '\0')
8883                 --q;
8884             eptr = p;
8885             elen = q - p;
8886
8887             /* ... right here, because formatting flags should not apply */
8888             SvGROW(sv, SvCUR(sv) + elen + 1);
8889             p = SvEND(sv);
8890             Copy(eptr, p, elen, char);
8891             p += elen;
8892             *p = '\0';
8893             SvCUR_set(sv, p - SvPVX_const(sv));
8894             svix = osvix;
8895             continue;   /* not "break" */
8896         }
8897
8898         /* calculate width before utf8_upgrade changes it */
8899         have = esignlen + zeros + elen;
8900         if (have < zeros)
8901             Perl_croak_nocontext(PL_memory_wrap);
8902
8903         if (is_utf8 != has_utf8) {
8904              if (is_utf8) {
8905                   if (SvCUR(sv))
8906                        sv_utf8_upgrade(sv);
8907              }
8908              else {
8909                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8910                   sv_utf8_upgrade(nsv);
8911                   eptr = SvPVX_const(nsv);
8912                   elen = SvCUR(nsv);
8913              }
8914              SvGROW(sv, SvCUR(sv) + elen + 1);
8915              p = SvEND(sv);
8916              *p = '\0';
8917         }
8918
8919         need = (have > width ? have : width);
8920         gap = need - have;
8921
8922         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8923             Perl_croak_nocontext(PL_memory_wrap);
8924         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8925         p = SvEND(sv);
8926         if (esignlen && fill == '0') {
8927             int i;
8928             for (i = 0; i < (int)esignlen; i++)
8929                 *p++ = esignbuf[i];
8930         }
8931         if (gap && !left) {
8932             memset(p, fill, gap);
8933             p += gap;
8934         }
8935         if (esignlen && fill != '0') {
8936             int i;
8937             for (i = 0; i < (int)esignlen; i++)
8938                 *p++ = esignbuf[i];
8939         }
8940         if (zeros) {
8941             int i;
8942             for (i = zeros; i; i--)
8943                 *p++ = '0';
8944         }
8945         if (elen) {
8946             Copy(eptr, p, elen, char);
8947             p += elen;
8948         }
8949         if (gap && left) {
8950             memset(p, ' ', gap);
8951             p += gap;
8952         }
8953         if (vectorize) {
8954             if (veclen) {
8955                 Copy(dotstr, p, dotstrlen, char);
8956                 p += dotstrlen;
8957             }
8958             else
8959                 vectorize = FALSE;              /* done iterating over vecstr */
8960         }
8961         if (is_utf8)
8962             has_utf8 = TRUE;
8963         if (has_utf8)
8964             SvUTF8_on(sv);
8965         *p = '\0';
8966         SvCUR_set(sv, p - SvPVX_const(sv));
8967         if (vectorize) {
8968             esignlen = 0;
8969             goto vector;
8970         }
8971     }
8972 }
8973
8974 /* =========================================================================
8975
8976 =head1 Cloning an interpreter
8977
8978 All the macros and functions in this section are for the private use of
8979 the main function, perl_clone().
8980
8981 The foo_dup() functions make an exact copy of an existing foo thinngy.
8982 During the course of a cloning, a hash table is used to map old addresses
8983 to new addresses. The table is created and manipulated with the
8984 ptr_table_* functions.
8985
8986 =cut
8987
8988 ============================================================================*/
8989
8990
8991 #if defined(USE_ITHREADS)
8992
8993 #ifndef GpREFCNT_inc
8994 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8995 #endif
8996
8997
8998 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8999 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
9000 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
9001 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
9002 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
9003 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
9004 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
9005 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
9006 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
9007 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
9008 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
9009 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
9010 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
9011
9012
9013 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
9014    regcomp.c. AMS 20010712 */
9015
9016 REGEXP *
9017 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
9018 {
9019     dVAR;
9020     REGEXP *ret;
9021     int i, len, npar;
9022     struct reg_substr_datum *s;
9023
9024     if (!r)
9025         return (REGEXP *)NULL;
9026
9027     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
9028         return ret;
9029
9030     len = r->offsets[0];
9031     npar = r->nparens+1;
9032
9033     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
9034     Copy(r->program, ret->program, len+1, regnode);
9035
9036     Newx(ret->startp, npar, I32);
9037     Copy(r->startp, ret->startp, npar, I32);
9038     Newx(ret->endp, npar, I32);
9039     Copy(r->startp, ret->startp, npar, I32);
9040
9041     Newx(ret->substrs, 1, struct reg_substr_data);
9042     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
9043         s->min_offset = r->substrs->data[i].min_offset;
9044         s->max_offset = r->substrs->data[i].max_offset;
9045         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
9046         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
9047     }
9048
9049     ret->regstclass = NULL;
9050     if (r->data) {
9051         struct reg_data *d;
9052         const int count = r->data->count;
9053         int i;
9054
9055         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
9056                 char, struct reg_data);
9057         Newx(d->what, count, U8);
9058
9059         d->count = count;
9060         for (i = 0; i < count; i++) {
9061             d->what[i] = r->data->what[i];
9062             switch (d->what[i]) {
9063                 /* legal options are one of: sfpont
9064                    see also regcomp.h and pregfree() */
9065             case 's':
9066                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
9067                 break;
9068             case 'p':
9069                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
9070                 break;
9071             case 'f':
9072                 /* This is cheating. */
9073                 Newx(d->data[i], 1, struct regnode_charclass_class);
9074                 StructCopy(r->data->data[i], d->data[i],
9075                             struct regnode_charclass_class);
9076                 ret->regstclass = (regnode*)d->data[i];
9077                 break;
9078             case 'o':
9079                 /* Compiled op trees are readonly, and can thus be
9080                    shared without duplication. */
9081                 OP_REFCNT_LOCK;
9082                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
9083                 OP_REFCNT_UNLOCK;
9084                 break;
9085             case 'n':
9086                 d->data[i] = r->data->data[i];
9087                 break;
9088             case 't':
9089                 d->data[i] = r->data->data[i];
9090                 OP_REFCNT_LOCK;
9091                 ((reg_trie_data*)d->data[i])->refcount++;
9092                 OP_REFCNT_UNLOCK;
9093                 break;
9094             default:
9095                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
9096             }
9097         }
9098
9099         ret->data = d;
9100     }
9101     else
9102         ret->data = NULL;
9103
9104     Newx(ret->offsets, 2*len+1, U32);
9105     Copy(r->offsets, ret->offsets, 2*len+1, U32);
9106
9107     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
9108     ret->refcnt         = r->refcnt;
9109     ret->minlen         = r->minlen;
9110     ret->prelen         = r->prelen;
9111     ret->nparens        = r->nparens;
9112     ret->lastparen      = r->lastparen;
9113     ret->lastcloseparen = r->lastcloseparen;
9114     ret->reganch        = r->reganch;
9115
9116     ret->sublen         = r->sublen;
9117
9118     if (RX_MATCH_COPIED(ret))
9119         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
9120     else
9121         ret->subbeg = Nullch;
9122 #ifdef PERL_OLD_COPY_ON_WRITE
9123     ret->saved_copy = Nullsv;
9124 #endif
9125
9126     ptr_table_store(PL_ptr_table, r, ret);
9127     return ret;
9128 }
9129
9130 /* duplicate a file handle */
9131
9132 PerlIO *
9133 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
9134 {
9135     PerlIO *ret;
9136
9137     PERL_UNUSED_ARG(type);
9138
9139     if (!fp)
9140         return (PerlIO*)NULL;
9141
9142     /* look for it in the table first */
9143     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
9144     if (ret)
9145         return ret;
9146
9147     /* create anew and remember what it is */
9148     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
9149     ptr_table_store(PL_ptr_table, fp, ret);
9150     return ret;
9151 }
9152
9153 /* duplicate a directory handle */
9154
9155 DIR *
9156 Perl_dirp_dup(pTHX_ DIR *dp)
9157 {
9158     if (!dp)
9159         return (DIR*)NULL;
9160     /* XXX TODO */
9161     return dp;
9162 }
9163
9164 /* duplicate a typeglob */
9165
9166 GP *
9167 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
9168 {
9169     GP *ret;
9170     if (!gp)
9171         return (GP*)NULL;
9172     /* look for it in the table first */
9173     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
9174     if (ret)
9175         return ret;
9176
9177     /* create anew and remember what it is */
9178     Newxz(ret, 1, GP);
9179     ptr_table_store(PL_ptr_table, gp, ret);
9180
9181     /* clone */
9182     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
9183     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
9184     ret->gp_io          = io_dup_inc(gp->gp_io, param);
9185     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
9186     ret->gp_av          = av_dup_inc(gp->gp_av, param);
9187     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
9188     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
9189     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
9190     ret->gp_cvgen       = gp->gp_cvgen;
9191     ret->gp_line        = gp->gp_line;
9192     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
9193     return ret;
9194 }
9195
9196 /* duplicate a chain of magic */
9197
9198 MAGIC *
9199 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
9200 {
9201     MAGIC *mgprev = (MAGIC*)NULL;
9202     MAGIC *mgret;
9203     if (!mg)
9204         return (MAGIC*)NULL;
9205     /* look for it in the table first */
9206     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
9207     if (mgret)
9208         return mgret;
9209
9210     for (; mg; mg = mg->mg_moremagic) {
9211         MAGIC *nmg;
9212         Newxz(nmg, 1, MAGIC);
9213         if (mgprev)
9214             mgprev->mg_moremagic = nmg;
9215         else
9216             mgret = nmg;
9217         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
9218         nmg->mg_private = mg->mg_private;
9219         nmg->mg_type    = mg->mg_type;
9220         nmg->mg_flags   = mg->mg_flags;
9221         if (mg->mg_type == PERL_MAGIC_qr) {
9222             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
9223         }
9224         else if(mg->mg_type == PERL_MAGIC_backref) {
9225             const AV * const av = (AV*) mg->mg_obj;
9226             SV **svp;
9227             I32 i;
9228             (void)SvREFCNT_inc(nmg->mg_obj = (SV*)newAV());
9229             svp = AvARRAY(av);
9230             for (i = AvFILLp(av); i >= 0; i--) {
9231                 if (!svp[i]) continue;
9232                 av_push((AV*)nmg->mg_obj,sv_dup(svp[i],param));
9233             }
9234         }
9235         else if (mg->mg_type == PERL_MAGIC_symtab) {
9236             nmg->mg_obj = mg->mg_obj;
9237         }
9238         else {
9239             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9240                               ? sv_dup_inc(mg->mg_obj, param)
9241                               : sv_dup(mg->mg_obj, param);
9242         }
9243         nmg->mg_len     = mg->mg_len;
9244         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9245         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9246             if (mg->mg_len > 0) {
9247                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9248                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9249                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9250                 {
9251                     AMT * const amtp = (AMT*)mg->mg_ptr;
9252                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9253                     I32 i;
9254                     for (i = 1; i < NofAMmeth; i++) {
9255                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9256                     }
9257                 }
9258             }
9259             else if (mg->mg_len == HEf_SVKEY)
9260                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9261         }
9262         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9263             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9264         }
9265         mgprev = nmg;
9266     }
9267     return mgret;
9268 }
9269
9270 /* create a new pointer-mapping table */
9271
9272 PTR_TBL_t *
9273 Perl_ptr_table_new(pTHX)
9274 {
9275     PTR_TBL_t *tbl;
9276     Newxz(tbl, 1, PTR_TBL_t);
9277     tbl->tbl_max        = 511;
9278     tbl->tbl_items      = 0;
9279     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9280     return tbl;
9281 }
9282
9283 #if (PTRSIZE == 8)
9284 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 3)
9285 #else
9286 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 2)
9287 #endif
9288
9289 /* 
9290    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9291    following define) and at call to new_body_inline made below in 
9292    Perl_ptr_table_store()
9293  */
9294
9295 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9296
9297 /* map an existing pointer using a table */
9298
9299 void *
9300 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9301 {
9302     PTR_TBL_ENT_t *tblent;
9303     const UV hash = PTR_TABLE_HASH(sv);
9304     assert(tbl);
9305     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9306     for (; tblent; tblent = tblent->next) {
9307         if (tblent->oldval == sv)
9308             return tblent->newval;
9309     }
9310     return (void*)NULL;
9311 }
9312
9313 /* add a new entry to a pointer-mapping table */
9314
9315 void
9316 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9317 {
9318     PTR_TBL_ENT_t *tblent, **otblent;
9319     /* XXX this may be pessimal on platforms where pointers aren't good
9320      * hash values e.g. if they grow faster in the most significant
9321      * bits */
9322     const UV hash = PTR_TABLE_HASH(oldsv);
9323     bool empty = 1;
9324
9325     assert(tbl);
9326     otblent = &tbl->tbl_ary[hash & tbl->tbl_max];
9327     for (tblent = *otblent; tblent; empty=0, tblent = tblent->next) {
9328         if (tblent->oldval == oldsv) {
9329             tblent->newval = newsv;
9330             return;
9331         }
9332     }
9333     new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9334     tblent->oldval = oldsv;
9335     tblent->newval = newsv;
9336     tblent->next = *otblent;
9337     *otblent = tblent;
9338     tbl->tbl_items++;
9339     if (!empty && tbl->tbl_items > tbl->tbl_max)
9340         ptr_table_split(tbl);
9341 }
9342
9343 /* double the hash bucket size of an existing ptr table */
9344
9345 void
9346 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9347 {
9348     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9349     const UV oldsize = tbl->tbl_max + 1;
9350     UV newsize = oldsize * 2;
9351     UV i;
9352
9353     Renew(ary, newsize, PTR_TBL_ENT_t*);
9354     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9355     tbl->tbl_max = --newsize;
9356     tbl->tbl_ary = ary;
9357     for (i=0; i < oldsize; i++, ary++) {
9358         PTR_TBL_ENT_t **curentp, **entp, *ent;
9359         if (!*ary)
9360             continue;
9361         curentp = ary + oldsize;
9362         for (entp = ary, ent = *ary; ent; ent = *entp) {
9363             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9364                 *entp = ent->next;
9365                 ent->next = *curentp;
9366                 *curentp = ent;
9367                 continue;
9368             }
9369             else
9370                 entp = &ent->next;
9371         }
9372     }
9373 }
9374
9375 /* remove all the entries from a ptr table */
9376
9377 void
9378 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9379 {
9380     register PTR_TBL_ENT_t **array;
9381     register PTR_TBL_ENT_t *entry;
9382     UV riter = 0;
9383     UV max;
9384
9385     if (!tbl || !tbl->tbl_items) {
9386         return;
9387     }
9388
9389     array = tbl->tbl_ary;
9390     entry = array[0];
9391     max = tbl->tbl_max;
9392
9393     for (;;) {
9394         if (entry) {
9395             PTR_TBL_ENT_t *oentry = entry;
9396             entry = entry->next;
9397             del_pte(oentry);
9398         }
9399         if (!entry) {
9400             if (++riter > max) {
9401                 break;
9402             }
9403             entry = array[riter];
9404         }
9405     }
9406
9407     tbl->tbl_items = 0;
9408 }
9409
9410 /* clear and free a ptr table */
9411
9412 void
9413 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9414 {
9415     if (!tbl) {
9416         return;
9417     }
9418     ptr_table_clear(tbl);
9419     Safefree(tbl->tbl_ary);
9420     Safefree(tbl);
9421 }
9422
9423
9424 void
9425 Perl_rvpv_dup(pTHX_ SV *dstr, SV *sstr, CLONE_PARAMS* param)
9426 {
9427     if (SvROK(sstr)) {
9428         SvRV_set(dstr, SvWEAKREF(sstr)
9429                        ? sv_dup(SvRV(sstr), param)
9430                        : sv_dup_inc(SvRV(sstr), param));
9431
9432     }
9433     else if (SvPVX_const(sstr)) {
9434         /* Has something there */
9435         if (SvLEN(sstr)) {
9436             /* Normal PV - clone whole allocated space */
9437             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9438             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9439                 /* Not that normal - actually sstr is copy on write.
9440                    But we are a true, independant SV, so:  */
9441                 SvREADONLY_off(dstr);
9442                 SvFAKE_off(dstr);
9443             }
9444         }
9445         else {
9446             /* Special case - not normally malloced for some reason */
9447             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9448                 /* A "shared" PV - clone it as "shared" PV */
9449                 SvPV_set(dstr,
9450                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9451                                          param)));
9452             }
9453             else {
9454                 /* Some other special case - random pointer */
9455                 SvPV_set(dstr, SvPVX(sstr));            
9456             }
9457         }
9458     }
9459     else {
9460         /* Copy the Null */
9461         if (SvTYPE(dstr) == SVt_RV)
9462             SvRV_set(dstr, NULL);
9463         else
9464             SvPV_set(dstr, 0);
9465     }
9466 }
9467
9468 /* duplicate an SV of any type (including AV, HV etc) */
9469
9470 SV *
9471 Perl_sv_dup(pTHX_ SV *sstr, CLONE_PARAMS* param)
9472 {
9473     dVAR;
9474     SV *dstr;
9475
9476     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9477         return Nullsv;
9478     /* look for it in the table first */
9479     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9480     if (dstr)
9481         return dstr;
9482
9483     if(param->flags & CLONEf_JOIN_IN) {
9484         /** We are joining here so we don't want do clone
9485             something that is bad **/
9486         const char *hvname;
9487
9488         if(SvTYPE(sstr) == SVt_PVHV &&
9489            (hvname = HvNAME_get(sstr))) {
9490             /** don't clone stashes if they already exist **/
9491             return (SV*)gv_stashpv(hvname,0);
9492         }
9493     }
9494
9495     /* create anew and remember what it is */
9496     new_SV(dstr);
9497
9498 #ifdef DEBUG_LEAKING_SCALARS
9499     dstr->sv_debug_optype = sstr->sv_debug_optype;
9500     dstr->sv_debug_line = sstr->sv_debug_line;
9501     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9502     dstr->sv_debug_cloned = 1;
9503 #  ifdef NETWARE
9504     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9505 #  else
9506     dstr->sv_debug_file = savesharedpv(sstr->sv_debug_file);
9507 #  endif
9508 #endif
9509
9510     ptr_table_store(PL_ptr_table, sstr, dstr);
9511
9512     /* clone */
9513     SvFLAGS(dstr)       = SvFLAGS(sstr);
9514     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9515     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9516
9517 #ifdef DEBUGGING
9518     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9519         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9520                       PL_watch_pvx, SvPVX_const(sstr));
9521 #endif
9522
9523     /* don't clone objects whose class has asked us not to */
9524     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9525         SvFLAGS(dstr) &= ~SVTYPEMASK;
9526         SvOBJECT_off(dstr);
9527         return dstr;
9528     }
9529
9530     switch (SvTYPE(sstr)) {
9531     case SVt_NULL:
9532         SvANY(dstr)     = NULL;
9533         break;
9534     case SVt_IV:
9535         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9536         SvIV_set(dstr, SvIVX(sstr));
9537         break;
9538     case SVt_NV:
9539         SvANY(dstr)     = new_XNV();
9540         SvNV_set(dstr, SvNVX(sstr));
9541         break;
9542     case SVt_RV:
9543         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9544         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9545         break;
9546     default:
9547         {
9548             /* These are all the types that need complex bodies allocating.  */
9549             void *new_body;
9550             const svtype sv_type = SvTYPE(sstr);
9551             const struct body_details *const sv_type_details
9552                 = bodies_by_type + sv_type;
9553
9554             switch (sv_type) {
9555             default:
9556                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9557                            (IV)SvTYPE(sstr));
9558                 break;
9559
9560             case SVt_PVGV:
9561                 if (GvUNIQUE((GV*)sstr)) {
9562                     /* Do sharing here, and fall through */
9563                 }
9564             case SVt_PVIO:
9565             case SVt_PVFM:
9566             case SVt_PVHV:
9567             case SVt_PVAV:
9568             case SVt_PVBM:
9569             case SVt_PVCV:
9570             case SVt_PVLV:
9571             case SVt_PVMG:
9572             case SVt_PVNV:
9573             case SVt_PVIV:
9574             case SVt_PV:
9575                 assert(sv_type_details->copy);
9576                 if (sv_type_details->arena) {
9577                     new_body_inline(new_body, sv_type_details->copy, sv_type);
9578                     new_body
9579                         = (void*)((char*)new_body - sv_type_details->offset);
9580                 } else {
9581                     new_body = new_NOARENA(sv_type_details);
9582                 }
9583             }
9584             assert(new_body);
9585             SvANY(dstr) = new_body;
9586
9587 #ifndef PURIFY
9588             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9589                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9590                  sv_type_details->copy, char);
9591 #else
9592             Copy(((char*)SvANY(sstr)),
9593                  ((char*)SvANY(dstr)),
9594                  sv_type_details->size + sv_type_details->offset, char);
9595 #endif
9596
9597             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9598                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9599
9600             /* The Copy above means that all the source (unduplicated) pointers
9601                are now in the destination.  We can check the flags and the
9602                pointers in either, but it's possible that there's less cache
9603                missing by always going for the destination.
9604                FIXME - instrument and check that assumption  */
9605             if (sv_type >= SVt_PVMG) {
9606                 if (SvMAGIC(dstr))
9607                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9608                 if (SvSTASH(dstr))
9609                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9610             }
9611
9612             /* The cast silences a GCC warning about unhandled types.  */
9613             switch ((int)sv_type) {
9614             case SVt_PV:
9615                 break;
9616             case SVt_PVIV:
9617                 break;
9618             case SVt_PVNV:
9619                 break;
9620             case SVt_PVMG:
9621                 break;
9622             case SVt_PVBM:
9623                 break;
9624             case SVt_PVLV:
9625                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9626                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9627                     LvTARG(dstr) = dstr;
9628                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9629                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9630                 else
9631                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9632                 break;
9633             case SVt_PVGV:
9634                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9635                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9636                 /* Don't call sv_add_backref here as it's going to be created
9637                    as part of the magic cloning of the symbol table.  */
9638                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9639                 (void)GpREFCNT_inc(GvGP(dstr));
9640                 break;
9641             case SVt_PVIO:
9642                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9643                 if (IoOFP(dstr) == IoIFP(sstr))
9644                     IoOFP(dstr) = IoIFP(dstr);
9645                 else
9646                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9647                 /* PL_rsfp_filters entries have fake IoDIRP() */
9648                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9649                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9650                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9651                     /* I have no idea why fake dirp (rsfps)
9652                        should be treated differently but otherwise
9653                        we end up with leaks -- sky*/
9654                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9655                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9656                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9657                 } else {
9658                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9659                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9660                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9661                 }
9662                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9663                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9664                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9665                 break;
9666             case SVt_PVAV:
9667                 if (AvARRAY((AV*)sstr)) {
9668                     SV **dst_ary, **src_ary;
9669                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9670
9671                     src_ary = AvARRAY((AV*)sstr);
9672                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9673                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9674                     SvPV_set(dstr, (char*)dst_ary);
9675                     AvALLOC((AV*)dstr) = dst_ary;
9676                     if (AvREAL((AV*)sstr)) {
9677                         while (items-- > 0)
9678                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9679                     }
9680                     else {
9681                         while (items-- > 0)
9682                             *dst_ary++ = sv_dup(*src_ary++, param);
9683                     }
9684                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9685                     while (items-- > 0) {
9686                         *dst_ary++ = &PL_sv_undef;
9687                     }
9688                 }
9689                 else {
9690                     SvPV_set(dstr, Nullch);
9691                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9692                 }
9693                 break;
9694             case SVt_PVHV:
9695                 {
9696                     HEK *hvname = 0;
9697
9698                     if (HvARRAY((HV*)sstr)) {
9699                         STRLEN i = 0;
9700                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9701                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9702                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9703                         char *darray;
9704                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9705                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9706                             char);
9707                         HvARRAY(dstr) = (HE**)darray;
9708                         while (i <= sxhv->xhv_max) {
9709                             const HE *source = HvARRAY(sstr)[i];
9710                             HvARRAY(dstr)[i] = source
9711                                 ? he_dup(source, sharekeys, param) : 0;
9712                             ++i;
9713                         }
9714                         if (SvOOK(sstr)) {
9715                             struct xpvhv_aux *saux = HvAUX(sstr);
9716                             struct xpvhv_aux *daux = HvAUX(dstr);
9717                             /* This flag isn't copied.  */
9718                             /* SvOOK_on(hv) attacks the IV flags.  */
9719                             SvFLAGS(dstr) |= SVf_OOK;
9720
9721                             hvname = saux->xhv_name;
9722                             daux->xhv_name
9723                                 = hvname ? hek_dup(hvname, param) : hvname;
9724
9725                             daux->xhv_riter = saux->xhv_riter;
9726                             daux->xhv_eiter = saux->xhv_eiter
9727                                 ? he_dup(saux->xhv_eiter,
9728                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9729                         }
9730                     }
9731                     else {
9732                         SvPV_set(dstr, Nullch);
9733                     }
9734                     /* Record stashes for possible cloning in Perl_clone(). */
9735                     if(hvname)
9736                         av_push(param->stashes, dstr);
9737                 }
9738                 break;
9739             case SVt_PVFM:
9740             case SVt_PVCV:
9741                 /* NOTE: not refcounted */
9742                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9743                 OP_REFCNT_LOCK;
9744                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9745                 OP_REFCNT_UNLOCK;
9746                 if (CvCONST(dstr)) {
9747                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9748                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9749                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9750                 }
9751                 /* don't dup if copying back - CvGV isn't refcounted, so the
9752                  * duped GV may never be freed. A bit of a hack! DAPM */
9753                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9754                     Nullgv : gv_dup(CvGV(dstr), param) ;
9755                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9756                     CvDEPTH(dstr) = 0;
9757                 }
9758                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9759                 CvOUTSIDE(dstr) =
9760                     CvWEAKOUTSIDE(sstr)
9761                     ? cv_dup(    CvOUTSIDE(dstr), param)
9762                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9763                 if (!CvXSUB(dstr))
9764                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9765                 break;
9766             }
9767         }
9768     }
9769
9770     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9771         ++PL_sv_objcount;
9772
9773     return dstr;
9774  }
9775
9776 /* duplicate a context */
9777
9778 PERL_CONTEXT *
9779 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9780 {
9781     PERL_CONTEXT *ncxs;
9782
9783     if (!cxs)
9784         return (PERL_CONTEXT*)NULL;
9785
9786     /* look for it in the table first */
9787     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9788     if (ncxs)
9789         return ncxs;
9790
9791     /* create anew and remember what it is */
9792     Newxz(ncxs, max + 1, PERL_CONTEXT);
9793     ptr_table_store(PL_ptr_table, cxs, ncxs);
9794
9795     while (ix >= 0) {
9796         PERL_CONTEXT *cx = &cxs[ix];
9797         PERL_CONTEXT *ncx = &ncxs[ix];
9798         ncx->cx_type    = cx->cx_type;
9799         if (CxTYPE(cx) == CXt_SUBST) {
9800             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9801         }
9802         else {
9803             ncx->blk_oldsp      = cx->blk_oldsp;
9804             ncx->blk_oldcop     = cx->blk_oldcop;
9805             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9806             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9807             ncx->blk_oldpm      = cx->blk_oldpm;
9808             ncx->blk_gimme      = cx->blk_gimme;
9809             switch (CxTYPE(cx)) {
9810             case CXt_SUB:
9811                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9812                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9813                                            : cv_dup(cx->blk_sub.cv,param));
9814                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9815                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9816                                            : Nullav);
9817                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9818                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9819                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9820                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9821                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9822                 break;
9823             case CXt_EVAL:
9824                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9825                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9826                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9827                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9828                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9829                 ncx->blk_eval.retop = cx->blk_eval.retop;
9830                 break;
9831             case CXt_LOOP:
9832                 ncx->blk_loop.label     = cx->blk_loop.label;
9833                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9834                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9835                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9836                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9837                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9838                                            ? cx->blk_loop.iterdata
9839                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9840                 ncx->blk_loop.oldcomppad
9841                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9842                                             cx->blk_loop.oldcomppad);
9843                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9844                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9845                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9846                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9847                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9848                 break;
9849             case CXt_FORMAT:
9850                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9851                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9852                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9853                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9854                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9855                 break;
9856             case CXt_BLOCK:
9857             case CXt_NULL:
9858                 break;
9859             }
9860         }
9861         --ix;
9862     }
9863     return ncxs;
9864 }
9865
9866 /* duplicate a stack info structure */
9867
9868 PERL_SI *
9869 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9870 {
9871     PERL_SI *nsi;
9872
9873     if (!si)
9874         return (PERL_SI*)NULL;
9875
9876     /* look for it in the table first */
9877     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9878     if (nsi)
9879         return nsi;
9880
9881     /* create anew and remember what it is */
9882     Newxz(nsi, 1, PERL_SI);
9883     ptr_table_store(PL_ptr_table, si, nsi);
9884
9885     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9886     nsi->si_cxix        = si->si_cxix;
9887     nsi->si_cxmax       = si->si_cxmax;
9888     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9889     nsi->si_type        = si->si_type;
9890     nsi->si_prev        = si_dup(si->si_prev, param);
9891     nsi->si_next        = si_dup(si->si_next, param);
9892     nsi->si_markoff     = si->si_markoff;
9893
9894     return nsi;
9895 }
9896
9897 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9898 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9899 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9900 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9901 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9902 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9903 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9904 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9905 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9906 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9907 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9908 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9909 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9910 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9911
9912 /* XXXXX todo */
9913 #define pv_dup_inc(p)   SAVEPV(p)
9914 #define pv_dup(p)       SAVEPV(p)
9915 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9916
9917 /* map any object to the new equivent - either something in the
9918  * ptr table, or something in the interpreter structure
9919  */
9920
9921 void *
9922 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9923 {
9924     void *ret;
9925
9926     if (!v)
9927         return (void*)NULL;
9928
9929     /* look for it in the table first */
9930     ret = ptr_table_fetch(PL_ptr_table, v);
9931     if (ret)
9932         return ret;
9933
9934     /* see if it is part of the interpreter structure */
9935     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9936         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9937     else {
9938         ret = v;
9939     }
9940
9941     return ret;
9942 }
9943
9944 /* duplicate the save stack */
9945
9946 ANY *
9947 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9948 {
9949     ANY * const ss      = proto_perl->Tsavestack;
9950     const I32 max       = proto_perl->Tsavestack_max;
9951     I32 ix              = proto_perl->Tsavestack_ix;
9952     ANY *nss;
9953     SV *sv;
9954     GV *gv;
9955     AV *av;
9956     HV *hv;
9957     void* ptr;
9958     int intval;
9959     long longval;
9960     GP *gp;
9961     IV iv;
9962     char *c = NULL;
9963     void (*dptr) (void*);
9964     void (*dxptr) (pTHX_ void*);
9965
9966     Newxz(nss, max, ANY);
9967
9968     while (ix > 0) {
9969         I32 i = POPINT(ss,ix);
9970         TOPINT(nss,ix) = i;
9971         switch (i) {
9972         case SAVEt_ITEM:                        /* normal string */
9973             sv = (SV*)POPPTR(ss,ix);
9974             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9975             sv = (SV*)POPPTR(ss,ix);
9976             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9977             break;
9978         case SAVEt_SV:                          /* scalar reference */
9979             sv = (SV*)POPPTR(ss,ix);
9980             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9981             gv = (GV*)POPPTR(ss,ix);
9982             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9983             break;
9984         case SAVEt_GENERIC_PVREF:               /* generic char* */
9985             c = (char*)POPPTR(ss,ix);
9986             TOPPTR(nss,ix) = pv_dup(c);
9987             ptr = POPPTR(ss,ix);
9988             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9989             break;
9990         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9991             c = (char*)POPPTR(ss,ix);
9992             TOPPTR(nss,ix) = savesharedpv(c);
9993             ptr = POPPTR(ss,ix);
9994             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9995             break;
9996         case SAVEt_GENERIC_SVREF:               /* generic sv */
9997         case SAVEt_SVREF:                       /* scalar reference */
9998             sv = (SV*)POPPTR(ss,ix);
9999             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10000             ptr = POPPTR(ss,ix);
10001             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
10002             break;
10003         case SAVEt_AV:                          /* array reference */
10004             av = (AV*)POPPTR(ss,ix);
10005             TOPPTR(nss,ix) = av_dup_inc(av, param);
10006             gv = (GV*)POPPTR(ss,ix);
10007             TOPPTR(nss,ix) = gv_dup(gv, param);
10008             break;
10009         case SAVEt_HV:                          /* hash reference */
10010             hv = (HV*)POPPTR(ss,ix);
10011             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10012             gv = (GV*)POPPTR(ss,ix);
10013             TOPPTR(nss,ix) = gv_dup(gv, param);
10014             break;
10015         case SAVEt_INT:                         /* int reference */
10016             ptr = POPPTR(ss,ix);
10017             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10018             intval = (int)POPINT(ss,ix);
10019             TOPINT(nss,ix) = intval;
10020             break;
10021         case SAVEt_LONG:                        /* long reference */
10022             ptr = POPPTR(ss,ix);
10023             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10024             longval = (long)POPLONG(ss,ix);
10025             TOPLONG(nss,ix) = longval;
10026             break;
10027         case SAVEt_I32:                         /* I32 reference */
10028         case SAVEt_I16:                         /* I16 reference */
10029         case SAVEt_I8:                          /* I8 reference */
10030             ptr = POPPTR(ss,ix);
10031             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10032             i = POPINT(ss,ix);
10033             TOPINT(nss,ix) = i;
10034             break;
10035         case SAVEt_IV:                          /* IV reference */
10036             ptr = POPPTR(ss,ix);
10037             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10038             iv = POPIV(ss,ix);
10039             TOPIV(nss,ix) = iv;
10040             break;
10041         case SAVEt_SPTR:                        /* SV* reference */
10042             ptr = POPPTR(ss,ix);
10043             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10044             sv = (SV*)POPPTR(ss,ix);
10045             TOPPTR(nss,ix) = sv_dup(sv, param);
10046             break;
10047         case SAVEt_VPTR:                        /* random* reference */
10048             ptr = POPPTR(ss,ix);
10049             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10050             ptr = POPPTR(ss,ix);
10051             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10052             break;
10053         case SAVEt_PPTR:                        /* char* reference */
10054             ptr = POPPTR(ss,ix);
10055             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10056             c = (char*)POPPTR(ss,ix);
10057             TOPPTR(nss,ix) = pv_dup(c);
10058             break;
10059         case SAVEt_HPTR:                        /* HV* reference */
10060             ptr = POPPTR(ss,ix);
10061             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10062             hv = (HV*)POPPTR(ss,ix);
10063             TOPPTR(nss,ix) = hv_dup(hv, param);
10064             break;
10065         case SAVEt_APTR:                        /* AV* reference */
10066             ptr = POPPTR(ss,ix);
10067             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10068             av = (AV*)POPPTR(ss,ix);
10069             TOPPTR(nss,ix) = av_dup(av, param);
10070             break;
10071         case SAVEt_NSTAB:
10072             gv = (GV*)POPPTR(ss,ix);
10073             TOPPTR(nss,ix) = gv_dup(gv, param);
10074             break;
10075         case SAVEt_GP:                          /* scalar reference */
10076             gp = (GP*)POPPTR(ss,ix);
10077             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
10078             (void)GpREFCNT_inc(gp);
10079             gv = (GV*)POPPTR(ss,ix);
10080             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
10081             c = (char*)POPPTR(ss,ix);
10082             TOPPTR(nss,ix) = pv_dup(c);
10083             iv = POPIV(ss,ix);
10084             TOPIV(nss,ix) = iv;
10085             iv = POPIV(ss,ix);
10086             TOPIV(nss,ix) = iv;
10087             break;
10088         case SAVEt_FREESV:
10089         case SAVEt_MORTALIZESV:
10090             sv = (SV*)POPPTR(ss,ix);
10091             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10092             break;
10093         case SAVEt_FREEOP:
10094             ptr = POPPTR(ss,ix);
10095             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
10096                 /* these are assumed to be refcounted properly */
10097                 OP *o;
10098                 switch (((OP*)ptr)->op_type) {
10099                 case OP_LEAVESUB:
10100                 case OP_LEAVESUBLV:
10101                 case OP_LEAVEEVAL:
10102                 case OP_LEAVE:
10103                 case OP_SCOPE:
10104                 case OP_LEAVEWRITE:
10105                     TOPPTR(nss,ix) = ptr;
10106                     o = (OP*)ptr;
10107                     OpREFCNT_inc(o);
10108                     break;
10109                 default:
10110                     TOPPTR(nss,ix) = Nullop;
10111                     break;
10112                 }
10113             }
10114             else
10115                 TOPPTR(nss,ix) = Nullop;
10116             break;
10117         case SAVEt_FREEPV:
10118             c = (char*)POPPTR(ss,ix);
10119             TOPPTR(nss,ix) = pv_dup_inc(c);
10120             break;
10121         case SAVEt_CLEARSV:
10122             longval = POPLONG(ss,ix);
10123             TOPLONG(nss,ix) = longval;
10124             break;
10125         case SAVEt_DELETE:
10126             hv = (HV*)POPPTR(ss,ix);
10127             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10128             c = (char*)POPPTR(ss,ix);
10129             TOPPTR(nss,ix) = pv_dup_inc(c);
10130             i = POPINT(ss,ix);
10131             TOPINT(nss,ix) = i;
10132             break;
10133         case SAVEt_DESTRUCTOR:
10134             ptr = POPPTR(ss,ix);
10135             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10136             dptr = POPDPTR(ss,ix);
10137             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
10138                                         any_dup(FPTR2DPTR(void *, dptr),
10139                                                 proto_perl));
10140             break;
10141         case SAVEt_DESTRUCTOR_X:
10142             ptr = POPPTR(ss,ix);
10143             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10144             dxptr = POPDXPTR(ss,ix);
10145             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
10146                                          any_dup(FPTR2DPTR(void *, dxptr),
10147                                                  proto_perl));
10148             break;
10149         case SAVEt_REGCONTEXT:
10150         case SAVEt_ALLOC:
10151             i = POPINT(ss,ix);
10152             TOPINT(nss,ix) = i;
10153             ix -= i;
10154             break;
10155         case SAVEt_STACK_POS:           /* Position on Perl stack */
10156             i = POPINT(ss,ix);
10157             TOPINT(nss,ix) = i;
10158             break;
10159         case SAVEt_AELEM:               /* array element */
10160             sv = (SV*)POPPTR(ss,ix);
10161             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10162             i = POPINT(ss,ix);
10163             TOPINT(nss,ix) = i;
10164             av = (AV*)POPPTR(ss,ix);
10165             TOPPTR(nss,ix) = av_dup_inc(av, param);
10166             break;
10167         case SAVEt_HELEM:               /* hash element */
10168             sv = (SV*)POPPTR(ss,ix);
10169             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10170             sv = (SV*)POPPTR(ss,ix);
10171             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10172             hv = (HV*)POPPTR(ss,ix);
10173             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10174             break;
10175         case SAVEt_OP:
10176             ptr = POPPTR(ss,ix);
10177             TOPPTR(nss,ix) = ptr;
10178             break;
10179         case SAVEt_HINTS:
10180             i = POPINT(ss,ix);
10181             TOPINT(nss,ix) = i;
10182             break;
10183         case SAVEt_COMPPAD:
10184             av = (AV*)POPPTR(ss,ix);
10185             TOPPTR(nss,ix) = av_dup(av, param);
10186             break;
10187         case SAVEt_PADSV:
10188             longval = (long)POPLONG(ss,ix);
10189             TOPLONG(nss,ix) = longval;
10190             ptr = POPPTR(ss,ix);
10191             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10192             sv = (SV*)POPPTR(ss,ix);
10193             TOPPTR(nss,ix) = sv_dup(sv, param);
10194             break;
10195         case SAVEt_BOOL:
10196             ptr = POPPTR(ss,ix);
10197             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10198             longval = (long)POPBOOL(ss,ix);
10199             TOPBOOL(nss,ix) = (bool)longval;
10200             break;
10201         case SAVEt_SET_SVFLAGS:
10202             i = POPINT(ss,ix);
10203             TOPINT(nss,ix) = i;
10204             i = POPINT(ss,ix);
10205             TOPINT(nss,ix) = i;
10206             sv = (SV*)POPPTR(ss,ix);
10207             TOPPTR(nss,ix) = sv_dup(sv, param);
10208             break;
10209         default:
10210             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
10211         }
10212     }
10213
10214     return nss;
10215 }
10216
10217
10218 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
10219  * flag to the result. This is done for each stash before cloning starts,
10220  * so we know which stashes want their objects cloned */
10221
10222 static void
10223 do_mark_cloneable_stash(pTHX_ SV *sv)
10224 {
10225     const HEK * const hvname = HvNAME_HEK((HV*)sv);
10226     if (hvname) {
10227         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
10228         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
10229         if (cloner && GvCV(cloner)) {
10230             dSP;
10231             UV status;
10232
10233             ENTER;
10234             SAVETMPS;
10235             PUSHMARK(SP);
10236             XPUSHs(sv_2mortal(newSVhek(hvname)));
10237             PUTBACK;
10238             call_sv((SV*)GvCV(cloner), G_SCALAR);
10239             SPAGAIN;
10240             status = POPu;
10241             PUTBACK;
10242             FREETMPS;
10243             LEAVE;
10244             if (status)
10245                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
10246         }
10247     }
10248 }
10249
10250
10251
10252 /*
10253 =for apidoc perl_clone
10254
10255 Create and return a new interpreter by cloning the current one.
10256
10257 perl_clone takes these flags as parameters:
10258
10259 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10260 without it we only clone the data and zero the stacks,
10261 with it we copy the stacks and the new perl interpreter is
10262 ready to run at the exact same point as the previous one.
10263 The pseudo-fork code uses COPY_STACKS while the
10264 threads->new doesn't.
10265
10266 CLONEf_KEEP_PTR_TABLE
10267 perl_clone keeps a ptr_table with the pointer of the old
10268 variable as a key and the new variable as a value,
10269 this allows it to check if something has been cloned and not
10270 clone it again but rather just use the value and increase the
10271 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10272 the ptr_table using the function
10273 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10274 reason to keep it around is if you want to dup some of your own
10275 variable who are outside the graph perl scans, example of this
10276 code is in threads.xs create
10277
10278 CLONEf_CLONE_HOST
10279 This is a win32 thing, it is ignored on unix, it tells perls
10280 win32host code (which is c++) to clone itself, this is needed on
10281 win32 if you want to run two threads at the same time,
10282 if you just want to do some stuff in a separate perl interpreter
10283 and then throw it away and return to the original one,
10284 you don't need to do anything.
10285
10286 =cut
10287 */
10288
10289 /* XXX the above needs expanding by someone who actually understands it ! */
10290 EXTERN_C PerlInterpreter *
10291 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10292
10293 PerlInterpreter *
10294 perl_clone(PerlInterpreter *proto_perl, UV flags)
10295 {
10296    dVAR;
10297 #ifdef PERL_IMPLICIT_SYS
10298
10299    /* perlhost.h so we need to call into it
10300    to clone the host, CPerlHost should have a c interface, sky */
10301
10302    if (flags & CLONEf_CLONE_HOST) {
10303        return perl_clone_host(proto_perl,flags);
10304    }
10305    return perl_clone_using(proto_perl, flags,
10306                             proto_perl->IMem,
10307                             proto_perl->IMemShared,
10308                             proto_perl->IMemParse,
10309                             proto_perl->IEnv,
10310                             proto_perl->IStdIO,
10311                             proto_perl->ILIO,
10312                             proto_perl->IDir,
10313                             proto_perl->ISock,
10314                             proto_perl->IProc);
10315 }
10316
10317 PerlInterpreter *
10318 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10319                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10320                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10321                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10322                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10323                  struct IPerlProc* ipP)
10324 {
10325     /* XXX many of the string copies here can be optimized if they're
10326      * constants; they need to be allocated as common memory and just
10327      * their pointers copied. */
10328
10329     IV i;
10330     CLONE_PARAMS clone_params;
10331     CLONE_PARAMS* param = &clone_params;
10332
10333     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10334     /* for each stash, determine whether its objects should be cloned */
10335     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10336     PERL_SET_THX(my_perl);
10337
10338 #  ifdef DEBUGGING
10339     Poison(my_perl, 1, PerlInterpreter);
10340     PL_op = Nullop;
10341     PL_curcop = (COP *)Nullop;
10342     PL_markstack = 0;
10343     PL_scopestack = 0;
10344     PL_savestack = 0;
10345     PL_savestack_ix = 0;
10346     PL_savestack_max = -1;
10347     PL_sig_pending = 0;
10348     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10349 #  else /* !DEBUGGING */
10350     Zero(my_perl, 1, PerlInterpreter);
10351 #  endif        /* DEBUGGING */
10352
10353     /* host pointers */
10354     PL_Mem              = ipM;
10355     PL_MemShared        = ipMS;
10356     PL_MemParse         = ipMP;
10357     PL_Env              = ipE;
10358     PL_StdIO            = ipStd;
10359     PL_LIO              = ipLIO;
10360     PL_Dir              = ipD;
10361     PL_Sock             = ipS;
10362     PL_Proc             = ipP;
10363 #else           /* !PERL_IMPLICIT_SYS */
10364     IV i;
10365     CLONE_PARAMS clone_params;
10366     CLONE_PARAMS* param = &clone_params;
10367     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10368     /* for each stash, determine whether its objects should be cloned */
10369     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10370     PERL_SET_THX(my_perl);
10371
10372 #    ifdef DEBUGGING
10373     Poison(my_perl, 1, PerlInterpreter);
10374     PL_op = Nullop;
10375     PL_curcop = (COP *)Nullop;
10376     PL_markstack = 0;
10377     PL_scopestack = 0;
10378     PL_savestack = 0;
10379     PL_savestack_ix = 0;
10380     PL_savestack_max = -1;
10381     PL_sig_pending = 0;
10382     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10383 #    else       /* !DEBUGGING */
10384     Zero(my_perl, 1, PerlInterpreter);
10385 #    endif      /* DEBUGGING */
10386 #endif          /* PERL_IMPLICIT_SYS */
10387     param->flags = flags;
10388     param->proto_perl = proto_perl;
10389
10390     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10391     Zero(&PL_body_roots, 1, PL_body_roots);
10392     
10393     PL_nice_chunk       = NULL;
10394     PL_nice_chunk_size  = 0;
10395     PL_sv_count         = 0;
10396     PL_sv_objcount      = 0;
10397     PL_sv_root          = Nullsv;
10398     PL_sv_arenaroot     = Nullsv;
10399
10400     PL_debug            = proto_perl->Idebug;
10401
10402     PL_hash_seed        = proto_perl->Ihash_seed;
10403     PL_rehash_seed      = proto_perl->Irehash_seed;
10404
10405 #ifdef USE_REENTRANT_API
10406     /* XXX: things like -Dm will segfault here in perlio, but doing
10407      *  PERL_SET_CONTEXT(proto_perl);
10408      * breaks too many other things
10409      */
10410     Perl_reentrant_init(aTHX);
10411 #endif
10412
10413     /* create SV map for pointer relocation */
10414     PL_ptr_table = ptr_table_new();
10415
10416     /* initialize these special pointers as early as possible */
10417     SvANY(&PL_sv_undef)         = NULL;
10418     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10419     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10420     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10421
10422     SvANY(&PL_sv_no)            = new_XPVNV();
10423     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10424     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10425                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10426     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10427     SvCUR_set(&PL_sv_no, 0);
10428     SvLEN_set(&PL_sv_no, 1);
10429     SvIV_set(&PL_sv_no, 0);
10430     SvNV_set(&PL_sv_no, 0);
10431     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10432
10433     SvANY(&PL_sv_yes)           = new_XPVNV();
10434     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10435     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10436                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10437     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10438     SvCUR_set(&PL_sv_yes, 1);
10439     SvLEN_set(&PL_sv_yes, 2);
10440     SvIV_set(&PL_sv_yes, 1);
10441     SvNV_set(&PL_sv_yes, 1);
10442     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10443
10444     /* create (a non-shared!) shared string table */
10445     PL_strtab           = newHV();
10446     HvSHAREKEYS_off(PL_strtab);
10447     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10448     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10449
10450     PL_compiling = proto_perl->Icompiling;
10451
10452     /* These two PVs will be free'd special way so must set them same way op.c does */
10453     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10454     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10455
10456     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10457     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10458
10459     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10460     if (!specialWARN(PL_compiling.cop_warnings))
10461         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10462     if (!specialCopIO(PL_compiling.cop_io))
10463         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10464     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10465
10466     /* pseudo environmental stuff */
10467     PL_origargc         = proto_perl->Iorigargc;
10468     PL_origargv         = proto_perl->Iorigargv;
10469
10470     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10471
10472     /* Set tainting stuff before PerlIO_debug can possibly get called */
10473     PL_tainting         = proto_perl->Itainting;
10474     PL_taint_warn       = proto_perl->Itaint_warn;
10475
10476 #ifdef PERLIO_LAYERS
10477     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10478     PerlIO_clone(aTHX_ proto_perl, param);
10479 #endif
10480
10481     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10482     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10483     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10484     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10485     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10486     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10487
10488     /* switches */
10489     PL_minus_c          = proto_perl->Iminus_c;
10490     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10491     PL_localpatches     = proto_perl->Ilocalpatches;
10492     PL_splitstr         = proto_perl->Isplitstr;
10493     PL_preprocess       = proto_perl->Ipreprocess;
10494     PL_minus_n          = proto_perl->Iminus_n;
10495     PL_minus_p          = proto_perl->Iminus_p;
10496     PL_minus_l          = proto_perl->Iminus_l;
10497     PL_minus_a          = proto_perl->Iminus_a;
10498     PL_minus_F          = proto_perl->Iminus_F;
10499     PL_doswitches       = proto_perl->Idoswitches;
10500     PL_dowarn           = proto_perl->Idowarn;
10501     PL_doextract        = proto_perl->Idoextract;
10502     PL_sawampersand     = proto_perl->Isawampersand;
10503     PL_unsafe           = proto_perl->Iunsafe;
10504     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10505     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10506     PL_perldb           = proto_perl->Iperldb;
10507     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10508     PL_exit_flags       = proto_perl->Iexit_flags;
10509
10510     /* magical thingies */
10511     /* XXX time(&PL_basetime) when asked for? */
10512     PL_basetime         = proto_perl->Ibasetime;
10513     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10514
10515     PL_maxsysfd         = proto_perl->Imaxsysfd;
10516     PL_multiline        = proto_perl->Imultiline;
10517     PL_statusvalue      = proto_perl->Istatusvalue;
10518 #ifdef VMS
10519     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10520 #else
10521     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10522 #endif
10523     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10524
10525     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10526     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10527     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10528
10529     /* Clone the regex array */
10530     PL_regex_padav = newAV();
10531     {
10532         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10533         SV** const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10534         IV i;
10535         av_push(PL_regex_padav,
10536                 sv_dup_inc(regexen[0],param));
10537         for(i = 1; i <= len; i++) {
10538             if(SvREPADTMP(regexen[i])) {
10539               av_push(PL_regex_padav, sv_dup_inc(regexen[i], param));
10540             } else {
10541                 av_push(PL_regex_padav,
10542                     SvREFCNT_inc(
10543                         newSViv(PTR2IV(re_dup(INT2PTR(REGEXP *,
10544                              SvIVX(regexen[i])), param)))
10545                        ));
10546             }
10547         }
10548     }
10549     PL_regex_pad = AvARRAY(PL_regex_padav);
10550
10551     /* shortcuts to various I/O objects */
10552     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10553     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10554     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10555     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10556     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10557     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10558
10559     /* shortcuts to regexp stuff */
10560     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10561
10562     /* shortcuts to misc objects */
10563     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10564
10565     /* shortcuts to debugging objects */
10566     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10567     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10568     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10569     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10570     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10571     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10572     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10573     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10574     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10575
10576     /* symbol tables */
10577     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10578     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10579     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10580     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10581     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10582
10583     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10584     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10585     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10586     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10587     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10588     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10589
10590     PL_sub_generation   = proto_perl->Isub_generation;
10591
10592     /* funky return mechanisms */
10593     PL_forkprocess      = proto_perl->Iforkprocess;
10594
10595     /* subprocess state */
10596     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10597
10598     /* internal state */
10599     PL_maxo             = proto_perl->Imaxo;
10600     if (proto_perl->Iop_mask)
10601         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10602     else
10603         PL_op_mask      = Nullch;
10604     /* PL_asserting        = proto_perl->Iasserting; */
10605
10606     /* current interpreter roots */
10607     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10608     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10609     PL_main_start       = proto_perl->Imain_start;
10610     PL_eval_root        = proto_perl->Ieval_root;
10611     PL_eval_start       = proto_perl->Ieval_start;
10612
10613     /* runtime control stuff */
10614     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10615     PL_copline          = proto_perl->Icopline;
10616
10617     PL_filemode         = proto_perl->Ifilemode;
10618     PL_lastfd           = proto_perl->Ilastfd;
10619     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10620     PL_Argv             = NULL;
10621     PL_Cmd              = Nullch;
10622     PL_gensym           = proto_perl->Igensym;
10623     PL_preambled        = proto_perl->Ipreambled;
10624     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10625     PL_laststatval      = proto_perl->Ilaststatval;
10626     PL_laststype        = proto_perl->Ilaststype;
10627     PL_mess_sv          = Nullsv;
10628
10629     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10630
10631     /* interpreter atexit processing */
10632     PL_exitlistlen      = proto_perl->Iexitlistlen;
10633     if (PL_exitlistlen) {
10634         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10635         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10636     }
10637     else
10638         PL_exitlist     = (PerlExitListEntry*)NULL;
10639     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10640     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10641     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10642
10643     PL_profiledata      = NULL;
10644     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10645     /* PL_rsfp_filters entries have fake IoDIRP() */
10646     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10647
10648     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10649
10650     PAD_CLONE_VARS(proto_perl, param);
10651
10652 #ifdef HAVE_INTERP_INTERN
10653     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10654 #endif
10655
10656     /* more statics moved here */
10657     PL_generation       = proto_perl->Igeneration;
10658     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10659
10660     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10661     PL_in_clean_all     = proto_perl->Iin_clean_all;
10662
10663     PL_uid              = proto_perl->Iuid;
10664     PL_euid             = proto_perl->Ieuid;
10665     PL_gid              = proto_perl->Igid;
10666     PL_egid             = proto_perl->Iegid;
10667     PL_nomemok          = proto_perl->Inomemok;
10668     PL_an               = proto_perl->Ian;
10669     PL_evalseq          = proto_perl->Ievalseq;
10670     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10671     PL_origalen         = proto_perl->Iorigalen;
10672 #ifdef PERL_USES_PL_PIDSTATUS
10673     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10674 #endif
10675     PL_osname           = SAVEPV(proto_perl->Iosname);
10676     PL_sighandlerp      = proto_perl->Isighandlerp;
10677
10678     PL_runops           = proto_perl->Irunops;
10679
10680     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10681
10682 #ifdef CSH
10683     PL_cshlen           = proto_perl->Icshlen;
10684     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10685 #endif
10686
10687     PL_lex_state        = proto_perl->Ilex_state;
10688     PL_lex_defer        = proto_perl->Ilex_defer;
10689     PL_lex_expect       = proto_perl->Ilex_expect;
10690     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10691     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10692     PL_lex_starts       = proto_perl->Ilex_starts;
10693     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10694     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10695     PL_lex_op           = proto_perl->Ilex_op;
10696     PL_lex_inpat        = proto_perl->Ilex_inpat;
10697     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10698     PL_lex_brackets     = proto_perl->Ilex_brackets;
10699     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10700     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10701     PL_lex_casemods     = proto_perl->Ilex_casemods;
10702     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10703     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10704
10705     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10706     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10707     PL_nexttoke         = proto_perl->Inexttoke;
10708
10709     /* XXX This is probably masking the deeper issue of why
10710      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10711      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10712      * (A little debugging with a watchpoint on it may help.)
10713      */
10714     if (SvANY(proto_perl->Ilinestr)) {
10715         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10716         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10717         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10718         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10719         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10720         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10721         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10722         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10723         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10724     }
10725     else {
10726         PL_linestr = NEWSV(65,79);
10727         sv_upgrade(PL_linestr,SVt_PVIV);
10728         sv_setpvn(PL_linestr,"",0);
10729         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10730     }
10731     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10732     PL_pending_ident    = proto_perl->Ipending_ident;
10733     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10734
10735     PL_expect           = proto_perl->Iexpect;
10736
10737     PL_multi_start      = proto_perl->Imulti_start;
10738     PL_multi_end        = proto_perl->Imulti_end;
10739     PL_multi_open       = proto_perl->Imulti_open;
10740     PL_multi_close      = proto_perl->Imulti_close;
10741
10742     PL_error_count      = proto_perl->Ierror_count;
10743     PL_subline          = proto_perl->Isubline;
10744     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10745
10746     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10747     if (SvANY(proto_perl->Ilinestr)) {
10748         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10749         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10750         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10751         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10752         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10753     }
10754     else {
10755         PL_last_uni     = SvPVX(PL_linestr);
10756         PL_last_lop     = SvPVX(PL_linestr);
10757         PL_last_lop_op  = 0;
10758     }
10759     PL_in_my            = proto_perl->Iin_my;
10760     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10761 #ifdef FCRYPT
10762     PL_cryptseen        = proto_perl->Icryptseen;
10763 #endif
10764
10765     PL_hints            = proto_perl->Ihints;
10766
10767     PL_amagic_generation        = proto_perl->Iamagic_generation;
10768
10769 #ifdef USE_LOCALE_COLLATE
10770     PL_collation_ix     = proto_perl->Icollation_ix;
10771     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10772     PL_collation_standard       = proto_perl->Icollation_standard;
10773     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10774     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10775 #endif /* USE_LOCALE_COLLATE */
10776
10777 #ifdef USE_LOCALE_NUMERIC
10778     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10779     PL_numeric_standard = proto_perl->Inumeric_standard;
10780     PL_numeric_local    = proto_perl->Inumeric_local;
10781     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10782 #endif /* !USE_LOCALE_NUMERIC */
10783
10784     /* utf8 character classes */
10785     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10786     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10787     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10788     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10789     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10790     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10791     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10792     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10793     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10794     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10795     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10796     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10797     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10798     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10799     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10800     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10801     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10802     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10803     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10804     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10805
10806     /* Did the locale setup indicate UTF-8? */
10807     PL_utf8locale       = proto_perl->Iutf8locale;
10808     /* Unicode features (see perlrun/-C) */
10809     PL_unicode          = proto_perl->Iunicode;
10810
10811     /* Pre-5.8 signals control */
10812     PL_signals          = proto_perl->Isignals;
10813
10814     /* times() ticks per second */
10815     PL_clocktick        = proto_perl->Iclocktick;
10816
10817     /* Recursion stopper for PerlIO_find_layer */
10818     PL_in_load_module   = proto_perl->Iin_load_module;
10819
10820     /* sort() routine */
10821     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10822
10823     /* Not really needed/useful since the reenrant_retint is "volatile",
10824      * but do it for consistency's sake. */
10825     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10826
10827     /* Hooks to shared SVs and locks. */
10828     PL_sharehook        = proto_perl->Isharehook;
10829     PL_lockhook         = proto_perl->Ilockhook;
10830     PL_unlockhook       = proto_perl->Iunlockhook;
10831     PL_threadhook       = proto_perl->Ithreadhook;
10832
10833     PL_runops_std       = proto_perl->Irunops_std;
10834     PL_runops_dbg       = proto_perl->Irunops_dbg;
10835
10836 #ifdef THREADS_HAVE_PIDS
10837     PL_ppid             = proto_perl->Ippid;
10838 #endif
10839
10840     /* swatch cache */
10841     PL_last_swash_hv    = Nullhv;       /* reinits on demand */
10842     PL_last_swash_klen  = 0;
10843     PL_last_swash_key[0]= '\0';
10844     PL_last_swash_tmps  = (U8*)NULL;
10845     PL_last_swash_slen  = 0;
10846
10847     PL_glob_index       = proto_perl->Iglob_index;
10848     PL_srand_called     = proto_perl->Isrand_called;
10849     PL_uudmap['M']      = 0;            /* reinits on demand */
10850     PL_bitcount         = Nullch;       /* reinits on demand */
10851
10852     if (proto_perl->Ipsig_pend) {
10853         Newxz(PL_psig_pend, SIG_SIZE, int);
10854     }
10855     else {
10856         PL_psig_pend    = (int*)NULL;
10857     }
10858
10859     if (proto_perl->Ipsig_ptr) {
10860         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10861         Newxz(PL_psig_name, SIG_SIZE, SV*);
10862         for (i = 1; i < SIG_SIZE; i++) {
10863             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10864             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10865         }
10866     }
10867     else {
10868         PL_psig_ptr     = (SV**)NULL;
10869         PL_psig_name    = (SV**)NULL;
10870     }
10871
10872     /* thrdvar.h stuff */
10873
10874     if (flags & CLONEf_COPY_STACKS) {
10875         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10876         PL_tmps_ix              = proto_perl->Ttmps_ix;
10877         PL_tmps_max             = proto_perl->Ttmps_max;
10878         PL_tmps_floor           = proto_perl->Ttmps_floor;
10879         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10880         i = 0;
10881         while (i <= PL_tmps_ix) {
10882             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10883             ++i;
10884         }
10885
10886         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10887         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10888         Newxz(PL_markstack, i, I32);
10889         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10890                                                   - proto_perl->Tmarkstack);
10891         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10892                                                   - proto_perl->Tmarkstack);
10893         Copy(proto_perl->Tmarkstack, PL_markstack,
10894              PL_markstack_ptr - PL_markstack + 1, I32);
10895
10896         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10897          * NOTE: unlike the others! */
10898         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10899         PL_scopestack_max       = proto_perl->Tscopestack_max;
10900         Newxz(PL_scopestack, PL_scopestack_max, I32);
10901         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10902
10903         /* NOTE: si_dup() looks at PL_markstack */
10904         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10905
10906         /* PL_curstack          = PL_curstackinfo->si_stack; */
10907         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10908         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10909
10910         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10911         PL_stack_base           = AvARRAY(PL_curstack);
10912         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10913                                                    - proto_perl->Tstack_base);
10914         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10915
10916         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10917          * NOTE: unlike the others! */
10918         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10919         PL_savestack_max        = proto_perl->Tsavestack_max;
10920         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10921         PL_savestack            = ss_dup(proto_perl, param);
10922     }
10923     else {
10924         init_stacks();
10925         ENTER;                  /* perl_destruct() wants to LEAVE; */
10926     }
10927
10928     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10929     PL_top_env          = &PL_start_env;
10930
10931     PL_op               = proto_perl->Top;
10932
10933     PL_Sv               = Nullsv;
10934     PL_Xpv              = (XPV*)NULL;
10935     PL_na               = proto_perl->Tna;
10936
10937     PL_statbuf          = proto_perl->Tstatbuf;
10938     PL_statcache        = proto_perl->Tstatcache;
10939     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10940     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10941 #ifdef HAS_TIMES
10942     PL_timesbuf         = proto_perl->Ttimesbuf;
10943 #endif
10944
10945     PL_tainted          = proto_perl->Ttainted;
10946     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10947     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10948     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10949     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10950     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10951     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10952     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10953     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10954     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10955
10956     PL_restartop        = proto_perl->Trestartop;
10957     PL_in_eval          = proto_perl->Tin_eval;
10958     PL_delaymagic       = proto_perl->Tdelaymagic;
10959     PL_dirty            = proto_perl->Tdirty;
10960     PL_localizing       = proto_perl->Tlocalizing;
10961
10962     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10963     PL_hv_fetch_ent_mh  = Nullhe;
10964     PL_modcount         = proto_perl->Tmodcount;
10965     PL_lastgotoprobe    = Nullop;
10966     PL_dumpindent       = proto_perl->Tdumpindent;
10967
10968     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10969     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10970     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10971     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10972     PL_efloatbuf        = Nullch;               /* reinits on demand */
10973     PL_efloatsize       = 0;                    /* reinits on demand */
10974
10975     /* regex stuff */
10976
10977     PL_screamfirst      = NULL;
10978     PL_screamnext       = NULL;
10979     PL_maxscream        = -1;                   /* reinits on demand */
10980     PL_lastscream       = Nullsv;
10981
10982     PL_watchaddr        = NULL;
10983     PL_watchok          = Nullch;
10984
10985     PL_regdummy         = proto_perl->Tregdummy;
10986     PL_regprecomp       = Nullch;
10987     PL_regnpar          = 0;
10988     PL_regsize          = 0;
10989     PL_colorset         = 0;            /* reinits PL_colors[] */
10990     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10991     PL_reginput         = Nullch;
10992     PL_regbol           = Nullch;
10993     PL_regeol           = Nullch;
10994     PL_regstartp        = (I32*)NULL;
10995     PL_regendp          = (I32*)NULL;
10996     PL_reglastparen     = (U32*)NULL;
10997     PL_reglastcloseparen        = (U32*)NULL;
10998     PL_regtill          = Nullch;
10999     PL_reg_start_tmp    = (char**)NULL;
11000     PL_reg_start_tmpl   = 0;
11001     PL_regdata          = (struct reg_data*)NULL;
11002     PL_bostr            = Nullch;
11003     PL_reg_flags        = 0;
11004     PL_reg_eval_set     = 0;
11005     PL_regnarrate       = 0;
11006     PL_regprogram       = (regnode*)NULL;
11007     PL_regindent        = 0;
11008     PL_regcc            = (CURCUR*)NULL;
11009     PL_reg_call_cc      = (struct re_cc_state*)NULL;
11010     PL_reg_re           = (regexp*)NULL;
11011     PL_reg_ganch        = Nullch;
11012     PL_reg_sv           = Nullsv;
11013     PL_reg_match_utf8   = FALSE;
11014     PL_reg_magic        = (MAGIC*)NULL;
11015     PL_reg_oldpos       = 0;
11016     PL_reg_oldcurpm     = (PMOP*)NULL;
11017     PL_reg_curpm        = (PMOP*)NULL;
11018     PL_reg_oldsaved     = Nullch;
11019     PL_reg_oldsavedlen  = 0;
11020 #ifdef PERL_OLD_COPY_ON_WRITE
11021     PL_nrs              = Nullsv;
11022 #endif
11023     PL_reg_maxiter      = 0;
11024     PL_reg_leftiter     = 0;
11025     PL_reg_poscache     = Nullch;
11026     PL_reg_poscache_size= 0;
11027
11028     /* RE engine - function pointers */
11029     PL_regcompp         = proto_perl->Tregcompp;
11030     PL_regexecp         = proto_perl->Tregexecp;
11031     PL_regint_start     = proto_perl->Tregint_start;
11032     PL_regint_string    = proto_perl->Tregint_string;
11033     PL_regfree          = proto_perl->Tregfree;
11034
11035     PL_reginterp_cnt    = 0;
11036     PL_reg_starttry     = 0;
11037
11038     /* Pluggable optimizer */
11039     PL_peepp            = proto_perl->Tpeepp;
11040
11041     PL_stashcache       = newHV();
11042
11043     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
11044         ptr_table_free(PL_ptr_table);
11045         PL_ptr_table = NULL;
11046     }
11047
11048     /* Call the ->CLONE method, if it exists, for each of the stashes
11049        identified by sv_dup() above.
11050     */
11051     while(av_len(param->stashes) != -1) {
11052         HV* const stash = (HV*) av_shift(param->stashes);
11053         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
11054         if (cloner && GvCV(cloner)) {
11055             dSP;
11056             ENTER;
11057             SAVETMPS;
11058             PUSHMARK(SP);
11059             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
11060             PUTBACK;
11061             call_sv((SV*)GvCV(cloner), G_DISCARD);
11062             FREETMPS;
11063             LEAVE;
11064         }
11065     }
11066
11067     SvREFCNT_dec(param->stashes);
11068
11069     /* orphaned? eg threads->new inside BEGIN or use */
11070     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
11071         (void)SvREFCNT_inc(PL_compcv);
11072         SAVEFREESV(PL_compcv);
11073     }
11074
11075     return my_perl;
11076 }
11077
11078 #endif /* USE_ITHREADS */
11079
11080 /*
11081 =head1 Unicode Support
11082
11083 =for apidoc sv_recode_to_utf8
11084
11085 The encoding is assumed to be an Encode object, on entry the PV
11086 of the sv is assumed to be octets in that encoding, and the sv
11087 will be converted into Unicode (and UTF-8).
11088
11089 If the sv already is UTF-8 (or if it is not POK), or if the encoding
11090 is not a reference, nothing is done to the sv.  If the encoding is not
11091 an C<Encode::XS> Encoding object, bad things will happen.
11092 (See F<lib/encoding.pm> and L<Encode>).
11093
11094 The PV of the sv is returned.
11095
11096 =cut */
11097
11098 char *
11099 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
11100 {
11101     dVAR;
11102     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
11103         SV *uni;
11104         STRLEN len;
11105         const char *s;
11106         dSP;
11107         ENTER;
11108         SAVETMPS;
11109         save_re_context();
11110         PUSHMARK(sp);
11111         EXTEND(SP, 3);
11112         XPUSHs(encoding);
11113         XPUSHs(sv);
11114 /*
11115   NI-S 2002/07/09
11116   Passing sv_yes is wrong - it needs to be or'ed set of constants
11117   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
11118   remove converted chars from source.
11119
11120   Both will default the value - let them.
11121
11122         XPUSHs(&PL_sv_yes);
11123 */
11124         PUTBACK;
11125         call_method("decode", G_SCALAR);
11126         SPAGAIN;
11127         uni = POPs;
11128         PUTBACK;
11129         s = SvPV_const(uni, len);
11130         if (s != SvPVX_const(sv)) {
11131             SvGROW(sv, len + 1);
11132             Move(s, SvPVX(sv), len + 1, char);
11133             SvCUR_set(sv, len);
11134         }
11135         FREETMPS;
11136         LEAVE;
11137         SvUTF8_on(sv);
11138         return SvPVX(sv);
11139     }
11140     return SvPOKp(sv) ? SvPVX(sv) : NULL;
11141 }
11142
11143 /*
11144 =for apidoc sv_cat_decode
11145
11146 The encoding is assumed to be an Encode object, the PV of the ssv is
11147 assumed to be octets in that encoding and decoding the input starts
11148 from the position which (PV + *offset) pointed to.  The dsv will be
11149 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
11150 when the string tstr appears in decoding output or the input ends on
11151 the PV of the ssv. The value which the offset points will be modified
11152 to the last input position on the ssv.
11153
11154 Returns TRUE if the terminator was found, else returns FALSE.
11155
11156 =cut */
11157
11158 bool
11159 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
11160                    SV *ssv, int *offset, char *tstr, int tlen)
11161 {
11162     dVAR;
11163     bool ret = FALSE;
11164     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
11165         SV *offsv;
11166         dSP;
11167         ENTER;
11168         SAVETMPS;
11169         save_re_context();
11170         PUSHMARK(sp);
11171         EXTEND(SP, 6);
11172         XPUSHs(encoding);
11173         XPUSHs(dsv);
11174         XPUSHs(ssv);
11175         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
11176         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
11177         PUTBACK;
11178         call_method("cat_decode", G_SCALAR);
11179         SPAGAIN;
11180         ret = SvTRUE(TOPs);
11181         *offset = SvIV(offsv);
11182         PUTBACK;
11183         FREETMPS;
11184         LEAVE;
11185     }
11186     else
11187         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
11188     return ret;
11189
11190 }
11191
11192 /* ---------------------------------------------------------------------
11193  *
11194  * support functions for report_uninit()
11195  */
11196
11197 /* the maxiumum size of array or hash where we will scan looking
11198  * for the undefined element that triggered the warning */
11199
11200 #define FUV_MAX_SEARCH_SIZE 1000
11201
11202 /* Look for an entry in the hash whose value has the same SV as val;
11203  * If so, return a mortal copy of the key. */
11204
11205 STATIC SV*
11206 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
11207 {
11208     dVAR;
11209     register HE **array;
11210     I32 i;
11211
11212     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
11213                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
11214         return Nullsv;
11215
11216     array = HvARRAY(hv);
11217
11218     for (i=HvMAX(hv); i>0; i--) {
11219         register HE *entry;
11220         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
11221             if (HeVAL(entry) != val)
11222                 continue;
11223             if (    HeVAL(entry) == &PL_sv_undef ||
11224                     HeVAL(entry) == &PL_sv_placeholder)
11225                 continue;
11226             if (!HeKEY(entry))
11227                 return Nullsv;
11228             if (HeKLEN(entry) == HEf_SVKEY)
11229                 return sv_mortalcopy(HeKEY_sv(entry));
11230             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
11231         }
11232     }
11233     return Nullsv;
11234 }
11235
11236 /* Look for an entry in the array whose value has the same SV as val;
11237  * If so, return the index, otherwise return -1. */
11238
11239 STATIC I32
11240 S_find_array_subscript(pTHX_ AV *av, SV* val)
11241 {
11242     SV** svp;
11243     I32 i;
11244     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
11245                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
11246         return -1;
11247
11248     svp = AvARRAY(av);
11249     for (i=AvFILLp(av); i>=0; i--) {
11250         if (svp[i] == val && svp[i] != &PL_sv_undef)
11251             return i;
11252     }
11253     return -1;
11254 }
11255
11256 /* S_varname(): return the name of a variable, optionally with a subscript.
11257  * If gv is non-zero, use the name of that global, along with gvtype (one
11258  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11259  * targ.  Depending on the value of the subscript_type flag, return:
11260  */
11261
11262 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11263 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11264 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11265 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11266
11267 STATIC SV*
11268 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11269         SV* keyname, I32 aindex, int subscript_type)
11270 {
11271
11272     SV * const name = sv_newmortal();
11273     if (gv) {
11274         char buffer[2];
11275         buffer[0] = gvtype;
11276         buffer[1] = 0;
11277
11278         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11279
11280         gv_fullname4(name, gv, buffer, 0);
11281
11282         if ((unsigned int)SvPVX(name)[1] <= 26) {
11283             buffer[0] = '^';
11284             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11285
11286             /* Swap the 1 unprintable control character for the 2 byte pretty
11287                version - ie substr($name, 1, 1) = $buffer; */
11288             sv_insert(name, 1, 1, buffer, 2);
11289         }
11290     }
11291     else {
11292         U32 unused;
11293         CV * const cv = find_runcv(&unused);
11294         SV *sv;
11295         AV *av;
11296
11297         if (!cv || !CvPADLIST(cv))
11298             return Nullsv;
11299         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11300         sv = *av_fetch(av, targ, FALSE);
11301         /* SvLEN in a pad name is not to be trusted */
11302         sv_setpv(name, SvPV_nolen_const(sv));
11303     }
11304
11305     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11306         SV * const sv = NEWSV(0,0);
11307         *SvPVX(name) = '$';
11308         Perl_sv_catpvf(aTHX_ name, "{%s}",
11309             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11310         SvREFCNT_dec(sv);
11311     }
11312     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11313         *SvPVX(name) = '$';
11314         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11315     }
11316     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11317         sv_insert(name, 0, 0,  "within ", 7);
11318
11319     return name;
11320 }
11321
11322
11323 /*
11324 =for apidoc find_uninit_var
11325
11326 Find the name of the undefined variable (if any) that caused the operator o
11327 to issue a "Use of uninitialized value" warning.
11328 If match is true, only return a name if it's value matches uninit_sv.
11329 So roughly speaking, if a unary operator (such as OP_COS) generates a
11330 warning, then following the direct child of the op may yield an
11331 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11332 other hand, with OP_ADD there are two branches to follow, so we only print
11333 the variable name if we get an exact match.
11334
11335 The name is returned as a mortal SV.
11336
11337 Assumes that PL_op is the op that originally triggered the error, and that
11338 PL_comppad/PL_curpad points to the currently executing pad.
11339
11340 =cut
11341 */
11342
11343 STATIC SV *
11344 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11345 {
11346     dVAR;
11347     SV *sv;
11348     AV *av;
11349     GV *gv;
11350     OP *o, *o2, *kid;
11351
11352     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11353                             uninit_sv == &PL_sv_placeholder)))
11354         return Nullsv;
11355
11356     switch (obase->op_type) {
11357
11358     case OP_RV2AV:
11359     case OP_RV2HV:
11360     case OP_PADAV:
11361     case OP_PADHV:
11362       {
11363         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11364         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11365         I32 index = 0;
11366         SV *keysv = Nullsv;
11367         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11368
11369         if (pad) { /* @lex, %lex */
11370             sv = PAD_SVl(obase->op_targ);
11371             gv = Nullgv;
11372         }
11373         else {
11374             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11375             /* @global, %global */
11376                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11377                 if (!gv)
11378                     break;
11379                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11380             }
11381             else /* @{expr}, %{expr} */
11382                 return find_uninit_var(cUNOPx(obase)->op_first,
11383                                                     uninit_sv, match);
11384         }
11385
11386         /* attempt to find a match within the aggregate */
11387         if (hash) {
11388             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11389             if (keysv)
11390                 subscript_type = FUV_SUBSCRIPT_HASH;
11391         }
11392         else {
11393             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11394             if (index >= 0)
11395                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11396         }
11397
11398         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11399             break;
11400
11401         return varname(gv, hash ? '%' : '@', obase->op_targ,
11402                                     keysv, index, subscript_type);
11403       }
11404
11405     case OP_PADSV:
11406         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11407             break;
11408         return varname(Nullgv, '$', obase->op_targ,
11409                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11410
11411     case OP_GVSV:
11412         gv = cGVOPx_gv(obase);
11413         if (!gv || (match && GvSV(gv) != uninit_sv))
11414             break;
11415         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11416
11417     case OP_AELEMFAST:
11418         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11419             if (match) {
11420                 SV **svp;
11421                 av = (AV*)PAD_SV(obase->op_targ);
11422                 if (!av || SvRMAGICAL(av))
11423                     break;
11424                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11425                 if (!svp || *svp != uninit_sv)
11426                     break;
11427             }
11428             return varname(Nullgv, '$', obase->op_targ,
11429                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11430         }
11431         else {
11432             gv = cGVOPx_gv(obase);
11433             if (!gv)
11434                 break;
11435             if (match) {
11436                 SV **svp;
11437                 av = GvAV(gv);
11438                 if (!av || SvRMAGICAL(av))
11439                     break;
11440                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11441                 if (!svp || *svp != uninit_sv)
11442                     break;
11443             }
11444             return varname(gv, '$', 0,
11445                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11446         }
11447         break;
11448
11449     case OP_EXISTS:
11450         o = cUNOPx(obase)->op_first;
11451         if (!o || o->op_type != OP_NULL ||
11452                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11453             break;
11454         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11455
11456     case OP_AELEM:
11457     case OP_HELEM:
11458         if (PL_op == obase)
11459             /* $a[uninit_expr] or $h{uninit_expr} */
11460             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11461
11462         gv = Nullgv;
11463         o = cBINOPx(obase)->op_first;
11464         kid = cBINOPx(obase)->op_last;
11465
11466         /* get the av or hv, and optionally the gv */
11467         sv = Nullsv;
11468         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11469             sv = PAD_SV(o->op_targ);
11470         }
11471         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11472                 && cUNOPo->op_first->op_type == OP_GV)
11473         {
11474             gv = cGVOPx_gv(cUNOPo->op_first);
11475             if (!gv)
11476                 break;
11477             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11478         }
11479         if (!sv)
11480             break;
11481
11482         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11483             /* index is constant */
11484             if (match) {
11485                 if (SvMAGICAL(sv))
11486                     break;
11487                 if (obase->op_type == OP_HELEM) {
11488                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11489                     if (!he || HeVAL(he) != uninit_sv)
11490                         break;
11491                 }
11492                 else {
11493                     SV ** const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11494                     if (!svp || *svp != uninit_sv)
11495                         break;
11496                 }
11497             }
11498             if (obase->op_type == OP_HELEM)
11499                 return varname(gv, '%', o->op_targ,
11500                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11501             else
11502                 return varname(gv, '@', o->op_targ, Nullsv,
11503                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11504             ;
11505         }
11506         else  {
11507             /* index is an expression;
11508              * attempt to find a match within the aggregate */
11509             if (obase->op_type == OP_HELEM) {
11510                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11511                 if (keysv)
11512                     return varname(gv, '%', o->op_targ,
11513                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11514             }
11515             else {
11516                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11517                 if (index >= 0)
11518                     return varname(gv, '@', o->op_targ,
11519                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11520             }
11521             if (match)
11522                 break;
11523             return varname(gv,
11524                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11525                 ? '@' : '%',
11526                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11527         }
11528
11529         break;
11530
11531     case OP_AASSIGN:
11532         /* only examine RHS */
11533         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11534
11535     case OP_OPEN:
11536         o = cUNOPx(obase)->op_first;
11537         if (o->op_type == OP_PUSHMARK)
11538             o = o->op_sibling;
11539
11540         if (!o->op_sibling) {
11541             /* one-arg version of open is highly magical */
11542
11543             if (o->op_type == OP_GV) { /* open FOO; */
11544                 gv = cGVOPx_gv(o);
11545                 if (match && GvSV(gv) != uninit_sv)
11546                     break;
11547                 return varname(gv, '$', 0,
11548                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11549             }
11550             /* other possibilities not handled are:
11551              * open $x; or open my $x;  should return '${*$x}'
11552              * open expr;               should return '$'.expr ideally
11553              */
11554              break;
11555         }
11556         goto do_op;
11557
11558     /* ops where $_ may be an implicit arg */
11559     case OP_TRANS:
11560     case OP_SUBST:
11561     case OP_MATCH:
11562         if ( !(obase->op_flags & OPf_STACKED)) {
11563             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11564                                  ? PAD_SVl(obase->op_targ)
11565                                  : DEFSV))
11566             {
11567                 sv = sv_newmortal();
11568                 sv_setpvn(sv, "$_", 2);
11569                 return sv;
11570             }
11571         }
11572         goto do_op;
11573
11574     case OP_PRTF:
11575     case OP_PRINT:
11576         /* skip filehandle as it can't produce 'undef' warning  */
11577         o = cUNOPx(obase)->op_first;
11578         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11579             o = o->op_sibling->op_sibling;
11580         goto do_op2;
11581
11582
11583     case OP_RV2SV:
11584     case OP_CUSTOM:
11585     case OP_ENTERSUB:
11586         match = 1; /* XS or custom code could trigger random warnings */
11587         goto do_op;
11588
11589     case OP_SCHOMP:
11590     case OP_CHOMP:
11591         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11592             return sv_2mortal(newSVpvn("${$/}", 5));
11593         /* FALL THROUGH */
11594
11595     default:
11596     do_op:
11597         if (!(obase->op_flags & OPf_KIDS))
11598             break;
11599         o = cUNOPx(obase)->op_first;
11600         
11601     do_op2:
11602         if (!o)
11603             break;
11604
11605         /* if all except one arg are constant, or have no side-effects,
11606          * or are optimized away, then it's unambiguous */
11607         o2 = Nullop;
11608         for (kid=o; kid; kid = kid->op_sibling) {
11609             if (kid &&
11610                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11611                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11612                   || (kid->op_type == OP_PUSHMARK)
11613                 )
11614             )
11615                 continue;
11616             if (o2) { /* more than one found */
11617                 o2 = Nullop;
11618                 break;
11619             }
11620             o2 = kid;
11621         }
11622         if (o2)
11623             return find_uninit_var(o2, uninit_sv, match);
11624
11625         /* scan all args */
11626         while (o) {
11627             sv = find_uninit_var(o, uninit_sv, 1);
11628             if (sv)
11629                 return sv;
11630             o = o->op_sibling;
11631         }
11632         break;
11633     }
11634     return Nullsv;
11635 }
11636
11637
11638 /*
11639 =for apidoc report_uninit
11640
11641 Print appropriate "Use of uninitialized variable" warning
11642
11643 =cut
11644 */
11645
11646 void
11647 Perl_report_uninit(pTHX_ SV* uninit_sv)
11648 {
11649     if (PL_op) {
11650         SV* varname = Nullsv;
11651         if (uninit_sv) {
11652             varname = find_uninit_var(PL_op, uninit_sv,0);
11653             if (varname)
11654                 sv_insert(varname, 0, 0, " ", 1);
11655         }
11656         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11657                 varname ? SvPV_nolen_const(varname) : "",
11658                 " in ", OP_DESC(PL_op));
11659     }
11660     else
11661         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11662                     "", "", "");
11663 }
11664
11665 /*
11666  * Local variables:
11667  * c-indentation-style: bsd
11668  * c-basic-offset: 4
11669  * indent-tabs-mode: t
11670  * End:
11671  *
11672  * ex: set ts=8 sts=4 sw=4 noet:
11673  */