d7ed3ea61ffd5ea891ff25cc062dd704a81df256
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = Nullav;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void **arena_root   = &PL_body_arenaroots[sv_type];
644     void **root         = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void **r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void **thing_copy = (void **)thing;     \
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      + relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
813      - relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      + relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
819      - relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      + relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
835      - relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      + relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
841      - relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126     /* If NV 0.0 is store as all bits 0 then Zero() already creates a correct
1127        0.0 for us.  */
1128         if (old_type_details->zero_nv)
1129             SvNV_set(sv, 0);
1130 #endif
1131
1132         if (new_type == SVt_PVIO)
1133             IoPAGE_LEN(sv)      = 60;
1134         if (old_type < SVt_RV)
1135             SvPV_set(sv, 0);
1136         break;
1137     default:
1138         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1139     }
1140
1141     if (old_type_details->size) {
1142         /* If the old body had an allocated size, then we need to free it.  */
1143 #ifdef PURIFY
1144         my_safefree(old_body);
1145 #else
1146         del_body((void*)((char*)old_body + old_type_details->offset),
1147                  &PL_body_roots[old_type]);
1148 #endif
1149     }
1150 }
1151
1152 /*
1153 =for apidoc sv_backoff
1154
1155 Remove any string offset. You should normally use the C<SvOOK_off> macro
1156 wrapper instead.
1157
1158 =cut
1159 */
1160
1161 int
1162 Perl_sv_backoff(pTHX_ register SV *sv)
1163 {
1164     assert(SvOOK(sv));
1165     assert(SvTYPE(sv) != SVt_PVHV);
1166     assert(SvTYPE(sv) != SVt_PVAV);
1167     if (SvIVX(sv)) {
1168         const char * const s = SvPVX_const(sv);
1169         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1170         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1171         SvIV_set(sv, 0);
1172         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1173     }
1174     SvFLAGS(sv) &= ~SVf_OOK;
1175     return 0;
1176 }
1177
1178 /*
1179 =for apidoc sv_grow
1180
1181 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1182 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1183 Use the C<SvGROW> wrapper instead.
1184
1185 =cut
1186 */
1187
1188 char *
1189 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1190 {
1191     register char *s;
1192
1193 #ifdef HAS_64K_LIMIT
1194     if (newlen >= 0x10000) {
1195         PerlIO_printf(Perl_debug_log,
1196                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1197         my_exit(1);
1198     }
1199 #endif /* HAS_64K_LIMIT */
1200     if (SvROK(sv))
1201         sv_unref(sv);
1202     if (SvTYPE(sv) < SVt_PV) {
1203         sv_upgrade(sv, SVt_PV);
1204         s = SvPVX_mutable(sv);
1205     }
1206     else if (SvOOK(sv)) {       /* pv is offset? */
1207         sv_backoff(sv);
1208         s = SvPVX_mutable(sv);
1209         if (newlen > SvLEN(sv))
1210             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1211 #ifdef HAS_64K_LIMIT
1212         if (newlen >= 0x10000)
1213             newlen = 0xFFFF;
1214 #endif
1215     }
1216     else
1217         s = SvPVX_mutable(sv);
1218
1219     if (newlen > SvLEN(sv)) {           /* need more room? */
1220         newlen = PERL_STRLEN_ROUNDUP(newlen);
1221         if (SvLEN(sv) && s) {
1222 #ifdef MYMALLOC
1223             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1224             if (newlen <= l) {
1225                 SvLEN_set(sv, l);
1226                 return s;
1227             } else
1228 #endif
1229             s = saferealloc(s, newlen);
1230         }
1231         else {
1232             s = safemalloc(newlen);
1233             if (SvPVX_const(sv) && SvCUR(sv)) {
1234                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1235             }
1236         }
1237         SvPV_set(sv, s);
1238         SvLEN_set(sv, newlen);
1239     }
1240     return s;
1241 }
1242
1243 /*
1244 =for apidoc sv_setiv
1245
1246 Copies an integer into the given SV, upgrading first if necessary.
1247 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1248
1249 =cut
1250 */
1251
1252 void
1253 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1254 {
1255     SV_CHECK_THINKFIRST_COW_DROP(sv);
1256     switch (SvTYPE(sv)) {
1257     case SVt_NULL:
1258         sv_upgrade(sv, SVt_IV);
1259         break;
1260     case SVt_NV:
1261         sv_upgrade(sv, SVt_PVNV);
1262         break;
1263     case SVt_RV:
1264     case SVt_PV:
1265         sv_upgrade(sv, SVt_PVIV);
1266         break;
1267
1268     case SVt_PVGV:
1269     case SVt_PVAV:
1270     case SVt_PVHV:
1271     case SVt_PVCV:
1272     case SVt_PVFM:
1273     case SVt_PVIO:
1274         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1275                    OP_DESC(PL_op));
1276     }
1277     (void)SvIOK_only(sv);                       /* validate number */
1278     SvIV_set(sv, i);
1279     SvTAINT(sv);
1280 }
1281
1282 /*
1283 =for apidoc sv_setiv_mg
1284
1285 Like C<sv_setiv>, but also handles 'set' magic.
1286
1287 =cut
1288 */
1289
1290 void
1291 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1292 {
1293     sv_setiv(sv,i);
1294     SvSETMAGIC(sv);
1295 }
1296
1297 /*
1298 =for apidoc sv_setuv
1299
1300 Copies an unsigned integer into the given SV, upgrading first if necessary.
1301 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1302
1303 =cut
1304 */
1305
1306 void
1307 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1308 {
1309     /* With these two if statements:
1310        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1311
1312        without
1313        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1314
1315        If you wish to remove them, please benchmark to see what the effect is
1316     */
1317     if (u <= (UV)IV_MAX) {
1318        sv_setiv(sv, (IV)u);
1319        return;
1320     }
1321     sv_setiv(sv, 0);
1322     SvIsUV_on(sv);
1323     SvUV_set(sv, u);
1324 }
1325
1326 /*
1327 =for apidoc sv_setuv_mg
1328
1329 Like C<sv_setuv>, but also handles 'set' magic.
1330
1331 =cut
1332 */
1333
1334 void
1335 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1336 {
1337     sv_setiv(sv, 0);
1338     SvIsUV_on(sv);
1339     sv_setuv(sv,u);
1340     SvSETMAGIC(sv);
1341 }
1342
1343 /*
1344 =for apidoc sv_setnv
1345
1346 Copies a double into the given SV, upgrading first if necessary.
1347 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1354 {
1355     SV_CHECK_THINKFIRST_COW_DROP(sv);
1356     switch (SvTYPE(sv)) {
1357     case SVt_NULL:
1358     case SVt_IV:
1359         sv_upgrade(sv, SVt_NV);
1360         break;
1361     case SVt_RV:
1362     case SVt_PV:
1363     case SVt_PVIV:
1364         sv_upgrade(sv, SVt_PVNV);
1365         break;
1366
1367     case SVt_PVGV:
1368     case SVt_PVAV:
1369     case SVt_PVHV:
1370     case SVt_PVCV:
1371     case SVt_PVFM:
1372     case SVt_PVIO:
1373         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1374                    OP_NAME(PL_op));
1375     }
1376     SvNV_set(sv, num);
1377     (void)SvNOK_only(sv);                       /* validate number */
1378     SvTAINT(sv);
1379 }
1380
1381 /*
1382 =for apidoc sv_setnv_mg
1383
1384 Like C<sv_setnv>, but also handles 'set' magic.
1385
1386 =cut
1387 */
1388
1389 void
1390 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1391 {
1392     sv_setnv(sv,num);
1393     SvSETMAGIC(sv);
1394 }
1395
1396 /* Print an "isn't numeric" warning, using a cleaned-up,
1397  * printable version of the offending string
1398  */
1399
1400 STATIC void
1401 S_not_a_number(pTHX_ SV *sv)
1402 {
1403      SV *dsv;
1404      char tmpbuf[64];
1405      const char *pv;
1406
1407      if (DO_UTF8(sv)) {
1408           dsv = sv_2mortal(newSVpvn("", 0));
1409           pv = sv_uni_display(dsv, sv, 10, 0);
1410      } else {
1411           char *d = tmpbuf;
1412           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1413           /* each *s can expand to 4 chars + "...\0",
1414              i.e. need room for 8 chars */
1415         
1416           const char *s, *end;
1417           for (s = SvPVX_const(sv), end = s + SvCUR(sv); s < end && d < limit;
1418                s++) {
1419                int ch = *s & 0xFF;
1420                if (ch & 128 && !isPRINT_LC(ch)) {
1421                     *d++ = 'M';
1422                     *d++ = '-';
1423                     ch &= 127;
1424                }
1425                if (ch == '\n') {
1426                     *d++ = '\\';
1427                     *d++ = 'n';
1428                }
1429                else if (ch == '\r') {
1430                     *d++ = '\\';
1431                     *d++ = 'r';
1432                }
1433                else if (ch == '\f') {
1434                     *d++ = '\\';
1435                     *d++ = 'f';
1436                }
1437                else if (ch == '\\') {
1438                     *d++ = '\\';
1439                     *d++ = '\\';
1440                }
1441                else if (ch == '\0') {
1442                     *d++ = '\\';
1443                     *d++ = '0';
1444                }
1445                else if (isPRINT_LC(ch))
1446                     *d++ = ch;
1447                else {
1448                     *d++ = '^';
1449                     *d++ = toCTRL(ch);
1450                }
1451           }
1452           if (s < end) {
1453                *d++ = '.';
1454                *d++ = '.';
1455                *d++ = '.';
1456           }
1457           *d = '\0';
1458           pv = tmpbuf;
1459     }
1460
1461     if (PL_op)
1462         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1463                     "Argument \"%s\" isn't numeric in %s", pv,
1464                     OP_DESC(PL_op));
1465     else
1466         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1467                     "Argument \"%s\" isn't numeric", pv);
1468 }
1469
1470 /*
1471 =for apidoc looks_like_number
1472
1473 Test if the content of an SV looks like a number (or is a number).
1474 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1475 non-numeric warning), even if your atof() doesn't grok them.
1476
1477 =cut
1478 */
1479
1480 I32
1481 Perl_looks_like_number(pTHX_ SV *sv)
1482 {
1483     register const char *sbegin;
1484     STRLEN len;
1485
1486     if (SvPOK(sv)) {
1487         sbegin = SvPVX_const(sv);
1488         len = SvCUR(sv);
1489     }
1490     else if (SvPOKp(sv))
1491         sbegin = SvPV_const(sv, len);
1492     else
1493         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1494     return grok_number(sbegin, len, NULL);
1495 }
1496
1497 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1498    until proven guilty, assume that things are not that bad... */
1499
1500 /*
1501    NV_PRESERVES_UV:
1502
1503    As 64 bit platforms often have an NV that doesn't preserve all bits of
1504    an IV (an assumption perl has been based on to date) it becomes necessary
1505    to remove the assumption that the NV always carries enough precision to
1506    recreate the IV whenever needed, and that the NV is the canonical form.
1507    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1508    precision as a side effect of conversion (which would lead to insanity
1509    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1510    1) to distinguish between IV/UV/NV slots that have cached a valid
1511       conversion where precision was lost and IV/UV/NV slots that have a
1512       valid conversion which has lost no precision
1513    2) to ensure that if a numeric conversion to one form is requested that
1514       would lose precision, the precise conversion (or differently
1515       imprecise conversion) is also performed and cached, to prevent
1516       requests for different numeric formats on the same SV causing
1517       lossy conversion chains. (lossless conversion chains are perfectly
1518       acceptable (still))
1519
1520
1521    flags are used:
1522    SvIOKp is true if the IV slot contains a valid value
1523    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1524    SvNOKp is true if the NV slot contains a valid value
1525    SvNOK  is true only if the NV value is accurate
1526
1527    so
1528    while converting from PV to NV, check to see if converting that NV to an
1529    IV(or UV) would lose accuracy over a direct conversion from PV to
1530    IV(or UV). If it would, cache both conversions, return NV, but mark
1531    SV as IOK NOKp (ie not NOK).
1532
1533    While converting from PV to IV, check to see if converting that IV to an
1534    NV would lose accuracy over a direct conversion from PV to NV. If it
1535    would, cache both conversions, flag similarly.
1536
1537    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1538    correctly because if IV & NV were set NV *always* overruled.
1539    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1540    changes - now IV and NV together means that the two are interchangeable:
1541    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1542
1543    The benefit of this is that operations such as pp_add know that if
1544    SvIOK is true for both left and right operands, then integer addition
1545    can be used instead of floating point (for cases where the result won't
1546    overflow). Before, floating point was always used, which could lead to
1547    loss of precision compared with integer addition.
1548
1549    * making IV and NV equal status should make maths accurate on 64 bit
1550      platforms
1551    * may speed up maths somewhat if pp_add and friends start to use
1552      integers when possible instead of fp. (Hopefully the overhead in
1553      looking for SvIOK and checking for overflow will not outweigh the
1554      fp to integer speedup)
1555    * will slow down integer operations (callers of SvIV) on "inaccurate"
1556      values, as the change from SvIOK to SvIOKp will cause a call into
1557      sv_2iv each time rather than a macro access direct to the IV slot
1558    * should speed up number->string conversion on integers as IV is
1559      favoured when IV and NV are equally accurate
1560
1561    ####################################################################
1562    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1563    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1564    On the other hand, SvUOK is true iff UV.
1565    ####################################################################
1566
1567    Your mileage will vary depending your CPU's relative fp to integer
1568    performance ratio.
1569 */
1570
1571 #ifndef NV_PRESERVES_UV
1572 #  define IS_NUMBER_UNDERFLOW_IV 1
1573 #  define IS_NUMBER_UNDERFLOW_UV 2
1574 #  define IS_NUMBER_IV_AND_UV    2
1575 #  define IS_NUMBER_OVERFLOW_IV  4
1576 #  define IS_NUMBER_OVERFLOW_UV  5
1577
1578 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1579
1580 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1581 STATIC int
1582 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1583 {
1584     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1585     if (SvNVX(sv) < (NV)IV_MIN) {
1586         (void)SvIOKp_on(sv);
1587         (void)SvNOK_on(sv);
1588         SvIV_set(sv, IV_MIN);
1589         return IS_NUMBER_UNDERFLOW_IV;
1590     }
1591     if (SvNVX(sv) > (NV)UV_MAX) {
1592         (void)SvIOKp_on(sv);
1593         (void)SvNOK_on(sv);
1594         SvIsUV_on(sv);
1595         SvUV_set(sv, UV_MAX);
1596         return IS_NUMBER_OVERFLOW_UV;
1597     }
1598     (void)SvIOKp_on(sv);
1599     (void)SvNOK_on(sv);
1600     /* Can't use strtol etc to convert this string.  (See truth table in
1601        sv_2iv  */
1602     if (SvNVX(sv) <= (UV)IV_MAX) {
1603         SvIV_set(sv, I_V(SvNVX(sv)));
1604         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1605             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1606         } else {
1607             /* Integer is imprecise. NOK, IOKp */
1608         }
1609         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1610     }
1611     SvIsUV_on(sv);
1612     SvUV_set(sv, U_V(SvNVX(sv)));
1613     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1614         if (SvUVX(sv) == UV_MAX) {
1615             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1616                possibly be preserved by NV. Hence, it must be overflow.
1617                NOK, IOKp */
1618             return IS_NUMBER_OVERFLOW_UV;
1619         }
1620         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1621     } else {
1622         /* Integer is imprecise. NOK, IOKp */
1623     }
1624     return IS_NUMBER_OVERFLOW_IV;
1625 }
1626 #endif /* !NV_PRESERVES_UV*/
1627
1628 /*
1629 =for apidoc sv_2iv_flags
1630
1631 Return the integer value of an SV, doing any necessary string
1632 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1633 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1634
1635 =cut
1636 */
1637
1638 IV
1639 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1640 {
1641     if (!sv)
1642         return 0;
1643     if (SvGMAGICAL(sv)) {
1644         if (flags & SV_GMAGIC)
1645             mg_get(sv);
1646         if (SvIOKp(sv))
1647             return SvIVX(sv);
1648         if (SvNOKp(sv)) {
1649             return I_V(SvNVX(sv));
1650         }
1651         if (SvPOKp(sv) && SvLEN(sv))
1652             return asIV(sv);
1653         if (!SvROK(sv)) {
1654             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1655                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1656                     report_uninit(sv);
1657             }
1658             return 0;
1659         }
1660     }
1661     if (SvTHINKFIRST(sv)) {
1662         if (SvROK(sv)) {
1663             if (SvAMAGIC(sv)) {
1664                 SV * const tmpstr=AMG_CALLun(sv,numer);
1665                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1666                     return SvIV(tmpstr);
1667                 }
1668             }
1669             return PTR2IV(SvRV(sv));
1670         }
1671         if (SvIsCOW(sv)) {
1672             sv_force_normal_flags(sv, 0);
1673         }
1674         if (SvREADONLY(sv) && !SvOK(sv)) {
1675             if (ckWARN(WARN_UNINITIALIZED))
1676                 report_uninit(sv);
1677             return 0;
1678         }
1679     }
1680     if (SvIOKp(sv)) {
1681         if (SvIsUV(sv)) {
1682             return (IV)(SvUVX(sv));
1683         }
1684         else {
1685             return SvIVX(sv);
1686         }
1687     }
1688     if (SvNOKp(sv)) {
1689         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1690          * without also getting a cached IV/UV from it at the same time
1691          * (ie PV->NV conversion should detect loss of accuracy and cache
1692          * IV or UV at same time to avoid this.  NWC */
1693
1694         if (SvTYPE(sv) == SVt_NV)
1695             sv_upgrade(sv, SVt_PVNV);
1696
1697         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1698         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1699            certainly cast into the IV range at IV_MAX, whereas the correct
1700            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1701            cases go to UV */
1702         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1703             SvIV_set(sv, I_V(SvNVX(sv)));
1704             if (SvNVX(sv) == (NV) SvIVX(sv)
1705 #ifndef NV_PRESERVES_UV
1706                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1707                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1708                 /* Don't flag it as "accurately an integer" if the number
1709                    came from a (by definition imprecise) NV operation, and
1710                    we're outside the range of NV integer precision */
1711 #endif
1712                 ) {
1713                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1714                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1715                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1716                                       PTR2UV(sv),
1717                                       SvNVX(sv),
1718                                       SvIVX(sv)));
1719
1720             } else {
1721                 /* IV not precise.  No need to convert from PV, as NV
1722                    conversion would already have cached IV if it detected
1723                    that PV->IV would be better than PV->NV->IV
1724                    flags already correct - don't set public IOK.  */
1725                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1726                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1727                                       PTR2UV(sv),
1728                                       SvNVX(sv),
1729                                       SvIVX(sv)));
1730             }
1731             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1732                but the cast (NV)IV_MIN rounds to a the value less (more
1733                negative) than IV_MIN which happens to be equal to SvNVX ??
1734                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1735                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1736                (NV)UVX == NVX are both true, but the values differ. :-(
1737                Hopefully for 2s complement IV_MIN is something like
1738                0x8000000000000000 which will be exact. NWC */
1739         }
1740         else {
1741             SvUV_set(sv, U_V(SvNVX(sv)));
1742             if (
1743                 (SvNVX(sv) == (NV) SvUVX(sv))
1744 #ifndef  NV_PRESERVES_UV
1745                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1746                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1747                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1748                 /* Don't flag it as "accurately an integer" if the number
1749                    came from a (by definition imprecise) NV operation, and
1750                    we're outside the range of NV integer precision */
1751 #endif
1752                 )
1753                 SvIOK_on(sv);
1754             SvIsUV_on(sv);
1755             DEBUG_c(PerlIO_printf(Perl_debug_log,
1756                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1757                                   PTR2UV(sv),
1758                                   SvUVX(sv),
1759                                   SvUVX(sv)));
1760         }
1761     }
1762     else if (SvPOKp(sv) && SvLEN(sv)) {
1763         UV value;
1764         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1765         /* We want to avoid a possible problem when we cache an IV which
1766            may be later translated to an NV, and the resulting NV is not
1767            the same as the direct translation of the initial string
1768            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1769            be careful to ensure that the value with the .456 is around if the
1770            NV value is requested in the future).
1771         
1772            This means that if we cache such an IV, we need to cache the
1773            NV as well.  Moreover, we trade speed for space, and do not
1774            cache the NV if we are sure it's not needed.
1775          */
1776
1777         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1778         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1779              == IS_NUMBER_IN_UV) {
1780             /* It's definitely an integer, only upgrade to PVIV */
1781             if (SvTYPE(sv) < SVt_PVIV)
1782                 sv_upgrade(sv, SVt_PVIV);
1783             (void)SvIOK_on(sv);
1784         } else if (SvTYPE(sv) < SVt_PVNV)
1785             sv_upgrade(sv, SVt_PVNV);
1786
1787         /* If NV preserves UV then we only use the UV value if we know that
1788            we aren't going to call atof() below. If NVs don't preserve UVs
1789            then the value returned may have more precision than atof() will
1790            return, even though value isn't perfectly accurate.  */
1791         if ((numtype & (IS_NUMBER_IN_UV
1792 #ifdef NV_PRESERVES_UV
1793                         | IS_NUMBER_NOT_INT
1794 #endif
1795             )) == IS_NUMBER_IN_UV) {
1796             /* This won't turn off the public IOK flag if it was set above  */
1797             (void)SvIOKp_on(sv);
1798
1799             if (!(numtype & IS_NUMBER_NEG)) {
1800                 /* positive */;
1801                 if (value <= (UV)IV_MAX) {
1802                     SvIV_set(sv, (IV)value);
1803                 } else {
1804                     SvUV_set(sv, value);
1805                     SvIsUV_on(sv);
1806                 }
1807             } else {
1808                 /* 2s complement assumption  */
1809                 if (value <= (UV)IV_MIN) {
1810                     SvIV_set(sv, -(IV)value);
1811                 } else {
1812                     /* Too negative for an IV.  This is a double upgrade, but
1813                        I'm assuming it will be rare.  */
1814                     if (SvTYPE(sv) < SVt_PVNV)
1815                         sv_upgrade(sv, SVt_PVNV);
1816                     SvNOK_on(sv);
1817                     SvIOK_off(sv);
1818                     SvIOKp_on(sv);
1819                     SvNV_set(sv, -(NV)value);
1820                     SvIV_set(sv, IV_MIN);
1821                 }
1822             }
1823         }
1824         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1825            will be in the previous block to set the IV slot, and the next
1826            block to set the NV slot.  So no else here.  */
1827         
1828         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1829             != IS_NUMBER_IN_UV) {
1830             /* It wasn't an (integer that doesn't overflow the UV). */
1831             SvNV_set(sv, Atof(SvPVX_const(sv)));
1832
1833             if (! numtype && ckWARN(WARN_NUMERIC))
1834                 not_a_number(sv);
1835
1836 #if defined(USE_LONG_DOUBLE)
1837             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1838                                   PTR2UV(sv), SvNVX(sv)));
1839 #else
1840             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1841                                   PTR2UV(sv), SvNVX(sv)));
1842 #endif
1843
1844
1845 #ifdef NV_PRESERVES_UV
1846             (void)SvIOKp_on(sv);
1847             (void)SvNOK_on(sv);
1848             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1849                 SvIV_set(sv, I_V(SvNVX(sv)));
1850                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1851                     SvIOK_on(sv);
1852                 } else {
1853                     /* Integer is imprecise. NOK, IOKp */
1854                 }
1855                 /* UV will not work better than IV */
1856             } else {
1857                 if (SvNVX(sv) > (NV)UV_MAX) {
1858                     SvIsUV_on(sv);
1859                     /* Integer is inaccurate. NOK, IOKp, is UV */
1860                     SvUV_set(sv, UV_MAX);
1861                     SvIsUV_on(sv);
1862                 } else {
1863                     SvUV_set(sv, U_V(SvNVX(sv)));
1864                     /* 0xFFFFFFFFFFFFFFFF not an issue in here */
1865                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1866                         SvIOK_on(sv);
1867                         SvIsUV_on(sv);
1868                     } else {
1869                         /* Integer is imprecise. NOK, IOKp, is UV */
1870                         SvIsUV_on(sv);
1871                     }
1872                 }
1873             }
1874 #else /* NV_PRESERVES_UV */
1875             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1876                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1877                 /* The IV slot will have been set from value returned by
1878                    grok_number above.  The NV slot has just been set using
1879                    Atof.  */
1880                 SvNOK_on(sv);
1881                 assert (SvIOKp(sv));
1882             } else {
1883                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1884                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1885                     /* Small enough to preserve all bits. */
1886                     (void)SvIOKp_on(sv);
1887                     SvNOK_on(sv);
1888                     SvIV_set(sv, I_V(SvNVX(sv)));
1889                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1890                         SvIOK_on(sv);
1891                     /* Assumption: first non-preserved integer is < IV_MAX,
1892                        this NV is in the preserved range, therefore: */
1893                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1894                           < (UV)IV_MAX)) {
1895                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1896                     }
1897                 } else {
1898                     /* IN_UV NOT_INT
1899                          0      0       already failed to read UV.
1900                          0      1       already failed to read UV.
1901                          1      0       you won't get here in this case. IV/UV
1902                                         slot set, public IOK, Atof() unneeded.
1903                          1      1       already read UV.
1904                        so there's no point in sv_2iuv_non_preserve() attempting
1905                        to use atol, strtol, strtoul etc.  */
1906                     sv_2iuv_non_preserve (sv, numtype);
1907                 }
1908             }
1909 #endif /* NV_PRESERVES_UV */
1910         }
1911     } else  {
1912         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
1913             report_uninit(sv);
1914         if (SvTYPE(sv) < SVt_IV)
1915             /* Typically the caller expects that sv_any is not NULL now.  */
1916             sv_upgrade(sv, SVt_IV);
1917         return 0;
1918     }
1919     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1920         PTR2UV(sv),SvIVX(sv)));
1921     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1922 }
1923
1924 /*
1925 =for apidoc sv_2uv_flags
1926
1927 Return the unsigned integer value of an SV, doing any necessary string
1928 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1929 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1930
1931 =cut
1932 */
1933
1934 UV
1935 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1936 {
1937     if (!sv)
1938         return 0;
1939     if (SvGMAGICAL(sv)) {
1940         if (flags & SV_GMAGIC)
1941             mg_get(sv);
1942         if (SvIOKp(sv))
1943             return SvUVX(sv);
1944         if (SvNOKp(sv))
1945             return U_V(SvNVX(sv));
1946         if (SvPOKp(sv) && SvLEN(sv))
1947             return asUV(sv);
1948         if (!SvROK(sv)) {
1949             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1950                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1951                     report_uninit(sv);
1952             }
1953             return 0;
1954         }
1955     }
1956     if (SvTHINKFIRST(sv)) {
1957         if (SvROK(sv)) {
1958           SV* tmpstr;
1959           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
1960                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
1961               return SvUV(tmpstr);
1962           return PTR2UV(SvRV(sv));
1963         }
1964         if (SvIsCOW(sv)) {
1965             sv_force_normal_flags(sv, 0);
1966         }
1967         if (SvREADONLY(sv) && !SvOK(sv)) {
1968             if (ckWARN(WARN_UNINITIALIZED))
1969                 report_uninit(sv);
1970             return 0;
1971         }
1972     }
1973     if (SvIOKp(sv)) {
1974         if (SvIsUV(sv)) {
1975             return SvUVX(sv);
1976         }
1977         else {
1978             return (UV)SvIVX(sv);
1979         }
1980     }
1981     if (SvNOKp(sv)) {
1982         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1983          * without also getting a cached IV/UV from it at the same time
1984          * (ie PV->NV conversion should detect loss of accuracy and cache
1985          * IV or UV at same time to avoid this. */
1986         /* IV-over-UV optimisation - choose to cache IV if possible */
1987
1988         if (SvTYPE(sv) == SVt_NV)
1989             sv_upgrade(sv, SVt_PVNV);
1990
1991         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1992         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1993             SvIV_set(sv, I_V(SvNVX(sv)));
1994             if (SvNVX(sv) == (NV) SvIVX(sv)
1995 #ifndef NV_PRESERVES_UV
1996                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1997                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1998                 /* Don't flag it as "accurately an integer" if the number
1999                    came from a (by definition imprecise) NV operation, and
2000                    we're outside the range of NV integer precision */
2001 #endif
2002                 ) {
2003                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
2004                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2005                                       "0x%"UVxf" uv(%"NVgf" => %"IVdf") (precise)\n",
2006                                       PTR2UV(sv),
2007                                       SvNVX(sv),
2008                                       SvIVX(sv)));
2009
2010             } else {
2011                 /* IV not precise.  No need to convert from PV, as NV
2012                    conversion would already have cached IV if it detected
2013                    that PV->IV would be better than PV->NV->IV
2014                    flags already correct - don't set public IOK.  */
2015                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2016                                       "0x%"UVxf" uv(%"NVgf" => %"IVdf") (imprecise)\n",
2017                                       PTR2UV(sv),
2018                                       SvNVX(sv),
2019                                       SvIVX(sv)));
2020             }
2021             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
2022                but the cast (NV)IV_MIN rounds to a the value less (more
2023                negative) than IV_MIN which happens to be equal to SvNVX ??
2024                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
2025                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
2026                (NV)UVX == NVX are both true, but the values differ. :-(
2027                Hopefully for 2s complement IV_MIN is something like
2028                0x8000000000000000 which will be exact. NWC */
2029         }
2030         else {
2031             SvUV_set(sv, U_V(SvNVX(sv)));
2032             if (
2033                 (SvNVX(sv) == (NV) SvUVX(sv))
2034 #ifndef  NV_PRESERVES_UV
2035                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
2036                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
2037                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
2038                 /* Don't flag it as "accurately an integer" if the number
2039                    came from a (by definition imprecise) NV operation, and
2040                    we're outside the range of NV integer precision */
2041 #endif
2042                 )
2043                 SvIOK_on(sv);
2044             SvIsUV_on(sv);
2045             DEBUG_c(PerlIO_printf(Perl_debug_log,
2046                                   "0x%"UVxf" 2uv(%"UVuf" => %"IVdf") (as unsigned)\n",
2047                                   PTR2UV(sv),
2048                                   SvUVX(sv),
2049                                   SvUVX(sv)));
2050         }
2051     }
2052     else if (SvPOKp(sv) && SvLEN(sv)) {
2053         UV value;
2054         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2055
2056         /* We want to avoid a possible problem when we cache a UV which
2057            may be later translated to an NV, and the resulting NV is not
2058            the translation of the initial data.
2059         
2060            This means that if we cache such a UV, we need to cache the
2061            NV as well.  Moreover, we trade speed for space, and do not
2062            cache the NV if not needed.
2063          */
2064
2065         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
2066         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2067              == IS_NUMBER_IN_UV) {
2068             /* It's definitely an integer, only upgrade to PVIV */
2069             if (SvTYPE(sv) < SVt_PVIV)
2070                 sv_upgrade(sv, SVt_PVIV);
2071             (void)SvIOK_on(sv);
2072         } else if (SvTYPE(sv) < SVt_PVNV)
2073             sv_upgrade(sv, SVt_PVNV);
2074
2075         /* If NV preserves UV then we only use the UV value if we know that
2076            we aren't going to call atof() below. If NVs don't preserve UVs
2077            then the value returned may have more precision than atof() will
2078            return, even though it isn't accurate.  */
2079         if ((numtype & (IS_NUMBER_IN_UV
2080 #ifdef NV_PRESERVES_UV
2081                         | IS_NUMBER_NOT_INT
2082 #endif
2083             )) == IS_NUMBER_IN_UV) {
2084             /* This won't turn off the public IOK flag if it was set above  */
2085             (void)SvIOKp_on(sv);
2086
2087             if (!(numtype & IS_NUMBER_NEG)) {
2088                 /* positive */;
2089                 if (value <= (UV)IV_MAX) {
2090                     SvIV_set(sv, (IV)value);
2091                 } else {
2092                     /* it didn't overflow, and it was positive. */
2093                     SvUV_set(sv, value);
2094                     SvIsUV_on(sv);
2095                 }
2096             } else {
2097                 /* 2s complement assumption  */
2098                 if (value <= (UV)IV_MIN) {
2099                     SvIV_set(sv, -(IV)value);
2100                 } else {
2101                     /* Too negative for an IV.  This is a double upgrade, but
2102                        I'm assuming it will be rare.  */
2103                     if (SvTYPE(sv) < SVt_PVNV)
2104                         sv_upgrade(sv, SVt_PVNV);
2105                     SvNOK_on(sv);
2106                     SvIOK_off(sv);
2107                     SvIOKp_on(sv);
2108                     SvNV_set(sv, -(NV)value);
2109                     SvIV_set(sv, IV_MIN);
2110                 }
2111             }
2112         }
2113         
2114         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2115             != IS_NUMBER_IN_UV) {
2116             /* It wasn't an integer, or it overflowed the UV. */
2117             SvNV_set(sv, Atof(SvPVX_const(sv)));
2118
2119             if (! numtype && ckWARN(WARN_NUMERIC))
2120                     not_a_number(sv);
2121
2122 #if defined(USE_LONG_DOUBLE)
2123             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%" PERL_PRIgldbl ")\n",
2124                                   PTR2UV(sv), SvNVX(sv)));
2125 #else
2126             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"NVgf")\n",
2127                                   PTR2UV(sv), SvNVX(sv)));
2128 #endif
2129
2130 #ifdef NV_PRESERVES_UV
2131             (void)SvIOKp_on(sv);
2132             (void)SvNOK_on(sv);
2133             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2134                 SvIV_set(sv, I_V(SvNVX(sv)));
2135                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
2136                     SvIOK_on(sv);
2137                 } else {
2138                     /* Integer is imprecise. NOK, IOKp */
2139                 }
2140                 /* UV will not work better than IV */
2141             } else {
2142                 if (SvNVX(sv) > (NV)UV_MAX) {
2143                     SvIsUV_on(sv);
2144                     /* Integer is inaccurate. NOK, IOKp, is UV */
2145                     SvUV_set(sv, UV_MAX);
2146                     SvIsUV_on(sv);
2147                 } else {
2148                     SvUV_set(sv, U_V(SvNVX(sv)));
2149                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
2150                        NV preservse UV so can do correct comparison.  */
2151                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
2152                         SvIOK_on(sv);
2153                         SvIsUV_on(sv);
2154                     } else {
2155                         /* Integer is imprecise. NOK, IOKp, is UV */
2156                         SvIsUV_on(sv);
2157                     }
2158                 }
2159             }
2160 #else /* NV_PRESERVES_UV */
2161             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2162                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
2163                 /* The UV slot will have been set from value returned by
2164                    grok_number above.  The NV slot has just been set using
2165                    Atof.  */
2166                 SvNOK_on(sv);
2167                 assert (SvIOKp(sv));
2168             } else {
2169                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
2170                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2171                     /* Small enough to preserve all bits. */
2172                     (void)SvIOKp_on(sv);
2173                     SvNOK_on(sv);
2174                     SvIV_set(sv, I_V(SvNVX(sv)));
2175                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
2176                         SvIOK_on(sv);
2177                     /* Assumption: first non-preserved integer is < IV_MAX,
2178                        this NV is in the preserved range, therefore: */
2179                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
2180                           < (UV)IV_MAX)) {
2181                         Perl_croak(aTHX_ "sv_2uv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
2182                     }
2183                 } else
2184                     sv_2iuv_non_preserve (sv, numtype);
2185             }
2186 #endif /* NV_PRESERVES_UV */
2187         }
2188     }
2189     else  {
2190         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2191             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2192                 report_uninit(sv);
2193         }
2194         if (SvTYPE(sv) < SVt_IV)
2195             /* Typically the caller expects that sv_any is not NULL now.  */
2196             sv_upgrade(sv, SVt_IV);
2197         return 0;
2198     }
2199
2200     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2201                           PTR2UV(sv),SvUVX(sv)));
2202     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2203 }
2204
2205 /*
2206 =for apidoc sv_2nv
2207
2208 Return the num value of an SV, doing any necessary string or integer
2209 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2210 macros.
2211
2212 =cut
2213 */
2214
2215 NV
2216 Perl_sv_2nv(pTHX_ register SV *sv)
2217 {
2218     if (!sv)
2219         return 0.0;
2220     if (SvGMAGICAL(sv)) {
2221         mg_get(sv);
2222         if (SvNOKp(sv))
2223             return SvNVX(sv);
2224         if (SvPOKp(sv) && SvLEN(sv)) {
2225             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2226                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2227                 not_a_number(sv);
2228             return Atof(SvPVX_const(sv));
2229         }
2230         if (SvIOKp(sv)) {
2231             if (SvIsUV(sv))
2232                 return (NV)SvUVX(sv);
2233             else
2234                 return (NV)SvIVX(sv);
2235         }       
2236         if (!SvROK(sv)) {
2237             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2238                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2239                     report_uninit(sv);
2240             }
2241             return (NV)0;
2242         }
2243     }
2244     if (SvTHINKFIRST(sv)) {
2245         if (SvROK(sv)) {
2246           SV* tmpstr;
2247           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
2248                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
2249               return SvNV(tmpstr);
2250           return PTR2NV(SvRV(sv));
2251         }
2252         if (SvIsCOW(sv)) {
2253             sv_force_normal_flags(sv, 0);
2254         }
2255         if (SvREADONLY(sv) && !SvOK(sv)) {
2256             if (ckWARN(WARN_UNINITIALIZED))
2257                 report_uninit(sv);
2258             return 0.0;
2259         }
2260     }
2261     if (SvTYPE(sv) < SVt_NV) {
2262         if (SvTYPE(sv) == SVt_IV)
2263             sv_upgrade(sv, SVt_PVNV);
2264         else
2265             sv_upgrade(sv, SVt_NV);
2266 #ifdef USE_LONG_DOUBLE
2267         DEBUG_c({
2268             STORE_NUMERIC_LOCAL_SET_STANDARD();
2269             PerlIO_printf(Perl_debug_log,
2270                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2271                           PTR2UV(sv), SvNVX(sv));
2272             RESTORE_NUMERIC_LOCAL();
2273         });
2274 #else
2275         DEBUG_c({
2276             STORE_NUMERIC_LOCAL_SET_STANDARD();
2277             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2278                           PTR2UV(sv), SvNVX(sv));
2279             RESTORE_NUMERIC_LOCAL();
2280         });
2281 #endif
2282     }
2283     else if (SvTYPE(sv) < SVt_PVNV)
2284         sv_upgrade(sv, SVt_PVNV);
2285     if (SvNOKp(sv)) {
2286         return SvNVX(sv);
2287     }
2288     if (SvIOKp(sv)) {
2289         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2290 #ifdef NV_PRESERVES_UV
2291         SvNOK_on(sv);
2292 #else
2293         /* Only set the public NV OK flag if this NV preserves the IV  */
2294         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2295         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2296                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2297             SvNOK_on(sv);
2298         else
2299             SvNOKp_on(sv);
2300 #endif
2301     }
2302     else if (SvPOKp(sv) && SvLEN(sv)) {
2303         UV value;
2304         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2305         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2306             not_a_number(sv);
2307 #ifdef NV_PRESERVES_UV
2308         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2309             == IS_NUMBER_IN_UV) {
2310             /* It's definitely an integer */
2311             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2312         } else
2313             SvNV_set(sv, Atof(SvPVX_const(sv)));
2314         SvNOK_on(sv);
2315 #else
2316         SvNV_set(sv, Atof(SvPVX_const(sv)));
2317         /* Only set the public NV OK flag if this NV preserves the value in
2318            the PV at least as well as an IV/UV would.
2319            Not sure how to do this 100% reliably. */
2320         /* if that shift count is out of range then Configure's test is
2321            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2322            UV_BITS */
2323         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2324             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2325             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2326         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2327             /* Can't use strtol etc to convert this string, so don't try.
2328                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2329             SvNOK_on(sv);
2330         } else {
2331             /* value has been set.  It may not be precise.  */
2332             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2333                 /* 2s complement assumption for (UV)IV_MIN  */
2334                 SvNOK_on(sv); /* Integer is too negative.  */
2335             } else {
2336                 SvNOKp_on(sv);
2337                 SvIOKp_on(sv);
2338
2339                 if (numtype & IS_NUMBER_NEG) {
2340                     SvIV_set(sv, -(IV)value);
2341                 } else if (value <= (UV)IV_MAX) {
2342                     SvIV_set(sv, (IV)value);
2343                 } else {
2344                     SvUV_set(sv, value);
2345                     SvIsUV_on(sv);
2346                 }
2347
2348                 if (numtype & IS_NUMBER_NOT_INT) {
2349                     /* I believe that even if the original PV had decimals,
2350                        they are lost beyond the limit of the FP precision.
2351                        However, neither is canonical, so both only get p
2352                        flags.  NWC, 2000/11/25 */
2353                     /* Both already have p flags, so do nothing */
2354                 } else {
2355                     const NV nv = SvNVX(sv);
2356                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2357                         if (SvIVX(sv) == I_V(nv)) {
2358                             SvNOK_on(sv);
2359                             SvIOK_on(sv);
2360                         } else {
2361                             SvIOK_on(sv);
2362                             /* It had no "." so it must be integer.  */
2363                         }
2364                     } else {
2365                         /* between IV_MAX and NV(UV_MAX).
2366                            Could be slightly > UV_MAX */
2367
2368                         if (numtype & IS_NUMBER_NOT_INT) {
2369                             /* UV and NV both imprecise.  */
2370                         } else {
2371                             const UV nv_as_uv = U_V(nv);
2372
2373                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2374                                 SvNOK_on(sv);
2375                                 SvIOK_on(sv);
2376                             } else {
2377                                 SvIOK_on(sv);
2378                             }
2379                         }
2380                     }
2381                 }
2382             }
2383         }
2384 #endif /* NV_PRESERVES_UV */
2385     }
2386     else  {
2387         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2388             report_uninit(sv);
2389         if (SvTYPE(sv) < SVt_NV)
2390             /* Typically the caller expects that sv_any is not NULL now.  */
2391             /* XXX Ilya implies that this is a bug in callers that assume this
2392                and ideally should be fixed.  */
2393             sv_upgrade(sv, SVt_NV);
2394         return 0.0;
2395     }
2396 #if defined(USE_LONG_DOUBLE)
2397     DEBUG_c({
2398         STORE_NUMERIC_LOCAL_SET_STANDARD();
2399         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2400                       PTR2UV(sv), SvNVX(sv));
2401         RESTORE_NUMERIC_LOCAL();
2402     });
2403 #else
2404     DEBUG_c({
2405         STORE_NUMERIC_LOCAL_SET_STANDARD();
2406         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2407                       PTR2UV(sv), SvNVX(sv));
2408         RESTORE_NUMERIC_LOCAL();
2409     });
2410 #endif
2411     return SvNVX(sv);
2412 }
2413
2414 /* asIV(): extract an integer from the string value of an SV.
2415  * Caller must validate PVX  */
2416
2417 STATIC IV
2418 S_asIV(pTHX_ SV *sv)
2419 {
2420     UV value;
2421     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2422
2423     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2424         == IS_NUMBER_IN_UV) {
2425         /* It's definitely an integer */
2426         if (numtype & IS_NUMBER_NEG) {
2427             if (value < (UV)IV_MIN)
2428                 return -(IV)value;
2429         } else {
2430             if (value < (UV)IV_MAX)
2431                 return (IV)value;
2432         }
2433     }
2434     if (!numtype) {
2435         if (ckWARN(WARN_NUMERIC))
2436             not_a_number(sv);
2437     }
2438     return I_V(Atof(SvPVX_const(sv)));
2439 }
2440
2441 /* asUV(): extract an unsigned integer from the string value of an SV
2442  * Caller must validate PVX  */
2443
2444 STATIC UV
2445 S_asUV(pTHX_ SV *sv)
2446 {
2447     UV value;
2448     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2449
2450     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2451         == IS_NUMBER_IN_UV) {
2452         /* It's definitely an integer */
2453         if (!(numtype & IS_NUMBER_NEG))
2454             return value;
2455     }
2456     if (!numtype) {
2457         if (ckWARN(WARN_NUMERIC))
2458             not_a_number(sv);
2459     }
2460     return U_V(Atof(SvPVX_const(sv)));
2461 }
2462
2463 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2464  * UV as a string towards the end of buf, and return pointers to start and
2465  * end of it.
2466  *
2467  * We assume that buf is at least TYPE_CHARS(UV) long.
2468  */
2469
2470 static char *
2471 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2472 {
2473     char *ptr = buf + TYPE_CHARS(UV);
2474     char * const ebuf = ptr;
2475     int sign;
2476
2477     if (is_uv)
2478         sign = 0;
2479     else if (iv >= 0) {
2480         uv = iv;
2481         sign = 0;
2482     } else {
2483         uv = -iv;
2484         sign = 1;
2485     }
2486     do {
2487         *--ptr = '0' + (char)(uv % 10);
2488     } while (uv /= 10);
2489     if (sign)
2490         *--ptr = '-';
2491     *peob = ebuf;
2492     return ptr;
2493 }
2494
2495 /*
2496 =for apidoc sv_2pv_flags
2497
2498 Returns a pointer to the string value of an SV, and sets *lp to its length.
2499 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2500 if necessary.
2501 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2502 usually end up here too.
2503
2504 =cut
2505 */
2506
2507 char *
2508 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2509 {
2510     register char *s;
2511     int olderrno;
2512
2513     if (!sv) {
2514         if (lp)
2515             *lp = 0;
2516         return (char *)"";
2517     }
2518     if (SvGMAGICAL(sv)) {
2519         if (flags & SV_GMAGIC)
2520             mg_get(sv);
2521         if (SvPOKp(sv)) {
2522             if (lp)
2523                 *lp = SvCUR(sv);
2524             if (flags & SV_MUTABLE_RETURN)
2525                 return SvPVX_mutable(sv);
2526             if (flags & SV_CONST_RETURN)
2527                 return (char *)SvPVX_const(sv);
2528             return SvPVX(sv);
2529         }
2530         if (SvIOKp(sv) || SvNOKp(sv)) {
2531             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2532             STRLEN len;
2533
2534             if (SvIOKp(sv)) {
2535                 len = SvIsUV(sv) ? my_sprintf(tbuf,"%"UVuf, (UV)SvUVX(sv))
2536                     : my_sprintf(tbuf,"%"IVdf, (IV)SvIVX(sv));
2537             } else {
2538                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2539                 len = strlen(tbuf);
2540             }
2541             if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2542                 /* Sneaky stuff here */
2543                 SV *tsv = newSVpvn(tbuf, len);
2544
2545                 sv_2mortal(tsv);
2546                 if (lp)
2547                     *lp = SvCUR(tsv);
2548                 return SvPVX(tsv);
2549             }
2550             else {
2551                 dVAR;
2552
2553 #ifdef FIXNEGATIVEZERO
2554                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2555                     tbuf[0] = '0';
2556                     tbuf[1] = 0;
2557                     len = 1;
2558                 }
2559 #endif
2560                 SvUPGRADE(sv, SVt_PV);
2561                 if (lp)
2562                     *lp = len;
2563                 s = SvGROW_mutable(sv, len + 1);
2564                 SvCUR_set(sv, len);
2565                 SvPOKp_on(sv);
2566                 return memcpy(s, tbuf, len + 1);
2567             }
2568         }
2569         if (!SvROK(sv)) {
2570             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2571                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2572                     report_uninit(sv);
2573             }
2574             if (lp)
2575                 *lp = 0;
2576             return (char *)"";
2577         }
2578     }
2579     if (SvTHINKFIRST(sv)) {
2580         if (SvROK(sv)) {
2581             SV* tmpstr;
2582
2583             if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,string)) &&
2584                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2585                 /* Unwrap this:  */
2586                 /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr); */
2587
2588                 char *pv;
2589                 if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2590                     if (flags & SV_CONST_RETURN) {
2591                         pv = (char *) SvPVX_const(tmpstr);
2592                     } else {
2593                         pv = (flags & SV_MUTABLE_RETURN)
2594                             ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2595                     }
2596                     if (lp)
2597                         *lp = SvCUR(tmpstr);
2598                 } else {
2599                     pv = sv_2pv_flags(tmpstr, lp, flags);
2600                 }
2601                 if (SvUTF8(tmpstr))
2602                     SvUTF8_on(sv);
2603                 else
2604                     SvUTF8_off(sv);
2605                 return pv;
2606             } else {
2607                 SV *tsv;
2608                 MAGIC *mg;
2609                 const SV *const referent = (SV*)SvRV(sv);
2610
2611                 if (!referent) {
2612                     tsv = sv_2mortal(newSVpvn("NULLREF", 7));
2613                 } else if (SvTYPE(referent) == SVt_PVMG
2614                            && ((SvFLAGS(referent) &
2615                                 (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2616                                == (SVs_OBJECT|SVs_SMG))
2617                            && (mg = mg_find(referent, PERL_MAGIC_qr))) {
2618                     const regexp *re = (regexp *)mg->mg_obj;
2619
2620                     if (!mg->mg_ptr) {
2621                         const char *fptr = "msix";
2622                         char reflags[6];
2623                         char ch;
2624                         int left = 0;
2625                         int right = 4;
2626                         char need_newline = 0;
2627                         U16 reganch =
2628                             (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2629
2630                         while((ch = *fptr++)) {
2631                             if(reganch & 1) {
2632                                 reflags[left++] = ch;
2633                             }
2634                             else {
2635                                 reflags[right--] = ch;
2636                             }
2637                             reganch >>= 1;
2638                         }
2639                         if(left != 4) {
2640                             reflags[left] = '-';
2641                             left = 5;
2642                         }
2643
2644                         mg->mg_len = re->prelen + 4 + left;
2645                         /*
2646                          * If /x was used, we have to worry about a regex
2647                          * ending with a comment later being embedded
2648                          * within another regex. If so, we don't want this
2649                          * regex's "commentization" to leak out to the
2650                          * right part of the enclosing regex, we must cap
2651                          * it with a newline.
2652                          *
2653                          * So, if /x was used, we scan backwards from the
2654                          * end of the regex. If we find a '#' before we
2655                          * find a newline, we need to add a newline
2656                          * ourself. If we find a '\n' first (or if we
2657                          * don't find '#' or '\n'), we don't need to add
2658                          * anything.  -jfriedl
2659                          */
2660                         if (PMf_EXTENDED & re->reganch) {
2661                             const char *endptr = re->precomp + re->prelen;
2662                             while (endptr >= re->precomp) {
2663                                 const char c = *(endptr--);
2664                                 if (c == '\n')
2665                                     break; /* don't need another */
2666                                 if (c == '#') {
2667                                     /* we end while in a comment, so we
2668                                        need a newline */
2669                                     mg->mg_len++; /* save space for it */
2670                                     need_newline = 1; /* note to add it */
2671                                     break;
2672                                 }
2673                             }
2674                         }
2675
2676                         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2677                         Copy("(?", mg->mg_ptr, 2, char);
2678                         Copy(reflags, mg->mg_ptr+2, left, char);
2679                         Copy(":", mg->mg_ptr+left+2, 1, char);
2680                         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2681                         if (need_newline)
2682                             mg->mg_ptr[mg->mg_len - 2] = '\n';
2683                         mg->mg_ptr[mg->mg_len - 1] = ')';
2684                         mg->mg_ptr[mg->mg_len] = 0;
2685                     }
2686                     PL_reginterp_cnt += re->program[0].next_off;
2687
2688                     if (re->reganch & ROPT_UTF8)
2689                         SvUTF8_on(sv);
2690                     else
2691                         SvUTF8_off(sv);
2692                     if (lp)
2693                         *lp = mg->mg_len;
2694                     return mg->mg_ptr;
2695                 } else {
2696                     const char *const typestr = sv_reftype(referent, 0);
2697
2698                     tsv = sv_newmortal();
2699                     if (SvOBJECT(referent)) {
2700                         const char *const name = HvNAME_get(SvSTASH(referent));
2701                         Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2702                                        name ? name : "__ANON__" , typestr,
2703                                        PTR2UV(referent));
2704                     }
2705                     else
2706                         Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr,
2707                                        PTR2UV(referent));
2708                 }
2709                 if (lp)
2710                     *lp = SvCUR(tsv);
2711                 return SvPVX(tsv);
2712             }
2713         }
2714         if (SvREADONLY(sv) && !SvOK(sv)) {
2715             if (ckWARN(WARN_UNINITIALIZED))
2716                 report_uninit(sv);
2717             if (lp)
2718                 *lp = 0;
2719             return (char *)"";
2720         }
2721     }
2722     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2723         /* I'm assuming that if both IV and NV are equally valid then
2724            converting the IV is going to be more efficient */
2725         const U32 isIOK = SvIOK(sv);
2726         const U32 isUIOK = SvIsUV(sv);
2727         char buf[TYPE_CHARS(UV)];
2728         char *ebuf, *ptr;
2729
2730         if (SvTYPE(sv) < SVt_PVIV)
2731             sv_upgrade(sv, SVt_PVIV);
2732         if (isUIOK)
2733             ptr = uiv_2buf(buf, 0, SvUVX(sv), 1, &ebuf);
2734         else
2735             ptr = uiv_2buf(buf, SvIVX(sv), 0, 0, &ebuf);
2736         /* inlined from sv_setpvn */
2737         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2738         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2739         SvCUR_set(sv, ebuf - ptr);
2740         s = SvEND(sv);
2741         *s = '\0';
2742         if (isIOK)
2743             SvIOK_on(sv);
2744         else
2745             SvIOKp_on(sv);
2746         if (isUIOK)
2747             SvIsUV_on(sv);
2748     }
2749     else if (SvNOKp(sv)) {
2750         if (SvTYPE(sv) < SVt_PVNV)
2751             sv_upgrade(sv, SVt_PVNV);
2752         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2753         s = SvGROW_mutable(sv, NV_DIG + 20);
2754         olderrno = errno;       /* some Xenix systems wipe out errno here */
2755 #ifdef apollo
2756         if (SvNVX(sv) == 0.0)
2757             (void)strcpy(s,"0");
2758         else
2759 #endif /*apollo*/
2760         {
2761             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2762         }
2763         errno = olderrno;
2764 #ifdef FIXNEGATIVEZERO
2765         if (*s == '-' && s[1] == '0' && !s[2])
2766             strcpy(s,"0");
2767 #endif
2768         while (*s) s++;
2769 #ifdef hcx
2770         if (s[-1] == '.')
2771             *--s = '\0';
2772 #endif
2773     }
2774     else {
2775         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2776             report_uninit(sv);
2777         if (lp)
2778         *lp = 0;
2779         if (SvTYPE(sv) < SVt_PV)
2780             /* Typically the caller expects that sv_any is not NULL now.  */
2781             sv_upgrade(sv, SVt_PV);
2782         return (char *)"";
2783     }
2784     {
2785         const STRLEN len = s - SvPVX_const(sv);
2786         if (lp) 
2787             *lp = len;
2788         SvCUR_set(sv, len);
2789     }
2790     SvPOK_on(sv);
2791     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2792                           PTR2UV(sv),SvPVX_const(sv)));
2793     if (flags & SV_CONST_RETURN)
2794         return (char *)SvPVX_const(sv);
2795     if (flags & SV_MUTABLE_RETURN)
2796         return SvPVX_mutable(sv);
2797     return SvPVX(sv);
2798 }
2799
2800 /*
2801 =for apidoc sv_copypv
2802
2803 Copies a stringified representation of the source SV into the
2804 destination SV.  Automatically performs any necessary mg_get and
2805 coercion of numeric values into strings.  Guaranteed to preserve
2806 UTF-8 flag even from overloaded objects.  Similar in nature to
2807 sv_2pv[_flags] but operates directly on an SV instead of just the
2808 string.  Mostly uses sv_2pv_flags to do its work, except when that
2809 would lose the UTF-8'ness of the PV.
2810
2811 =cut
2812 */
2813
2814 void
2815 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2816 {
2817     STRLEN len;
2818     const char * const s = SvPV_const(ssv,len);
2819     sv_setpvn(dsv,s,len);
2820     if (SvUTF8(ssv))
2821         SvUTF8_on(dsv);
2822     else
2823         SvUTF8_off(dsv);
2824 }
2825
2826 /*
2827 =for apidoc sv_2pvbyte
2828
2829 Return a pointer to the byte-encoded representation of the SV, and set *lp
2830 to its length.  May cause the SV to be downgraded from UTF-8 as a
2831 side-effect.
2832
2833 Usually accessed via the C<SvPVbyte> macro.
2834
2835 =cut
2836 */
2837
2838 char *
2839 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2840 {
2841     sv_utf8_downgrade(sv,0);
2842     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2843 }
2844
2845 /*
2846 =for apidoc sv_2pvutf8
2847
2848 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2849 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2850
2851 Usually accessed via the C<SvPVutf8> macro.
2852
2853 =cut
2854 */
2855
2856 char *
2857 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2858 {
2859     sv_utf8_upgrade(sv);
2860     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2861 }
2862
2863
2864 /*
2865 =for apidoc sv_2bool
2866
2867 This function is only called on magical items, and is only used by
2868 sv_true() or its macro equivalent.
2869
2870 =cut
2871 */
2872
2873 bool
2874 Perl_sv_2bool(pTHX_ register SV *sv)
2875 {
2876     SvGETMAGIC(sv);
2877
2878     if (!SvOK(sv))
2879         return 0;
2880     if (SvROK(sv)) {
2881         SV* tmpsv;
2882         if (SvAMAGIC(sv) && (tmpsv=AMG_CALLun(sv,bool_)) &&
2883                 (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2884             return (bool)SvTRUE(tmpsv);
2885       return SvRV(sv) != 0;
2886     }
2887     if (SvPOKp(sv)) {
2888         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2889         if (Xpvtmp &&
2890                 (*sv->sv_u.svu_pv > '0' ||
2891                 Xpvtmp->xpv_cur > 1 ||
2892                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2893             return 1;
2894         else
2895             return 0;
2896     }
2897     else {
2898         if (SvIOKp(sv))
2899             return SvIVX(sv) != 0;
2900         else {
2901             if (SvNOKp(sv))
2902                 return SvNVX(sv) != 0.0;
2903             else
2904                 return FALSE;
2905         }
2906     }
2907 }
2908
2909 /*
2910 =for apidoc sv_utf8_upgrade
2911
2912 Converts the PV of an SV to its UTF-8-encoded form.
2913 Forces the SV to string form if it is not already.
2914 Always sets the SvUTF8 flag to avoid future validity checks even
2915 if all the bytes have hibit clear.
2916
2917 This is not as a general purpose byte encoding to Unicode interface:
2918 use the Encode extension for that.
2919
2920 =for apidoc sv_utf8_upgrade_flags
2921
2922 Converts the PV of an SV to its UTF-8-encoded form.
2923 Forces the SV to string form if it is not already.
2924 Always sets the SvUTF8 flag to avoid future validity checks even
2925 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2926 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2927 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2928
2929 This is not as a general purpose byte encoding to Unicode interface:
2930 use the Encode extension for that.
2931
2932 =cut
2933 */
2934
2935 STRLEN
2936 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2937 {
2938     if (sv == &PL_sv_undef)
2939         return 0;
2940     if (!SvPOK(sv)) {
2941         STRLEN len = 0;
2942         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2943             (void) sv_2pv_flags(sv,&len, flags);
2944             if (SvUTF8(sv))
2945                 return len;
2946         } else {
2947             (void) SvPV_force(sv,len);
2948         }
2949     }
2950
2951     if (SvUTF8(sv)) {
2952         return SvCUR(sv);
2953     }
2954
2955     if (SvIsCOW(sv)) {
2956         sv_force_normal_flags(sv, 0);
2957     }
2958
2959     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2960         sv_recode_to_utf8(sv, PL_encoding);
2961     else { /* Assume Latin-1/EBCDIC */
2962         /* This function could be much more efficient if we
2963          * had a FLAG in SVs to signal if there are any hibit
2964          * chars in the PV.  Given that there isn't such a flag
2965          * make the loop as fast as possible. */
2966         const U8 *s = (U8 *) SvPVX_const(sv);
2967         const U8 * const e = (U8 *) SvEND(sv);
2968         const U8 *t = s;
2969         int hibit = 0;
2970         
2971         while (t < e) {
2972             const U8 ch = *t++;
2973             if ((hibit = !NATIVE_IS_INVARIANT(ch)))
2974                 break;
2975         }
2976         if (hibit) {
2977             STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2978             U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2979
2980             SvPV_free(sv); /* No longer using what was there before. */
2981
2982             SvPV_set(sv, (char*)recoded);
2983             SvCUR_set(sv, len - 1);
2984             SvLEN_set(sv, len); /* No longer know the real size. */
2985         }
2986         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2987         SvUTF8_on(sv);
2988     }
2989     return SvCUR(sv);
2990 }
2991
2992 /*
2993 =for apidoc sv_utf8_downgrade
2994
2995 Attempts to convert the PV of an SV from characters to bytes.
2996 If the PV contains a character beyond byte, this conversion will fail;
2997 in this case, either returns false or, if C<fail_ok> is not
2998 true, croaks.
2999
3000 This is not as a general purpose Unicode to byte encoding interface:
3001 use the Encode extension for that.
3002
3003 =cut
3004 */
3005
3006 bool
3007 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
3008 {
3009     if (SvPOKp(sv) && SvUTF8(sv)) {
3010         if (SvCUR(sv)) {
3011             U8 *s;
3012             STRLEN len;
3013
3014             if (SvIsCOW(sv)) {
3015                 sv_force_normal_flags(sv, 0);
3016             }
3017             s = (U8 *) SvPV(sv, len);
3018             if (!utf8_to_bytes(s, &len)) {
3019                 if (fail_ok)
3020                     return FALSE;
3021                 else {
3022                     if (PL_op)
3023                         Perl_croak(aTHX_ "Wide character in %s",
3024                                    OP_DESC(PL_op));
3025                     else
3026                         Perl_croak(aTHX_ "Wide character");
3027                 }
3028             }
3029             SvCUR_set(sv, len);
3030         }
3031     }
3032     SvUTF8_off(sv);
3033     return TRUE;
3034 }
3035
3036 /*
3037 =for apidoc sv_utf8_encode
3038
3039 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
3040 flag off so that it looks like octets again.
3041
3042 =cut
3043 */
3044
3045 void
3046 Perl_sv_utf8_encode(pTHX_ register SV *sv)
3047 {
3048     (void) sv_utf8_upgrade(sv);
3049     if (SvIsCOW(sv)) {
3050         sv_force_normal_flags(sv, 0);
3051     }
3052     if (SvREADONLY(sv)) {
3053         Perl_croak(aTHX_ PL_no_modify);
3054     }
3055     SvUTF8_off(sv);
3056 }
3057
3058 /*
3059 =for apidoc sv_utf8_decode
3060
3061 If the PV of the SV is an octet sequence in UTF-8
3062 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
3063 so that it looks like a character. If the PV contains only single-byte
3064 characters, the C<SvUTF8> flag stays being off.
3065 Scans PV for validity and returns false if the PV is invalid UTF-8.
3066
3067 =cut
3068 */
3069
3070 bool
3071 Perl_sv_utf8_decode(pTHX_ register SV *sv)
3072 {
3073     if (SvPOKp(sv)) {
3074         const U8 *c;
3075         const U8 *e;
3076
3077         /* The octets may have got themselves encoded - get them back as
3078          * bytes
3079          */
3080         if (!sv_utf8_downgrade(sv, TRUE))
3081             return FALSE;
3082
3083         /* it is actually just a matter of turning the utf8 flag on, but
3084          * we want to make sure everything inside is valid utf8 first.
3085          */
3086         c = (const U8 *) SvPVX_const(sv);
3087         if (!is_utf8_string(c, SvCUR(sv)+1))
3088             return FALSE;
3089         e = (const U8 *) SvEND(sv);
3090         while (c < e) {
3091             const U8 ch = *c++;
3092             if (!UTF8_IS_INVARIANT(ch)) {
3093                 SvUTF8_on(sv);
3094                 break;
3095             }
3096         }
3097     }
3098     return TRUE;
3099 }
3100
3101 /*
3102 =for apidoc sv_setsv
3103
3104 Copies the contents of the source SV C<ssv> into the destination SV
3105 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3106 function if the source SV needs to be reused. Does not handle 'set' magic.
3107 Loosely speaking, it performs a copy-by-value, obliterating any previous
3108 content of the destination.
3109
3110 You probably want to use one of the assortment of wrappers, such as
3111 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3112 C<SvSetMagicSV_nosteal>.
3113
3114 =for apidoc sv_setsv_flags
3115
3116 Copies the contents of the source SV C<ssv> into the destination SV
3117 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3118 function if the source SV needs to be reused. Does not handle 'set' magic.
3119 Loosely speaking, it performs a copy-by-value, obliterating any previous
3120 content of the destination.
3121 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
3122 C<ssv> if appropriate, else not. If the C<flags> parameter has the
3123 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
3124 and C<sv_setsv_nomg> are implemented in terms of this function.
3125
3126 You probably want to use one of the assortment of wrappers, such as
3127 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3128 C<SvSetMagicSV_nosteal>.
3129
3130 This is the primary function for copying scalars, and most other
3131 copy-ish functions and macros use this underneath.
3132
3133 =cut
3134 */
3135
3136 void
3137 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
3138 {
3139     register U32 sflags;
3140     register int dtype;
3141     register int stype;
3142
3143     if (sstr == dstr)
3144         return;
3145     SV_CHECK_THINKFIRST_COW_DROP(dstr);
3146     if (!sstr)
3147         sstr = &PL_sv_undef;
3148     stype = SvTYPE(sstr);
3149     dtype = SvTYPE(dstr);
3150
3151     SvAMAGIC_off(dstr);
3152     if ( SvVOK(dstr) )
3153     {
3154         /* need to nuke the magic */
3155         mg_free(dstr);
3156         SvRMAGICAL_off(dstr);
3157     }
3158
3159     /* There's a lot of redundancy below but we're going for speed here */
3160
3161     switch (stype) {
3162     case SVt_NULL:
3163       undef_sstr:
3164         if (dtype != SVt_PVGV) {
3165             (void)SvOK_off(dstr);
3166             return;
3167         }
3168         break;
3169     case SVt_IV:
3170         if (SvIOK(sstr)) {
3171             switch (dtype) {
3172             case SVt_NULL:
3173                 sv_upgrade(dstr, SVt_IV);
3174                 break;
3175             case SVt_NV:
3176                 sv_upgrade(dstr, SVt_PVNV);
3177                 break;
3178             case SVt_RV:
3179             case SVt_PV:
3180                 sv_upgrade(dstr, SVt_PVIV);
3181                 break;
3182             }
3183             (void)SvIOK_only(dstr);
3184             SvIV_set(dstr,  SvIVX(sstr));
3185             if (SvIsUV(sstr))
3186                 SvIsUV_on(dstr);
3187             if (SvTAINTED(sstr))
3188                 SvTAINT(dstr);
3189             return;
3190         }
3191         goto undef_sstr;
3192
3193     case SVt_NV:
3194         if (SvNOK(sstr)) {
3195             switch (dtype) {
3196             case SVt_NULL:
3197             case SVt_IV:
3198                 sv_upgrade(dstr, SVt_NV);
3199                 break;
3200             case SVt_RV:
3201             case SVt_PV:
3202             case SVt_PVIV:
3203                 sv_upgrade(dstr, SVt_PVNV);
3204                 break;
3205             }
3206             SvNV_set(dstr, SvNVX(sstr));
3207             (void)SvNOK_only(dstr);
3208             if (SvTAINTED(sstr))
3209                 SvTAINT(dstr);
3210             return;
3211         }
3212         goto undef_sstr;
3213
3214     case SVt_RV:
3215         if (dtype < SVt_RV)
3216             sv_upgrade(dstr, SVt_RV);
3217         else if (dtype == SVt_PVGV &&
3218                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
3219             sstr = SvRV(sstr);
3220             if (sstr == dstr) {
3221                 if (GvIMPORTED(dstr) != GVf_IMPORTED
3222                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3223                 {
3224                     GvIMPORTED_on(dstr);
3225                 }
3226                 GvMULTI_on(dstr);
3227                 return;
3228             }
3229             goto glob_assign;
3230         }
3231         break;
3232     case SVt_PVFM:
3233 #ifdef PERL_OLD_COPY_ON_WRITE
3234         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3235             if (dtype < SVt_PVIV)
3236                 sv_upgrade(dstr, SVt_PVIV);
3237             break;
3238         }
3239         /* Fall through */
3240 #endif
3241     case SVt_PV:
3242         if (dtype < SVt_PV)
3243             sv_upgrade(dstr, SVt_PV);
3244         break;
3245     case SVt_PVIV:
3246         if (dtype < SVt_PVIV)
3247             sv_upgrade(dstr, SVt_PVIV);
3248         break;
3249     case SVt_PVNV:
3250         if (dtype < SVt_PVNV)
3251             sv_upgrade(dstr, SVt_PVNV);
3252         break;
3253     case SVt_PVAV:
3254     case SVt_PVHV:
3255     case SVt_PVCV:
3256     case SVt_PVIO:
3257         {
3258         const char * const type = sv_reftype(sstr,0);
3259         if (PL_op)
3260             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3261         else
3262             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3263         }
3264         break;
3265
3266     case SVt_PVGV:
3267         if (dtype <= SVt_PVGV) {
3268   glob_assign:
3269             if (dtype != SVt_PVGV) {
3270                 const char * const name = GvNAME(sstr);
3271                 const STRLEN len = GvNAMELEN(sstr);
3272                 /* don't upgrade SVt_PVLV: it can hold a glob */
3273                 if (dtype != SVt_PVLV)
3274                     sv_upgrade(dstr, SVt_PVGV);
3275                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3276                 GvSTASH(dstr) = GvSTASH(sstr);
3277                 if (GvSTASH(dstr))
3278                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3279                 GvNAME(dstr) = savepvn(name, len);
3280                 GvNAMELEN(dstr) = len;
3281                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3282             }
3283
3284 #ifdef GV_UNIQUE_CHECK
3285                 if (GvUNIQUE((GV*)dstr)) {
3286                     Perl_croak(aTHX_ PL_no_modify);
3287                 }
3288 #endif
3289
3290             (void)SvOK_off(dstr);
3291             GvINTRO_off(dstr);          /* one-shot flag */
3292             gp_free((GV*)dstr);
3293             GvGP(dstr) = gp_ref(GvGP(sstr));
3294             if (SvTAINTED(sstr))
3295                 SvTAINT(dstr);
3296             if (GvIMPORTED(dstr) != GVf_IMPORTED
3297                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3298             {
3299                 GvIMPORTED_on(dstr);
3300             }
3301             GvMULTI_on(dstr);
3302             return;
3303         }
3304         /* FALL THROUGH */
3305
3306     default:
3307         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3308             mg_get(sstr);
3309             if ((int)SvTYPE(sstr) != stype) {
3310                 stype = SvTYPE(sstr);
3311                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3312                     goto glob_assign;
3313             }
3314         }
3315         if (stype == SVt_PVLV)
3316             SvUPGRADE(dstr, SVt_PVNV);
3317         else
3318             SvUPGRADE(dstr, (U32)stype);
3319     }
3320
3321     sflags = SvFLAGS(sstr);
3322
3323     if (sflags & SVf_ROK) {
3324         if (dtype >= SVt_PV) {
3325             if (dtype == SVt_PVGV) {
3326                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3327                 SV *dref = 0;
3328                 const int intro = GvINTRO(dstr);
3329
3330 #ifdef GV_UNIQUE_CHECK
3331                 if (GvUNIQUE((GV*)dstr)) {
3332                     Perl_croak(aTHX_ PL_no_modify);
3333                 }
3334 #endif
3335
3336                 if (intro) {
3337                     GvINTRO_off(dstr);  /* one-shot flag */
3338                     GvLINE(dstr) = CopLINE(PL_curcop);
3339                     GvEGV(dstr) = (GV*)dstr;
3340                 }
3341                 GvMULTI_on(dstr);
3342                 switch (SvTYPE(sref)) {
3343                 case SVt_PVAV:
3344                     if (intro)
3345                         SAVEGENERICSV(GvAV(dstr));
3346                     else
3347                         dref = (SV*)GvAV(dstr);
3348                     GvAV(dstr) = (AV*)sref;
3349                     if (!GvIMPORTED_AV(dstr)
3350                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3351                     {
3352                         GvIMPORTED_AV_on(dstr);
3353                     }
3354                     break;
3355                 case SVt_PVHV:
3356                     if (intro)
3357                         SAVEGENERICSV(GvHV(dstr));
3358                     else
3359                         dref = (SV*)GvHV(dstr);
3360                     GvHV(dstr) = (HV*)sref;
3361                     if (!GvIMPORTED_HV(dstr)
3362                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3363                     {
3364                         GvIMPORTED_HV_on(dstr);
3365                     }
3366                     break;
3367                 case SVt_PVCV:
3368                     if (intro) {
3369                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3370                             SvREFCNT_dec(GvCV(dstr));
3371                             GvCV(dstr) = Nullcv;
3372                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3373                             PL_sub_generation++;
3374                         }
3375                         SAVEGENERICSV(GvCV(dstr));
3376                     }
3377                     else
3378                         dref = (SV*)GvCV(dstr);
3379                     if (GvCV(dstr) != (CV*)sref) {
3380                         CV* const cv = GvCV(dstr);
3381                         if (cv) {
3382                             if (!GvCVGEN((GV*)dstr) &&
3383                                 (CvROOT(cv) || CvXSUB(cv)))
3384                             {
3385                                 /* Redefining a sub - warning is mandatory if
3386                                    it was a const and its value changed. */
3387                                 if (ckWARN(WARN_REDEFINE)
3388                                     || (CvCONST(cv)
3389                                         && (!CvCONST((CV*)sref)
3390                                             || sv_cmp(cv_const_sv(cv),
3391                                                       cv_const_sv((CV*)sref)))))
3392                                 {
3393                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3394                                         CvCONST(cv)
3395                                         ? "Constant subroutine %s::%s redefined"
3396                                         : "Subroutine %s::%s redefined",
3397                                         HvNAME_get(GvSTASH((GV*)dstr)),
3398                                         GvENAME((GV*)dstr));
3399                                 }
3400                             }
3401                             if (!intro)
3402                                 cv_ckproto(cv, (GV*)dstr,
3403                                            SvPOK(sref)
3404                                            ? SvPVX_const(sref) : Nullch);
3405                         }
3406                         GvCV(dstr) = (CV*)sref;
3407                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3408                         GvASSUMECV_on(dstr);
3409                         PL_sub_generation++;
3410                     }
3411                     if (!GvIMPORTED_CV(dstr)
3412                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3413                     {
3414                         GvIMPORTED_CV_on(dstr);
3415                     }
3416                     break;
3417                 case SVt_PVIO:
3418                     if (intro)
3419                         SAVEGENERICSV(GvIOp(dstr));
3420                     else
3421                         dref = (SV*)GvIOp(dstr);
3422                     GvIOp(dstr) = (IO*)sref;
3423                     break;
3424                 case SVt_PVFM:
3425                     if (intro)
3426                         SAVEGENERICSV(GvFORM(dstr));
3427                     else
3428                         dref = (SV*)GvFORM(dstr);
3429                     GvFORM(dstr) = (CV*)sref;
3430                     break;
3431                 default:
3432                     if (intro)
3433                         SAVEGENERICSV(GvSV(dstr));
3434                     else
3435                         dref = (SV*)GvSV(dstr);
3436                     GvSV(dstr) = sref;
3437                     if (!GvIMPORTED_SV(dstr)
3438                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3439                     {
3440                         GvIMPORTED_SV_on(dstr);
3441                     }
3442                     break;
3443                 }
3444                 if (dref)
3445                     SvREFCNT_dec(dref);
3446                 if (SvTAINTED(sstr))
3447                     SvTAINT(dstr);
3448                 return;
3449             }
3450             if (SvPVX_const(dstr)) {
3451                 SvPV_free(dstr);
3452                 SvLEN_set(dstr, 0);
3453                 SvCUR_set(dstr, 0);
3454             }
3455         }
3456         (void)SvOK_off(dstr);
3457         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3458         SvROK_on(dstr);
3459         if (sflags & SVp_NOK) {
3460             SvNOKp_on(dstr);
3461             /* Only set the public OK flag if the source has public OK.  */
3462             if (sflags & SVf_NOK)
3463                 SvFLAGS(dstr) |= SVf_NOK;
3464             SvNV_set(dstr, SvNVX(sstr));
3465         }
3466         if (sflags & SVp_IOK) {
3467             (void)SvIOKp_on(dstr);
3468             if (sflags & SVf_IOK)
3469                 SvFLAGS(dstr) |= SVf_IOK;
3470             if (sflags & SVf_IVisUV)
3471                 SvIsUV_on(dstr);
3472             SvIV_set(dstr, SvIVX(sstr));
3473         }
3474         if (SvAMAGIC(sstr)) {
3475             SvAMAGIC_on(dstr);
3476         }
3477     }
3478     else if (sflags & SVp_POK) {
3479         bool isSwipe = 0;
3480
3481         /*
3482          * Check to see if we can just swipe the string.  If so, it's a
3483          * possible small lose on short strings, but a big win on long ones.
3484          * It might even be a win on short strings if SvPVX_const(dstr)
3485          * has to be allocated and SvPVX_const(sstr) has to be freed.
3486          */
3487
3488         /* Whichever path we take through the next code, we want this true,
3489            and doing it now facilitates the COW check.  */
3490         (void)SvPOK_only(dstr);
3491
3492         if (
3493             /* We're not already COW  */
3494             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3495 #ifndef PERL_OLD_COPY_ON_WRITE
3496              /* or we are, but dstr isn't a suitable target.  */
3497              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3498 #endif
3499              )
3500             &&
3501             !(isSwipe =
3502                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3503                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3504                  (!(flags & SV_NOSTEAL)) &&
3505                                         /* and we're allowed to steal temps */
3506                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3507                  SvLEN(sstr)    &&        /* and really is a string */
3508                                 /* and won't be needed again, potentially */
3509               !(PL_op && PL_op->op_type == OP_AASSIGN))
3510 #ifdef PERL_OLD_COPY_ON_WRITE
3511             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3512                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3513                  && SvTYPE(sstr) >= SVt_PVIV)
3514 #endif
3515             ) {
3516             /* Failed the swipe test, and it's not a shared hash key either.
3517                Have to copy the string.  */
3518             STRLEN len = SvCUR(sstr);
3519             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3520             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3521             SvCUR_set(dstr, len);
3522             *SvEND(dstr) = '\0';
3523         } else {
3524             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3525                be true in here.  */
3526             /* Either it's a shared hash key, or it's suitable for
3527                copy-on-write or we can swipe the string.  */
3528             if (DEBUG_C_TEST) {
3529                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3530                 sv_dump(sstr);
3531                 sv_dump(dstr);
3532             }
3533 #ifdef PERL_OLD_COPY_ON_WRITE
3534             if (!isSwipe) {
3535                 /* I believe I should acquire a global SV mutex if
3536                    it's a COW sv (not a shared hash key) to stop
3537                    it going un copy-on-write.
3538                    If the source SV has gone un copy on write between up there
3539                    and down here, then (assert() that) it is of the correct
3540                    form to make it copy on write again */
3541                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3542                     != (SVf_FAKE | SVf_READONLY)) {
3543                     SvREADONLY_on(sstr);
3544                     SvFAKE_on(sstr);
3545                     /* Make the source SV into a loop of 1.
3546                        (about to become 2) */
3547                     SV_COW_NEXT_SV_SET(sstr, sstr);
3548                 }
3549             }
3550 #endif
3551             /* Initial code is common.  */
3552             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3553                 SvPV_free(dstr);
3554             }
3555
3556             if (!isSwipe) {
3557                 /* making another shared SV.  */
3558                 STRLEN cur = SvCUR(sstr);
3559                 STRLEN len = SvLEN(sstr);
3560 #ifdef PERL_OLD_COPY_ON_WRITE
3561                 if (len) {
3562                     assert (SvTYPE(dstr) >= SVt_PVIV);
3563                     /* SvIsCOW_normal */
3564                     /* splice us in between source and next-after-source.  */
3565                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3566                     SV_COW_NEXT_SV_SET(sstr, dstr);
3567                     SvPV_set(dstr, SvPVX_mutable(sstr));
3568                 } else
3569 #endif
3570                 {
3571                     /* SvIsCOW_shared_hash */
3572                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3573                                           "Copy on write: Sharing hash\n"));
3574
3575                     assert (SvTYPE(dstr) >= SVt_PV);
3576                     SvPV_set(dstr,
3577                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3578                 }
3579                 SvLEN_set(dstr, len);
3580                 SvCUR_set(dstr, cur);
3581                 SvREADONLY_on(dstr);
3582                 SvFAKE_on(dstr);
3583                 /* Relesase a global SV mutex.  */
3584             }
3585             else
3586                 {       /* Passes the swipe test.  */
3587                 SvPV_set(dstr, SvPVX_mutable(sstr));
3588                 SvLEN_set(dstr, SvLEN(sstr));
3589                 SvCUR_set(dstr, SvCUR(sstr));
3590
3591                 SvTEMP_off(dstr);
3592                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3593                 SvPV_set(sstr, Nullch);
3594                 SvLEN_set(sstr, 0);
3595                 SvCUR_set(sstr, 0);
3596                 SvTEMP_off(sstr);
3597             }
3598         }
3599         if (sflags & SVf_UTF8)
3600             SvUTF8_on(dstr);
3601         if (sflags & SVp_NOK) {
3602             SvNOKp_on(dstr);
3603             if (sflags & SVf_NOK)
3604                 SvFLAGS(dstr) |= SVf_NOK;
3605             SvNV_set(dstr, SvNVX(sstr));
3606         }
3607         if (sflags & SVp_IOK) {
3608             (void)SvIOKp_on(dstr);
3609             if (sflags & SVf_IOK)
3610                 SvFLAGS(dstr) |= SVf_IOK;
3611             if (sflags & SVf_IVisUV)
3612                 SvIsUV_on(dstr);
3613             SvIV_set(dstr, SvIVX(sstr));
3614         }
3615         if (SvVOK(sstr)) {
3616             MAGIC *smg = mg_find(sstr,PERL_MAGIC_vstring);
3617             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3618                         smg->mg_ptr, smg->mg_len);
3619             SvRMAGICAL_on(dstr);
3620         }
3621     }
3622     else if (sflags & SVp_IOK) {
3623         if (sflags & SVf_IOK)
3624             (void)SvIOK_only(dstr);
3625         else {
3626             (void)SvOK_off(dstr);
3627             (void)SvIOKp_on(dstr);
3628         }
3629         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3630         if (sflags & SVf_IVisUV)
3631             SvIsUV_on(dstr);
3632         SvIV_set(dstr, SvIVX(sstr));
3633         if (sflags & SVp_NOK) {
3634             if (sflags & SVf_NOK)
3635                 (void)SvNOK_on(dstr);
3636             else
3637                 (void)SvNOKp_on(dstr);
3638             SvNV_set(dstr, SvNVX(sstr));
3639         }
3640     }
3641     else if (sflags & SVp_NOK) {
3642         if (sflags & SVf_NOK)
3643             (void)SvNOK_only(dstr);
3644         else {
3645             (void)SvOK_off(dstr);
3646             SvNOKp_on(dstr);
3647         }
3648         SvNV_set(dstr, SvNVX(sstr));
3649     }
3650     else {
3651         if (dtype == SVt_PVGV) {
3652             if (ckWARN(WARN_MISC))
3653                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3654         }
3655         else
3656             (void)SvOK_off(dstr);
3657     }
3658     if (SvTAINTED(sstr))
3659         SvTAINT(dstr);
3660 }
3661
3662 /*
3663 =for apidoc sv_setsv_mg
3664
3665 Like C<sv_setsv>, but also handles 'set' magic.
3666
3667 =cut
3668 */
3669
3670 void
3671 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3672 {
3673     sv_setsv(dstr,sstr);
3674     SvSETMAGIC(dstr);
3675 }
3676
3677 #ifdef PERL_OLD_COPY_ON_WRITE
3678 SV *
3679 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3680 {
3681     STRLEN cur = SvCUR(sstr);
3682     STRLEN len = SvLEN(sstr);
3683     register char *new_pv;
3684
3685     if (DEBUG_C_TEST) {
3686         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3687                       sstr, dstr);
3688         sv_dump(sstr);
3689         if (dstr)
3690                     sv_dump(dstr);
3691     }
3692
3693     if (dstr) {
3694         if (SvTHINKFIRST(dstr))
3695             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3696         else if (SvPVX_const(dstr))
3697             Safefree(SvPVX_const(dstr));
3698     }
3699     else
3700         new_SV(dstr);
3701     SvUPGRADE(dstr, SVt_PVIV);
3702
3703     assert (SvPOK(sstr));
3704     assert (SvPOKp(sstr));
3705     assert (!SvIOK(sstr));
3706     assert (!SvIOKp(sstr));
3707     assert (!SvNOK(sstr));
3708     assert (!SvNOKp(sstr));
3709
3710     if (SvIsCOW(sstr)) {
3711
3712         if (SvLEN(sstr) == 0) {
3713             /* source is a COW shared hash key.  */
3714             DEBUG_C(PerlIO_printf(Perl_debug_log,
3715                                   "Fast copy on write: Sharing hash\n"));
3716             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3717             goto common_exit;
3718         }
3719         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3720     } else {
3721         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3722         SvUPGRADE(sstr, SVt_PVIV);
3723         SvREADONLY_on(sstr);
3724         SvFAKE_on(sstr);
3725         DEBUG_C(PerlIO_printf(Perl_debug_log,
3726                               "Fast copy on write: Converting sstr to COW\n"));
3727         SV_COW_NEXT_SV_SET(dstr, sstr);
3728     }
3729     SV_COW_NEXT_SV_SET(sstr, dstr);
3730     new_pv = SvPVX_mutable(sstr);
3731
3732   common_exit:
3733     SvPV_set(dstr, new_pv);
3734     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3735     if (SvUTF8(sstr))
3736         SvUTF8_on(dstr);
3737     SvLEN_set(dstr, len);
3738     SvCUR_set(dstr, cur);
3739     if (DEBUG_C_TEST) {
3740         sv_dump(dstr);
3741     }
3742     return dstr;
3743 }
3744 #endif
3745
3746 /*
3747 =for apidoc sv_setpvn
3748
3749 Copies a string into an SV.  The C<len> parameter indicates the number of
3750 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3751 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3752
3753 =cut
3754 */
3755
3756 void
3757 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3758 {
3759     register char *dptr;
3760
3761     SV_CHECK_THINKFIRST_COW_DROP(sv);
3762     if (!ptr) {
3763         (void)SvOK_off(sv);
3764         return;
3765     }
3766     else {
3767         /* len is STRLEN which is unsigned, need to copy to signed */
3768         const IV iv = len;
3769         if (iv < 0)
3770             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3771     }
3772     SvUPGRADE(sv, SVt_PV);
3773
3774     dptr = SvGROW(sv, len + 1);
3775     Move(ptr,dptr,len,char);
3776     dptr[len] = '\0';
3777     SvCUR_set(sv, len);
3778     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3779     SvTAINT(sv);
3780 }
3781
3782 /*
3783 =for apidoc sv_setpvn_mg
3784
3785 Like C<sv_setpvn>, but also handles 'set' magic.
3786
3787 =cut
3788 */
3789
3790 void
3791 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3792 {
3793     sv_setpvn(sv,ptr,len);
3794     SvSETMAGIC(sv);
3795 }
3796
3797 /*
3798 =for apidoc sv_setpv
3799
3800 Copies a string into an SV.  The string must be null-terminated.  Does not
3801 handle 'set' magic.  See C<sv_setpv_mg>.
3802
3803 =cut
3804 */
3805
3806 void
3807 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3808 {
3809     register STRLEN len;
3810
3811     SV_CHECK_THINKFIRST_COW_DROP(sv);
3812     if (!ptr) {
3813         (void)SvOK_off(sv);
3814         return;
3815     }
3816     len = strlen(ptr);
3817     SvUPGRADE(sv, SVt_PV);
3818
3819     SvGROW(sv, len + 1);
3820     Move(ptr,SvPVX(sv),len+1,char);
3821     SvCUR_set(sv, len);
3822     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3823     SvTAINT(sv);
3824 }
3825
3826 /*
3827 =for apidoc sv_setpv_mg
3828
3829 Like C<sv_setpv>, but also handles 'set' magic.
3830
3831 =cut
3832 */
3833
3834 void
3835 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3836 {
3837     sv_setpv(sv,ptr);
3838     SvSETMAGIC(sv);
3839 }
3840
3841 /*
3842 =for apidoc sv_usepvn
3843
3844 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3845 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3846 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3847 string length, C<len>, must be supplied.  This function will realloc the
3848 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3849 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3850 See C<sv_usepvn_mg>.
3851
3852 =cut
3853 */
3854
3855 void
3856 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3857 {
3858     STRLEN allocate;
3859     SV_CHECK_THINKFIRST_COW_DROP(sv);
3860     SvUPGRADE(sv, SVt_PV);
3861     if (!ptr) {
3862         (void)SvOK_off(sv);
3863         return;
3864     }
3865     if (SvPVX_const(sv))
3866         SvPV_free(sv);
3867
3868     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3869     ptr = saferealloc (ptr, allocate);
3870     SvPV_set(sv, ptr);
3871     SvCUR_set(sv, len);
3872     SvLEN_set(sv, allocate);
3873     *SvEND(sv) = '\0';
3874     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3875     SvTAINT(sv);
3876 }
3877
3878 /*
3879 =for apidoc sv_usepvn_mg
3880
3881 Like C<sv_usepvn>, but also handles 'set' magic.
3882
3883 =cut
3884 */
3885
3886 void
3887 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3888 {
3889     sv_usepvn(sv,ptr,len);
3890     SvSETMAGIC(sv);
3891 }
3892
3893 #ifdef PERL_OLD_COPY_ON_WRITE
3894 /* Need to do this *after* making the SV normal, as we need the buffer
3895    pointer to remain valid until after we've copied it.  If we let go too early,
3896    another thread could invalidate it by unsharing last of the same hash key
3897    (which it can do by means other than releasing copy-on-write Svs)
3898    or by changing the other copy-on-write SVs in the loop.  */
3899 STATIC void
3900 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3901 {
3902     if (len) { /* this SV was SvIsCOW_normal(sv) */
3903          /* we need to find the SV pointing to us.  */
3904         SV * const current = SV_COW_NEXT_SV(after);
3905
3906         if (current == sv) {
3907             /* The SV we point to points back to us (there were only two of us
3908                in the loop.)
3909                Hence other SV is no longer copy on write either.  */
3910             SvFAKE_off(after);
3911             SvREADONLY_off(after);
3912         } else {
3913             /* We need to follow the pointers around the loop.  */
3914             SV *next;
3915             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3916                 assert (next);
3917                 current = next;
3918                  /* don't loop forever if the structure is bust, and we have
3919                     a pointer into a closed loop.  */
3920                 assert (current != after);
3921                 assert (SvPVX_const(current) == pvx);
3922             }
3923             /* Make the SV before us point to the SV after us.  */
3924             SV_COW_NEXT_SV_SET(current, after);
3925         }
3926     } else {
3927         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3928     }
3929 }
3930
3931 int
3932 Perl_sv_release_IVX(pTHX_ register SV *sv)
3933 {
3934     if (SvIsCOW(sv))
3935         sv_force_normal_flags(sv, 0);
3936     SvOOK_off(sv);
3937     return 0;
3938 }
3939 #endif
3940 /*
3941 =for apidoc sv_force_normal_flags
3942
3943 Undo various types of fakery on an SV: if the PV is a shared string, make
3944 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3945 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3946 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3947 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3948 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3949 set to some other value.) In addition, the C<flags> parameter gets passed to
3950 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3951 with flags set to 0.
3952
3953 =cut
3954 */
3955
3956 void
3957 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3958 {
3959 #ifdef PERL_OLD_COPY_ON_WRITE
3960     if (SvREADONLY(sv)) {
3961         /* At this point I believe I should acquire a global SV mutex.  */
3962         if (SvFAKE(sv)) {
3963             const char * const pvx = SvPVX_const(sv);
3964             const STRLEN len = SvLEN(sv);
3965             const STRLEN cur = SvCUR(sv);
3966             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3967             if (DEBUG_C_TEST) {
3968                 PerlIO_printf(Perl_debug_log,
3969                               "Copy on write: Force normal %ld\n",
3970                               (long) flags);
3971                 sv_dump(sv);
3972             }
3973             SvFAKE_off(sv);
3974             SvREADONLY_off(sv);
3975             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3976             SvPV_set(sv, (char*)0);
3977             SvLEN_set(sv, 0);
3978             if (flags & SV_COW_DROP_PV) {
3979                 /* OK, so we don't need to copy our buffer.  */
3980                 SvPOK_off(sv);
3981             } else {
3982                 SvGROW(sv, cur + 1);
3983                 Move(pvx,SvPVX(sv),cur,char);
3984                 SvCUR_set(sv, cur);
3985                 *SvEND(sv) = '\0';
3986             }
3987             sv_release_COW(sv, pvx, len, next);
3988             if (DEBUG_C_TEST) {
3989                 sv_dump(sv);
3990             }
3991         }
3992         else if (IN_PERL_RUNTIME)
3993             Perl_croak(aTHX_ PL_no_modify);
3994         /* At this point I believe that I can drop the global SV mutex.  */
3995     }
3996 #else
3997     if (SvREADONLY(sv)) {
3998         if (SvFAKE(sv)) {
3999             const char * const pvx = SvPVX_const(sv);
4000             const STRLEN len = SvCUR(sv);
4001             SvFAKE_off(sv);
4002             SvREADONLY_off(sv);
4003             SvPV_set(sv, Nullch);
4004             SvLEN_set(sv, 0);
4005             SvGROW(sv, len + 1);
4006             Move(pvx,SvPVX(sv),len,char);
4007             *SvEND(sv) = '\0';
4008             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
4009         }
4010         else if (IN_PERL_RUNTIME)
4011             Perl_croak(aTHX_ PL_no_modify);
4012     }
4013 #endif
4014     if (SvROK(sv))
4015         sv_unref_flags(sv, flags);
4016     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
4017         sv_unglob(sv);
4018 }
4019
4020 /*
4021 =for apidoc sv_chop
4022
4023 Efficient removal of characters from the beginning of the string buffer.
4024 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
4025 the string buffer.  The C<ptr> becomes the first character of the adjusted
4026 string. Uses the "OOK hack".
4027 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
4028 refer to the same chunk of data.
4029
4030 =cut
4031 */
4032
4033 void
4034 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
4035 {
4036     register STRLEN delta;
4037     if (!ptr || !SvPOKp(sv))
4038         return;
4039     delta = ptr - SvPVX_const(sv);
4040     SV_CHECK_THINKFIRST(sv);
4041     if (SvTYPE(sv) < SVt_PVIV)
4042         sv_upgrade(sv,SVt_PVIV);
4043
4044     if (!SvOOK(sv)) {
4045         if (!SvLEN(sv)) { /* make copy of shared string */
4046             const char *pvx = SvPVX_const(sv);
4047             const STRLEN len = SvCUR(sv);
4048             SvGROW(sv, len + 1);
4049             Move(pvx,SvPVX(sv),len,char);
4050             *SvEND(sv) = '\0';
4051         }
4052         SvIV_set(sv, 0);
4053         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
4054            and we do that anyway inside the SvNIOK_off
4055         */
4056         SvFLAGS(sv) |= SVf_OOK;
4057     }
4058     SvNIOK_off(sv);
4059     SvLEN_set(sv, SvLEN(sv) - delta);
4060     SvCUR_set(sv, SvCUR(sv) - delta);
4061     SvPV_set(sv, SvPVX(sv) + delta);
4062     SvIV_set(sv, SvIVX(sv) + delta);
4063 }
4064
4065 /*
4066 =for apidoc sv_catpvn
4067
4068 Concatenates the string onto the end of the string which is in the SV.  The
4069 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4070 status set, then the bytes appended should be valid UTF-8.
4071 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
4072
4073 =for apidoc sv_catpvn_flags
4074
4075 Concatenates the string onto the end of the string which is in the SV.  The
4076 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4077 status set, then the bytes appended should be valid UTF-8.
4078 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
4079 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
4080 in terms of this function.
4081
4082 =cut
4083 */
4084
4085 void
4086 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
4087 {
4088     STRLEN dlen;
4089     const char *dstr = SvPV_force_flags(dsv, dlen, flags);
4090
4091     SvGROW(dsv, dlen + slen + 1);
4092     if (sstr == dstr)
4093         sstr = SvPVX_const(dsv);
4094     Move(sstr, SvPVX(dsv) + dlen, slen, char);
4095     SvCUR_set(dsv, SvCUR(dsv) + slen);
4096     *SvEND(dsv) = '\0';
4097     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
4098     SvTAINT(dsv);
4099     if (flags & SV_SMAGIC)
4100         SvSETMAGIC(dsv);
4101 }
4102
4103 /*
4104 =for apidoc sv_catsv
4105
4106 Concatenates the string from SV C<ssv> onto the end of the string in
4107 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
4108 not 'set' magic.  See C<sv_catsv_mg>.
4109
4110 =for apidoc sv_catsv_flags
4111
4112 Concatenates the string from SV C<ssv> onto the end of the string in
4113 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
4114 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
4115 and C<sv_catsv_nomg> are implemented in terms of this function.
4116
4117 =cut */
4118
4119 void
4120 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
4121 {
4122     const char *spv;
4123     STRLEN slen;
4124     if (ssv) {
4125         if ((spv = SvPV_const(ssv, slen))) {
4126             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
4127                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
4128                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
4129                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
4130                 dsv->sv_flags doesn't have that bit set.
4131                 Andy Dougherty  12 Oct 2001
4132             */
4133             const I32 sutf8 = DO_UTF8(ssv);
4134             I32 dutf8;
4135
4136             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
4137                 mg_get(dsv);
4138             dutf8 = DO_UTF8(dsv);
4139
4140             if (dutf8 != sutf8) {
4141                 if (dutf8) {
4142                     /* Not modifying source SV, so taking a temporary copy. */
4143                     SV* csv = sv_2mortal(newSVpvn(spv, slen));
4144
4145                     sv_utf8_upgrade(csv);
4146                     spv = SvPV_const(csv, slen);
4147                 }
4148                 else
4149                     sv_utf8_upgrade_nomg(dsv);
4150             }
4151             sv_catpvn_nomg(dsv, spv, slen);
4152         }
4153     }
4154     if (flags & SV_SMAGIC)
4155         SvSETMAGIC(dsv);
4156 }
4157
4158 /*
4159 =for apidoc sv_catpv
4160
4161 Concatenates the string onto the end of the string which is in the SV.
4162 If the SV has the UTF-8 status set, then the bytes appended should be
4163 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
4164
4165 =cut */
4166
4167 void
4168 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
4169 {
4170     register STRLEN len;
4171     STRLEN tlen;
4172     char *junk;
4173
4174     if (!ptr)
4175         return;
4176     junk = SvPV_force(sv, tlen);
4177     len = strlen(ptr);
4178     SvGROW(sv, tlen + len + 1);
4179     if (ptr == junk)
4180         ptr = SvPVX_const(sv);
4181     Move(ptr,SvPVX(sv)+tlen,len+1,char);
4182     SvCUR_set(sv, SvCUR(sv) + len);
4183     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
4184     SvTAINT(sv);
4185 }
4186
4187 /*
4188 =for apidoc sv_catpv_mg
4189
4190 Like C<sv_catpv>, but also handles 'set' magic.
4191
4192 =cut
4193 */
4194
4195 void
4196 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
4197 {
4198     sv_catpv(sv,ptr);
4199     SvSETMAGIC(sv);
4200 }
4201
4202 /*
4203 =for apidoc newSV
4204
4205 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
4206 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
4207 macro.
4208
4209 =cut
4210 */
4211
4212 SV *
4213 Perl_newSV(pTHX_ STRLEN len)
4214 {
4215     register SV *sv;
4216
4217     new_SV(sv);
4218     if (len) {
4219         sv_upgrade(sv, SVt_PV);
4220         SvGROW(sv, len + 1);
4221     }
4222     return sv;
4223 }
4224 /*
4225 =for apidoc sv_magicext
4226
4227 Adds magic to an SV, upgrading it if necessary. Applies the
4228 supplied vtable and returns a pointer to the magic added.
4229
4230 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4231 In particular, you can add magic to SvREADONLY SVs, and add more than
4232 one instance of the same 'how'.
4233
4234 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4235 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4236 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4237 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4238
4239 (This is now used as a subroutine by C<sv_magic>.)
4240
4241 =cut
4242 */
4243 MAGIC * 
4244 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4245                  const char* name, I32 namlen)
4246 {
4247     MAGIC* mg;
4248
4249     if (SvTYPE(sv) < SVt_PVMG) {
4250         SvUPGRADE(sv, SVt_PVMG);
4251     }
4252     Newxz(mg, 1, MAGIC);
4253     mg->mg_moremagic = SvMAGIC(sv);
4254     SvMAGIC_set(sv, mg);
4255
4256     /* Sometimes a magic contains a reference loop, where the sv and
4257        object refer to each other.  To prevent a reference loop that
4258        would prevent such objects being freed, we look for such loops
4259        and if we find one we avoid incrementing the object refcount.
4260
4261        Note we cannot do this to avoid self-tie loops as intervening RV must
4262        have its REFCNT incremented to keep it in existence.
4263
4264     */
4265     if (!obj || obj == sv ||
4266         how == PERL_MAGIC_arylen ||
4267         how == PERL_MAGIC_qr ||
4268         how == PERL_MAGIC_symtab ||
4269         (SvTYPE(obj) == SVt_PVGV &&
4270             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4271             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4272             GvFORM(obj) == (CV*)sv)))
4273     {
4274         mg->mg_obj = obj;
4275     }
4276     else {
4277         mg->mg_obj = SvREFCNT_inc(obj);
4278         mg->mg_flags |= MGf_REFCOUNTED;
4279     }
4280
4281     /* Normal self-ties simply pass a null object, and instead of
4282        using mg_obj directly, use the SvTIED_obj macro to produce a
4283        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4284        with an RV obj pointing to the glob containing the PVIO.  In
4285        this case, to avoid a reference loop, we need to weaken the
4286        reference.
4287     */
4288
4289     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4290         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4291     {
4292       sv_rvweaken(obj);
4293     }
4294
4295     mg->mg_type = how;
4296     mg->mg_len = namlen;
4297     if (name) {
4298         if (namlen > 0)
4299             mg->mg_ptr = savepvn(name, namlen);
4300         else if (namlen == HEf_SVKEY)
4301             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4302         else
4303             mg->mg_ptr = (char *) name;
4304     }
4305     mg->mg_virtual = vtable;
4306
4307     mg_magical(sv);
4308     if (SvGMAGICAL(sv))
4309         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4310     return mg;
4311 }
4312
4313 /*
4314 =for apidoc sv_magic
4315
4316 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4317 then adds a new magic item of type C<how> to the head of the magic list.
4318
4319 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4320 handling of the C<name> and C<namlen> arguments.
4321
4322 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4323 to add more than one instance of the same 'how'.
4324
4325 =cut
4326 */
4327
4328 void
4329 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4330 {
4331     const MGVTBL *vtable;
4332     MAGIC* mg;
4333
4334 #ifdef PERL_OLD_COPY_ON_WRITE
4335     if (SvIsCOW(sv))
4336         sv_force_normal_flags(sv, 0);
4337 #endif
4338     if (SvREADONLY(sv)) {
4339         if (
4340             /* its okay to attach magic to shared strings; the subsequent
4341              * upgrade to PVMG will unshare the string */
4342             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4343
4344             && IN_PERL_RUNTIME
4345             && how != PERL_MAGIC_regex_global
4346             && how != PERL_MAGIC_bm
4347             && how != PERL_MAGIC_fm
4348             && how != PERL_MAGIC_sv
4349             && how != PERL_MAGIC_backref
4350            )
4351         {
4352             Perl_croak(aTHX_ PL_no_modify);
4353         }
4354     }
4355     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4356         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4357             /* sv_magic() refuses to add a magic of the same 'how' as an
4358                existing one
4359              */
4360             if (how == PERL_MAGIC_taint)
4361                 mg->mg_len |= 1;
4362             return;
4363         }
4364     }
4365
4366     switch (how) {
4367     case PERL_MAGIC_sv:
4368         vtable = &PL_vtbl_sv;
4369         break;
4370     case PERL_MAGIC_overload:
4371         vtable = &PL_vtbl_amagic;
4372         break;
4373     case PERL_MAGIC_overload_elem:
4374         vtable = &PL_vtbl_amagicelem;
4375         break;
4376     case PERL_MAGIC_overload_table:
4377         vtable = &PL_vtbl_ovrld;
4378         break;
4379     case PERL_MAGIC_bm:
4380         vtable = &PL_vtbl_bm;
4381         break;
4382     case PERL_MAGIC_regdata:
4383         vtable = &PL_vtbl_regdata;
4384         break;
4385     case PERL_MAGIC_regdatum:
4386         vtable = &PL_vtbl_regdatum;
4387         break;
4388     case PERL_MAGIC_env:
4389         vtable = &PL_vtbl_env;
4390         break;
4391     case PERL_MAGIC_fm:
4392         vtable = &PL_vtbl_fm;
4393         break;
4394     case PERL_MAGIC_envelem:
4395         vtable = &PL_vtbl_envelem;
4396         break;
4397     case PERL_MAGIC_regex_global:
4398         vtable = &PL_vtbl_mglob;
4399         break;
4400     case PERL_MAGIC_isa:
4401         vtable = &PL_vtbl_isa;
4402         break;
4403     case PERL_MAGIC_isaelem:
4404         vtable = &PL_vtbl_isaelem;
4405         break;
4406     case PERL_MAGIC_nkeys:
4407         vtable = &PL_vtbl_nkeys;
4408         break;
4409     case PERL_MAGIC_dbfile:
4410         vtable = NULL;
4411         break;
4412     case PERL_MAGIC_dbline:
4413         vtable = &PL_vtbl_dbline;
4414         break;
4415 #ifdef USE_LOCALE_COLLATE
4416     case PERL_MAGIC_collxfrm:
4417         vtable = &PL_vtbl_collxfrm;
4418         break;
4419 #endif /* USE_LOCALE_COLLATE */
4420     case PERL_MAGIC_tied:
4421         vtable = &PL_vtbl_pack;
4422         break;
4423     case PERL_MAGIC_tiedelem:
4424     case PERL_MAGIC_tiedscalar:
4425         vtable = &PL_vtbl_packelem;
4426         break;
4427     case PERL_MAGIC_qr:
4428         vtable = &PL_vtbl_regexp;
4429         break;
4430     case PERL_MAGIC_sig:
4431         vtable = &PL_vtbl_sig;
4432         break;
4433     case PERL_MAGIC_sigelem:
4434         vtable = &PL_vtbl_sigelem;
4435         break;
4436     case PERL_MAGIC_taint:
4437         vtable = &PL_vtbl_taint;
4438         break;
4439     case PERL_MAGIC_uvar:
4440         vtable = &PL_vtbl_uvar;
4441         break;
4442     case PERL_MAGIC_vec:
4443         vtable = &PL_vtbl_vec;
4444         break;
4445     case PERL_MAGIC_arylen_p:
4446     case PERL_MAGIC_rhash:
4447     case PERL_MAGIC_symtab:
4448     case PERL_MAGIC_vstring:
4449         vtable = NULL;
4450         break;
4451     case PERL_MAGIC_utf8:
4452         vtable = &PL_vtbl_utf8;
4453         break;
4454     case PERL_MAGIC_substr:
4455         vtable = &PL_vtbl_substr;
4456         break;
4457     case PERL_MAGIC_defelem:
4458         vtable = &PL_vtbl_defelem;
4459         break;
4460     case PERL_MAGIC_glob:
4461         vtable = &PL_vtbl_glob;
4462         break;
4463     case PERL_MAGIC_arylen:
4464         vtable = &PL_vtbl_arylen;
4465         break;
4466     case PERL_MAGIC_pos:
4467         vtable = &PL_vtbl_pos;
4468         break;
4469     case PERL_MAGIC_backref:
4470         vtable = &PL_vtbl_backref;
4471         break;
4472     case PERL_MAGIC_ext:
4473         /* Reserved for use by extensions not perl internals.           */
4474         /* Useful for attaching extension internal data to perl vars.   */
4475         /* Note that multiple extensions may clash if magical scalars   */
4476         /* etc holding private data from one are passed to another.     */
4477         vtable = NULL;
4478         break;
4479     default:
4480         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4481     }
4482
4483     /* Rest of work is done else where */
4484     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4485
4486     switch (how) {
4487     case PERL_MAGIC_taint:
4488         mg->mg_len = 1;
4489         break;
4490     case PERL_MAGIC_ext:
4491     case PERL_MAGIC_dbfile:
4492         SvRMAGICAL_on(sv);
4493         break;
4494     }
4495 }
4496
4497 /*
4498 =for apidoc sv_unmagic
4499
4500 Removes all magic of type C<type> from an SV.
4501
4502 =cut
4503 */
4504
4505 int
4506 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4507 {
4508     MAGIC* mg;
4509     MAGIC** mgp;
4510     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4511         return 0;
4512     mgp = &SvMAGIC(sv);
4513     for (mg = *mgp; mg; mg = *mgp) {
4514         if (mg->mg_type == type) {
4515             const MGVTBL* const vtbl = mg->mg_virtual;
4516             *mgp = mg->mg_moremagic;
4517             if (vtbl && vtbl->svt_free)
4518                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4519             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4520                 if (mg->mg_len > 0)
4521                     Safefree(mg->mg_ptr);
4522                 else if (mg->mg_len == HEf_SVKEY)
4523                     SvREFCNT_dec((SV*)mg->mg_ptr);
4524                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4525                     Safefree(mg->mg_ptr);
4526             }
4527             if (mg->mg_flags & MGf_REFCOUNTED)
4528                 SvREFCNT_dec(mg->mg_obj);
4529             Safefree(mg);
4530         }
4531         else
4532             mgp = &mg->mg_moremagic;
4533     }
4534     if (!SvMAGIC(sv)) {
4535         SvMAGICAL_off(sv);
4536        SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4537     }
4538
4539     return 0;
4540 }
4541
4542 /*
4543 =for apidoc sv_rvweaken
4544
4545 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4546 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4547 push a back-reference to this RV onto the array of backreferences
4548 associated with that magic.
4549
4550 =cut
4551 */
4552
4553 SV *
4554 Perl_sv_rvweaken(pTHX_ SV *sv)
4555 {
4556     SV *tsv;
4557     if (!SvOK(sv))  /* let undefs pass */
4558         return sv;
4559     if (!SvROK(sv))
4560         Perl_croak(aTHX_ "Can't weaken a nonreference");
4561     else if (SvWEAKREF(sv)) {
4562         if (ckWARN(WARN_MISC))
4563             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4564         return sv;
4565     }
4566     tsv = SvRV(sv);
4567     Perl_sv_add_backref(aTHX_ tsv, sv);
4568     SvWEAKREF_on(sv);
4569     SvREFCNT_dec(tsv);
4570     return sv;
4571 }
4572
4573 /* Give tsv backref magic if it hasn't already got it, then push a
4574  * back-reference to sv onto the array associated with the backref magic.
4575  */
4576
4577 void
4578 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4579 {
4580     AV *av;
4581     MAGIC *mg;
4582     if (SvMAGICAL(tsv) && (mg = mg_find(tsv, PERL_MAGIC_backref)))
4583         av = (AV*)mg->mg_obj;
4584     else {
4585         av = newAV();
4586         sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4587         /* av now has a refcnt of 2, which avoids it getting freed
4588          * before us during global cleanup. The extra ref is removed
4589          * by magic_killbackrefs() when tsv is being freed */
4590     }
4591     if (AvFILLp(av) >= AvMAX(av)) {
4592         av_extend(av, AvFILLp(av)+1);
4593     }
4594     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4595 }
4596
4597 /* delete a back-reference to ourselves from the backref magic associated
4598  * with the SV we point to.
4599  */
4600
4601 STATIC void
4602 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4603 {
4604     AV *av;
4605     SV **svp;
4606     I32 i;
4607     MAGIC *mg = NULL;
4608     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref))) {
4609         if (PL_in_clean_all)
4610             return;
4611     }
4612     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref)))
4613         Perl_croak(aTHX_ "panic: del_backref");
4614     av = (AV *)mg->mg_obj;
4615     svp = AvARRAY(av);
4616     /* We shouldn't be in here more than once, but for paranoia reasons lets
4617        not assume this.  */
4618     for (i = AvFILLp(av); i >= 0; i--) {
4619         if (svp[i] == sv) {
4620             const SSize_t fill = AvFILLp(av);
4621             if (i != fill) {
4622                 /* We weren't the last entry.
4623                    An unordered list has this property that you can take the
4624                    last element off the end to fill the hole, and it's still
4625                    an unordered list :-)
4626                 */
4627                 svp[i] = svp[fill];
4628             }
4629             svp[fill] = Nullsv;
4630             AvFILLp(av) = fill - 1;
4631         }
4632     }
4633 }
4634
4635 /*
4636 =for apidoc sv_insert
4637
4638 Inserts a string at the specified offset/length within the SV. Similar to
4639 the Perl substr() function.
4640
4641 =cut
4642 */
4643
4644 void
4645 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4646 {
4647     register char *big;
4648     register char *mid;
4649     register char *midend;
4650     register char *bigend;
4651     register I32 i;
4652     STRLEN curlen;
4653
4654
4655     if (!bigstr)
4656         Perl_croak(aTHX_ "Can't modify non-existent substring");
4657     SvPV_force(bigstr, curlen);
4658     (void)SvPOK_only_UTF8(bigstr);
4659     if (offset + len > curlen) {
4660         SvGROW(bigstr, offset+len+1);
4661         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4662         SvCUR_set(bigstr, offset+len);
4663     }
4664
4665     SvTAINT(bigstr);
4666     i = littlelen - len;
4667     if (i > 0) {                        /* string might grow */
4668         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4669         mid = big + offset + len;
4670         midend = bigend = big + SvCUR(bigstr);
4671         bigend += i;
4672         *bigend = '\0';
4673         while (midend > mid)            /* shove everything down */
4674             *--bigend = *--midend;
4675         Move(little,big+offset,littlelen,char);
4676         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4677         SvSETMAGIC(bigstr);
4678         return;
4679     }
4680     else if (i == 0) {
4681         Move(little,SvPVX(bigstr)+offset,len,char);
4682         SvSETMAGIC(bigstr);
4683         return;
4684     }
4685
4686     big = SvPVX(bigstr);
4687     mid = big + offset;
4688     midend = mid + len;
4689     bigend = big + SvCUR(bigstr);
4690
4691     if (midend > bigend)
4692         Perl_croak(aTHX_ "panic: sv_insert");
4693
4694     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4695         if (littlelen) {
4696             Move(little, mid, littlelen,char);
4697             mid += littlelen;
4698         }
4699         i = bigend - midend;
4700         if (i > 0) {
4701             Move(midend, mid, i,char);
4702             mid += i;
4703         }
4704         *mid = '\0';
4705         SvCUR_set(bigstr, mid - big);
4706     }
4707     else if ((i = mid - big)) { /* faster from front */
4708         midend -= littlelen;
4709         mid = midend;
4710         sv_chop(bigstr,midend-i);
4711         big += i;
4712         while (i--)
4713             *--midend = *--big;
4714         if (littlelen)
4715             Move(little, mid, littlelen,char);
4716     }
4717     else if (littlelen) {
4718         midend -= littlelen;
4719         sv_chop(bigstr,midend);
4720         Move(little,midend,littlelen,char);
4721     }
4722     else {
4723         sv_chop(bigstr,midend);
4724     }
4725     SvSETMAGIC(bigstr);
4726 }
4727
4728 /*
4729 =for apidoc sv_replace
4730
4731 Make the first argument a copy of the second, then delete the original.
4732 The target SV physically takes over ownership of the body of the source SV
4733 and inherits its flags; however, the target keeps any magic it owns,
4734 and any magic in the source is discarded.
4735 Note that this is a rather specialist SV copying operation; most of the
4736 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4737
4738 =cut
4739 */
4740
4741 void
4742 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4743 {
4744     const U32 refcnt = SvREFCNT(sv);
4745     SV_CHECK_THINKFIRST_COW_DROP(sv);
4746     if (SvREFCNT(nsv) != 1) {
4747         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4748                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4749     }
4750     if (SvMAGICAL(sv)) {
4751         if (SvMAGICAL(nsv))
4752             mg_free(nsv);
4753         else
4754             sv_upgrade(nsv, SVt_PVMG);
4755         SvMAGIC_set(nsv, SvMAGIC(sv));
4756         SvFLAGS(nsv) |= SvMAGICAL(sv);
4757         SvMAGICAL_off(sv);
4758         SvMAGIC_set(sv, NULL);
4759     }
4760     SvREFCNT(sv) = 0;
4761     sv_clear(sv);
4762     assert(!SvREFCNT(sv));
4763 #ifdef DEBUG_LEAKING_SCALARS
4764     sv->sv_flags  = nsv->sv_flags;
4765     sv->sv_any    = nsv->sv_any;
4766     sv->sv_refcnt = nsv->sv_refcnt;
4767     sv->sv_u      = nsv->sv_u;
4768 #else
4769     StructCopy(nsv,sv,SV);
4770 #endif
4771     /* Currently could join these into one piece of pointer arithmetic, but
4772        it would be unclear.  */
4773     if(SvTYPE(sv) == SVt_IV)
4774         SvANY(sv)
4775             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4776     else if (SvTYPE(sv) == SVt_RV) {
4777         SvANY(sv) = &sv->sv_u.svu_rv;
4778     }
4779         
4780
4781 #ifdef PERL_OLD_COPY_ON_WRITE
4782     if (SvIsCOW_normal(nsv)) {
4783         /* We need to follow the pointers around the loop to make the
4784            previous SV point to sv, rather than nsv.  */
4785         SV *next;
4786         SV *current = nsv;
4787         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4788             assert(next);
4789             current = next;
4790             assert(SvPVX_const(current) == SvPVX_const(nsv));
4791         }
4792         /* Make the SV before us point to the SV after us.  */
4793         if (DEBUG_C_TEST) {
4794             PerlIO_printf(Perl_debug_log, "previous is\n");
4795             sv_dump(current);
4796             PerlIO_printf(Perl_debug_log,
4797                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4798                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4799         }
4800         SV_COW_NEXT_SV_SET(current, sv);
4801     }
4802 #endif
4803     SvREFCNT(sv) = refcnt;
4804     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4805     SvREFCNT(nsv) = 0;
4806     del_SV(nsv);
4807 }
4808
4809 /*
4810 =for apidoc sv_clear
4811
4812 Clear an SV: call any destructors, free up any memory used by the body,
4813 and free the body itself. The SV's head is I<not> freed, although
4814 its type is set to all 1's so that it won't inadvertently be assumed
4815 to be live during global destruction etc.
4816 This function should only be called when REFCNT is zero. Most of the time
4817 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4818 instead.
4819
4820 =cut
4821 */
4822
4823 void
4824 Perl_sv_clear(pTHX_ register SV *sv)
4825 {
4826     dVAR;
4827     const U32 type = SvTYPE(sv);
4828     const struct body_details *const sv_type_details
4829         = bodies_by_type + type;
4830
4831     assert(sv);
4832     assert(SvREFCNT(sv) == 0);
4833
4834     if (type <= SVt_IV)
4835         return;
4836
4837     if (SvOBJECT(sv)) {
4838         if (PL_defstash) {              /* Still have a symbol table? */
4839             dSP;
4840             HV* stash;
4841             do {        
4842                 CV* destructor;
4843                 stash = SvSTASH(sv);
4844                 destructor = StashHANDLER(stash,DESTROY);
4845                 if (destructor) {
4846                     SV* const tmpref = newRV(sv);
4847                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4848                     ENTER;
4849                     PUSHSTACKi(PERLSI_DESTROY);
4850                     EXTEND(SP, 2);
4851                     PUSHMARK(SP);
4852                     PUSHs(tmpref);
4853                     PUTBACK;
4854                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4855                 
4856                 
4857                     POPSTACK;
4858                     SPAGAIN;
4859                     LEAVE;
4860                     if(SvREFCNT(tmpref) < 2) {
4861                         /* tmpref is not kept alive! */
4862                         SvREFCNT(sv)--;
4863                         SvRV_set(tmpref, NULL);
4864                         SvROK_off(tmpref);
4865                     }
4866                     SvREFCNT_dec(tmpref);
4867                 }
4868             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4869
4870
4871             if (SvREFCNT(sv)) {
4872                 if (PL_in_clean_objs)
4873                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4874                           HvNAME_get(stash));
4875                 /* DESTROY gave object new lease on life */
4876                 return;
4877             }
4878         }
4879
4880         if (SvOBJECT(sv)) {
4881             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4882             SvOBJECT_off(sv);   /* Curse the object. */
4883             if (type != SVt_PVIO)
4884                 --PL_sv_objcount;       /* XXX Might want something more general */
4885         }
4886     }
4887     if (type >= SVt_PVMG) {
4888         if (SvMAGIC(sv))
4889             mg_free(sv);
4890         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4891             SvREFCNT_dec(SvSTASH(sv));
4892     }
4893     switch (type) {
4894     case SVt_PVIO:
4895         if (IoIFP(sv) &&
4896             IoIFP(sv) != PerlIO_stdin() &&
4897             IoIFP(sv) != PerlIO_stdout() &&
4898             IoIFP(sv) != PerlIO_stderr())
4899         {
4900             io_close((IO*)sv, FALSE);
4901         }
4902         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4903             PerlDir_close(IoDIRP(sv));
4904         IoDIRP(sv) = (DIR*)NULL;
4905         Safefree(IoTOP_NAME(sv));
4906         Safefree(IoFMT_NAME(sv));
4907         Safefree(IoBOTTOM_NAME(sv));
4908         goto freescalar;
4909     case SVt_PVBM:
4910         goto freescalar;
4911     case SVt_PVCV:
4912     case SVt_PVFM:
4913         cv_undef((CV*)sv);
4914         goto freescalar;
4915     case SVt_PVHV:
4916         hv_undef((HV*)sv);
4917         break;
4918     case SVt_PVAV:
4919         av_undef((AV*)sv);
4920         break;
4921     case SVt_PVLV:
4922         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4923             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4924             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4925             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4926         }
4927         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4928             SvREFCNT_dec(LvTARG(sv));
4929         goto freescalar;
4930     case SVt_PVGV:
4931         gp_free((GV*)sv);
4932         Safefree(GvNAME(sv));
4933         /* If we're in a stash, we don't own a reference to it. However it does
4934            have a back reference to us, which needs to be cleared.  */
4935         if (GvSTASH(sv))
4936             sv_del_backref((SV*)GvSTASH(sv), sv);
4937     case SVt_PVMG:
4938     case SVt_PVNV:
4939     case SVt_PVIV:
4940       freescalar:
4941         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4942         if (SvOOK(sv)) {
4943             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4944             /* Don't even bother with turning off the OOK flag.  */
4945         }
4946     case SVt_PV:
4947     case SVt_RV:
4948         if (SvROK(sv)) {
4949             SV *target = SvRV(sv);
4950             if (SvWEAKREF(sv))
4951                 sv_del_backref(target, sv);
4952             else
4953                 SvREFCNT_dec(target);
4954         }
4955 #ifdef PERL_OLD_COPY_ON_WRITE
4956         else if (SvPVX_const(sv)) {
4957             if (SvIsCOW(sv)) {
4958                 /* I believe I need to grab the global SV mutex here and
4959                    then recheck the COW status.  */
4960                 if (DEBUG_C_TEST) {
4961                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4962                     sv_dump(sv);
4963                 }
4964                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4965                                SV_COW_NEXT_SV(sv));
4966                 /* And drop it here.  */
4967                 SvFAKE_off(sv);
4968             } else if (SvLEN(sv)) {
4969                 Safefree(SvPVX_const(sv));
4970             }
4971         }
4972 #else
4973         else if (SvPVX_const(sv) && SvLEN(sv))
4974             Safefree(SvPVX_mutable(sv));
4975         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4976             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4977             SvFAKE_off(sv);
4978         }
4979 #endif
4980         break;
4981     case SVt_NV:
4982         break;
4983     }
4984
4985     SvFLAGS(sv) &= SVf_BREAK;
4986     SvFLAGS(sv) |= SVTYPEMASK;
4987
4988     if (sv_type_details->arena) {
4989         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4990                  &PL_body_roots[type]);
4991     }
4992     else if (sv_type_details->size) {
4993         my_safefree(SvANY(sv));
4994     }
4995 }
4996
4997 /*
4998 =for apidoc sv_newref
4999
5000 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
5001 instead.
5002
5003 =cut
5004 */
5005
5006 SV *
5007 Perl_sv_newref(pTHX_ SV *sv)
5008 {
5009     if (sv)
5010         (SvREFCNT(sv))++;
5011     return sv;
5012 }
5013
5014 /*
5015 =for apidoc sv_free
5016
5017 Decrement an SV's reference count, and if it drops to zero, call
5018 C<sv_clear> to invoke destructors and free up any memory used by
5019 the body; finally, deallocate the SV's head itself.
5020 Normally called via a wrapper macro C<SvREFCNT_dec>.
5021
5022 =cut
5023 */
5024
5025 void
5026 Perl_sv_free(pTHX_ SV *sv)
5027 {
5028     dVAR;
5029     if (!sv)
5030         return;
5031     if (SvREFCNT(sv) == 0) {
5032         if (SvFLAGS(sv) & SVf_BREAK)
5033             /* this SV's refcnt has been artificially decremented to
5034              * trigger cleanup */
5035             return;
5036         if (PL_in_clean_all) /* All is fair */
5037             return;
5038         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5039             /* make sure SvREFCNT(sv)==0 happens very seldom */
5040             SvREFCNT(sv) = (~(U32)0)/2;
5041             return;
5042         }
5043         if (ckWARN_d(WARN_INTERNAL)) {
5044             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
5045                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
5046                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5047 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
5048             Perl_dump_sv_child(aTHX_ sv);
5049 #endif
5050         }
5051         return;
5052     }
5053     if (--(SvREFCNT(sv)) > 0)
5054         return;
5055     Perl_sv_free2(aTHX_ sv);
5056 }
5057
5058 void
5059 Perl_sv_free2(pTHX_ SV *sv)
5060 {
5061     dVAR;
5062 #ifdef DEBUGGING
5063     if (SvTEMP(sv)) {
5064         if (ckWARN_d(WARN_DEBUGGING))
5065             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
5066                         "Attempt to free temp prematurely: SV 0x%"UVxf
5067                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5068         return;
5069     }
5070 #endif
5071     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5072         /* make sure SvREFCNT(sv)==0 happens very seldom */
5073         SvREFCNT(sv) = (~(U32)0)/2;
5074         return;
5075     }
5076     sv_clear(sv);
5077     if (! SvREFCNT(sv))
5078         del_SV(sv);
5079 }
5080
5081 /*
5082 =for apidoc sv_len
5083
5084 Returns the length of the string in the SV. Handles magic and type
5085 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
5086
5087 =cut
5088 */
5089
5090 STRLEN
5091 Perl_sv_len(pTHX_ register SV *sv)
5092 {
5093     STRLEN len;
5094
5095     if (!sv)
5096         return 0;
5097
5098     if (SvGMAGICAL(sv))
5099         len = mg_length(sv);
5100     else
5101         (void)SvPV_const(sv, len);
5102     return len;
5103 }
5104
5105 /*
5106 =for apidoc sv_len_utf8
5107
5108 Returns the number of characters in the string in an SV, counting wide
5109 UTF-8 bytes as a single character. Handles magic and type coercion.
5110
5111 =cut
5112 */
5113
5114 /*
5115  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
5116  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
5117  * (Note that the mg_len is not the length of the mg_ptr field.)
5118  *
5119  */
5120
5121 STRLEN
5122 Perl_sv_len_utf8(pTHX_ register SV *sv)
5123 {
5124     if (!sv)
5125         return 0;
5126
5127     if (SvGMAGICAL(sv))
5128         return mg_length(sv);
5129     else
5130     {
5131         STRLEN len, ulen;
5132         const U8 *s = (U8*)SvPV_const(sv, len);
5133         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
5134
5135         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
5136             ulen = mg->mg_len;
5137 #ifdef PERL_UTF8_CACHE_ASSERT
5138             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
5139 #endif
5140         }
5141         else {
5142             ulen = Perl_utf8_length(aTHX_ s, s + len);
5143             if (!mg && !SvREADONLY(sv)) {
5144                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5145                 mg = mg_find(sv, PERL_MAGIC_utf8);
5146                 assert(mg);
5147             }
5148             if (mg)
5149                 mg->mg_len = ulen;
5150         }
5151         return ulen;
5152     }
5153 }
5154
5155 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
5156  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5157  * between UTF-8 and byte offsets.  There are two (substr offset and substr
5158  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
5159  * and byte offset) cache positions.
5160  *
5161  * The mg_len field is used by sv_len_utf8(), see its comments.
5162  * Note that the mg_len is not the length of the mg_ptr field.
5163  *
5164  */
5165 STATIC bool
5166 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
5167                    I32 offsetp, const U8 *s, const U8 *start)
5168 {
5169     bool found = FALSE;
5170
5171     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5172         if (!*mgp)
5173             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
5174         assert(*mgp);
5175
5176         if ((*mgp)->mg_ptr)
5177             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5178         else {
5179             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5180             (*mgp)->mg_ptr = (char *) *cachep;
5181         }
5182         assert(*cachep);
5183
5184         (*cachep)[i]   = offsetp;
5185         (*cachep)[i+1] = s - start;
5186         found = TRUE;
5187     }
5188
5189     return found;
5190 }
5191
5192 /*
5193  * S_utf8_mg_pos() is used to query and update mg_ptr field of
5194  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5195  * between UTF-8 and byte offsets.  See also the comments of
5196  * S_utf8_mg_pos_init().
5197  *
5198  */
5199 STATIC bool
5200 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
5201 {
5202     bool found = FALSE;
5203
5204     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5205         if (!*mgp)
5206             *mgp = mg_find(sv, PERL_MAGIC_utf8);
5207         if (*mgp && (*mgp)->mg_ptr) {
5208             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5209             ASSERT_UTF8_CACHE(*cachep);
5210             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
5211                  found = TRUE;
5212             else {                      /* We will skip to the right spot. */
5213                  STRLEN forw  = 0;
5214                  STRLEN backw = 0;
5215                  const U8* p = NULL;
5216
5217                  /* The assumption is that going backward is half
5218                   * the speed of going forward (that's where the
5219                   * 2 * backw in the below comes from).  (The real
5220                   * figure of course depends on the UTF-8 data.) */
5221
5222                  if ((*cachep)[i] > (STRLEN)uoff) {
5223                       forw  = uoff;
5224                       backw = (*cachep)[i] - (STRLEN)uoff;
5225
5226                       if (forw < 2 * backw)
5227                            p = start;
5228                       else
5229                            p = start + (*cachep)[i+1];
5230                  }
5231                  /* Try this only for the substr offset (i == 0),
5232                   * not for the substr length (i == 2). */
5233                  else if (i == 0) { /* (*cachep)[i] < uoff */
5234                       const STRLEN ulen = sv_len_utf8(sv);
5235
5236                       if ((STRLEN)uoff < ulen) {
5237                            forw  = (STRLEN)uoff - (*cachep)[i];
5238                            backw = ulen - (STRLEN)uoff;
5239
5240                            if (forw < 2 * backw)
5241                                 p = start + (*cachep)[i+1];
5242                            else
5243                                 p = send;
5244                       }
5245
5246                       /* If the string is not long enough for uoff,
5247                        * we could extend it, but not at this low a level. */
5248                  }
5249
5250                  if (p) {
5251                       if (forw < 2 * backw) {
5252                            while (forw--)
5253                                 p += UTF8SKIP(p);
5254                       }
5255                       else {
5256                            while (backw--) {
5257                                 p--;
5258                                 while (UTF8_IS_CONTINUATION(*p))
5259                                      p--;
5260                            }
5261                       }
5262
5263                       /* Update the cache. */
5264                       (*cachep)[i]   = (STRLEN)uoff;
5265                       (*cachep)[i+1] = p - start;
5266
5267                       /* Drop the stale "length" cache */
5268                       if (i == 0) {
5269                           (*cachep)[2] = 0;
5270                           (*cachep)[3] = 0;
5271                       }
5272
5273                       found = TRUE;
5274                  }
5275             }
5276             if (found) {        /* Setup the return values. */
5277                  *offsetp = (*cachep)[i+1];
5278                  *sp = start + *offsetp;
5279                  if (*sp >= send) {
5280                       *sp = send;
5281                       *offsetp = send - start;
5282                  }
5283                  else if (*sp < start) {
5284                       *sp = start;
5285                       *offsetp = 0;
5286                  }
5287             }
5288         }
5289 #ifdef PERL_UTF8_CACHE_ASSERT
5290         if (found) {
5291              U8 *s = start;
5292              I32 n = uoff;
5293
5294              while (n-- && s < send)
5295                   s += UTF8SKIP(s);
5296
5297              if (i == 0) {
5298                   assert(*offsetp == s - start);
5299                   assert((*cachep)[0] == (STRLEN)uoff);
5300                   assert((*cachep)[1] == *offsetp);
5301              }
5302              ASSERT_UTF8_CACHE(*cachep);
5303         }
5304 #endif
5305     }
5306
5307     return found;
5308 }
5309
5310 /*
5311 =for apidoc sv_pos_u2b
5312
5313 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5314 the start of the string, to a count of the equivalent number of bytes; if
5315 lenp is non-zero, it does the same to lenp, but this time starting from
5316 the offset, rather than from the start of the string. Handles magic and
5317 type coercion.
5318
5319 =cut
5320 */
5321
5322 /*
5323  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5324  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5325  * byte offsets.  See also the comments of S_utf8_mg_pos().
5326  *
5327  */
5328
5329 void
5330 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5331 {
5332     const U8 *start;
5333     STRLEN len;
5334
5335     if (!sv)
5336         return;
5337
5338     start = (U8*)SvPV_const(sv, len);
5339     if (len) {
5340         STRLEN boffset = 0;
5341         STRLEN *cache = 0;
5342         const U8 *s = start;
5343         I32 uoffset = *offsetp;
5344         const U8 * const send = s + len;
5345         MAGIC *mg = 0;
5346         bool found = FALSE;
5347
5348          if (utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send))
5349              found = TRUE;
5350          if (!found && uoffset > 0) {
5351               while (s < send && uoffset--)
5352                    s += UTF8SKIP(s);
5353               if (s >= send)
5354                    s = send;
5355               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5356                   boffset = cache[1];
5357               *offsetp = s - start;
5358          }
5359          if (lenp) {
5360               found = FALSE;
5361               start = s;
5362               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5363                   *lenp -= boffset;
5364                   found = TRUE;
5365               }
5366               if (!found && *lenp > 0) {
5367                    I32 ulen = *lenp;
5368                    if (ulen > 0)
5369                         while (s < send && ulen--)
5370                              s += UTF8SKIP(s);
5371                    if (s >= send)
5372                         s = send;
5373                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5374               }
5375               *lenp = s - start;
5376          }
5377          ASSERT_UTF8_CACHE(cache);
5378     }
5379     else {
5380          *offsetp = 0;
5381          if (lenp)
5382               *lenp = 0;
5383     }
5384
5385     return;
5386 }
5387
5388 /*
5389 =for apidoc sv_pos_b2u
5390
5391 Converts the value pointed to by offsetp from a count of bytes from the
5392 start of the string, to a count of the equivalent number of UTF-8 chars.
5393 Handles magic and type coercion.
5394
5395 =cut
5396 */
5397
5398 /*
5399  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5400  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5401  * byte offsets.  See also the comments of S_utf8_mg_pos().
5402  *
5403  */
5404
5405 void
5406 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5407 {
5408     const U8* s;
5409     STRLEN len;
5410
5411     if (!sv)
5412         return;
5413
5414     s = (const U8*)SvPV_const(sv, len);
5415     if ((I32)len < *offsetp)
5416         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5417     else {
5418         const U8* send = s + *offsetp;
5419         MAGIC* mg = NULL;
5420         STRLEN *cache = NULL;
5421
5422         len = 0;
5423
5424         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5425             mg = mg_find(sv, PERL_MAGIC_utf8);
5426             if (mg && mg->mg_ptr) {
5427                 cache = (STRLEN *) mg->mg_ptr;
5428                 if (cache[1] == (STRLEN)*offsetp) {
5429                     /* An exact match. */
5430                     *offsetp = cache[0];
5431
5432                     return;
5433                 }
5434                 else if (cache[1] < (STRLEN)*offsetp) {
5435                     /* We already know part of the way. */
5436                     len = cache[0];
5437                     s  += cache[1];
5438                     /* Let the below loop do the rest. */
5439                 }
5440                 else { /* cache[1] > *offsetp */
5441                     /* We already know all of the way, now we may
5442                      * be able to walk back.  The same assumption
5443                      * is made as in S_utf8_mg_pos(), namely that
5444                      * walking backward is twice slower than
5445                      * walking forward. */
5446                     const STRLEN forw  = *offsetp;
5447                     STRLEN backw = cache[1] - *offsetp;
5448
5449                     if (!(forw < 2 * backw)) {
5450                         const U8 *p = s + cache[1];
5451                         STRLEN ubackw = 0;
5452                         
5453                         cache[1] -= backw;
5454
5455                         while (backw--) {
5456                             p--;
5457                             while (UTF8_IS_CONTINUATION(*p)) {
5458                                 p--;
5459                                 backw--;
5460                             }
5461                             ubackw++;
5462                         }
5463
5464                         cache[0] -= ubackw;
5465                         *offsetp = cache[0];
5466
5467                         /* Drop the stale "length" cache */
5468                         cache[2] = 0;
5469                         cache[3] = 0;
5470
5471                         return;
5472                     }
5473                 }
5474             }
5475             ASSERT_UTF8_CACHE(cache);
5476         }
5477
5478         while (s < send) {
5479             STRLEN n = 1;
5480
5481             /* Call utf8n_to_uvchr() to validate the sequence
5482              * (unless a simple non-UTF character) */
5483             if (!UTF8_IS_INVARIANT(*s))
5484                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5485             if (n > 0) {
5486                 s += n;
5487                 len++;
5488             }
5489             else
5490                 break;
5491         }
5492
5493         if (!SvREADONLY(sv)) {
5494             if (!mg) {
5495                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5496                 mg = mg_find(sv, PERL_MAGIC_utf8);
5497             }
5498             assert(mg);
5499
5500             if (!mg->mg_ptr) {
5501                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5502                 mg->mg_ptr = (char *) cache;
5503             }
5504             assert(cache);
5505
5506             cache[0] = len;
5507             cache[1] = *offsetp;
5508             /* Drop the stale "length" cache */
5509             cache[2] = 0;
5510             cache[3] = 0;
5511         }
5512
5513         *offsetp = len;
5514     }
5515     return;
5516 }
5517
5518 /*
5519 =for apidoc sv_eq
5520
5521 Returns a boolean indicating whether the strings in the two SVs are
5522 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5523 coerce its args to strings if necessary.
5524
5525 =cut
5526 */
5527
5528 I32
5529 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5530 {
5531     const char *pv1;
5532     STRLEN cur1;
5533     const char *pv2;
5534     STRLEN cur2;
5535     I32  eq     = 0;
5536     char *tpv   = Nullch;
5537     SV* svrecode = Nullsv;
5538
5539     if (!sv1) {
5540         pv1 = "";
5541         cur1 = 0;
5542     }
5543     else
5544         pv1 = SvPV_const(sv1, cur1);
5545
5546     if (!sv2){
5547         pv2 = "";
5548         cur2 = 0;
5549     }
5550     else
5551         pv2 = SvPV_const(sv2, cur2);
5552
5553     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5554         /* Differing utf8ness.
5555          * Do not UTF8size the comparands as a side-effect. */
5556          if (PL_encoding) {
5557               if (SvUTF8(sv1)) {
5558                    svrecode = newSVpvn(pv2, cur2);
5559                    sv_recode_to_utf8(svrecode, PL_encoding);
5560                    pv2 = SvPV_const(svrecode, cur2);
5561               }
5562               else {
5563                    svrecode = newSVpvn(pv1, cur1);
5564                    sv_recode_to_utf8(svrecode, PL_encoding);
5565                    pv1 = SvPV_const(svrecode, cur1);
5566               }
5567               /* Now both are in UTF-8. */
5568               if (cur1 != cur2) {
5569                    SvREFCNT_dec(svrecode);
5570                    return FALSE;
5571               }
5572          }
5573          else {
5574               bool is_utf8 = TRUE;
5575
5576               if (SvUTF8(sv1)) {
5577                    /* sv1 is the UTF-8 one,
5578                     * if is equal it must be downgrade-able */
5579                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5580                                                      &cur1, &is_utf8);
5581                    if (pv != pv1)
5582                         pv1 = tpv = pv;
5583               }
5584               else {
5585                    /* sv2 is the UTF-8 one,
5586                     * if is equal it must be downgrade-able */
5587                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5588                                                       &cur2, &is_utf8);
5589                    if (pv != pv2)
5590                         pv2 = tpv = pv;
5591               }
5592               if (is_utf8) {
5593                    /* Downgrade not possible - cannot be eq */
5594                    assert (tpv == 0);
5595                    return FALSE;
5596               }
5597          }
5598     }
5599
5600     if (cur1 == cur2)
5601         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5602         
5603     if (svrecode)
5604          SvREFCNT_dec(svrecode);
5605
5606     if (tpv)
5607         Safefree(tpv);
5608
5609     return eq;
5610 }
5611
5612 /*
5613 =for apidoc sv_cmp
5614
5615 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5616 string in C<sv1> is less than, equal to, or greater than the string in
5617 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5618 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5619
5620 =cut
5621 */
5622
5623 I32
5624 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5625 {
5626     STRLEN cur1, cur2;
5627     const char *pv1, *pv2;
5628     char *tpv = Nullch;
5629     I32  cmp;
5630     SV *svrecode = Nullsv;
5631
5632     if (!sv1) {
5633         pv1 = "";
5634         cur1 = 0;
5635     }
5636     else
5637         pv1 = SvPV_const(sv1, cur1);
5638
5639     if (!sv2) {
5640         pv2 = "";
5641         cur2 = 0;
5642     }
5643     else
5644         pv2 = SvPV_const(sv2, cur2);
5645
5646     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5647         /* Differing utf8ness.
5648          * Do not UTF8size the comparands as a side-effect. */
5649         if (SvUTF8(sv1)) {
5650             if (PL_encoding) {
5651                  svrecode = newSVpvn(pv2, cur2);
5652                  sv_recode_to_utf8(svrecode, PL_encoding);
5653                  pv2 = SvPV_const(svrecode, cur2);
5654             }
5655             else {
5656                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5657             }
5658         }
5659         else {
5660             if (PL_encoding) {
5661                  svrecode = newSVpvn(pv1, cur1);
5662                  sv_recode_to_utf8(svrecode, PL_encoding);
5663                  pv1 = SvPV_const(svrecode, cur1);
5664             }
5665             else {
5666                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5667             }
5668         }
5669     }
5670
5671     if (!cur1) {
5672         cmp = cur2 ? -1 : 0;
5673     } else if (!cur2) {
5674         cmp = 1;
5675     } else {
5676         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5677
5678         if (retval) {
5679             cmp = retval < 0 ? -1 : 1;
5680         } else if (cur1 == cur2) {
5681             cmp = 0;
5682         } else {
5683             cmp = cur1 < cur2 ? -1 : 1;
5684         }
5685     }
5686
5687     if (svrecode)
5688          SvREFCNT_dec(svrecode);
5689
5690     if (tpv)
5691         Safefree(tpv);
5692
5693     return cmp;
5694 }
5695
5696 /*
5697 =for apidoc sv_cmp_locale
5698
5699 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5700 'use bytes' aware, handles get magic, and will coerce its args to strings
5701 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5702
5703 =cut
5704 */
5705
5706 I32
5707 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5708 {
5709 #ifdef USE_LOCALE_COLLATE
5710
5711     char *pv1, *pv2;
5712     STRLEN len1, len2;
5713     I32 retval;
5714
5715     if (PL_collation_standard)
5716         goto raw_compare;
5717
5718     len1 = 0;
5719     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5720     len2 = 0;
5721     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5722
5723     if (!pv1 || !len1) {
5724         if (pv2 && len2)
5725             return -1;
5726         else
5727             goto raw_compare;
5728     }
5729     else {
5730         if (!pv2 || !len2)
5731             return 1;
5732     }
5733
5734     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5735
5736     if (retval)
5737         return retval < 0 ? -1 : 1;
5738
5739     /*
5740      * When the result of collation is equality, that doesn't mean
5741      * that there are no differences -- some locales exclude some
5742      * characters from consideration.  So to avoid false equalities,
5743      * we use the raw string as a tiebreaker.
5744      */
5745
5746   raw_compare:
5747     /* FALL THROUGH */
5748
5749 #endif /* USE_LOCALE_COLLATE */
5750
5751     return sv_cmp(sv1, sv2);
5752 }
5753
5754
5755 #ifdef USE_LOCALE_COLLATE
5756
5757 /*
5758 =for apidoc sv_collxfrm
5759
5760 Add Collate Transform magic to an SV if it doesn't already have it.
5761
5762 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5763 scalar data of the variable, but transformed to such a format that a normal
5764 memory comparison can be used to compare the data according to the locale
5765 settings.
5766
5767 =cut
5768 */
5769
5770 char *
5771 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5772 {
5773     MAGIC *mg;
5774
5775     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5776     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5777         const char *s;
5778         char *xf;
5779         STRLEN len, xlen;
5780
5781         if (mg)
5782             Safefree(mg->mg_ptr);
5783         s = SvPV_const(sv, len);
5784         if ((xf = mem_collxfrm(s, len, &xlen))) {
5785             if (SvREADONLY(sv)) {
5786                 SAVEFREEPV(xf);
5787                 *nxp = xlen;
5788                 return xf + sizeof(PL_collation_ix);
5789             }
5790             if (! mg) {
5791                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5792                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5793                 assert(mg);
5794             }
5795             mg->mg_ptr = xf;
5796             mg->mg_len = xlen;
5797         }
5798         else {
5799             if (mg) {
5800                 mg->mg_ptr = NULL;
5801                 mg->mg_len = -1;
5802             }
5803         }
5804     }
5805     if (mg && mg->mg_ptr) {
5806         *nxp = mg->mg_len;
5807         return mg->mg_ptr + sizeof(PL_collation_ix);
5808     }
5809     else {
5810         *nxp = 0;
5811         return NULL;
5812     }
5813 }
5814
5815 #endif /* USE_LOCALE_COLLATE */
5816
5817 /*
5818 =for apidoc sv_gets
5819
5820 Get a line from the filehandle and store it into the SV, optionally
5821 appending to the currently-stored string.
5822
5823 =cut
5824 */
5825
5826 char *
5827 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5828 {
5829     const char *rsptr;
5830     STRLEN rslen;
5831     register STDCHAR rslast;
5832     register STDCHAR *bp;
5833     register I32 cnt;
5834     I32 i = 0;
5835     I32 rspara = 0;
5836     I32 recsize;
5837
5838     if (SvTHINKFIRST(sv))
5839         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5840     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5841        from <>.
5842        However, perlbench says it's slower, because the existing swipe code
5843        is faster than copy on write.
5844        Swings and roundabouts.  */
5845     SvUPGRADE(sv, SVt_PV);
5846
5847     SvSCREAM_off(sv);
5848
5849     if (append) {
5850         if (PerlIO_isutf8(fp)) {
5851             if (!SvUTF8(sv)) {
5852                 sv_utf8_upgrade_nomg(sv);
5853                 sv_pos_u2b(sv,&append,0);
5854             }
5855         } else if (SvUTF8(sv)) {
5856             SV * const tsv = NEWSV(0,0);
5857             sv_gets(tsv, fp, 0);
5858             sv_utf8_upgrade_nomg(tsv);
5859             SvCUR_set(sv,append);
5860             sv_catsv(sv,tsv);
5861             sv_free(tsv);
5862             goto return_string_or_null;
5863         }
5864     }
5865
5866     SvPOK_only(sv);
5867     if (PerlIO_isutf8(fp))
5868         SvUTF8_on(sv);
5869
5870     if (IN_PERL_COMPILETIME) {
5871         /* we always read code in line mode */
5872         rsptr = "\n";
5873         rslen = 1;
5874     }
5875     else if (RsSNARF(PL_rs)) {
5876         /* If it is a regular disk file use size from stat() as estimate
5877            of amount we are going to read - may result in malloc-ing
5878            more memory than we realy need if layers bellow reduce
5879            size we read (e.g. CRLF or a gzip layer)
5880          */
5881         Stat_t st;
5882         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5883             const Off_t offset = PerlIO_tell(fp);
5884             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5885                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5886             }
5887         }
5888         rsptr = NULL;
5889         rslen = 0;
5890     }
5891     else if (RsRECORD(PL_rs)) {
5892       I32 bytesread;
5893       char *buffer;
5894
5895       /* Grab the size of the record we're getting */
5896       recsize = SvIV(SvRV(PL_rs));
5897       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5898       /* Go yank in */
5899 #ifdef VMS
5900       /* VMS wants read instead of fread, because fread doesn't respect */
5901       /* RMS record boundaries. This is not necessarily a good thing to be */
5902       /* doing, but we've got no other real choice - except avoid stdio
5903          as implementation - perhaps write a :vms layer ?
5904        */
5905       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5906 #else
5907       bytesread = PerlIO_read(fp, buffer, recsize);
5908 #endif
5909       if (bytesread < 0)
5910           bytesread = 0;
5911       SvCUR_set(sv, bytesread += append);
5912       buffer[bytesread] = '\0';
5913       goto return_string_or_null;
5914     }
5915     else if (RsPARA(PL_rs)) {
5916         rsptr = "\n\n";
5917         rslen = 2;
5918         rspara = 1;
5919     }
5920     else {
5921         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5922         if (PerlIO_isutf8(fp)) {
5923             rsptr = SvPVutf8(PL_rs, rslen);
5924         }
5925         else {
5926             if (SvUTF8(PL_rs)) {
5927                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5928                     Perl_croak(aTHX_ "Wide character in $/");
5929                 }
5930             }
5931             rsptr = SvPV_const(PL_rs, rslen);
5932         }
5933     }
5934
5935     rslast = rslen ? rsptr[rslen - 1] : '\0';
5936
5937     if (rspara) {               /* have to do this both before and after */
5938         do {                    /* to make sure file boundaries work right */
5939             if (PerlIO_eof(fp))
5940                 return 0;
5941             i = PerlIO_getc(fp);
5942             if (i != '\n') {
5943                 if (i == -1)
5944                     return 0;
5945                 PerlIO_ungetc(fp,i);
5946                 break;
5947             }
5948         } while (i != EOF);
5949     }
5950
5951     /* See if we know enough about I/O mechanism to cheat it ! */
5952
5953     /* This used to be #ifdef test - it is made run-time test for ease
5954        of abstracting out stdio interface. One call should be cheap
5955        enough here - and may even be a macro allowing compile
5956        time optimization.
5957      */
5958
5959     if (PerlIO_fast_gets(fp)) {
5960
5961     /*
5962      * We're going to steal some values from the stdio struct
5963      * and put EVERYTHING in the innermost loop into registers.
5964      */
5965     register STDCHAR *ptr;
5966     STRLEN bpx;
5967     I32 shortbuffered;
5968
5969 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5970     /* An ungetc()d char is handled separately from the regular
5971      * buffer, so we getc() it back out and stuff it in the buffer.
5972      */
5973     i = PerlIO_getc(fp);
5974     if (i == EOF) return 0;
5975     *(--((*fp)->_ptr)) = (unsigned char) i;
5976     (*fp)->_cnt++;
5977 #endif
5978
5979     /* Here is some breathtakingly efficient cheating */
5980
5981     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5982     /* make sure we have the room */
5983     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5984         /* Not room for all of it
5985            if we are looking for a separator and room for some
5986          */
5987         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5988             /* just process what we have room for */
5989             shortbuffered = cnt - SvLEN(sv) + append + 1;
5990             cnt -= shortbuffered;
5991         }
5992         else {
5993             shortbuffered = 0;
5994             /* remember that cnt can be negative */
5995             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
5996         }
5997     }
5998     else
5999         shortbuffered = 0;
6000     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
6001     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
6002     DEBUG_P(PerlIO_printf(Perl_debug_log,
6003         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6004     DEBUG_P(PerlIO_printf(Perl_debug_log,
6005         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6006                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6007                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
6008     for (;;) {
6009       screamer:
6010         if (cnt > 0) {
6011             if (rslen) {
6012                 while (cnt > 0) {                    /* this     |  eat */
6013                     cnt--;
6014                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
6015                         goto thats_all_folks;        /* screams  |  sed :-) */
6016                 }
6017             }
6018             else {
6019                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
6020                 bp += cnt;                           /* screams  |  dust */
6021                 ptr += cnt;                          /* louder   |  sed :-) */
6022                 cnt = 0;
6023             }
6024         }
6025         
6026         if (shortbuffered) {            /* oh well, must extend */
6027             cnt = shortbuffered;
6028             shortbuffered = 0;
6029             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
6030             SvCUR_set(sv, bpx);
6031             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
6032             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
6033             continue;
6034         }
6035
6036         DEBUG_P(PerlIO_printf(Perl_debug_log,
6037                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
6038                               PTR2UV(ptr),(long)cnt));
6039         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
6040 #if 0
6041         DEBUG_P(PerlIO_printf(Perl_debug_log,
6042             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6043             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6044             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6045 #endif
6046         /* This used to call 'filbuf' in stdio form, but as that behaves like
6047            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
6048            another abstraction.  */
6049         i   = PerlIO_getc(fp);          /* get more characters */
6050 #if 0
6051         DEBUG_P(PerlIO_printf(Perl_debug_log,
6052             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6053             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6054             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6055 #endif
6056         cnt = PerlIO_get_cnt(fp);
6057         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
6058         DEBUG_P(PerlIO_printf(Perl_debug_log,
6059             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6060
6061         if (i == EOF)                   /* all done for ever? */
6062             goto thats_really_all_folks;
6063
6064         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
6065         SvCUR_set(sv, bpx);
6066         SvGROW(sv, bpx + cnt + 2);
6067         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
6068
6069         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
6070
6071         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
6072             goto thats_all_folks;
6073     }
6074
6075 thats_all_folks:
6076     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
6077           memNE((char*)bp - rslen, rsptr, rslen))
6078         goto screamer;                          /* go back to the fray */
6079 thats_really_all_folks:
6080     if (shortbuffered)
6081         cnt += shortbuffered;
6082         DEBUG_P(PerlIO_printf(Perl_debug_log,
6083             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6084     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
6085     DEBUG_P(PerlIO_printf(Perl_debug_log,
6086         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6087         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6088         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6089     *bp = '\0';
6090     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
6091     DEBUG_P(PerlIO_printf(Perl_debug_log,
6092         "Screamer: done, len=%ld, string=|%.*s|\n",
6093         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
6094     }
6095    else
6096     {
6097        /*The big, slow, and stupid way. */
6098 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
6099         STDCHAR *buf = 0;
6100         Newx(buf, 8192, STDCHAR);
6101         assert(buf);
6102 #else
6103         STDCHAR buf[8192];
6104 #endif
6105
6106 screamer2:
6107         if (rslen) {
6108             register const STDCHAR *bpe = buf + sizeof(buf);
6109             bp = buf;
6110             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
6111                 ; /* keep reading */
6112             cnt = bp - buf;
6113         }
6114         else {
6115             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
6116             /* Accomodate broken VAXC compiler, which applies U8 cast to
6117              * both args of ?: operator, causing EOF to change into 255
6118              */
6119             if (cnt > 0)
6120                  i = (U8)buf[cnt - 1];
6121             else
6122                  i = EOF;
6123         }
6124
6125         if (cnt < 0)
6126             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
6127         if (append)
6128              sv_catpvn(sv, (char *) buf, cnt);
6129         else
6130              sv_setpvn(sv, (char *) buf, cnt);
6131
6132         if (i != EOF &&                 /* joy */
6133             (!rslen ||
6134              SvCUR(sv) < rslen ||
6135              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
6136         {
6137             append = -1;
6138             /*
6139              * If we're reading from a TTY and we get a short read,
6140              * indicating that the user hit his EOF character, we need
6141              * to notice it now, because if we try to read from the TTY
6142              * again, the EOF condition will disappear.
6143              *
6144              * The comparison of cnt to sizeof(buf) is an optimization
6145              * that prevents unnecessary calls to feof().
6146              *
6147              * - jik 9/25/96
6148              */
6149             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
6150                 goto screamer2;
6151         }
6152
6153 #ifdef USE_HEAP_INSTEAD_OF_STACK
6154         Safefree(buf);
6155 #endif
6156     }
6157
6158     if (rspara) {               /* have to do this both before and after */
6159         while (i != EOF) {      /* to make sure file boundaries work right */
6160             i = PerlIO_getc(fp);
6161             if (i != '\n') {
6162                 PerlIO_ungetc(fp,i);
6163                 break;
6164             }
6165         }
6166     }
6167
6168 return_string_or_null:
6169     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
6170 }
6171
6172 /*
6173 =for apidoc sv_inc
6174
6175 Auto-increment of the value in the SV, doing string to numeric conversion
6176 if necessary. Handles 'get' magic.
6177
6178 =cut
6179 */
6180
6181 void
6182 Perl_sv_inc(pTHX_ register SV *sv)
6183 {
6184     register char *d;
6185     int flags;
6186
6187     if (!sv)
6188         return;
6189     SvGETMAGIC(sv);
6190     if (SvTHINKFIRST(sv)) {
6191         if (SvIsCOW(sv))
6192             sv_force_normal_flags(sv, 0);
6193         if (SvREADONLY(sv)) {
6194             if (IN_PERL_RUNTIME)
6195                 Perl_croak(aTHX_ PL_no_modify);
6196         }
6197         if (SvROK(sv)) {
6198             IV i;
6199             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
6200                 return;
6201             i = PTR2IV(SvRV(sv));
6202             sv_unref(sv);
6203             sv_setiv(sv, i);
6204         }
6205     }
6206     flags = SvFLAGS(sv);
6207     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
6208         /* It's (privately or publicly) a float, but not tested as an
6209            integer, so test it to see. */
6210         (void) SvIV(sv);
6211         flags = SvFLAGS(sv);
6212     }
6213     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6214         /* It's publicly an integer, or privately an integer-not-float */
6215 #ifdef PERL_PRESERVE_IVUV
6216       oops_its_int:
6217 #endif
6218         if (SvIsUV(sv)) {
6219             if (SvUVX(sv) == UV_MAX)
6220                 sv_setnv(sv, UV_MAX_P1);
6221             else
6222                 (void)SvIOK_only_UV(sv);
6223                 SvUV_set(sv, SvUVX(sv) + 1);
6224         } else {
6225             if (SvIVX(sv) == IV_MAX)
6226                 sv_setuv(sv, (UV)IV_MAX + 1);
6227             else {
6228                 (void)SvIOK_only(sv);
6229                 SvIV_set(sv, SvIVX(sv) + 1);
6230             }   
6231         }
6232         return;
6233     }
6234     if (flags & SVp_NOK) {
6235         (void)SvNOK_only(sv);
6236         SvNV_set(sv, SvNVX(sv) + 1.0);
6237         return;
6238     }
6239
6240     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6241         if ((flags & SVTYPEMASK) < SVt_PVIV)
6242             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6243         (void)SvIOK_only(sv);
6244         SvIV_set(sv, 1);
6245         return;
6246     }
6247     d = SvPVX(sv);
6248     while (isALPHA(*d)) d++;
6249     while (isDIGIT(*d)) d++;
6250     if (*d) {
6251 #ifdef PERL_PRESERVE_IVUV
6252         /* Got to punt this as an integer if needs be, but we don't issue
6253            warnings. Probably ought to make the sv_iv_please() that does
6254            the conversion if possible, and silently.  */
6255         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6256         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6257             /* Need to try really hard to see if it's an integer.
6258                9.22337203685478e+18 is an integer.
6259                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6260                so $a="9.22337203685478e+18"; $a+0; $a++
6261                needs to be the same as $a="9.22337203685478e+18"; $a++
6262                or we go insane. */
6263         
6264             (void) sv_2iv(sv);
6265             if (SvIOK(sv))
6266                 goto oops_its_int;
6267
6268             /* sv_2iv *should* have made this an NV */
6269             if (flags & SVp_NOK) {
6270                 (void)SvNOK_only(sv);
6271                 SvNV_set(sv, SvNVX(sv) + 1.0);
6272                 return;
6273             }
6274             /* I don't think we can get here. Maybe I should assert this
6275                And if we do get here I suspect that sv_setnv will croak. NWC
6276                Fall through. */
6277 #if defined(USE_LONG_DOUBLE)
6278             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6279                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6280 #else
6281             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6282                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6283 #endif
6284         }
6285 #endif /* PERL_PRESERVE_IVUV */
6286         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6287         return;
6288     }
6289     d--;
6290     while (d >= SvPVX_const(sv)) {
6291         if (isDIGIT(*d)) {
6292             if (++*d <= '9')
6293                 return;
6294             *(d--) = '0';
6295         }
6296         else {
6297 #ifdef EBCDIC
6298             /* MKS: The original code here died if letters weren't consecutive.
6299              * at least it didn't have to worry about non-C locales.  The
6300              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6301              * arranged in order (although not consecutively) and that only
6302              * [A-Za-z] are accepted by isALPHA in the C locale.
6303              */
6304             if (*d != 'z' && *d != 'Z') {
6305                 do { ++*d; } while (!isALPHA(*d));
6306                 return;
6307             }
6308             *(d--) -= 'z' - 'a';
6309 #else
6310             ++*d;
6311             if (isALPHA(*d))
6312                 return;
6313             *(d--) -= 'z' - 'a' + 1;
6314 #endif
6315         }
6316     }
6317     /* oh,oh, the number grew */
6318     SvGROW(sv, SvCUR(sv) + 2);
6319     SvCUR_set(sv, SvCUR(sv) + 1);
6320     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6321         *d = d[-1];
6322     if (isDIGIT(d[1]))
6323         *d = '1';
6324     else
6325         *d = d[1];
6326 }
6327
6328 /*
6329 =for apidoc sv_dec
6330
6331 Auto-decrement of the value in the SV, doing string to numeric conversion
6332 if necessary. Handles 'get' magic.
6333
6334 =cut
6335 */
6336
6337 void
6338 Perl_sv_dec(pTHX_ register SV *sv)
6339 {
6340     int flags;
6341
6342     if (!sv)
6343         return;
6344     SvGETMAGIC(sv);
6345     if (SvTHINKFIRST(sv)) {
6346         if (SvIsCOW(sv))
6347             sv_force_normal_flags(sv, 0);
6348         if (SvREADONLY(sv)) {
6349             if (IN_PERL_RUNTIME)
6350                 Perl_croak(aTHX_ PL_no_modify);
6351         }
6352         if (SvROK(sv)) {
6353             IV i;
6354             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6355                 return;
6356             i = PTR2IV(SvRV(sv));
6357             sv_unref(sv);
6358             sv_setiv(sv, i);
6359         }
6360     }
6361     /* Unlike sv_inc we don't have to worry about string-never-numbers
6362        and keeping them magic. But we mustn't warn on punting */
6363     flags = SvFLAGS(sv);
6364     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6365         /* It's publicly an integer, or privately an integer-not-float */
6366 #ifdef PERL_PRESERVE_IVUV
6367       oops_its_int:
6368 #endif
6369         if (SvIsUV(sv)) {
6370             if (SvUVX(sv) == 0) {
6371                 (void)SvIOK_only(sv);
6372                 SvIV_set(sv, -1);
6373             }
6374             else {
6375                 (void)SvIOK_only_UV(sv);
6376                 SvUV_set(sv, SvUVX(sv) - 1);
6377             }   
6378         } else {
6379             if (SvIVX(sv) == IV_MIN)
6380                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6381             else {
6382                 (void)SvIOK_only(sv);
6383                 SvIV_set(sv, SvIVX(sv) - 1);
6384             }   
6385         }
6386         return;
6387     }
6388     if (flags & SVp_NOK) {
6389         SvNV_set(sv, SvNVX(sv) - 1.0);
6390         (void)SvNOK_only(sv);
6391         return;
6392     }
6393     if (!(flags & SVp_POK)) {
6394         if ((flags & SVTYPEMASK) < SVt_PVIV)
6395             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6396         SvIV_set(sv, -1);
6397         (void)SvIOK_only(sv);
6398         return;
6399     }
6400 #ifdef PERL_PRESERVE_IVUV
6401     {
6402         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6403         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6404             /* Need to try really hard to see if it's an integer.
6405                9.22337203685478e+18 is an integer.
6406                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6407                so $a="9.22337203685478e+18"; $a+0; $a--
6408                needs to be the same as $a="9.22337203685478e+18"; $a--
6409                or we go insane. */
6410         
6411             (void) sv_2iv(sv);
6412             if (SvIOK(sv))
6413                 goto oops_its_int;
6414
6415             /* sv_2iv *should* have made this an NV */
6416             if (flags & SVp_NOK) {
6417                 (void)SvNOK_only(sv);
6418                 SvNV_set(sv, SvNVX(sv) - 1.0);
6419                 return;
6420             }
6421             /* I don't think we can get here. Maybe I should assert this
6422                And if we do get here I suspect that sv_setnv will croak. NWC
6423                Fall through. */
6424 #if defined(USE_LONG_DOUBLE)
6425             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6426                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6427 #else
6428             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6429                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6430 #endif
6431         }
6432     }
6433 #endif /* PERL_PRESERVE_IVUV */
6434     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6435 }
6436
6437 /*
6438 =for apidoc sv_mortalcopy
6439
6440 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6441 The new SV is marked as mortal. It will be destroyed "soon", either by an
6442 explicit call to FREETMPS, or by an implicit call at places such as
6443 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6444
6445 =cut
6446 */
6447
6448 /* Make a string that will exist for the duration of the expression
6449  * evaluation.  Actually, it may have to last longer than that, but
6450  * hopefully we won't free it until it has been assigned to a
6451  * permanent location. */
6452
6453 SV *
6454 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6455 {
6456     register SV *sv;
6457
6458     new_SV(sv);
6459     sv_setsv(sv,oldstr);
6460     EXTEND_MORTAL(1);
6461     PL_tmps_stack[++PL_tmps_ix] = sv;
6462     SvTEMP_on(sv);
6463     return sv;
6464 }
6465
6466 /*
6467 =for apidoc sv_newmortal
6468
6469 Creates a new null SV which is mortal.  The reference count of the SV is
6470 set to 1. It will be destroyed "soon", either by an explicit call to
6471 FREETMPS, or by an implicit call at places such as statement boundaries.
6472 See also C<sv_mortalcopy> and C<sv_2mortal>.
6473
6474 =cut
6475 */
6476
6477 SV *
6478 Perl_sv_newmortal(pTHX)
6479 {
6480     register SV *sv;
6481
6482     new_SV(sv);
6483     SvFLAGS(sv) = SVs_TEMP;
6484     EXTEND_MORTAL(1);
6485     PL_tmps_stack[++PL_tmps_ix] = sv;
6486     return sv;
6487 }
6488
6489 /*
6490 =for apidoc sv_2mortal
6491
6492 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6493 by an explicit call to FREETMPS, or by an implicit call at places such as
6494 statement boundaries.  SvTEMP() is turned on which means that the SV's
6495 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6496 and C<sv_mortalcopy>.
6497
6498 =cut
6499 */
6500
6501 SV *
6502 Perl_sv_2mortal(pTHX_ register SV *sv)
6503 {
6504     dVAR;
6505     if (!sv)
6506         return sv;
6507     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6508         return sv;
6509     EXTEND_MORTAL(1);
6510     PL_tmps_stack[++PL_tmps_ix] = sv;
6511     SvTEMP_on(sv);
6512     return sv;
6513 }
6514
6515 /*
6516 =for apidoc newSVpv
6517
6518 Creates a new SV and copies a string into it.  The reference count for the
6519 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6520 strlen().  For efficiency, consider using C<newSVpvn> instead.
6521
6522 =cut
6523 */
6524
6525 SV *
6526 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6527 {
6528     register SV *sv;
6529
6530     new_SV(sv);
6531     sv_setpvn(sv,s,len ? len : strlen(s));
6532     return sv;
6533 }
6534
6535 /*
6536 =for apidoc newSVpvn
6537
6538 Creates a new SV and copies a string into it.  The reference count for the
6539 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6540 string.  You are responsible for ensuring that the source string is at least
6541 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6542
6543 =cut
6544 */
6545
6546 SV *
6547 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6548 {
6549     register SV *sv;
6550
6551     new_SV(sv);
6552     sv_setpvn(sv,s,len);
6553     return sv;
6554 }
6555
6556
6557 /*
6558 =for apidoc newSVhek
6559
6560 Creates a new SV from the hash key structure.  It will generate scalars that
6561 point to the shared string table where possible. Returns a new (undefined)
6562 SV if the hek is NULL.
6563
6564 =cut
6565 */
6566
6567 SV *
6568 Perl_newSVhek(pTHX_ const HEK *hek)
6569 {
6570     if (!hek) {
6571         SV *sv;
6572
6573         new_SV(sv);
6574         return sv;
6575     }
6576
6577     if (HEK_LEN(hek) == HEf_SVKEY) {
6578         return newSVsv(*(SV**)HEK_KEY(hek));
6579     } else {
6580         const int flags = HEK_FLAGS(hek);
6581         if (flags & HVhek_WASUTF8) {
6582             /* Trouble :-)
6583                Andreas would like keys he put in as utf8 to come back as utf8
6584             */
6585             STRLEN utf8_len = HEK_LEN(hek);
6586             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6587             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6588
6589             SvUTF8_on (sv);
6590             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6591             return sv;
6592         } else if (flags & HVhek_REHASH) {
6593             /* We don't have a pointer to the hv, so we have to replicate the
6594                flag into every HEK. This hv is using custom a hasing
6595                algorithm. Hence we can't return a shared string scalar, as
6596                that would contain the (wrong) hash value, and might get passed
6597                into an hv routine with a regular hash  */
6598
6599             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6600             if (HEK_UTF8(hek))
6601                 SvUTF8_on (sv);
6602             return sv;
6603         }
6604         /* This will be overwhelminly the most common case.  */
6605         return newSVpvn_share(HEK_KEY(hek),
6606                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6607                               HEK_HASH(hek));
6608     }
6609 }
6610
6611 /*
6612 =for apidoc newSVpvn_share
6613
6614 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6615 table. If the string does not already exist in the table, it is created
6616 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6617 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6618 otherwise the hash is computed.  The idea here is that as the string table
6619 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6620 hash lookup will avoid string compare.
6621
6622 =cut
6623 */
6624
6625 SV *
6626 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6627 {
6628     register SV *sv;
6629     bool is_utf8 = FALSE;
6630     if (len < 0) {
6631         STRLEN tmplen = -len;
6632         is_utf8 = TRUE;
6633         /* See the note in hv.c:hv_fetch() --jhi */
6634         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6635         len = tmplen;
6636     }
6637     if (!hash)
6638         PERL_HASH(hash, src, len);
6639     new_SV(sv);
6640     sv_upgrade(sv, SVt_PV);
6641     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6642     SvCUR_set(sv, len);
6643     SvLEN_set(sv, 0);
6644     SvREADONLY_on(sv);
6645     SvFAKE_on(sv);
6646     SvPOK_on(sv);
6647     if (is_utf8)
6648         SvUTF8_on(sv);
6649     return sv;
6650 }
6651
6652
6653 #if defined(PERL_IMPLICIT_CONTEXT)
6654
6655 /* pTHX_ magic can't cope with varargs, so this is a no-context
6656  * version of the main function, (which may itself be aliased to us).
6657  * Don't access this version directly.
6658  */
6659
6660 SV *
6661 Perl_newSVpvf_nocontext(const char* pat, ...)
6662 {
6663     dTHX;
6664     register SV *sv;
6665     va_list args;
6666     va_start(args, pat);
6667     sv = vnewSVpvf(pat, &args);
6668     va_end(args);
6669     return sv;
6670 }
6671 #endif
6672
6673 /*
6674 =for apidoc newSVpvf
6675
6676 Creates a new SV and initializes it with the string formatted like
6677 C<sprintf>.
6678
6679 =cut
6680 */
6681
6682 SV *
6683 Perl_newSVpvf(pTHX_ const char* pat, ...)
6684 {
6685     register SV *sv;
6686     va_list args;
6687     va_start(args, pat);
6688     sv = vnewSVpvf(pat, &args);
6689     va_end(args);
6690     return sv;
6691 }
6692
6693 /* backend for newSVpvf() and newSVpvf_nocontext() */
6694
6695 SV *
6696 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6697 {
6698     register SV *sv;
6699     new_SV(sv);
6700     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6701     return sv;
6702 }
6703
6704 /*
6705 =for apidoc newSVnv
6706
6707 Creates a new SV and copies a floating point value into it.
6708 The reference count for the SV is set to 1.
6709
6710 =cut
6711 */
6712
6713 SV *
6714 Perl_newSVnv(pTHX_ NV n)
6715 {
6716     register SV *sv;
6717
6718     new_SV(sv);
6719     sv_setnv(sv,n);
6720     return sv;
6721 }
6722
6723 /*
6724 =for apidoc newSViv
6725
6726 Creates a new SV and copies an integer into it.  The reference count for the
6727 SV is set to 1.
6728
6729 =cut
6730 */
6731
6732 SV *
6733 Perl_newSViv(pTHX_ IV i)
6734 {
6735     register SV *sv;
6736
6737     new_SV(sv);
6738     sv_setiv(sv,i);
6739     return sv;
6740 }
6741
6742 /*
6743 =for apidoc newSVuv
6744
6745 Creates a new SV and copies an unsigned integer into it.
6746 The reference count for the SV is set to 1.
6747
6748 =cut
6749 */
6750
6751 SV *
6752 Perl_newSVuv(pTHX_ UV u)
6753 {
6754     register SV *sv;
6755
6756     new_SV(sv);
6757     sv_setuv(sv,u);
6758     return sv;
6759 }
6760
6761 /*
6762 =for apidoc newRV_noinc
6763
6764 Creates an RV wrapper for an SV.  The reference count for the original
6765 SV is B<not> incremented.
6766
6767 =cut
6768 */
6769
6770 SV *
6771 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6772 {
6773     register SV *sv;
6774
6775     new_SV(sv);
6776     sv_upgrade(sv, SVt_RV);
6777     SvTEMP_off(tmpRef);
6778     SvRV_set(sv, tmpRef);
6779     SvROK_on(sv);
6780     return sv;
6781 }
6782
6783 /* newRV_inc is the official function name to use now.
6784  * newRV_inc is in fact #defined to newRV in sv.h
6785  */
6786
6787 SV *
6788 Perl_newRV(pTHX_ SV *tmpRef)
6789 {
6790     return newRV_noinc(SvREFCNT_inc(tmpRef));
6791 }
6792
6793 /*
6794 =for apidoc newSVsv
6795
6796 Creates a new SV which is an exact duplicate of the original SV.
6797 (Uses C<sv_setsv>).
6798
6799 =cut
6800 */
6801
6802 SV *
6803 Perl_newSVsv(pTHX_ register SV *old)
6804 {
6805     register SV *sv;
6806
6807     if (!old)
6808         return Nullsv;
6809     if (SvTYPE(old) == SVTYPEMASK) {
6810         if (ckWARN_d(WARN_INTERNAL))
6811             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6812         return Nullsv;
6813     }
6814     new_SV(sv);
6815     /* SV_GMAGIC is the default for sv_setv()
6816        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6817        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6818     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6819     return sv;
6820 }
6821
6822 /*
6823 =for apidoc sv_reset
6824
6825 Underlying implementation for the C<reset> Perl function.
6826 Note that the perl-level function is vaguely deprecated.
6827
6828 =cut
6829 */
6830
6831 void
6832 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6833 {
6834     dVAR;
6835     char todo[PERL_UCHAR_MAX+1];
6836
6837     if (!stash)
6838         return;
6839
6840     if (!*s) {          /* reset ?? searches */
6841         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6842         if (mg) {
6843             PMOP *pm = (PMOP *) mg->mg_obj;
6844             while (pm) {
6845                 pm->op_pmdynflags &= ~PMdf_USED;
6846                 pm = pm->op_pmnext;
6847             }
6848         }
6849         return;
6850     }
6851
6852     /* reset variables */
6853
6854     if (!HvARRAY(stash))
6855         return;
6856
6857     Zero(todo, 256, char);
6858     while (*s) {
6859         I32 max;
6860         I32 i = (unsigned char)*s;
6861         if (s[1] == '-') {
6862             s += 2;
6863         }
6864         max = (unsigned char)*s++;
6865         for ( ; i <= max; i++) {
6866             todo[i] = 1;
6867         }
6868         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6869             HE *entry;
6870             for (entry = HvARRAY(stash)[i];
6871                  entry;
6872                  entry = HeNEXT(entry))
6873             {
6874                 register GV *gv;
6875                 register SV *sv;
6876
6877                 if (!todo[(U8)*HeKEY(entry)])
6878                     continue;
6879                 gv = (GV*)HeVAL(entry);
6880                 sv = GvSV(gv);
6881                 if (sv) {
6882                     if (SvTHINKFIRST(sv)) {
6883                         if (!SvREADONLY(sv) && SvROK(sv))
6884                             sv_unref(sv);
6885                         /* XXX Is this continue a bug? Why should THINKFIRST
6886                            exempt us from resetting arrays and hashes?  */
6887                         continue;
6888                     }
6889                     SvOK_off(sv);
6890                     if (SvTYPE(sv) >= SVt_PV) {
6891                         SvCUR_set(sv, 0);
6892                         if (SvPVX_const(sv) != Nullch)
6893                             *SvPVX(sv) = '\0';
6894                         SvTAINT(sv);
6895                     }
6896                 }
6897                 if (GvAV(gv)) {
6898                     av_clear(GvAV(gv));
6899                 }
6900                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6901 #if defined(VMS)
6902                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6903 #else /* ! VMS */
6904                     hv_clear(GvHV(gv));
6905 #  if defined(USE_ENVIRON_ARRAY)
6906                     if (gv == PL_envgv)
6907                         my_clearenv();
6908 #  endif /* USE_ENVIRON_ARRAY */
6909 #endif /* VMS */
6910                 }
6911             }
6912         }
6913     }
6914 }
6915
6916 /*
6917 =for apidoc sv_2io
6918
6919 Using various gambits, try to get an IO from an SV: the IO slot if its a
6920 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6921 named after the PV if we're a string.
6922
6923 =cut
6924 */
6925
6926 IO*
6927 Perl_sv_2io(pTHX_ SV *sv)
6928 {
6929     IO* io;
6930     GV* gv;
6931
6932     switch (SvTYPE(sv)) {
6933     case SVt_PVIO:
6934         io = (IO*)sv;
6935         break;
6936     case SVt_PVGV:
6937         gv = (GV*)sv;
6938         io = GvIO(gv);
6939         if (!io)
6940             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6941         break;
6942     default:
6943         if (!SvOK(sv))
6944             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6945         if (SvROK(sv))
6946             return sv_2io(SvRV(sv));
6947         gv = gv_fetchsv(sv, FALSE, SVt_PVIO);
6948         if (gv)
6949             io = GvIO(gv);
6950         else
6951             io = 0;
6952         if (!io)
6953             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6954         break;
6955     }
6956     return io;
6957 }
6958
6959 /*
6960 =for apidoc sv_2cv
6961
6962 Using various gambits, try to get a CV from an SV; in addition, try if
6963 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6964
6965 =cut
6966 */
6967
6968 CV *
6969 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6970 {
6971     dVAR;
6972     GV *gv = Nullgv;
6973     CV *cv = Nullcv;
6974
6975     if (!sv)
6976         return *gvp = Nullgv, Nullcv;
6977     switch (SvTYPE(sv)) {
6978     case SVt_PVCV:
6979         *st = CvSTASH(sv);
6980         *gvp = Nullgv;
6981         return (CV*)sv;
6982     case SVt_PVHV:
6983     case SVt_PVAV:
6984         *gvp = Nullgv;
6985         return Nullcv;
6986     case SVt_PVGV:
6987         gv = (GV*)sv;
6988         *gvp = gv;
6989         *st = GvESTASH(gv);
6990         goto fix_gv;
6991
6992     default:
6993         SvGETMAGIC(sv);
6994         if (SvROK(sv)) {
6995             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
6996             tryAMAGICunDEREF(to_cv);
6997
6998             sv = SvRV(sv);
6999             if (SvTYPE(sv) == SVt_PVCV) {
7000                 cv = (CV*)sv;
7001                 *gvp = Nullgv;
7002                 *st = CvSTASH(cv);
7003                 return cv;
7004             }
7005             else if(isGV(sv))
7006                 gv = (GV*)sv;
7007             else
7008                 Perl_croak(aTHX_ "Not a subroutine reference");
7009         }
7010         else if (isGV(sv))
7011             gv = (GV*)sv;
7012         else
7013             gv = gv_fetchsv(sv, lref, SVt_PVCV);
7014         *gvp = gv;
7015         if (!gv)
7016             return Nullcv;
7017         *st = GvESTASH(gv);
7018     fix_gv:
7019         if (lref && !GvCVu(gv)) {
7020             SV *tmpsv;
7021             ENTER;
7022             tmpsv = NEWSV(704,0);
7023             gv_efullname3(tmpsv, gv, Nullch);
7024             /* XXX this is probably not what they think they're getting.
7025              * It has the same effect as "sub name;", i.e. just a forward
7026              * declaration! */
7027             newSUB(start_subparse(FALSE, 0),
7028                    newSVOP(OP_CONST, 0, tmpsv),
7029                    Nullop,
7030                    Nullop);
7031             LEAVE;
7032             if (!GvCVu(gv))
7033                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
7034                            sv);
7035         }
7036         return GvCVu(gv);
7037     }
7038 }
7039
7040 /*
7041 =for apidoc sv_true
7042
7043 Returns true if the SV has a true value by Perl's rules.
7044 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
7045 instead use an in-line version.
7046
7047 =cut
7048 */
7049
7050 I32
7051 Perl_sv_true(pTHX_ register SV *sv)
7052 {
7053     if (!sv)
7054         return 0;
7055     if (SvPOK(sv)) {
7056         register const XPV* const tXpv = (XPV*)SvANY(sv);
7057         if (tXpv &&
7058                 (tXpv->xpv_cur > 1 ||
7059                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
7060             return 1;
7061         else
7062             return 0;
7063     }
7064     else {
7065         if (SvIOK(sv))
7066             return SvIVX(sv) != 0;
7067         else {
7068             if (SvNOK(sv))
7069                 return SvNVX(sv) != 0.0;
7070             else
7071                 return sv_2bool(sv);
7072         }
7073     }
7074 }
7075
7076 /*
7077 =for apidoc sv_pvn_force
7078
7079 Get a sensible string out of the SV somehow.
7080 A private implementation of the C<SvPV_force> macro for compilers which
7081 can't cope with complex macro expressions. Always use the macro instead.
7082
7083 =for apidoc sv_pvn_force_flags
7084
7085 Get a sensible string out of the SV somehow.
7086 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
7087 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
7088 implemented in terms of this function.
7089 You normally want to use the various wrapper macros instead: see
7090 C<SvPV_force> and C<SvPV_force_nomg>
7091
7092 =cut
7093 */
7094
7095 char *
7096 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
7097 {
7098
7099     if (SvTHINKFIRST(sv) && !SvROK(sv))
7100         sv_force_normal_flags(sv, 0);
7101
7102     if (SvPOK(sv)) {
7103         if (lp)
7104             *lp = SvCUR(sv);
7105     }
7106     else {
7107         char *s;
7108         STRLEN len;
7109  
7110         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
7111             const char * const ref = sv_reftype(sv,0);
7112             if (PL_op)
7113                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
7114                            ref, OP_NAME(PL_op));
7115             else
7116                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
7117         }
7118         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
7119             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
7120                 OP_NAME(PL_op));
7121         s = sv_2pv_flags(sv, &len, flags);
7122         if (lp)
7123             *lp = len;
7124
7125         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
7126             if (SvROK(sv))
7127                 sv_unref(sv);
7128             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
7129             SvGROW(sv, len + 1);
7130             Move(s,SvPVX(sv),len,char);
7131             SvCUR_set(sv, len);
7132             *SvEND(sv) = '\0';
7133         }
7134         if (!SvPOK(sv)) {
7135             SvPOK_on(sv);               /* validate pointer */
7136             SvTAINT(sv);
7137             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
7138                                   PTR2UV(sv),SvPVX_const(sv)));
7139         }
7140     }
7141     return SvPVX_mutable(sv);
7142 }
7143
7144 /*
7145 =for apidoc sv_pvbyten_force
7146
7147 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
7148
7149 =cut
7150 */
7151
7152 char *
7153 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
7154 {
7155     sv_pvn_force(sv,lp);
7156     sv_utf8_downgrade(sv,0);
7157     *lp = SvCUR(sv);
7158     return SvPVX(sv);
7159 }
7160
7161 /*
7162 =for apidoc sv_pvutf8n_force
7163
7164 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
7165
7166 =cut
7167 */
7168
7169 char *
7170 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
7171 {
7172     sv_pvn_force(sv,lp);
7173     sv_utf8_upgrade(sv);
7174     *lp = SvCUR(sv);
7175     return SvPVX(sv);
7176 }
7177
7178 /*
7179 =for apidoc sv_reftype
7180
7181 Returns a string describing what the SV is a reference to.
7182
7183 =cut
7184 */
7185
7186 char *
7187 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
7188 {
7189     /* The fact that I don't need to downcast to char * everywhere, only in ?:
7190        inside return suggests a const propagation bug in g++.  */
7191     if (ob && SvOBJECT(sv)) {
7192         char * const name = HvNAME_get(SvSTASH(sv));
7193         return name ? name : (char *) "__ANON__";
7194     }
7195     else {
7196         switch (SvTYPE(sv)) {
7197         case SVt_NULL:
7198         case SVt_IV:
7199         case SVt_NV:
7200         case SVt_RV:
7201         case SVt_PV:
7202         case SVt_PVIV:
7203         case SVt_PVNV:
7204         case SVt_PVMG:
7205         case SVt_PVBM:
7206                                 if (SvVOK(sv))
7207                                     return "VSTRING";
7208                                 if (SvROK(sv))
7209                                     return "REF";
7210                                 else
7211                                     return "SCALAR";
7212
7213         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
7214                                 /* tied lvalues should appear to be
7215                                  * scalars for backwards compatitbility */
7216                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
7217                                     ? "SCALAR" : "LVALUE");
7218         case SVt_PVAV:          return "ARRAY";
7219         case SVt_PVHV:          return "HASH";
7220         case SVt_PVCV:          return "CODE";
7221         case SVt_PVGV:          return "GLOB";
7222         case SVt_PVFM:          return "FORMAT";
7223         case SVt_PVIO:          return "IO";
7224         default:                return "UNKNOWN";
7225         }
7226     }
7227 }
7228
7229 /*
7230 =for apidoc sv_isobject
7231
7232 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7233 object.  If the SV is not an RV, or if the object is not blessed, then this
7234 will return false.
7235
7236 =cut
7237 */
7238
7239 int
7240 Perl_sv_isobject(pTHX_ SV *sv)
7241 {
7242     if (!sv)
7243         return 0;
7244     SvGETMAGIC(sv);
7245     if (!SvROK(sv))
7246         return 0;
7247     sv = (SV*)SvRV(sv);
7248     if (!SvOBJECT(sv))
7249         return 0;
7250     return 1;
7251 }
7252
7253 /*
7254 =for apidoc sv_isa
7255
7256 Returns a boolean indicating whether the SV is blessed into the specified
7257 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7258 an inheritance relationship.
7259
7260 =cut
7261 */
7262
7263 int
7264 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7265 {
7266     const char *hvname;
7267     if (!sv)
7268         return 0;
7269     SvGETMAGIC(sv);
7270     if (!SvROK(sv))
7271         return 0;
7272     sv = (SV*)SvRV(sv);
7273     if (!SvOBJECT(sv))
7274         return 0;
7275     hvname = HvNAME_get(SvSTASH(sv));
7276     if (!hvname)
7277         return 0;
7278
7279     return strEQ(hvname, name);
7280 }
7281
7282 /*
7283 =for apidoc newSVrv
7284
7285 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7286 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7287 be blessed in the specified package.  The new SV is returned and its
7288 reference count is 1.
7289
7290 =cut
7291 */
7292
7293 SV*
7294 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7295 {
7296     SV *sv;
7297
7298     new_SV(sv);
7299
7300     SV_CHECK_THINKFIRST_COW_DROP(rv);
7301     SvAMAGIC_off(rv);
7302
7303     if (SvTYPE(rv) >= SVt_PVMG) {
7304         const U32 refcnt = SvREFCNT(rv);
7305         SvREFCNT(rv) = 0;
7306         sv_clear(rv);
7307         SvFLAGS(rv) = 0;
7308         SvREFCNT(rv) = refcnt;
7309     }
7310
7311     if (SvTYPE(rv) < SVt_RV)
7312         sv_upgrade(rv, SVt_RV);
7313     else if (SvTYPE(rv) > SVt_RV) {
7314         SvPV_free(rv);
7315         SvCUR_set(rv, 0);
7316         SvLEN_set(rv, 0);
7317     }
7318
7319     SvOK_off(rv);
7320     SvRV_set(rv, sv);
7321     SvROK_on(rv);
7322
7323     if (classname) {
7324         HV* const stash = gv_stashpv(classname, TRUE);
7325         (void)sv_bless(rv, stash);
7326     }
7327     return sv;
7328 }
7329
7330 /*
7331 =for apidoc sv_setref_pv
7332
7333 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7334 argument will be upgraded to an RV.  That RV will be modified to point to
7335 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7336 into the SV.  The C<classname> argument indicates the package for the
7337 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7338 will have a reference count of 1, and the RV will be returned.
7339
7340 Do not use with other Perl types such as HV, AV, SV, CV, because those
7341 objects will become corrupted by the pointer copy process.
7342
7343 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7344
7345 =cut
7346 */
7347
7348 SV*
7349 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7350 {
7351     if (!pv) {
7352         sv_setsv(rv, &PL_sv_undef);
7353         SvSETMAGIC(rv);
7354     }
7355     else
7356         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7357     return rv;
7358 }
7359
7360 /*
7361 =for apidoc sv_setref_iv
7362
7363 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7364 argument will be upgraded to an RV.  That RV will be modified to point to
7365 the new SV.  The C<classname> argument indicates the package for the
7366 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7367 will have a reference count of 1, and the RV will be returned.
7368
7369 =cut
7370 */
7371
7372 SV*
7373 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7374 {
7375     sv_setiv(newSVrv(rv,classname), iv);
7376     return rv;
7377 }
7378
7379 /*
7380 =for apidoc sv_setref_uv
7381
7382 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7383 argument will be upgraded to an RV.  That RV will be modified to point to
7384 the new SV.  The C<classname> argument indicates the package for the
7385 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7386 will have a reference count of 1, and the RV will be returned.
7387
7388 =cut
7389 */
7390
7391 SV*
7392 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7393 {
7394     sv_setuv(newSVrv(rv,classname), uv);
7395     return rv;
7396 }
7397
7398 /*
7399 =for apidoc sv_setref_nv
7400
7401 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7402 argument will be upgraded to an RV.  That RV will be modified to point to
7403 the new SV.  The C<classname> argument indicates the package for the
7404 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7405 will have a reference count of 1, and the RV will be returned.
7406
7407 =cut
7408 */
7409
7410 SV*
7411 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7412 {
7413     sv_setnv(newSVrv(rv,classname), nv);
7414     return rv;
7415 }
7416
7417 /*
7418 =for apidoc sv_setref_pvn
7419
7420 Copies a string into a new SV, optionally blessing the SV.  The length of the
7421 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7422 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7423 argument indicates the package for the blessing.  Set C<classname> to
7424 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7425 of 1, and the RV will be returned.
7426
7427 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7428
7429 =cut
7430 */
7431
7432 SV*
7433 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7434 {
7435     sv_setpvn(newSVrv(rv,classname), pv, n);
7436     return rv;
7437 }
7438
7439 /*
7440 =for apidoc sv_bless
7441
7442 Blesses an SV into a specified package.  The SV must be an RV.  The package
7443 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7444 of the SV is unaffected.
7445
7446 =cut
7447 */
7448
7449 SV*
7450 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7451 {
7452     SV *tmpRef;
7453     if (!SvROK(sv))
7454         Perl_croak(aTHX_ "Can't bless non-reference value");
7455     tmpRef = SvRV(sv);
7456     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7457         if (SvREADONLY(tmpRef))
7458             Perl_croak(aTHX_ PL_no_modify);
7459         if (SvOBJECT(tmpRef)) {
7460             if (SvTYPE(tmpRef) != SVt_PVIO)
7461                 --PL_sv_objcount;
7462             SvREFCNT_dec(SvSTASH(tmpRef));
7463         }
7464     }
7465     SvOBJECT_on(tmpRef);
7466     if (SvTYPE(tmpRef) != SVt_PVIO)
7467         ++PL_sv_objcount;
7468     SvUPGRADE(tmpRef, SVt_PVMG);
7469     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7470
7471     if (Gv_AMG(stash))
7472         SvAMAGIC_on(sv);
7473     else
7474         SvAMAGIC_off(sv);
7475
7476     if(SvSMAGICAL(tmpRef))
7477         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7478             mg_set(tmpRef);
7479
7480
7481
7482     return sv;
7483 }
7484
7485 /* Downgrades a PVGV to a PVMG.
7486  */
7487
7488 STATIC void
7489 S_sv_unglob(pTHX_ SV *sv)
7490 {
7491     void *xpvmg;
7492
7493     assert(SvTYPE(sv) == SVt_PVGV);
7494     SvFAKE_off(sv);
7495     if (GvGP(sv))
7496         gp_free((GV*)sv);
7497     if (GvSTASH(sv)) {
7498         sv_del_backref((SV*)GvSTASH(sv), sv);
7499         GvSTASH(sv) = Nullhv;
7500     }
7501     sv_unmagic(sv, PERL_MAGIC_glob);
7502     Safefree(GvNAME(sv));
7503     GvMULTI_off(sv);
7504
7505     /* need to keep SvANY(sv) in the right arena */
7506     xpvmg = new_XPVMG();
7507     StructCopy(SvANY(sv), xpvmg, XPVMG);
7508     del_XPVGV(SvANY(sv));
7509     SvANY(sv) = xpvmg;
7510
7511     SvFLAGS(sv) &= ~SVTYPEMASK;
7512     SvFLAGS(sv) |= SVt_PVMG;
7513 }
7514
7515 /*
7516 =for apidoc sv_unref_flags
7517
7518 Unsets the RV status of the SV, and decrements the reference count of
7519 whatever was being referenced by the RV.  This can almost be thought of
7520 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7521 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7522 (otherwise the decrementing is conditional on the reference count being
7523 different from one or the reference being a readonly SV).
7524 See C<SvROK_off>.
7525
7526 =cut
7527 */
7528
7529 void
7530 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7531 {
7532     SV* const target = SvRV(ref);
7533
7534     if (SvWEAKREF(ref)) {
7535         sv_del_backref(target, ref);
7536         SvWEAKREF_off(ref);
7537         SvRV_set(ref, NULL);
7538         return;
7539     }
7540     SvRV_set(ref, NULL);
7541     SvROK_off(ref);
7542     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7543        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7544     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7545         SvREFCNT_dec(target);
7546     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7547         sv_2mortal(target);     /* Schedule for freeing later */
7548 }
7549
7550 /*
7551 =for apidoc sv_untaint
7552
7553 Untaint an SV. Use C<SvTAINTED_off> instead.
7554 =cut
7555 */
7556
7557 void
7558 Perl_sv_untaint(pTHX_ SV *sv)
7559 {
7560     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7561         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7562         if (mg)
7563             mg->mg_len &= ~1;
7564     }
7565 }
7566
7567 /*
7568 =for apidoc sv_tainted
7569
7570 Test an SV for taintedness. Use C<SvTAINTED> instead.
7571 =cut
7572 */
7573
7574 bool
7575 Perl_sv_tainted(pTHX_ SV *sv)
7576 {
7577     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7578         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7579         if (mg && (mg->mg_len & 1) )
7580             return TRUE;
7581     }
7582     return FALSE;
7583 }
7584
7585 /*
7586 =for apidoc sv_setpviv
7587
7588 Copies an integer into the given SV, also updating its string value.
7589 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7590
7591 =cut
7592 */
7593
7594 void
7595 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7596 {
7597     char buf[TYPE_CHARS(UV)];
7598     char *ebuf;
7599     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7600
7601     sv_setpvn(sv, ptr, ebuf - ptr);
7602 }
7603
7604 /*
7605 =for apidoc sv_setpviv_mg
7606
7607 Like C<sv_setpviv>, but also handles 'set' magic.
7608
7609 =cut
7610 */
7611
7612 void
7613 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7614 {
7615     sv_setpviv(sv, iv);
7616     SvSETMAGIC(sv);
7617 }
7618
7619 #if defined(PERL_IMPLICIT_CONTEXT)
7620
7621 /* pTHX_ magic can't cope with varargs, so this is a no-context
7622  * version of the main function, (which may itself be aliased to us).
7623  * Don't access this version directly.
7624  */
7625
7626 void
7627 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7628 {
7629     dTHX;
7630     va_list args;
7631     va_start(args, pat);
7632     sv_vsetpvf(sv, pat, &args);
7633     va_end(args);
7634 }
7635
7636 /* pTHX_ magic can't cope with varargs, so this is a no-context
7637  * version of the main function, (which may itself be aliased to us).
7638  * Don't access this version directly.
7639  */
7640
7641 void
7642 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7643 {
7644     dTHX;
7645     va_list args;
7646     va_start(args, pat);
7647     sv_vsetpvf_mg(sv, pat, &args);
7648     va_end(args);
7649 }
7650 #endif
7651
7652 /*
7653 =for apidoc sv_setpvf
7654
7655 Works like C<sv_catpvf> but copies the text into the SV instead of
7656 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7657
7658 =cut
7659 */
7660
7661 void
7662 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7663 {
7664     va_list args;
7665     va_start(args, pat);
7666     sv_vsetpvf(sv, pat, &args);
7667     va_end(args);
7668 }
7669
7670 /*
7671 =for apidoc sv_vsetpvf
7672
7673 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7674 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7675
7676 Usually used via its frontend C<sv_setpvf>.
7677
7678 =cut
7679 */
7680
7681 void
7682 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7683 {
7684     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7685 }
7686
7687 /*
7688 =for apidoc sv_setpvf_mg
7689
7690 Like C<sv_setpvf>, but also handles 'set' magic.
7691
7692 =cut
7693 */
7694
7695 void
7696 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7697 {
7698     va_list args;
7699     va_start(args, pat);
7700     sv_vsetpvf_mg(sv, pat, &args);
7701     va_end(args);
7702 }
7703
7704 /*
7705 =for apidoc sv_vsetpvf_mg
7706
7707 Like C<sv_vsetpvf>, but also handles 'set' magic.
7708
7709 Usually used via its frontend C<sv_setpvf_mg>.
7710
7711 =cut
7712 */
7713
7714 void
7715 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7716 {
7717     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7718     SvSETMAGIC(sv);
7719 }
7720
7721 #if defined(PERL_IMPLICIT_CONTEXT)
7722
7723 /* pTHX_ magic can't cope with varargs, so this is a no-context
7724  * version of the main function, (which may itself be aliased to us).
7725  * Don't access this version directly.
7726  */
7727
7728 void
7729 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7730 {
7731     dTHX;
7732     va_list args;
7733     va_start(args, pat);
7734     sv_vcatpvf(sv, pat, &args);
7735     va_end(args);
7736 }
7737
7738 /* pTHX_ magic can't cope with varargs, so this is a no-context
7739  * version of the main function, (which may itself be aliased to us).
7740  * Don't access this version directly.
7741  */
7742
7743 void
7744 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7745 {
7746     dTHX;
7747     va_list args;
7748     va_start(args, pat);
7749     sv_vcatpvf_mg(sv, pat, &args);
7750     va_end(args);
7751 }
7752 #endif
7753
7754 /*
7755 =for apidoc sv_catpvf
7756
7757 Processes its arguments like C<sprintf> and appends the formatted
7758 output to an SV.  If the appended data contains "wide" characters
7759 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7760 and characters >255 formatted with %c), the original SV might get
7761 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7762 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7763 valid UTF-8; if the original SV was bytes, the pattern should be too.
7764
7765 =cut */
7766
7767 void
7768 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7769 {
7770     va_list args;
7771     va_start(args, pat);
7772     sv_vcatpvf(sv, pat, &args);
7773     va_end(args);
7774 }
7775
7776 /*
7777 =for apidoc sv_vcatpvf
7778
7779 Processes its arguments like C<vsprintf> and appends the formatted output
7780 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7781
7782 Usually used via its frontend C<sv_catpvf>.
7783
7784 =cut
7785 */
7786
7787 void
7788 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7789 {
7790     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7791 }
7792
7793 /*
7794 =for apidoc sv_catpvf_mg
7795
7796 Like C<sv_catpvf>, but also handles 'set' magic.
7797
7798 =cut
7799 */
7800
7801 void
7802 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7803 {
7804     va_list args;
7805     va_start(args, pat);
7806     sv_vcatpvf_mg(sv, pat, &args);
7807     va_end(args);
7808 }
7809
7810 /*
7811 =for apidoc sv_vcatpvf_mg
7812
7813 Like C<sv_vcatpvf>, but also handles 'set' magic.
7814
7815 Usually used via its frontend C<sv_catpvf_mg>.
7816
7817 =cut
7818 */
7819
7820 void
7821 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7822 {
7823     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7824     SvSETMAGIC(sv);
7825 }
7826
7827 /*
7828 =for apidoc sv_vsetpvfn
7829
7830 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7831 appending it.
7832
7833 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7834
7835 =cut
7836 */
7837
7838 void
7839 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7840 {
7841     sv_setpvn(sv, "", 0);
7842     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7843 }
7844
7845 /* private function for use in sv_vcatpvfn via the EXPECT_NUMBER macro */
7846
7847 STATIC I32
7848 S_expect_number(pTHX_ char** pattern)
7849 {
7850     I32 var = 0;
7851     switch (**pattern) {
7852     case '1': case '2': case '3':
7853     case '4': case '5': case '6':
7854     case '7': case '8': case '9':
7855         while (isDIGIT(**pattern))
7856             var = var * 10 + (*(*pattern)++ - '0');
7857     }
7858     return var;
7859 }
7860 #define EXPECT_NUMBER(pattern, var) (var = S_expect_number(aTHX_ &pattern))
7861
7862 static char *
7863 F0convert(NV nv, char *endbuf, STRLEN *len)
7864 {
7865     const int neg = nv < 0;
7866     UV uv;
7867
7868     if (neg)
7869         nv = -nv;
7870     if (nv < UV_MAX) {
7871         char *p = endbuf;
7872         nv += 0.5;
7873         uv = (UV)nv;
7874         if (uv & 1 && uv == nv)
7875             uv--;                       /* Round to even */
7876         do {
7877             const unsigned dig = uv % 10;
7878             *--p = '0' + dig;
7879         } while (uv /= 10);
7880         if (neg)
7881             *--p = '-';
7882         *len = endbuf - p;
7883         return p;
7884     }
7885     return Nullch;
7886 }
7887
7888
7889 /*
7890 =for apidoc sv_vcatpvfn
7891
7892 Processes its arguments like C<vsprintf> and appends the formatted output
7893 to an SV.  Uses an array of SVs if the C style variable argument list is
7894 missing (NULL).  When running with taint checks enabled, indicates via
7895 C<maybe_tainted> if results are untrustworthy (often due to the use of
7896 locales).
7897
7898 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7899
7900 =cut
7901 */
7902
7903
7904 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7905                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7906                         vec_utf8 = DO_UTF8(vecsv);
7907
7908 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7909
7910 void
7911 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7912 {
7913     char *p;
7914     char *q;
7915     const char *patend;
7916     STRLEN origlen;
7917     I32 svix = 0;
7918     static const char nullstr[] = "(null)";
7919     SV *argsv = Nullsv;
7920     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7921     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7922     SV *nsv = Nullsv;
7923     /* Times 4: a decimal digit takes more than 3 binary digits.
7924      * NV_DIG: mantissa takes than many decimal digits.
7925      * Plus 32: Playing safe. */
7926     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7927     /* large enough for "%#.#f" --chip */
7928     /* what about long double NVs? --jhi */
7929
7930     PERL_UNUSED_ARG(maybe_tainted);
7931
7932     /* no matter what, this is a string now */
7933     (void)SvPV_force(sv, origlen);
7934
7935     /* special-case "", "%s", and "%-p" (SVf - see below) */
7936     if (patlen == 0)
7937         return;
7938     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7939         if (args) {
7940             const char * const s = va_arg(*args, char*);
7941             sv_catpv(sv, s ? s : nullstr);
7942         }
7943         else if (svix < svmax) {
7944             sv_catsv(sv, *svargs);
7945         }
7946         return;
7947     }
7948     if (args && patlen == 3 && pat[0] == '%' &&
7949                 pat[1] == '-' && pat[2] == 'p') {
7950         argsv = va_arg(*args, SV*);
7951         sv_catsv(sv, argsv);
7952         return;
7953     }
7954
7955 #ifndef USE_LONG_DOUBLE
7956     /* special-case "%.<number>[gf]" */
7957     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7958          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7959         unsigned digits = 0;
7960         const char *pp;
7961
7962         pp = pat + 2;
7963         while (*pp >= '0' && *pp <= '9')
7964             digits = 10 * digits + (*pp++ - '0');
7965         if (pp - pat == (int)patlen - 1) {
7966             NV nv;
7967
7968             if (svix < svmax)
7969                 nv = SvNV(*svargs);
7970             else
7971                 return;
7972             if (*pp == 'g') {
7973                 /* Add check for digits != 0 because it seems that some
7974                    gconverts are buggy in this case, and we don't yet have
7975                    a Configure test for this.  */
7976                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7977                      /* 0, point, slack */
7978                     Gconvert(nv, (int)digits, 0, ebuf);
7979                     sv_catpv(sv, ebuf);
7980                     if (*ebuf)  /* May return an empty string for digits==0 */
7981                         return;
7982                 }
7983             } else if (!digits) {
7984                 STRLEN l;
7985
7986                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7987                     sv_catpvn(sv, p, l);
7988                     return;
7989                 }
7990             }
7991         }
7992     }
7993 #endif /* !USE_LONG_DOUBLE */
7994
7995     if (!args && svix < svmax && DO_UTF8(*svargs))
7996         has_utf8 = TRUE;
7997
7998     patend = (char*)pat + patlen;
7999     for (p = (char*)pat; p < patend; p = q) {
8000         bool alt = FALSE;
8001         bool left = FALSE;
8002         bool vectorize = FALSE;
8003         bool vectorarg = FALSE;
8004         bool vec_utf8 = FALSE;
8005         char fill = ' ';
8006         char plus = 0;
8007         char intsize = 0;
8008         STRLEN width = 0;
8009         STRLEN zeros = 0;
8010         bool has_precis = FALSE;
8011         STRLEN precis = 0;
8012         I32 osvix = svix;
8013         bool is_utf8 = FALSE;  /* is this item utf8?   */
8014 #ifdef HAS_LDBL_SPRINTF_BUG
8015         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8016            with sfio - Allen <allens@cpan.org> */
8017         bool fix_ldbl_sprintf_bug = FALSE;
8018 #endif
8019
8020         char esignbuf[4];
8021         U8 utf8buf[UTF8_MAXBYTES+1];
8022         STRLEN esignlen = 0;
8023
8024         const char *eptr = Nullch;
8025         STRLEN elen = 0;
8026         SV *vecsv = Nullsv;
8027         const U8 *vecstr = Null(U8*);
8028         STRLEN veclen = 0;
8029         char c = 0;
8030         int i;
8031         unsigned base = 0;
8032         IV iv = 0;
8033         UV uv = 0;
8034         /* we need a long double target in case HAS_LONG_DOUBLE but
8035            not USE_LONG_DOUBLE
8036         */
8037 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
8038         long double nv;
8039 #else
8040         NV nv;
8041 #endif
8042         STRLEN have;
8043         STRLEN need;
8044         STRLEN gap;
8045         const char *dotstr = ".";
8046         STRLEN dotstrlen = 1;
8047         I32 efix = 0; /* explicit format parameter index */
8048         I32 ewix = 0; /* explicit width index */
8049         I32 epix = 0; /* explicit precision index */
8050         I32 evix = 0; /* explicit vector index */
8051         bool asterisk = FALSE;
8052
8053         /* echo everything up to the next format specification */
8054         for (q = p; q < patend && *q != '%'; ++q) ;
8055         if (q > p) {
8056             if (has_utf8 && !pat_utf8)
8057                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
8058             else
8059                 sv_catpvn(sv, p, q - p);
8060             p = q;
8061         }
8062         if (q++ >= patend)
8063             break;
8064
8065 /*
8066     We allow format specification elements in this order:
8067         \d+\$              explicit format parameter index
8068         [-+ 0#]+           flags
8069         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
8070         0                  flag (as above): repeated to allow "v02"     
8071         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
8072         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
8073         [hlqLV]            size
8074     [%bcdefginopsuxDFOUX] format (mandatory)
8075 */
8076
8077         if (args) {
8078 /*  
8079         As of perl5.9.3, printf format checking is on by default.
8080         Internally, perl uses %p formats to provide an escape to
8081         some extended formatting.  This block deals with those
8082         extensions: if it does not match, (char*)q is reset and
8083         the normal format processing code is used.
8084
8085         Currently defined extensions are:
8086                 %p              include pointer address (standard)      
8087                 %-p     (SVf)   include an SV (previously %_)
8088                 %-<num>p        include an SV with precision <num>      
8089                 %1p     (VDf)   include a v-string (as %vd)
8090                 %<num>p         reserved for future extensions
8091
8092         Robin Barker 2005-07-14
8093 */
8094             char* r = q; 
8095             bool sv = FALSE;    
8096             STRLEN n = 0;
8097             if (*q == '-')
8098                 sv = *q++;
8099             EXPECT_NUMBER(q, n);
8100             if (*q++ == 'p') {
8101                 if (sv) {                       /* SVf */
8102                     if (n) {
8103                         precis = n;
8104                         has_precis = TRUE;
8105                     }
8106                     argsv = va_arg(*args, SV*);
8107                     eptr = SvPVx_const(argsv, elen);
8108                     if (DO_UTF8(argsv))
8109                         is_utf8 = TRUE;
8110                     goto string;
8111                 }
8112 #if vdNUMBER
8113                 else if (n == vdNUMBER) {       /* VDf */
8114                     vectorize = TRUE;
8115                     VECTORIZE_ARGS
8116                     goto format_vd;
8117                 }
8118 #endif
8119                 else if (n) {
8120                     if (ckWARN_d(WARN_INTERNAL))
8121                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
8122                         "internal %%<num>p might conflict with future printf extensions");
8123                 }
8124             }
8125             q = r; 
8126         }
8127
8128         if (EXPECT_NUMBER(q, width)) {
8129             if (*q == '$') {
8130                 ++q;
8131                 efix = width;
8132             } else {
8133                 goto gotwidth;
8134             }
8135         }
8136
8137         /* FLAGS */
8138
8139         while (*q) {
8140             switch (*q) {
8141             case ' ':
8142             case '+':
8143                 plus = *q++;
8144                 continue;
8145
8146             case '-':
8147                 left = TRUE;
8148                 q++;
8149                 continue;
8150
8151             case '0':
8152                 fill = *q++;
8153                 continue;
8154
8155             case '#':
8156                 alt = TRUE;
8157                 q++;
8158                 continue;
8159
8160             default:
8161                 break;
8162             }
8163             break;
8164         }
8165
8166       tryasterisk:
8167         if (*q == '*') {
8168             q++;
8169             if (EXPECT_NUMBER(q, ewix))
8170                 if (*q++ != '$')
8171                     goto unknown;
8172             asterisk = TRUE;
8173         }
8174         if (*q == 'v') {
8175             q++;
8176             if (vectorize)
8177                 goto unknown;
8178             if ((vectorarg = asterisk)) {
8179                 evix = ewix;
8180                 ewix = 0;
8181                 asterisk = FALSE;
8182             }
8183             vectorize = TRUE;
8184             goto tryasterisk;
8185         }
8186
8187         if (!asterisk)
8188         {
8189             if( *q == '0' )
8190                 fill = *q++;
8191             EXPECT_NUMBER(q, width);
8192         }
8193
8194         if (vectorize) {
8195             if (vectorarg) {
8196                 if (args)
8197                     vecsv = va_arg(*args, SV*);
8198                 else
8199                     vecsv = (evix ? evix <= svmax : svix < svmax) ?
8200                         svargs[evix ? evix-1 : svix++] : &PL_sv_undef;
8201                 dotstr = SvPV_const(vecsv, dotstrlen);
8202                 if (DO_UTF8(vecsv))
8203                     is_utf8 = TRUE;
8204             }
8205             if (args) {
8206                 VECTORIZE_ARGS
8207             }
8208             else if (efix ? efix <= svmax : svix < svmax) {
8209                 vecsv = svargs[efix ? efix-1 : svix++];
8210                 vecstr = (U8*)SvPV_const(vecsv,veclen);
8211                 vec_utf8 = DO_UTF8(vecsv);
8212                 /* if this is a version object, we need to return the
8213                  * stringified representation (which the SvPVX_const has
8214                  * already done for us), but not vectorize the args
8215                  */
8216                 if ( *q == 'd' && sv_derived_from(vecsv,"version") )
8217                 {
8218                         q++; /* skip past the rest of the %vd format */
8219                         eptr = (const char *) vecstr;
8220                         elen = veclen;
8221                         vectorize=FALSE;
8222                         goto string;
8223                 }
8224             }
8225             else {
8226                 vecstr = (U8*)"";
8227                 veclen = 0;
8228             }
8229         }
8230
8231         if (asterisk) {
8232             if (args)
8233                 i = va_arg(*args, int);
8234             else
8235                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8236                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8237             left |= (i < 0);
8238             width = (i < 0) ? -i : i;
8239         }
8240       gotwidth:
8241
8242         /* PRECISION */
8243
8244         if (*q == '.') {
8245             q++;
8246             if (*q == '*') {
8247                 q++;
8248                 if (EXPECT_NUMBER(q, epix) && *q++ != '$')
8249                     goto unknown;
8250                 /* XXX: todo, support specified precision parameter */
8251                 if (epix)
8252                     goto unknown;
8253                 if (args)
8254                     i = va_arg(*args, int);
8255                 else
8256                     i = (ewix ? ewix <= svmax : svix < svmax)
8257                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8258                 precis = (i < 0) ? 0 : i;
8259             }
8260             else {
8261                 precis = 0;
8262                 while (isDIGIT(*q))
8263                     precis = precis * 10 + (*q++ - '0');
8264             }
8265             has_precis = TRUE;
8266         }
8267
8268         /* SIZE */
8269
8270         switch (*q) {
8271 #ifdef WIN32
8272         case 'I':                       /* Ix, I32x, and I64x */
8273 #  ifdef WIN64
8274             if (q[1] == '6' && q[2] == '4') {
8275                 q += 3;
8276                 intsize = 'q';
8277                 break;
8278             }
8279 #  endif
8280             if (q[1] == '3' && q[2] == '2') {
8281                 q += 3;
8282                 break;
8283             }
8284 #  ifdef WIN64
8285             intsize = 'q';
8286 #  endif
8287             q++;
8288             break;
8289 #endif
8290 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8291         case 'L':                       /* Ld */
8292             /* FALL THROUGH */
8293 #ifdef HAS_QUAD
8294         case 'q':                       /* qd */
8295 #endif
8296             intsize = 'q';
8297             q++;
8298             break;
8299 #endif
8300         case 'l':
8301 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8302             if (*(q + 1) == 'l') {      /* lld, llf */
8303                 intsize = 'q';
8304                 q += 2;
8305                 break;
8306              }
8307 #endif
8308             /* FALL THROUGH */
8309         case 'h':
8310             /* FALL THROUGH */
8311         case 'V':
8312             intsize = *q++;
8313             break;
8314         }
8315
8316         /* CONVERSION */
8317
8318         if (*q == '%') {
8319             eptr = q++;
8320             elen = 1;
8321             goto string;
8322         }
8323
8324         if (vectorize)
8325             argsv = vecsv;
8326         else if (!args) {
8327             if (efix) {
8328                 const I32 i = efix-1;
8329                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8330             } else {
8331                 argsv = (svix >= 0 && svix < svmax)
8332                     ? svargs[svix++] : &PL_sv_undef;
8333             }
8334         }
8335
8336         switch (c = *q++) {
8337
8338             /* STRINGS */
8339
8340         case 'c':
8341             uv = (args && !vectorize) ? va_arg(*args, int) : SvIVx(argsv);
8342             if ((uv > 255 ||
8343                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8344                 && !IN_BYTES) {
8345                 eptr = (char*)utf8buf;
8346                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8347                 is_utf8 = TRUE;
8348             }
8349             else {
8350                 c = (char)uv;
8351                 eptr = &c;
8352                 elen = 1;
8353             }
8354             goto string;
8355
8356         case 's':
8357             if (args && !vectorize) {
8358                 eptr = va_arg(*args, char*);
8359                 if (eptr)
8360 #ifdef MACOS_TRADITIONAL
8361                   /* On MacOS, %#s format is used for Pascal strings */
8362                   if (alt)
8363                     elen = *eptr++;
8364                   else
8365 #endif
8366                     elen = strlen(eptr);
8367                 else {
8368                     eptr = (char *)nullstr;
8369                     elen = sizeof nullstr - 1;
8370                 }
8371             }
8372             else {
8373                 eptr = SvPVx_const(argsv, elen);
8374                 if (DO_UTF8(argsv)) {
8375                     if (has_precis && precis < elen) {
8376                         I32 p = precis;
8377                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8378                         precis = p;
8379                     }
8380                     if (width) { /* fudge width (can't fudge elen) */
8381                         width += elen - sv_len_utf8(argsv);
8382                     }
8383                     is_utf8 = TRUE;
8384                 }
8385             }
8386
8387         string:
8388             vectorize = FALSE;
8389             if (has_precis && elen > precis)
8390                 elen = precis;
8391             break;
8392
8393             /* INTEGERS */
8394
8395         case 'p':
8396             if (alt || vectorize)
8397                 goto unknown;
8398             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8399             base = 16;
8400             goto integer;
8401
8402         case 'D':
8403 #ifdef IV_IS_QUAD
8404             intsize = 'q';
8405 #else
8406             intsize = 'l';
8407 #endif
8408             /* FALL THROUGH */
8409         case 'd':
8410         case 'i':
8411 #if vdNUMBER
8412         format_vd:
8413 #endif
8414             if (vectorize) {
8415                 STRLEN ulen;
8416                 if (!veclen)
8417                     continue;
8418                 if (vec_utf8)
8419                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8420                                         UTF8_ALLOW_ANYUV);
8421                 else {
8422                     uv = *vecstr;
8423                     ulen = 1;
8424                 }
8425                 vecstr += ulen;
8426                 veclen -= ulen;
8427                 if (plus)
8428                      esignbuf[esignlen++] = plus;
8429             }
8430             else if (args) {
8431                 switch (intsize) {
8432                 case 'h':       iv = (short)va_arg(*args, int); break;
8433                 case 'l':       iv = va_arg(*args, long); break;
8434                 case 'V':       iv = va_arg(*args, IV); break;
8435                 default:        iv = va_arg(*args, int); break;
8436 #ifdef HAS_QUAD
8437                 case 'q':       iv = va_arg(*args, Quad_t); break;
8438 #endif
8439                 }
8440             }
8441             else {
8442                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8443                 switch (intsize) {
8444                 case 'h':       iv = (short)tiv; break;
8445                 case 'l':       iv = (long)tiv; break;
8446                 case 'V':
8447                 default:        iv = tiv; break;
8448 #ifdef HAS_QUAD
8449                 case 'q':       iv = (Quad_t)tiv; break;
8450 #endif
8451                 }
8452             }
8453             if ( !vectorize )   /* we already set uv above */
8454             {
8455                 if (iv >= 0) {
8456                     uv = iv;
8457                     if (plus)
8458                         esignbuf[esignlen++] = plus;
8459                 }
8460                 else {
8461                     uv = -iv;
8462                     esignbuf[esignlen++] = '-';
8463                 }
8464             }
8465             base = 10;
8466             goto integer;
8467
8468         case 'U':
8469 #ifdef IV_IS_QUAD
8470             intsize = 'q';
8471 #else
8472             intsize = 'l';
8473 #endif
8474             /* FALL THROUGH */
8475         case 'u':
8476             base = 10;
8477             goto uns_integer;
8478
8479         case 'b':
8480             base = 2;
8481             goto uns_integer;
8482
8483         case 'O':
8484 #ifdef IV_IS_QUAD
8485             intsize = 'q';
8486 #else
8487             intsize = 'l';
8488 #endif
8489             /* FALL THROUGH */
8490         case 'o':
8491             base = 8;
8492             goto uns_integer;
8493
8494         case 'X':
8495         case 'x':
8496             base = 16;
8497
8498         uns_integer:
8499             if (vectorize) {
8500                 STRLEN ulen;
8501         vector:
8502                 if (!veclen)
8503                     continue;
8504                 if (vec_utf8)
8505                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8506                                         UTF8_ALLOW_ANYUV);
8507                 else {
8508                     uv = *vecstr;
8509                     ulen = 1;
8510                 }
8511                 vecstr += ulen;
8512                 veclen -= ulen;
8513             }
8514             else if (args) {
8515                 switch (intsize) {
8516                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8517                 case 'l':  uv = va_arg(*args, unsigned long); break;
8518                 case 'V':  uv = va_arg(*args, UV); break;
8519                 default:   uv = va_arg(*args, unsigned); break;
8520 #ifdef HAS_QUAD
8521                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8522 #endif
8523                 }
8524             }
8525             else {
8526                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8527                 switch (intsize) {
8528                 case 'h':       uv = (unsigned short)tuv; break;
8529                 case 'l':       uv = (unsigned long)tuv; break;
8530                 case 'V':
8531                 default:        uv = tuv; break;
8532 #ifdef HAS_QUAD
8533                 case 'q':       uv = (Uquad_t)tuv; break;
8534 #endif
8535                 }
8536             }
8537
8538         integer:
8539             {
8540                 char *ptr = ebuf + sizeof ebuf;
8541                 switch (base) {
8542                     unsigned dig;
8543                 case 16:
8544                     if (!uv)
8545                         alt = FALSE;
8546                     p = (char*)((c == 'X')
8547                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8548                     do {
8549                         dig = uv & 15;
8550                         *--ptr = p[dig];
8551                     } while (uv >>= 4);
8552                     if (alt) {
8553                         esignbuf[esignlen++] = '0';
8554                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8555                     }
8556                     break;
8557                 case 8:
8558                     do {
8559                         dig = uv & 7;
8560                         *--ptr = '0' + dig;
8561                     } while (uv >>= 3);
8562                     if (alt && *ptr != '0')
8563                         *--ptr = '0';
8564                     break;
8565                 case 2:
8566                     if (!uv)
8567                         alt = FALSE;
8568                     do {
8569                         dig = uv & 1;
8570                         *--ptr = '0' + dig;
8571                     } while (uv >>= 1);
8572                     if (alt) {
8573                         esignbuf[esignlen++] = '0';
8574                         esignbuf[esignlen++] = 'b';
8575                     }
8576                     break;
8577                 default:                /* it had better be ten or less */
8578                     do {
8579                         dig = uv % base;
8580                         *--ptr = '0' + dig;
8581                     } while (uv /= base);
8582                     break;
8583                 }
8584                 elen = (ebuf + sizeof ebuf) - ptr;
8585                 eptr = ptr;
8586                 if (has_precis) {
8587                     if (precis > elen)
8588                         zeros = precis - elen;
8589                     else if (precis == 0 && elen == 1 && *eptr == '0')
8590                         elen = 0;
8591                 }
8592             }
8593             break;
8594
8595             /* FLOATING POINT */
8596
8597         case 'F':
8598             c = 'f';            /* maybe %F isn't supported here */
8599             /* FALL THROUGH */
8600         case 'e': case 'E':
8601         case 'f':
8602         case 'g': case 'G':
8603
8604             /* This is evil, but floating point is even more evil */
8605
8606             /* for SV-style calling, we can only get NV
8607                for C-style calling, we assume %f is double;
8608                for simplicity we allow any of %Lf, %llf, %qf for long double
8609             */
8610             switch (intsize) {
8611             case 'V':
8612 #if defined(USE_LONG_DOUBLE)
8613                 intsize = 'q';
8614 #endif
8615                 break;
8616 /* [perl #20339] - we should accept and ignore %lf rather than die */
8617             case 'l':
8618                 /* FALL THROUGH */
8619             default:
8620 #if defined(USE_LONG_DOUBLE)
8621                 intsize = args ? 0 : 'q';
8622 #endif
8623                 break;
8624             case 'q':
8625 #if defined(HAS_LONG_DOUBLE)
8626                 break;
8627 #else
8628                 /* FALL THROUGH */
8629 #endif
8630             case 'h':
8631                 goto unknown;
8632             }
8633
8634             /* now we need (long double) if intsize == 'q', else (double) */
8635             nv = (args && !vectorize) ?
8636 #if LONG_DOUBLESIZE > DOUBLESIZE
8637                 intsize == 'q' ?
8638                     va_arg(*args, long double) :
8639                     va_arg(*args, double)
8640 #else
8641                     va_arg(*args, double)
8642 #endif
8643                 : SvNVx(argsv);
8644
8645             need = 0;
8646             vectorize = FALSE;
8647             if (c != 'e' && c != 'E') {
8648                 i = PERL_INT_MIN;
8649                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8650                    will cast our (long double) to (double) */
8651                 (void)Perl_frexp(nv, &i);
8652                 if (i == PERL_INT_MIN)
8653                     Perl_die(aTHX_ "panic: frexp");
8654                 if (i > 0)
8655                     need = BIT_DIGITS(i);
8656             }
8657             need += has_precis ? precis : 6; /* known default */
8658
8659             if (need < width)
8660                 need = width;
8661
8662 #ifdef HAS_LDBL_SPRINTF_BUG
8663             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8664                with sfio - Allen <allens@cpan.org> */
8665
8666 #  ifdef DBL_MAX
8667 #    define MY_DBL_MAX DBL_MAX
8668 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8669 #    if DOUBLESIZE >= 8
8670 #      define MY_DBL_MAX 1.7976931348623157E+308L
8671 #    else
8672 #      define MY_DBL_MAX 3.40282347E+38L
8673 #    endif
8674 #  endif
8675
8676 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8677 #    define MY_DBL_MAX_BUG 1L
8678 #  else
8679 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8680 #  endif
8681
8682 #  ifdef DBL_MIN
8683 #    define MY_DBL_MIN DBL_MIN
8684 #  else  /* XXX guessing! -Allen */
8685 #    if DOUBLESIZE >= 8
8686 #      define MY_DBL_MIN 2.2250738585072014E-308L
8687 #    else
8688 #      define MY_DBL_MIN 1.17549435E-38L
8689 #    endif
8690 #  endif
8691
8692             if ((intsize == 'q') && (c == 'f') &&
8693                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8694                 (need < DBL_DIG)) {
8695                 /* it's going to be short enough that
8696                  * long double precision is not needed */
8697
8698                 if ((nv <= 0L) && (nv >= -0L))
8699                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8700                 else {
8701                     /* would use Perl_fp_class as a double-check but not
8702                      * functional on IRIX - see perl.h comments */
8703
8704                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8705                         /* It's within the range that a double can represent */
8706 #if defined(DBL_MAX) && !defined(DBL_MIN)
8707                         if ((nv >= ((long double)1/DBL_MAX)) ||
8708                             (nv <= (-(long double)1/DBL_MAX)))
8709 #endif
8710                         fix_ldbl_sprintf_bug = TRUE;
8711                     }
8712                 }
8713                 if (fix_ldbl_sprintf_bug == TRUE) {
8714                     double temp;
8715
8716                     intsize = 0;
8717                     temp = (double)nv;
8718                     nv = (NV)temp;
8719                 }
8720             }
8721
8722 #  undef MY_DBL_MAX
8723 #  undef MY_DBL_MAX_BUG
8724 #  undef MY_DBL_MIN
8725
8726 #endif /* HAS_LDBL_SPRINTF_BUG */
8727
8728             need += 20; /* fudge factor */
8729             if (PL_efloatsize < need) {
8730                 Safefree(PL_efloatbuf);
8731                 PL_efloatsize = need + 20; /* more fudge */
8732                 Newx(PL_efloatbuf, PL_efloatsize, char);
8733                 PL_efloatbuf[0] = '\0';
8734             }
8735
8736             if ( !(width || left || plus || alt) && fill != '0'
8737                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8738                 /* See earlier comment about buggy Gconvert when digits,
8739                    aka precis is 0  */
8740                 if ( c == 'g' && precis) {
8741                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8742                     /* May return an empty string for digits==0 */
8743                     if (*PL_efloatbuf) {
8744                         elen = strlen(PL_efloatbuf);
8745                         goto float_converted;
8746                     }
8747                 } else if ( c == 'f' && !precis) {
8748                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8749                         break;
8750                 }
8751             }
8752             {
8753                 char *ptr = ebuf + sizeof ebuf;
8754                 *--ptr = '\0';
8755                 *--ptr = c;
8756                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8757 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8758                 if (intsize == 'q') {
8759                     /* Copy the one or more characters in a long double
8760                      * format before the 'base' ([efgEFG]) character to
8761                      * the format string. */
8762                     static char const prifldbl[] = PERL_PRIfldbl;
8763                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8764                     while (p >= prifldbl) { *--ptr = *p--; }
8765                 }
8766 #endif
8767                 if (has_precis) {
8768                     base = precis;
8769                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8770                     *--ptr = '.';
8771                 }
8772                 if (width) {
8773                     base = width;
8774                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8775                 }
8776                 if (fill == '0')
8777                     *--ptr = fill;
8778                 if (left)
8779                     *--ptr = '-';
8780                 if (plus)
8781                     *--ptr = plus;
8782                 if (alt)
8783                     *--ptr = '#';
8784                 *--ptr = '%';
8785
8786                 /* No taint.  Otherwise we are in the strange situation
8787                  * where printf() taints but print($float) doesn't.
8788                  * --jhi */
8789 #if defined(HAS_LONG_DOUBLE)
8790                 elen = ((intsize == 'q')
8791                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8792                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8793 #else
8794                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8795 #endif
8796             }
8797         float_converted:
8798             eptr = PL_efloatbuf;
8799             break;
8800
8801             /* SPECIAL */
8802
8803         case 'n':
8804             i = SvCUR(sv) - origlen;
8805             if (args && !vectorize) {
8806                 switch (intsize) {
8807                 case 'h':       *(va_arg(*args, short*)) = i; break;
8808                 default:        *(va_arg(*args, int*)) = i; break;
8809                 case 'l':       *(va_arg(*args, long*)) = i; break;
8810                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8811 #ifdef HAS_QUAD
8812                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8813 #endif
8814                 }
8815             }
8816             else
8817                 sv_setuv_mg(argsv, (UV)i);
8818             vectorize = FALSE;
8819             continue;   /* not "break" */
8820
8821             /* UNKNOWN */
8822
8823         default:
8824       unknown:
8825             if (!args
8826                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8827                 && ckWARN(WARN_PRINTF))
8828             {
8829                 SV * const msg = sv_newmortal();
8830                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8831                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8832                 if (c) {
8833                     if (isPRINT(c))
8834                         Perl_sv_catpvf(aTHX_ msg,
8835                                        "\"%%%c\"", c & 0xFF);
8836                     else
8837                         Perl_sv_catpvf(aTHX_ msg,
8838                                        "\"%%\\%03"UVof"\"",
8839                                        (UV)c & 0xFF);
8840                 } else
8841                     sv_catpv(msg, "end of string");
8842                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8843             }
8844
8845             /* output mangled stuff ... */
8846             if (c == '\0')
8847                 --q;
8848             eptr = p;
8849             elen = q - p;
8850
8851             /* ... right here, because formatting flags should not apply */
8852             SvGROW(sv, SvCUR(sv) + elen + 1);
8853             p = SvEND(sv);
8854             Copy(eptr, p, elen, char);
8855             p += elen;
8856             *p = '\0';
8857             SvCUR_set(sv, p - SvPVX_const(sv));
8858             svix = osvix;
8859             continue;   /* not "break" */
8860         }
8861
8862         /* calculate width before utf8_upgrade changes it */
8863         have = esignlen + zeros + elen;
8864         if (have < zeros)
8865             Perl_croak_nocontext(PL_memory_wrap);
8866
8867         if (is_utf8 != has_utf8) {
8868              if (is_utf8) {
8869                   if (SvCUR(sv))
8870                        sv_utf8_upgrade(sv);
8871              }
8872              else {
8873                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8874                   sv_utf8_upgrade(nsv);
8875                   eptr = SvPVX_const(nsv);
8876                   elen = SvCUR(nsv);
8877              }
8878              SvGROW(sv, SvCUR(sv) + elen + 1);
8879              p = SvEND(sv);
8880              *p = '\0';
8881         }
8882
8883         need = (have > width ? have : width);
8884         gap = need - have;
8885
8886         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8887             Perl_croak_nocontext(PL_memory_wrap);
8888         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8889         p = SvEND(sv);
8890         if (esignlen && fill == '0') {
8891             int i;
8892             for (i = 0; i < (int)esignlen; i++)
8893                 *p++ = esignbuf[i];
8894         }
8895         if (gap && !left) {
8896             memset(p, fill, gap);
8897             p += gap;
8898         }
8899         if (esignlen && fill != '0') {
8900             int i;
8901             for (i = 0; i < (int)esignlen; i++)
8902                 *p++ = esignbuf[i];
8903         }
8904         if (zeros) {
8905             int i;
8906             for (i = zeros; i; i--)
8907                 *p++ = '0';
8908         }
8909         if (elen) {
8910             Copy(eptr, p, elen, char);
8911             p += elen;
8912         }
8913         if (gap && left) {
8914             memset(p, ' ', gap);
8915             p += gap;
8916         }
8917         if (vectorize) {
8918             if (veclen) {
8919                 Copy(dotstr, p, dotstrlen, char);
8920                 p += dotstrlen;
8921             }
8922             else
8923                 vectorize = FALSE;              /* done iterating over vecstr */
8924         }
8925         if (is_utf8)
8926             has_utf8 = TRUE;
8927         if (has_utf8)
8928             SvUTF8_on(sv);
8929         *p = '\0';
8930         SvCUR_set(sv, p - SvPVX_const(sv));
8931         if (vectorize) {
8932             esignlen = 0;
8933             goto vector;
8934         }
8935     }
8936 }
8937
8938 /* =========================================================================
8939
8940 =head1 Cloning an interpreter
8941
8942 All the macros and functions in this section are for the private use of
8943 the main function, perl_clone().
8944
8945 The foo_dup() functions make an exact copy of an existing foo thinngy.
8946 During the course of a cloning, a hash table is used to map old addresses
8947 to new addresses. The table is created and manipulated with the
8948 ptr_table_* functions.
8949
8950 =cut
8951
8952 ============================================================================*/
8953
8954
8955 #if defined(USE_ITHREADS)
8956
8957 #ifndef GpREFCNT_inc
8958 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8959 #endif
8960
8961
8962 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8963 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8964 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8965 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8966 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8967 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8968 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8969 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8970 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8971 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8972 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8973 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8974 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8975
8976
8977 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8978    regcomp.c. AMS 20010712 */
8979
8980 REGEXP *
8981 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8982 {
8983     dVAR;
8984     REGEXP *ret;
8985     int i, len, npar;
8986     struct reg_substr_datum *s;
8987
8988     if (!r)
8989         return (REGEXP *)NULL;
8990
8991     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
8992         return ret;
8993
8994     len = r->offsets[0];
8995     npar = r->nparens+1;
8996
8997     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
8998     Copy(r->program, ret->program, len+1, regnode);
8999
9000     Newx(ret->startp, npar, I32);
9001     Copy(r->startp, ret->startp, npar, I32);
9002     Newx(ret->endp, npar, I32);
9003     Copy(r->startp, ret->startp, npar, I32);
9004
9005     Newx(ret->substrs, 1, struct reg_substr_data);
9006     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
9007         s->min_offset = r->substrs->data[i].min_offset;
9008         s->max_offset = r->substrs->data[i].max_offset;
9009         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
9010         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
9011     }
9012
9013     ret->regstclass = NULL;
9014     if (r->data) {
9015         struct reg_data *d;
9016         const int count = r->data->count;
9017         int i;
9018
9019         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
9020                 char, struct reg_data);
9021         Newx(d->what, count, U8);
9022
9023         d->count = count;
9024         for (i = 0; i < count; i++) {
9025             d->what[i] = r->data->what[i];
9026             switch (d->what[i]) {
9027                 /* legal options are one of: sfpont
9028                    see also regcomp.h and pregfree() */
9029             case 's':
9030                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
9031                 break;
9032             case 'p':
9033                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
9034                 break;
9035             case 'f':
9036                 /* This is cheating. */
9037                 Newx(d->data[i], 1, struct regnode_charclass_class);
9038                 StructCopy(r->data->data[i], d->data[i],
9039                             struct regnode_charclass_class);
9040                 ret->regstclass = (regnode*)d->data[i];
9041                 break;
9042             case 'o':
9043                 /* Compiled op trees are readonly, and can thus be
9044                    shared without duplication. */
9045                 OP_REFCNT_LOCK;
9046                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
9047                 OP_REFCNT_UNLOCK;
9048                 break;
9049             case 'n':
9050                 d->data[i] = r->data->data[i];
9051                 break;
9052             case 't':
9053                 d->data[i] = r->data->data[i];
9054                 OP_REFCNT_LOCK;
9055                 ((reg_trie_data*)d->data[i])->refcount++;
9056                 OP_REFCNT_UNLOCK;
9057                 break;
9058             default:
9059                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
9060             }
9061         }
9062
9063         ret->data = d;
9064     }
9065     else
9066         ret->data = NULL;
9067
9068     Newx(ret->offsets, 2*len+1, U32);
9069     Copy(r->offsets, ret->offsets, 2*len+1, U32);
9070
9071     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
9072     ret->refcnt         = r->refcnt;
9073     ret->minlen         = r->minlen;
9074     ret->prelen         = r->prelen;
9075     ret->nparens        = r->nparens;
9076     ret->lastparen      = r->lastparen;
9077     ret->lastcloseparen = r->lastcloseparen;
9078     ret->reganch        = r->reganch;
9079
9080     ret->sublen         = r->sublen;
9081
9082     if (RX_MATCH_COPIED(ret))
9083         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
9084     else
9085         ret->subbeg = Nullch;
9086 #ifdef PERL_OLD_COPY_ON_WRITE
9087     ret->saved_copy = Nullsv;
9088 #endif
9089
9090     ptr_table_store(PL_ptr_table, r, ret);
9091     return ret;
9092 }
9093
9094 /* duplicate a file handle */
9095
9096 PerlIO *
9097 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
9098 {
9099     PerlIO *ret;
9100
9101     PERL_UNUSED_ARG(type);
9102
9103     if (!fp)
9104         return (PerlIO*)NULL;
9105
9106     /* look for it in the table first */
9107     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
9108     if (ret)
9109         return ret;
9110
9111     /* create anew and remember what it is */
9112     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
9113     ptr_table_store(PL_ptr_table, fp, ret);
9114     return ret;
9115 }
9116
9117 /* duplicate a directory handle */
9118
9119 DIR *
9120 Perl_dirp_dup(pTHX_ DIR *dp)
9121 {
9122     if (!dp)
9123         return (DIR*)NULL;
9124     /* XXX TODO */
9125     return dp;
9126 }
9127
9128 /* duplicate a typeglob */
9129
9130 GP *
9131 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
9132 {
9133     GP *ret;
9134     if (!gp)
9135         return (GP*)NULL;
9136     /* look for it in the table first */
9137     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
9138     if (ret)
9139         return ret;
9140
9141     /* create anew and remember what it is */
9142     Newxz(ret, 1, GP);
9143     ptr_table_store(PL_ptr_table, gp, ret);
9144
9145     /* clone */
9146     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
9147     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
9148     ret->gp_io          = io_dup_inc(gp->gp_io, param);
9149     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
9150     ret->gp_av          = av_dup_inc(gp->gp_av, param);
9151     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
9152     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
9153     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
9154     ret->gp_cvgen       = gp->gp_cvgen;
9155     ret->gp_line        = gp->gp_line;
9156     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
9157     return ret;
9158 }
9159
9160 /* duplicate a chain of magic */
9161
9162 MAGIC *
9163 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
9164 {
9165     MAGIC *mgprev = (MAGIC*)NULL;
9166     MAGIC *mgret;
9167     if (!mg)
9168         return (MAGIC*)NULL;
9169     /* look for it in the table first */
9170     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
9171     if (mgret)
9172         return mgret;
9173
9174     for (; mg; mg = mg->mg_moremagic) {
9175         MAGIC *nmg;
9176         Newxz(nmg, 1, MAGIC);
9177         if (mgprev)
9178             mgprev->mg_moremagic = nmg;
9179         else
9180             mgret = nmg;
9181         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
9182         nmg->mg_private = mg->mg_private;
9183         nmg->mg_type    = mg->mg_type;
9184         nmg->mg_flags   = mg->mg_flags;
9185         if (mg->mg_type == PERL_MAGIC_qr) {
9186             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
9187         }
9188         else if(mg->mg_type == PERL_MAGIC_backref) {
9189             const AV * const av = (AV*) mg->mg_obj;
9190             SV **svp;
9191             I32 i;
9192             (void)SvREFCNT_inc(nmg->mg_obj = (SV*)newAV());
9193             svp = AvARRAY(av);
9194             for (i = AvFILLp(av); i >= 0; i--) {
9195                 if (!svp[i]) continue;
9196                 av_push((AV*)nmg->mg_obj,sv_dup(svp[i],param));
9197             }
9198         }
9199         else if (mg->mg_type == PERL_MAGIC_symtab) {
9200             nmg->mg_obj = mg->mg_obj;
9201         }
9202         else {
9203             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9204                               ? sv_dup_inc(mg->mg_obj, param)
9205                               : sv_dup(mg->mg_obj, param);
9206         }
9207         nmg->mg_len     = mg->mg_len;
9208         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9209         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9210             if (mg->mg_len > 0) {
9211                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9212                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9213                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9214                 {
9215                     AMT * const amtp = (AMT*)mg->mg_ptr;
9216                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9217                     I32 i;
9218                     for (i = 1; i < NofAMmeth; i++) {
9219                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9220                     }
9221                 }
9222             }
9223             else if (mg->mg_len == HEf_SVKEY)
9224                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9225         }
9226         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9227             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9228         }
9229         mgprev = nmg;
9230     }
9231     return mgret;
9232 }
9233
9234 /* create a new pointer-mapping table */
9235
9236 PTR_TBL_t *
9237 Perl_ptr_table_new(pTHX)
9238 {
9239     PTR_TBL_t *tbl;
9240     Newxz(tbl, 1, PTR_TBL_t);
9241     tbl->tbl_max        = 511;
9242     tbl->tbl_items      = 0;
9243     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9244     return tbl;
9245 }
9246
9247 #if (PTRSIZE == 8)
9248 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 3)
9249 #else
9250 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 2)
9251 #endif
9252
9253 /* 
9254    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9255    following define) and at call to new_body_inline made below in 
9256    Perl_ptr_table_store()
9257  */
9258
9259 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9260
9261 /* map an existing pointer using a table */
9262
9263 void *
9264 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9265 {
9266     PTR_TBL_ENT_t *tblent;
9267     const UV hash = PTR_TABLE_HASH(sv);
9268     assert(tbl);
9269     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9270     for (; tblent; tblent = tblent->next) {
9271         if (tblent->oldval == sv)
9272             return tblent->newval;
9273     }
9274     return (void*)NULL;
9275 }
9276
9277 /* add a new entry to a pointer-mapping table */
9278
9279 void
9280 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9281 {
9282     PTR_TBL_ENT_t *tblent, **otblent;
9283     /* XXX this may be pessimal on platforms where pointers aren't good
9284      * hash values e.g. if they grow faster in the most significant
9285      * bits */
9286     const UV hash = PTR_TABLE_HASH(oldsv);
9287     bool empty = 1;
9288
9289     assert(tbl);
9290     otblent = &tbl->tbl_ary[hash & tbl->tbl_max];
9291     for (tblent = *otblent; tblent; empty=0, tblent = tblent->next) {
9292         if (tblent->oldval == oldsv) {
9293             tblent->newval = newsv;
9294             return;
9295         }
9296     }
9297     new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9298     tblent->oldval = oldsv;
9299     tblent->newval = newsv;
9300     tblent->next = *otblent;
9301     *otblent = tblent;
9302     tbl->tbl_items++;
9303     if (!empty && tbl->tbl_items > tbl->tbl_max)
9304         ptr_table_split(tbl);
9305 }
9306
9307 /* double the hash bucket size of an existing ptr table */
9308
9309 void
9310 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9311 {
9312     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9313     const UV oldsize = tbl->tbl_max + 1;
9314     UV newsize = oldsize * 2;
9315     UV i;
9316
9317     Renew(ary, newsize, PTR_TBL_ENT_t*);
9318     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9319     tbl->tbl_max = --newsize;
9320     tbl->tbl_ary = ary;
9321     for (i=0; i < oldsize; i++, ary++) {
9322         PTR_TBL_ENT_t **curentp, **entp, *ent;
9323         if (!*ary)
9324             continue;
9325         curentp = ary + oldsize;
9326         for (entp = ary, ent = *ary; ent; ent = *entp) {
9327             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9328                 *entp = ent->next;
9329                 ent->next = *curentp;
9330                 *curentp = ent;
9331                 continue;
9332             }
9333             else
9334                 entp = &ent->next;
9335         }
9336     }
9337 }
9338
9339 /* remove all the entries from a ptr table */
9340
9341 void
9342 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9343 {
9344     register PTR_TBL_ENT_t **array;
9345     register PTR_TBL_ENT_t *entry;
9346     UV riter = 0;
9347     UV max;
9348
9349     if (!tbl || !tbl->tbl_items) {
9350         return;
9351     }
9352
9353     array = tbl->tbl_ary;
9354     entry = array[0];
9355     max = tbl->tbl_max;
9356
9357     for (;;) {
9358         if (entry) {
9359             PTR_TBL_ENT_t *oentry = entry;
9360             entry = entry->next;
9361             del_pte(oentry);
9362         }
9363         if (!entry) {
9364             if (++riter > max) {
9365                 break;
9366             }
9367             entry = array[riter];
9368         }
9369     }
9370
9371     tbl->tbl_items = 0;
9372 }
9373
9374 /* clear and free a ptr table */
9375
9376 void
9377 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9378 {
9379     if (!tbl) {
9380         return;
9381     }
9382     ptr_table_clear(tbl);
9383     Safefree(tbl->tbl_ary);
9384     Safefree(tbl);
9385 }
9386
9387
9388 void
9389 Perl_rvpv_dup(pTHX_ SV *dstr, SV *sstr, CLONE_PARAMS* param)
9390 {
9391     if (SvROK(sstr)) {
9392         SvRV_set(dstr, SvWEAKREF(sstr)
9393                        ? sv_dup(SvRV(sstr), param)
9394                        : sv_dup_inc(SvRV(sstr), param));
9395
9396     }
9397     else if (SvPVX_const(sstr)) {
9398         /* Has something there */
9399         if (SvLEN(sstr)) {
9400             /* Normal PV - clone whole allocated space */
9401             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9402             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9403                 /* Not that normal - actually sstr is copy on write.
9404                    But we are a true, independant SV, so:  */
9405                 SvREADONLY_off(dstr);
9406                 SvFAKE_off(dstr);
9407             }
9408         }
9409         else {
9410             /* Special case - not normally malloced for some reason */
9411             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9412                 /* A "shared" PV - clone it as "shared" PV */
9413                 SvPV_set(dstr,
9414                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9415                                          param)));
9416             }
9417             else {
9418                 /* Some other special case - random pointer */
9419                 SvPV_set(dstr, SvPVX(sstr));            
9420             }
9421         }
9422     }
9423     else {
9424         /* Copy the Null */
9425         if (SvTYPE(dstr) == SVt_RV)
9426             SvRV_set(dstr, NULL);
9427         else
9428             SvPV_set(dstr, 0);
9429     }
9430 }
9431
9432 /* duplicate an SV of any type (including AV, HV etc) */
9433
9434 SV *
9435 Perl_sv_dup(pTHX_ SV *sstr, CLONE_PARAMS* param)
9436 {
9437     dVAR;
9438     SV *dstr;
9439
9440     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9441         return Nullsv;
9442     /* look for it in the table first */
9443     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9444     if (dstr)
9445         return dstr;
9446
9447     if(param->flags & CLONEf_JOIN_IN) {
9448         /** We are joining here so we don't want do clone
9449             something that is bad **/
9450         const char *hvname;
9451
9452         if(SvTYPE(sstr) == SVt_PVHV &&
9453            (hvname = HvNAME_get(sstr))) {
9454             /** don't clone stashes if they already exist **/
9455             return (SV*)gv_stashpv(hvname,0);
9456         }
9457     }
9458
9459     /* create anew and remember what it is */
9460     new_SV(dstr);
9461
9462 #ifdef DEBUG_LEAKING_SCALARS
9463     dstr->sv_debug_optype = sstr->sv_debug_optype;
9464     dstr->sv_debug_line = sstr->sv_debug_line;
9465     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9466     dstr->sv_debug_cloned = 1;
9467 #  ifdef NETWARE
9468     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9469 #  else
9470     dstr->sv_debug_file = savesharedpv(sstr->sv_debug_file);
9471 #  endif
9472 #endif
9473
9474     ptr_table_store(PL_ptr_table, sstr, dstr);
9475
9476     /* clone */
9477     SvFLAGS(dstr)       = SvFLAGS(sstr);
9478     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9479     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9480
9481 #ifdef DEBUGGING
9482     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9483         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9484                       PL_watch_pvx, SvPVX_const(sstr));
9485 #endif
9486
9487     /* don't clone objects whose class has asked us not to */
9488     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9489         SvFLAGS(dstr) &= ~SVTYPEMASK;
9490         SvOBJECT_off(dstr);
9491         return dstr;
9492     }
9493
9494     switch (SvTYPE(sstr)) {
9495     case SVt_NULL:
9496         SvANY(dstr)     = NULL;
9497         break;
9498     case SVt_IV:
9499         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9500         SvIV_set(dstr, SvIVX(sstr));
9501         break;
9502     case SVt_NV:
9503         SvANY(dstr)     = new_XNV();
9504         SvNV_set(dstr, SvNVX(sstr));
9505         break;
9506     case SVt_RV:
9507         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9508         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9509         break;
9510     default:
9511         {
9512             /* These are all the types that need complex bodies allocating.  */
9513             void *new_body;
9514             const svtype sv_type = SvTYPE(sstr);
9515             const struct body_details *const sv_type_details
9516                 = bodies_by_type + sv_type;
9517
9518             switch (sv_type) {
9519             default:
9520                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9521                            (IV)SvTYPE(sstr));
9522                 break;
9523
9524             case SVt_PVGV:
9525                 if (GvUNIQUE((GV*)sstr)) {
9526                     /* Do sharing here, and fall through */
9527                 }
9528             case SVt_PVIO:
9529             case SVt_PVFM:
9530             case SVt_PVHV:
9531             case SVt_PVAV:
9532             case SVt_PVBM:
9533             case SVt_PVCV:
9534             case SVt_PVLV:
9535             case SVt_PVMG:
9536             case SVt_PVNV:
9537             case SVt_PVIV:
9538             case SVt_PV:
9539                 assert(sv_type_details->copy);
9540                 if (sv_type_details->arena) {
9541                     new_body_inline(new_body, sv_type_details->copy, sv_type);
9542                     new_body
9543                         = (void*)((char*)new_body - sv_type_details->offset);
9544                 } else {
9545                     new_body = new_NOARENA(sv_type_details);
9546                 }
9547             }
9548             assert(new_body);
9549             SvANY(dstr) = new_body;
9550
9551 #ifndef PURIFY
9552             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9553                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9554                  sv_type_details->copy, char);
9555 #else
9556             Copy(((char*)SvANY(sstr)),
9557                  ((char*)SvANY(dstr)),
9558                  sv_type_details->size + sv_type_details->offset, char);
9559 #endif
9560
9561             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9562                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9563
9564             /* The Copy above means that all the source (unduplicated) pointers
9565                are now in the destination.  We can check the flags and the
9566                pointers in either, but it's possible that there's less cache
9567                missing by always going for the destination.
9568                FIXME - instrument and check that assumption  */
9569             if (sv_type >= SVt_PVMG) {
9570                 if (SvMAGIC(dstr))
9571                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9572                 if (SvSTASH(dstr))
9573                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9574             }
9575
9576             /* The cast silences a GCC warning about unhandled types.  */
9577             switch ((int)sv_type) {
9578             case SVt_PV:
9579                 break;
9580             case SVt_PVIV:
9581                 break;
9582             case SVt_PVNV:
9583                 break;
9584             case SVt_PVMG:
9585                 break;
9586             case SVt_PVBM:
9587                 break;
9588             case SVt_PVLV:
9589                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9590                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9591                     LvTARG(dstr) = dstr;
9592                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9593                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9594                 else
9595                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9596                 break;
9597             case SVt_PVGV:
9598                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9599                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9600                 /* Don't call sv_add_backref here as it's going to be created
9601                    as part of the magic cloning of the symbol table.  */
9602                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9603                 (void)GpREFCNT_inc(GvGP(dstr));
9604                 break;
9605             case SVt_PVIO:
9606                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9607                 if (IoOFP(dstr) == IoIFP(sstr))
9608                     IoOFP(dstr) = IoIFP(dstr);
9609                 else
9610                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9611                 /* PL_rsfp_filters entries have fake IoDIRP() */
9612                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9613                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9614                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9615                     /* I have no idea why fake dirp (rsfps)
9616                        should be treated differently but otherwise
9617                        we end up with leaks -- sky*/
9618                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9619                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9620                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9621                 } else {
9622                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9623                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9624                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9625                 }
9626                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9627                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9628                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9629                 break;
9630             case SVt_PVAV:
9631                 if (AvARRAY((AV*)sstr)) {
9632                     SV **dst_ary, **src_ary;
9633                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9634
9635                     src_ary = AvARRAY((AV*)sstr);
9636                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9637                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9638                     SvPV_set(dstr, (char*)dst_ary);
9639                     AvALLOC((AV*)dstr) = dst_ary;
9640                     if (AvREAL((AV*)sstr)) {
9641                         while (items-- > 0)
9642                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9643                     }
9644                     else {
9645                         while (items-- > 0)
9646                             *dst_ary++ = sv_dup(*src_ary++, param);
9647                     }
9648                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9649                     while (items-- > 0) {
9650                         *dst_ary++ = &PL_sv_undef;
9651                     }
9652                 }
9653                 else {
9654                     SvPV_set(dstr, Nullch);
9655                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9656                 }
9657                 break;
9658             case SVt_PVHV:
9659                 {
9660                     HEK *hvname = 0;
9661
9662                     if (HvARRAY((HV*)sstr)) {
9663                         STRLEN i = 0;
9664                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9665                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9666                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9667                         char *darray;
9668                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9669                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9670                             char);
9671                         HvARRAY(dstr) = (HE**)darray;
9672                         while (i <= sxhv->xhv_max) {
9673                             const HE *source = HvARRAY(sstr)[i];
9674                             HvARRAY(dstr)[i] = source
9675                                 ? he_dup(source, sharekeys, param) : 0;
9676                             ++i;
9677                         }
9678                         if (SvOOK(sstr)) {
9679                             struct xpvhv_aux *saux = HvAUX(sstr);
9680                             struct xpvhv_aux *daux = HvAUX(dstr);
9681                             /* This flag isn't copied.  */
9682                             /* SvOOK_on(hv) attacks the IV flags.  */
9683                             SvFLAGS(dstr) |= SVf_OOK;
9684
9685                             hvname = saux->xhv_name;
9686                             daux->xhv_name
9687                                 = hvname ? hek_dup(hvname, param) : hvname;
9688
9689                             daux->xhv_riter = saux->xhv_riter;
9690                             daux->xhv_eiter = saux->xhv_eiter
9691                                 ? he_dup(saux->xhv_eiter,
9692                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9693                         }
9694                     }
9695                     else {
9696                         SvPV_set(dstr, Nullch);
9697                     }
9698                     /* Record stashes for possible cloning in Perl_clone(). */
9699                     if(hvname)
9700                         av_push(param->stashes, dstr);
9701                 }
9702                 break;
9703             case SVt_PVFM:
9704             case SVt_PVCV:
9705                 /* NOTE: not refcounted */
9706                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9707                 OP_REFCNT_LOCK;
9708                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9709                 OP_REFCNT_UNLOCK;
9710                 if (CvCONST(dstr)) {
9711                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9712                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9713                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9714                 }
9715                 /* don't dup if copying back - CvGV isn't refcounted, so the
9716                  * duped GV may never be freed. A bit of a hack! DAPM */
9717                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9718                     Nullgv : gv_dup(CvGV(dstr), param) ;
9719                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9720                     CvDEPTH(dstr) = 0;
9721                 }
9722                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9723                 CvOUTSIDE(dstr) =
9724                     CvWEAKOUTSIDE(sstr)
9725                     ? cv_dup(    CvOUTSIDE(dstr), param)
9726                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9727                 if (!CvXSUB(dstr))
9728                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9729                 break;
9730             }
9731         }
9732     }
9733
9734     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9735         ++PL_sv_objcount;
9736
9737     return dstr;
9738  }
9739
9740 /* duplicate a context */
9741
9742 PERL_CONTEXT *
9743 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9744 {
9745     PERL_CONTEXT *ncxs;
9746
9747     if (!cxs)
9748         return (PERL_CONTEXT*)NULL;
9749
9750     /* look for it in the table first */
9751     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9752     if (ncxs)
9753         return ncxs;
9754
9755     /* create anew and remember what it is */
9756     Newxz(ncxs, max + 1, PERL_CONTEXT);
9757     ptr_table_store(PL_ptr_table, cxs, ncxs);
9758
9759     while (ix >= 0) {
9760         PERL_CONTEXT *cx = &cxs[ix];
9761         PERL_CONTEXT *ncx = &ncxs[ix];
9762         ncx->cx_type    = cx->cx_type;
9763         if (CxTYPE(cx) == CXt_SUBST) {
9764             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9765         }
9766         else {
9767             ncx->blk_oldsp      = cx->blk_oldsp;
9768             ncx->blk_oldcop     = cx->blk_oldcop;
9769             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9770             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9771             ncx->blk_oldpm      = cx->blk_oldpm;
9772             ncx->blk_gimme      = cx->blk_gimme;
9773             switch (CxTYPE(cx)) {
9774             case CXt_SUB:
9775                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9776                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9777                                            : cv_dup(cx->blk_sub.cv,param));
9778                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9779                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9780                                            : Nullav);
9781                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9782                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9783                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9784                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9785                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9786                 break;
9787             case CXt_EVAL:
9788                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9789                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9790                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9791                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9792                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9793                 ncx->blk_eval.retop = cx->blk_eval.retop;
9794                 break;
9795             case CXt_LOOP:
9796                 ncx->blk_loop.label     = cx->blk_loop.label;
9797                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9798                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9799                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9800                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9801                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9802                                            ? cx->blk_loop.iterdata
9803                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9804                 ncx->blk_loop.oldcomppad
9805                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9806                                             cx->blk_loop.oldcomppad);
9807                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9808                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9809                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9810                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9811                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9812                 break;
9813             case CXt_FORMAT:
9814                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9815                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9816                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9817                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9818                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9819                 break;
9820             case CXt_BLOCK:
9821             case CXt_NULL:
9822                 break;
9823             }
9824         }
9825         --ix;
9826     }
9827     return ncxs;
9828 }
9829
9830 /* duplicate a stack info structure */
9831
9832 PERL_SI *
9833 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9834 {
9835     PERL_SI *nsi;
9836
9837     if (!si)
9838         return (PERL_SI*)NULL;
9839
9840     /* look for it in the table first */
9841     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9842     if (nsi)
9843         return nsi;
9844
9845     /* create anew and remember what it is */
9846     Newxz(nsi, 1, PERL_SI);
9847     ptr_table_store(PL_ptr_table, si, nsi);
9848
9849     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9850     nsi->si_cxix        = si->si_cxix;
9851     nsi->si_cxmax       = si->si_cxmax;
9852     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9853     nsi->si_type        = si->si_type;
9854     nsi->si_prev        = si_dup(si->si_prev, param);
9855     nsi->si_next        = si_dup(si->si_next, param);
9856     nsi->si_markoff     = si->si_markoff;
9857
9858     return nsi;
9859 }
9860
9861 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9862 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9863 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9864 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9865 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9866 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9867 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9868 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9869 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9870 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9871 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9872 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9873 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9874 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9875
9876 /* XXXXX todo */
9877 #define pv_dup_inc(p)   SAVEPV(p)
9878 #define pv_dup(p)       SAVEPV(p)
9879 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9880
9881 /* map any object to the new equivent - either something in the
9882  * ptr table, or something in the interpreter structure
9883  */
9884
9885 void *
9886 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9887 {
9888     void *ret;
9889
9890     if (!v)
9891         return (void*)NULL;
9892
9893     /* look for it in the table first */
9894     ret = ptr_table_fetch(PL_ptr_table, v);
9895     if (ret)
9896         return ret;
9897
9898     /* see if it is part of the interpreter structure */
9899     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9900         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9901     else {
9902         ret = v;
9903     }
9904
9905     return ret;
9906 }
9907
9908 /* duplicate the save stack */
9909
9910 ANY *
9911 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9912 {
9913     ANY * const ss      = proto_perl->Tsavestack;
9914     const I32 max       = proto_perl->Tsavestack_max;
9915     I32 ix              = proto_perl->Tsavestack_ix;
9916     ANY *nss;
9917     SV *sv;
9918     GV *gv;
9919     AV *av;
9920     HV *hv;
9921     void* ptr;
9922     int intval;
9923     long longval;
9924     GP *gp;
9925     IV iv;
9926     char *c = NULL;
9927     void (*dptr) (void*);
9928     void (*dxptr) (pTHX_ void*);
9929
9930     Newxz(nss, max, ANY);
9931
9932     while (ix > 0) {
9933         I32 i = POPINT(ss,ix);
9934         TOPINT(nss,ix) = i;
9935         switch (i) {
9936         case SAVEt_ITEM:                        /* normal string */
9937             sv = (SV*)POPPTR(ss,ix);
9938             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9939             sv = (SV*)POPPTR(ss,ix);
9940             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9941             break;
9942         case SAVEt_SV:                          /* scalar reference */
9943             sv = (SV*)POPPTR(ss,ix);
9944             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9945             gv = (GV*)POPPTR(ss,ix);
9946             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9947             break;
9948         case SAVEt_GENERIC_PVREF:               /* generic char* */
9949             c = (char*)POPPTR(ss,ix);
9950             TOPPTR(nss,ix) = pv_dup(c);
9951             ptr = POPPTR(ss,ix);
9952             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9953             break;
9954         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9955             c = (char*)POPPTR(ss,ix);
9956             TOPPTR(nss,ix) = savesharedpv(c);
9957             ptr = POPPTR(ss,ix);
9958             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9959             break;
9960         case SAVEt_GENERIC_SVREF:               /* generic sv */
9961         case SAVEt_SVREF:                       /* scalar reference */
9962             sv = (SV*)POPPTR(ss,ix);
9963             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9964             ptr = POPPTR(ss,ix);
9965             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9966             break;
9967         case SAVEt_AV:                          /* array reference */
9968             av = (AV*)POPPTR(ss,ix);
9969             TOPPTR(nss,ix) = av_dup_inc(av, param);
9970             gv = (GV*)POPPTR(ss,ix);
9971             TOPPTR(nss,ix) = gv_dup(gv, param);
9972             break;
9973         case SAVEt_HV:                          /* hash reference */
9974             hv = (HV*)POPPTR(ss,ix);
9975             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9976             gv = (GV*)POPPTR(ss,ix);
9977             TOPPTR(nss,ix) = gv_dup(gv, param);
9978             break;
9979         case SAVEt_INT:                         /* int reference */
9980             ptr = POPPTR(ss,ix);
9981             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9982             intval = (int)POPINT(ss,ix);
9983             TOPINT(nss,ix) = intval;
9984             break;
9985         case SAVEt_LONG:                        /* long reference */
9986             ptr = POPPTR(ss,ix);
9987             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9988             longval = (long)POPLONG(ss,ix);
9989             TOPLONG(nss,ix) = longval;
9990             break;
9991         case SAVEt_I32:                         /* I32 reference */
9992         case SAVEt_I16:                         /* I16 reference */
9993         case SAVEt_I8:                          /* I8 reference */
9994             ptr = POPPTR(ss,ix);
9995             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9996             i = POPINT(ss,ix);
9997             TOPINT(nss,ix) = i;
9998             break;
9999         case SAVEt_IV:                          /* IV reference */
10000             ptr = POPPTR(ss,ix);
10001             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10002             iv = POPIV(ss,ix);
10003             TOPIV(nss,ix) = iv;
10004             break;
10005         case SAVEt_SPTR:                        /* SV* reference */
10006             ptr = POPPTR(ss,ix);
10007             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10008             sv = (SV*)POPPTR(ss,ix);
10009             TOPPTR(nss,ix) = sv_dup(sv, param);
10010             break;
10011         case SAVEt_VPTR:                        /* random* reference */
10012             ptr = POPPTR(ss,ix);
10013             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10014             ptr = POPPTR(ss,ix);
10015             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10016             break;
10017         case SAVEt_PPTR:                        /* char* reference */
10018             ptr = POPPTR(ss,ix);
10019             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10020             c = (char*)POPPTR(ss,ix);
10021             TOPPTR(nss,ix) = pv_dup(c);
10022             break;
10023         case SAVEt_HPTR:                        /* HV* reference */
10024             ptr = POPPTR(ss,ix);
10025             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10026             hv = (HV*)POPPTR(ss,ix);
10027             TOPPTR(nss,ix) = hv_dup(hv, param);
10028             break;
10029         case SAVEt_APTR:                        /* AV* reference */
10030             ptr = POPPTR(ss,ix);
10031             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10032             av = (AV*)POPPTR(ss,ix);
10033             TOPPTR(nss,ix) = av_dup(av, param);
10034             break;
10035         case SAVEt_NSTAB:
10036             gv = (GV*)POPPTR(ss,ix);
10037             TOPPTR(nss,ix) = gv_dup(gv, param);
10038             break;
10039         case SAVEt_GP:                          /* scalar reference */
10040             gp = (GP*)POPPTR(ss,ix);
10041             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
10042             (void)GpREFCNT_inc(gp);
10043             gv = (GV*)POPPTR(ss,ix);
10044             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
10045             c = (char*)POPPTR(ss,ix);
10046             TOPPTR(nss,ix) = pv_dup(c);
10047             iv = POPIV(ss,ix);
10048             TOPIV(nss,ix) = iv;
10049             iv = POPIV(ss,ix);
10050             TOPIV(nss,ix) = iv;
10051             break;
10052         case SAVEt_FREESV:
10053         case SAVEt_MORTALIZESV:
10054             sv = (SV*)POPPTR(ss,ix);
10055             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10056             break;
10057         case SAVEt_FREEOP:
10058             ptr = POPPTR(ss,ix);
10059             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
10060                 /* these are assumed to be refcounted properly */
10061                 OP *o;
10062                 switch (((OP*)ptr)->op_type) {
10063                 case OP_LEAVESUB:
10064                 case OP_LEAVESUBLV:
10065                 case OP_LEAVEEVAL:
10066                 case OP_LEAVE:
10067                 case OP_SCOPE:
10068                 case OP_LEAVEWRITE:
10069                     TOPPTR(nss,ix) = ptr;
10070                     o = (OP*)ptr;
10071                     OpREFCNT_inc(o);
10072                     break;
10073                 default:
10074                     TOPPTR(nss,ix) = Nullop;
10075                     break;
10076                 }
10077             }
10078             else
10079                 TOPPTR(nss,ix) = Nullop;
10080             break;
10081         case SAVEt_FREEPV:
10082             c = (char*)POPPTR(ss,ix);
10083             TOPPTR(nss,ix) = pv_dup_inc(c);
10084             break;
10085         case SAVEt_CLEARSV:
10086             longval = POPLONG(ss,ix);
10087             TOPLONG(nss,ix) = longval;
10088             break;
10089         case SAVEt_DELETE:
10090             hv = (HV*)POPPTR(ss,ix);
10091             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10092             c = (char*)POPPTR(ss,ix);
10093             TOPPTR(nss,ix) = pv_dup_inc(c);
10094             i = POPINT(ss,ix);
10095             TOPINT(nss,ix) = i;
10096             break;
10097         case SAVEt_DESTRUCTOR:
10098             ptr = POPPTR(ss,ix);
10099             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10100             dptr = POPDPTR(ss,ix);
10101             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
10102                                         any_dup(FPTR2DPTR(void *, dptr),
10103                                                 proto_perl));
10104             break;
10105         case SAVEt_DESTRUCTOR_X:
10106             ptr = POPPTR(ss,ix);
10107             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10108             dxptr = POPDXPTR(ss,ix);
10109             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
10110                                          any_dup(FPTR2DPTR(void *, dxptr),
10111                                                  proto_perl));
10112             break;
10113         case SAVEt_REGCONTEXT:
10114         case SAVEt_ALLOC:
10115             i = POPINT(ss,ix);
10116             TOPINT(nss,ix) = i;
10117             ix -= i;
10118             break;
10119         case SAVEt_STACK_POS:           /* Position on Perl stack */
10120             i = POPINT(ss,ix);
10121             TOPINT(nss,ix) = i;
10122             break;
10123         case SAVEt_AELEM:               /* array element */
10124             sv = (SV*)POPPTR(ss,ix);
10125             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10126             i = POPINT(ss,ix);
10127             TOPINT(nss,ix) = i;
10128             av = (AV*)POPPTR(ss,ix);
10129             TOPPTR(nss,ix) = av_dup_inc(av, param);
10130             break;
10131         case SAVEt_HELEM:               /* hash element */
10132             sv = (SV*)POPPTR(ss,ix);
10133             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10134             sv = (SV*)POPPTR(ss,ix);
10135             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10136             hv = (HV*)POPPTR(ss,ix);
10137             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10138             break;
10139         case SAVEt_OP:
10140             ptr = POPPTR(ss,ix);
10141             TOPPTR(nss,ix) = ptr;
10142             break;
10143         case SAVEt_HINTS:
10144             i = POPINT(ss,ix);
10145             TOPINT(nss,ix) = i;
10146             break;
10147         case SAVEt_COMPPAD:
10148             av = (AV*)POPPTR(ss,ix);
10149             TOPPTR(nss,ix) = av_dup(av, param);
10150             break;
10151         case SAVEt_PADSV:
10152             longval = (long)POPLONG(ss,ix);
10153             TOPLONG(nss,ix) = longval;
10154             ptr = POPPTR(ss,ix);
10155             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10156             sv = (SV*)POPPTR(ss,ix);
10157             TOPPTR(nss,ix) = sv_dup(sv, param);
10158             break;
10159         case SAVEt_BOOL:
10160             ptr = POPPTR(ss,ix);
10161             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10162             longval = (long)POPBOOL(ss,ix);
10163             TOPBOOL(nss,ix) = (bool)longval;
10164             break;
10165         case SAVEt_SET_SVFLAGS:
10166             i = POPINT(ss,ix);
10167             TOPINT(nss,ix) = i;
10168             i = POPINT(ss,ix);
10169             TOPINT(nss,ix) = i;
10170             sv = (SV*)POPPTR(ss,ix);
10171             TOPPTR(nss,ix) = sv_dup(sv, param);
10172             break;
10173         default:
10174             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
10175         }
10176     }
10177
10178     return nss;
10179 }
10180
10181
10182 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
10183  * flag to the result. This is done for each stash before cloning starts,
10184  * so we know which stashes want their objects cloned */
10185
10186 static void
10187 do_mark_cloneable_stash(pTHX_ SV *sv)
10188 {
10189     const HEK * const hvname = HvNAME_HEK((HV*)sv);
10190     if (hvname) {
10191         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
10192         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
10193         if (cloner && GvCV(cloner)) {
10194             dSP;
10195             UV status;
10196
10197             ENTER;
10198             SAVETMPS;
10199             PUSHMARK(SP);
10200             XPUSHs(sv_2mortal(newSVhek(hvname)));
10201             PUTBACK;
10202             call_sv((SV*)GvCV(cloner), G_SCALAR);
10203             SPAGAIN;
10204             status = POPu;
10205             PUTBACK;
10206             FREETMPS;
10207             LEAVE;
10208             if (status)
10209                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
10210         }
10211     }
10212 }
10213
10214
10215
10216 /*
10217 =for apidoc perl_clone
10218
10219 Create and return a new interpreter by cloning the current one.
10220
10221 perl_clone takes these flags as parameters:
10222
10223 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10224 without it we only clone the data and zero the stacks,
10225 with it we copy the stacks and the new perl interpreter is
10226 ready to run at the exact same point as the previous one.
10227 The pseudo-fork code uses COPY_STACKS while the
10228 threads->new doesn't.
10229
10230 CLONEf_KEEP_PTR_TABLE
10231 perl_clone keeps a ptr_table with the pointer of the old
10232 variable as a key and the new variable as a value,
10233 this allows it to check if something has been cloned and not
10234 clone it again but rather just use the value and increase the
10235 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10236 the ptr_table using the function
10237 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10238 reason to keep it around is if you want to dup some of your own
10239 variable who are outside the graph perl scans, example of this
10240 code is in threads.xs create
10241
10242 CLONEf_CLONE_HOST
10243 This is a win32 thing, it is ignored on unix, it tells perls
10244 win32host code (which is c++) to clone itself, this is needed on
10245 win32 if you want to run two threads at the same time,
10246 if you just want to do some stuff in a separate perl interpreter
10247 and then throw it away and return to the original one,
10248 you don't need to do anything.
10249
10250 =cut
10251 */
10252
10253 /* XXX the above needs expanding by someone who actually understands it ! */
10254 EXTERN_C PerlInterpreter *
10255 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10256
10257 PerlInterpreter *
10258 perl_clone(PerlInterpreter *proto_perl, UV flags)
10259 {
10260    dVAR;
10261 #ifdef PERL_IMPLICIT_SYS
10262
10263    /* perlhost.h so we need to call into it
10264    to clone the host, CPerlHost should have a c interface, sky */
10265
10266    if (flags & CLONEf_CLONE_HOST) {
10267        return perl_clone_host(proto_perl,flags);
10268    }
10269    return perl_clone_using(proto_perl, flags,
10270                             proto_perl->IMem,
10271                             proto_perl->IMemShared,
10272                             proto_perl->IMemParse,
10273                             proto_perl->IEnv,
10274                             proto_perl->IStdIO,
10275                             proto_perl->ILIO,
10276                             proto_perl->IDir,
10277                             proto_perl->ISock,
10278                             proto_perl->IProc);
10279 }
10280
10281 PerlInterpreter *
10282 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10283                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10284                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10285                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10286                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10287                  struct IPerlProc* ipP)
10288 {
10289     /* XXX many of the string copies here can be optimized if they're
10290      * constants; they need to be allocated as common memory and just
10291      * their pointers copied. */
10292
10293     IV i;
10294     CLONE_PARAMS clone_params;
10295     CLONE_PARAMS* param = &clone_params;
10296
10297     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10298     /* for each stash, determine whether its objects should be cloned */
10299     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10300     PERL_SET_THX(my_perl);
10301
10302 #  ifdef DEBUGGING
10303     Poison(my_perl, 1, PerlInterpreter);
10304     PL_op = Nullop;
10305     PL_curcop = (COP *)Nullop;
10306     PL_markstack = 0;
10307     PL_scopestack = 0;
10308     PL_savestack = 0;
10309     PL_savestack_ix = 0;
10310     PL_savestack_max = -1;
10311     PL_sig_pending = 0;
10312     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10313 #  else /* !DEBUGGING */
10314     Zero(my_perl, 1, PerlInterpreter);
10315 #  endif        /* DEBUGGING */
10316
10317     /* host pointers */
10318     PL_Mem              = ipM;
10319     PL_MemShared        = ipMS;
10320     PL_MemParse         = ipMP;
10321     PL_Env              = ipE;
10322     PL_StdIO            = ipStd;
10323     PL_LIO              = ipLIO;
10324     PL_Dir              = ipD;
10325     PL_Sock             = ipS;
10326     PL_Proc             = ipP;
10327 #else           /* !PERL_IMPLICIT_SYS */
10328     IV i;
10329     CLONE_PARAMS clone_params;
10330     CLONE_PARAMS* param = &clone_params;
10331     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10332     /* for each stash, determine whether its objects should be cloned */
10333     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10334     PERL_SET_THX(my_perl);
10335
10336 #    ifdef DEBUGGING
10337     Poison(my_perl, 1, PerlInterpreter);
10338     PL_op = Nullop;
10339     PL_curcop = (COP *)Nullop;
10340     PL_markstack = 0;
10341     PL_scopestack = 0;
10342     PL_savestack = 0;
10343     PL_savestack_ix = 0;
10344     PL_savestack_max = -1;
10345     PL_sig_pending = 0;
10346     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10347 #    else       /* !DEBUGGING */
10348     Zero(my_perl, 1, PerlInterpreter);
10349 #    endif      /* DEBUGGING */
10350 #endif          /* PERL_IMPLICIT_SYS */
10351     param->flags = flags;
10352     param->proto_perl = proto_perl;
10353
10354     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10355     Zero(&PL_body_roots, 1, PL_body_roots);
10356     
10357     PL_nice_chunk       = NULL;
10358     PL_nice_chunk_size  = 0;
10359     PL_sv_count         = 0;
10360     PL_sv_objcount      = 0;
10361     PL_sv_root          = Nullsv;
10362     PL_sv_arenaroot     = Nullsv;
10363
10364     PL_debug            = proto_perl->Idebug;
10365
10366     PL_hash_seed        = proto_perl->Ihash_seed;
10367     PL_rehash_seed      = proto_perl->Irehash_seed;
10368
10369 #ifdef USE_REENTRANT_API
10370     /* XXX: things like -Dm will segfault here in perlio, but doing
10371      *  PERL_SET_CONTEXT(proto_perl);
10372      * breaks too many other things
10373      */
10374     Perl_reentrant_init(aTHX);
10375 #endif
10376
10377     /* create SV map for pointer relocation */
10378     PL_ptr_table = ptr_table_new();
10379
10380     /* initialize these special pointers as early as possible */
10381     SvANY(&PL_sv_undef)         = NULL;
10382     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10383     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10384     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10385
10386     SvANY(&PL_sv_no)            = new_XPVNV();
10387     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10388     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10389                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10390     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10391     SvCUR_set(&PL_sv_no, 0);
10392     SvLEN_set(&PL_sv_no, 1);
10393     SvIV_set(&PL_sv_no, 0);
10394     SvNV_set(&PL_sv_no, 0);
10395     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10396
10397     SvANY(&PL_sv_yes)           = new_XPVNV();
10398     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10399     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10400                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10401     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10402     SvCUR_set(&PL_sv_yes, 1);
10403     SvLEN_set(&PL_sv_yes, 2);
10404     SvIV_set(&PL_sv_yes, 1);
10405     SvNV_set(&PL_sv_yes, 1);
10406     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10407
10408     /* create (a non-shared!) shared string table */
10409     PL_strtab           = newHV();
10410     HvSHAREKEYS_off(PL_strtab);
10411     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10412     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10413
10414     PL_compiling = proto_perl->Icompiling;
10415
10416     /* These two PVs will be free'd special way so must set them same way op.c does */
10417     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10418     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10419
10420     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10421     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10422
10423     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10424     if (!specialWARN(PL_compiling.cop_warnings))
10425         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10426     if (!specialCopIO(PL_compiling.cop_io))
10427         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10428     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10429
10430     /* pseudo environmental stuff */
10431     PL_origargc         = proto_perl->Iorigargc;
10432     PL_origargv         = proto_perl->Iorigargv;
10433
10434     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10435
10436     /* Set tainting stuff before PerlIO_debug can possibly get called */
10437     PL_tainting         = proto_perl->Itainting;
10438     PL_taint_warn       = proto_perl->Itaint_warn;
10439
10440 #ifdef PERLIO_LAYERS
10441     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10442     PerlIO_clone(aTHX_ proto_perl, param);
10443 #endif
10444
10445     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10446     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10447     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10448     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10449     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10450     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10451
10452     /* switches */
10453     PL_minus_c          = proto_perl->Iminus_c;
10454     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10455     PL_localpatches     = proto_perl->Ilocalpatches;
10456     PL_splitstr         = proto_perl->Isplitstr;
10457     PL_preprocess       = proto_perl->Ipreprocess;
10458     PL_minus_n          = proto_perl->Iminus_n;
10459     PL_minus_p          = proto_perl->Iminus_p;
10460     PL_minus_l          = proto_perl->Iminus_l;
10461     PL_minus_a          = proto_perl->Iminus_a;
10462     PL_minus_F          = proto_perl->Iminus_F;
10463     PL_doswitches       = proto_perl->Idoswitches;
10464     PL_dowarn           = proto_perl->Idowarn;
10465     PL_doextract        = proto_perl->Idoextract;
10466     PL_sawampersand     = proto_perl->Isawampersand;
10467     PL_unsafe           = proto_perl->Iunsafe;
10468     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10469     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10470     PL_perldb           = proto_perl->Iperldb;
10471     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10472     PL_exit_flags       = proto_perl->Iexit_flags;
10473
10474     /* magical thingies */
10475     /* XXX time(&PL_basetime) when asked for? */
10476     PL_basetime         = proto_perl->Ibasetime;
10477     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10478
10479     PL_maxsysfd         = proto_perl->Imaxsysfd;
10480     PL_multiline        = proto_perl->Imultiline;
10481     PL_statusvalue      = proto_perl->Istatusvalue;
10482 #ifdef VMS
10483     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10484 #else
10485     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10486 #endif
10487     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10488
10489     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10490     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10491     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10492
10493     /* Clone the regex array */
10494     PL_regex_padav = newAV();
10495     {
10496         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10497         SV** const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10498         IV i;
10499         av_push(PL_regex_padav,
10500                 sv_dup_inc(regexen[0],param));
10501         for(i = 1; i <= len; i++) {
10502             if(SvREPADTMP(regexen[i])) {
10503               av_push(PL_regex_padav, sv_dup_inc(regexen[i], param));
10504             } else {
10505                 av_push(PL_regex_padav,
10506                     SvREFCNT_inc(
10507                         newSViv(PTR2IV(re_dup(INT2PTR(REGEXP *,
10508                              SvIVX(regexen[i])), param)))
10509                        ));
10510             }
10511         }
10512     }
10513     PL_regex_pad = AvARRAY(PL_regex_padav);
10514
10515     /* shortcuts to various I/O objects */
10516     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10517     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10518     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10519     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10520     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10521     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10522
10523     /* shortcuts to regexp stuff */
10524     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10525
10526     /* shortcuts to misc objects */
10527     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10528
10529     /* shortcuts to debugging objects */
10530     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10531     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10532     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10533     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10534     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10535     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10536     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10537     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10538     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10539
10540     /* symbol tables */
10541     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10542     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10543     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10544     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10545     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10546
10547     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10548     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10549     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10550     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10551     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10552     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10553
10554     PL_sub_generation   = proto_perl->Isub_generation;
10555
10556     /* funky return mechanisms */
10557     PL_forkprocess      = proto_perl->Iforkprocess;
10558
10559     /* subprocess state */
10560     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10561
10562     /* internal state */
10563     PL_maxo             = proto_perl->Imaxo;
10564     if (proto_perl->Iop_mask)
10565         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10566     else
10567         PL_op_mask      = Nullch;
10568     /* PL_asserting        = proto_perl->Iasserting; */
10569
10570     /* current interpreter roots */
10571     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10572     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10573     PL_main_start       = proto_perl->Imain_start;
10574     PL_eval_root        = proto_perl->Ieval_root;
10575     PL_eval_start       = proto_perl->Ieval_start;
10576
10577     /* runtime control stuff */
10578     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10579     PL_copline          = proto_perl->Icopline;
10580
10581     PL_filemode         = proto_perl->Ifilemode;
10582     PL_lastfd           = proto_perl->Ilastfd;
10583     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10584     PL_Argv             = NULL;
10585     PL_Cmd              = Nullch;
10586     PL_gensym           = proto_perl->Igensym;
10587     PL_preambled        = proto_perl->Ipreambled;
10588     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10589     PL_laststatval      = proto_perl->Ilaststatval;
10590     PL_laststype        = proto_perl->Ilaststype;
10591     PL_mess_sv          = Nullsv;
10592
10593     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10594
10595     /* interpreter atexit processing */
10596     PL_exitlistlen      = proto_perl->Iexitlistlen;
10597     if (PL_exitlistlen) {
10598         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10599         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10600     }
10601     else
10602         PL_exitlist     = (PerlExitListEntry*)NULL;
10603     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10604     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10605     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10606
10607     PL_profiledata      = NULL;
10608     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10609     /* PL_rsfp_filters entries have fake IoDIRP() */
10610     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10611
10612     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10613
10614     PAD_CLONE_VARS(proto_perl, param);
10615
10616 #ifdef HAVE_INTERP_INTERN
10617     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10618 #endif
10619
10620     /* more statics moved here */
10621     PL_generation       = proto_perl->Igeneration;
10622     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10623
10624     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10625     PL_in_clean_all     = proto_perl->Iin_clean_all;
10626
10627     PL_uid              = proto_perl->Iuid;
10628     PL_euid             = proto_perl->Ieuid;
10629     PL_gid              = proto_perl->Igid;
10630     PL_egid             = proto_perl->Iegid;
10631     PL_nomemok          = proto_perl->Inomemok;
10632     PL_an               = proto_perl->Ian;
10633     PL_evalseq          = proto_perl->Ievalseq;
10634     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10635     PL_origalen         = proto_perl->Iorigalen;
10636 #ifdef PERL_USES_PL_PIDSTATUS
10637     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10638 #endif
10639     PL_osname           = SAVEPV(proto_perl->Iosname);
10640     PL_sighandlerp      = proto_perl->Isighandlerp;
10641
10642     PL_runops           = proto_perl->Irunops;
10643
10644     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10645
10646 #ifdef CSH
10647     PL_cshlen           = proto_perl->Icshlen;
10648     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10649 #endif
10650
10651     PL_lex_state        = proto_perl->Ilex_state;
10652     PL_lex_defer        = proto_perl->Ilex_defer;
10653     PL_lex_expect       = proto_perl->Ilex_expect;
10654     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10655     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10656     PL_lex_starts       = proto_perl->Ilex_starts;
10657     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10658     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10659     PL_lex_op           = proto_perl->Ilex_op;
10660     PL_lex_inpat        = proto_perl->Ilex_inpat;
10661     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10662     PL_lex_brackets     = proto_perl->Ilex_brackets;
10663     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10664     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10665     PL_lex_casemods     = proto_perl->Ilex_casemods;
10666     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10667     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10668
10669     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10670     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10671     PL_nexttoke         = proto_perl->Inexttoke;
10672
10673     /* XXX This is probably masking the deeper issue of why
10674      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10675      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10676      * (A little debugging with a watchpoint on it may help.)
10677      */
10678     if (SvANY(proto_perl->Ilinestr)) {
10679         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10680         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10681         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10682         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10683         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10684         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10685         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10686         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10687         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10688     }
10689     else {
10690         PL_linestr = NEWSV(65,79);
10691         sv_upgrade(PL_linestr,SVt_PVIV);
10692         sv_setpvn(PL_linestr,"",0);
10693         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10694     }
10695     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10696     PL_pending_ident    = proto_perl->Ipending_ident;
10697     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10698
10699     PL_expect           = proto_perl->Iexpect;
10700
10701     PL_multi_start      = proto_perl->Imulti_start;
10702     PL_multi_end        = proto_perl->Imulti_end;
10703     PL_multi_open       = proto_perl->Imulti_open;
10704     PL_multi_close      = proto_perl->Imulti_close;
10705
10706     PL_error_count      = proto_perl->Ierror_count;
10707     PL_subline          = proto_perl->Isubline;
10708     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10709
10710     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10711     if (SvANY(proto_perl->Ilinestr)) {
10712         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10713         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10714         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10715         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10716         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10717     }
10718     else {
10719         PL_last_uni     = SvPVX(PL_linestr);
10720         PL_last_lop     = SvPVX(PL_linestr);
10721         PL_last_lop_op  = 0;
10722     }
10723     PL_in_my            = proto_perl->Iin_my;
10724     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10725 #ifdef FCRYPT
10726     PL_cryptseen        = proto_perl->Icryptseen;
10727 #endif
10728
10729     PL_hints            = proto_perl->Ihints;
10730
10731     PL_amagic_generation        = proto_perl->Iamagic_generation;
10732
10733 #ifdef USE_LOCALE_COLLATE
10734     PL_collation_ix     = proto_perl->Icollation_ix;
10735     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10736     PL_collation_standard       = proto_perl->Icollation_standard;
10737     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10738     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10739 #endif /* USE_LOCALE_COLLATE */
10740
10741 #ifdef USE_LOCALE_NUMERIC
10742     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10743     PL_numeric_standard = proto_perl->Inumeric_standard;
10744     PL_numeric_local    = proto_perl->Inumeric_local;
10745     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10746 #endif /* !USE_LOCALE_NUMERIC */
10747
10748     /* utf8 character classes */
10749     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10750     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10751     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10752     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10753     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10754     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10755     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10756     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10757     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10758     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10759     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10760     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10761     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10762     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10763     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10764     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10765     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10766     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10767     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10768     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10769
10770     /* Did the locale setup indicate UTF-8? */
10771     PL_utf8locale       = proto_perl->Iutf8locale;
10772     /* Unicode features (see perlrun/-C) */
10773     PL_unicode          = proto_perl->Iunicode;
10774
10775     /* Pre-5.8 signals control */
10776     PL_signals          = proto_perl->Isignals;
10777
10778     /* times() ticks per second */
10779     PL_clocktick        = proto_perl->Iclocktick;
10780
10781     /* Recursion stopper for PerlIO_find_layer */
10782     PL_in_load_module   = proto_perl->Iin_load_module;
10783
10784     /* sort() routine */
10785     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10786
10787     /* Not really needed/useful since the reenrant_retint is "volatile",
10788      * but do it for consistency's sake. */
10789     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10790
10791     /* Hooks to shared SVs and locks. */
10792     PL_sharehook        = proto_perl->Isharehook;
10793     PL_lockhook         = proto_perl->Ilockhook;
10794     PL_unlockhook       = proto_perl->Iunlockhook;
10795     PL_threadhook       = proto_perl->Ithreadhook;
10796
10797     PL_runops_std       = proto_perl->Irunops_std;
10798     PL_runops_dbg       = proto_perl->Irunops_dbg;
10799
10800 #ifdef THREADS_HAVE_PIDS
10801     PL_ppid             = proto_perl->Ippid;
10802 #endif
10803
10804     /* swatch cache */
10805     PL_last_swash_hv    = Nullhv;       /* reinits on demand */
10806     PL_last_swash_klen  = 0;
10807     PL_last_swash_key[0]= '\0';
10808     PL_last_swash_tmps  = (U8*)NULL;
10809     PL_last_swash_slen  = 0;
10810
10811     PL_glob_index       = proto_perl->Iglob_index;
10812     PL_srand_called     = proto_perl->Isrand_called;
10813     PL_uudmap['M']      = 0;            /* reinits on demand */
10814     PL_bitcount         = Nullch;       /* reinits on demand */
10815
10816     if (proto_perl->Ipsig_pend) {
10817         Newxz(PL_psig_pend, SIG_SIZE, int);
10818     }
10819     else {
10820         PL_psig_pend    = (int*)NULL;
10821     }
10822
10823     if (proto_perl->Ipsig_ptr) {
10824         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10825         Newxz(PL_psig_name, SIG_SIZE, SV*);
10826         for (i = 1; i < SIG_SIZE; i++) {
10827             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10828             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10829         }
10830     }
10831     else {
10832         PL_psig_ptr     = (SV**)NULL;
10833         PL_psig_name    = (SV**)NULL;
10834     }
10835
10836     /* thrdvar.h stuff */
10837
10838     if (flags & CLONEf_COPY_STACKS) {
10839         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10840         PL_tmps_ix              = proto_perl->Ttmps_ix;
10841         PL_tmps_max             = proto_perl->Ttmps_max;
10842         PL_tmps_floor           = proto_perl->Ttmps_floor;
10843         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10844         i = 0;
10845         while (i <= PL_tmps_ix) {
10846             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10847             ++i;
10848         }
10849
10850         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10851         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10852         Newxz(PL_markstack, i, I32);
10853         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10854                                                   - proto_perl->Tmarkstack);
10855         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10856                                                   - proto_perl->Tmarkstack);
10857         Copy(proto_perl->Tmarkstack, PL_markstack,
10858              PL_markstack_ptr - PL_markstack + 1, I32);
10859
10860         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10861          * NOTE: unlike the others! */
10862         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10863         PL_scopestack_max       = proto_perl->Tscopestack_max;
10864         Newxz(PL_scopestack, PL_scopestack_max, I32);
10865         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10866
10867         /* NOTE: si_dup() looks at PL_markstack */
10868         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10869
10870         /* PL_curstack          = PL_curstackinfo->si_stack; */
10871         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10872         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10873
10874         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10875         PL_stack_base           = AvARRAY(PL_curstack);
10876         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10877                                                    - proto_perl->Tstack_base);
10878         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10879
10880         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10881          * NOTE: unlike the others! */
10882         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10883         PL_savestack_max        = proto_perl->Tsavestack_max;
10884         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10885         PL_savestack            = ss_dup(proto_perl, param);
10886     }
10887     else {
10888         init_stacks();
10889         ENTER;                  /* perl_destruct() wants to LEAVE; */
10890     }
10891
10892     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10893     PL_top_env          = &PL_start_env;
10894
10895     PL_op               = proto_perl->Top;
10896
10897     PL_Sv               = Nullsv;
10898     PL_Xpv              = (XPV*)NULL;
10899     PL_na               = proto_perl->Tna;
10900
10901     PL_statbuf          = proto_perl->Tstatbuf;
10902     PL_statcache        = proto_perl->Tstatcache;
10903     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10904     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10905 #ifdef HAS_TIMES
10906     PL_timesbuf         = proto_perl->Ttimesbuf;
10907 #endif
10908
10909     PL_tainted          = proto_perl->Ttainted;
10910     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10911     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10912     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10913     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10914     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10915     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10916     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10917     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10918     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10919
10920     PL_restartop        = proto_perl->Trestartop;
10921     PL_in_eval          = proto_perl->Tin_eval;
10922     PL_delaymagic       = proto_perl->Tdelaymagic;
10923     PL_dirty            = proto_perl->Tdirty;
10924     PL_localizing       = proto_perl->Tlocalizing;
10925
10926     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10927     PL_hv_fetch_ent_mh  = Nullhe;
10928     PL_modcount         = proto_perl->Tmodcount;
10929     PL_lastgotoprobe    = Nullop;
10930     PL_dumpindent       = proto_perl->Tdumpindent;
10931
10932     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10933     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10934     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10935     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10936     PL_efloatbuf        = Nullch;               /* reinits on demand */
10937     PL_efloatsize       = 0;                    /* reinits on demand */
10938
10939     /* regex stuff */
10940
10941     PL_screamfirst      = NULL;
10942     PL_screamnext       = NULL;
10943     PL_maxscream        = -1;                   /* reinits on demand */
10944     PL_lastscream       = Nullsv;
10945
10946     PL_watchaddr        = NULL;
10947     PL_watchok          = Nullch;
10948
10949     PL_regdummy         = proto_perl->Tregdummy;
10950     PL_regprecomp       = Nullch;
10951     PL_regnpar          = 0;
10952     PL_regsize          = 0;
10953     PL_colorset         = 0;            /* reinits PL_colors[] */
10954     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10955     PL_reginput         = Nullch;
10956     PL_regbol           = Nullch;
10957     PL_regeol           = Nullch;
10958     PL_regstartp        = (I32*)NULL;
10959     PL_regendp          = (I32*)NULL;
10960     PL_reglastparen     = (U32*)NULL;
10961     PL_reglastcloseparen        = (U32*)NULL;
10962     PL_regtill          = Nullch;
10963     PL_reg_start_tmp    = (char**)NULL;
10964     PL_reg_start_tmpl   = 0;
10965     PL_regdata          = (struct reg_data*)NULL;
10966     PL_bostr            = Nullch;
10967     PL_reg_flags        = 0;
10968     PL_reg_eval_set     = 0;
10969     PL_regnarrate       = 0;
10970     PL_regprogram       = (regnode*)NULL;
10971     PL_regindent        = 0;
10972     PL_regcc            = (CURCUR*)NULL;
10973     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10974     PL_reg_re           = (regexp*)NULL;
10975     PL_reg_ganch        = Nullch;
10976     PL_reg_sv           = Nullsv;
10977     PL_reg_match_utf8   = FALSE;
10978     PL_reg_magic        = (MAGIC*)NULL;
10979     PL_reg_oldpos       = 0;
10980     PL_reg_oldcurpm     = (PMOP*)NULL;
10981     PL_reg_curpm        = (PMOP*)NULL;
10982     PL_reg_oldsaved     = Nullch;
10983     PL_reg_oldsavedlen  = 0;
10984 #ifdef PERL_OLD_COPY_ON_WRITE
10985     PL_nrs              = Nullsv;
10986 #endif
10987     PL_reg_maxiter      = 0;
10988     PL_reg_leftiter     = 0;
10989     PL_reg_poscache     = Nullch;
10990     PL_reg_poscache_size= 0;
10991
10992     /* RE engine - function pointers */
10993     PL_regcompp         = proto_perl->Tregcompp;
10994     PL_regexecp         = proto_perl->Tregexecp;
10995     PL_regint_start     = proto_perl->Tregint_start;
10996     PL_regint_string    = proto_perl->Tregint_string;
10997     PL_regfree          = proto_perl->Tregfree;
10998
10999     PL_reginterp_cnt    = 0;
11000     PL_reg_starttry     = 0;
11001
11002     /* Pluggable optimizer */
11003     PL_peepp            = proto_perl->Tpeepp;
11004
11005     PL_stashcache       = newHV();
11006
11007     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
11008         ptr_table_free(PL_ptr_table);
11009         PL_ptr_table = NULL;
11010     }
11011
11012     /* Call the ->CLONE method, if it exists, for each of the stashes
11013        identified by sv_dup() above.
11014     */
11015     while(av_len(param->stashes) != -1) {
11016         HV* const stash = (HV*) av_shift(param->stashes);
11017         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
11018         if (cloner && GvCV(cloner)) {
11019             dSP;
11020             ENTER;
11021             SAVETMPS;
11022             PUSHMARK(SP);
11023             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
11024             PUTBACK;
11025             call_sv((SV*)GvCV(cloner), G_DISCARD);
11026             FREETMPS;
11027             LEAVE;
11028         }
11029     }
11030
11031     SvREFCNT_dec(param->stashes);
11032
11033     /* orphaned? eg threads->new inside BEGIN or use */
11034     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
11035         (void)SvREFCNT_inc(PL_compcv);
11036         SAVEFREESV(PL_compcv);
11037     }
11038
11039     return my_perl;
11040 }
11041
11042 #endif /* USE_ITHREADS */
11043
11044 /*
11045 =head1 Unicode Support
11046
11047 =for apidoc sv_recode_to_utf8
11048
11049 The encoding is assumed to be an Encode object, on entry the PV
11050 of the sv is assumed to be octets in that encoding, and the sv
11051 will be converted into Unicode (and UTF-8).
11052
11053 If the sv already is UTF-8 (or if it is not POK), or if the encoding
11054 is not a reference, nothing is done to the sv.  If the encoding is not
11055 an C<Encode::XS> Encoding object, bad things will happen.
11056 (See F<lib/encoding.pm> and L<Encode>).
11057
11058 The PV of the sv is returned.
11059
11060 =cut */
11061
11062 char *
11063 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
11064 {
11065     dVAR;
11066     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
11067         SV *uni;
11068         STRLEN len;
11069         const char *s;
11070         dSP;
11071         ENTER;
11072         SAVETMPS;
11073         save_re_context();
11074         PUSHMARK(sp);
11075         EXTEND(SP, 3);
11076         XPUSHs(encoding);
11077         XPUSHs(sv);
11078 /*
11079   NI-S 2002/07/09
11080   Passing sv_yes is wrong - it needs to be or'ed set of constants
11081   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
11082   remove converted chars from source.
11083
11084   Both will default the value - let them.
11085
11086         XPUSHs(&PL_sv_yes);
11087 */
11088         PUTBACK;
11089         call_method("decode", G_SCALAR);
11090         SPAGAIN;
11091         uni = POPs;
11092         PUTBACK;
11093         s = SvPV_const(uni, len);
11094         if (s != SvPVX_const(sv)) {
11095             SvGROW(sv, len + 1);
11096             Move(s, SvPVX(sv), len + 1, char);
11097             SvCUR_set(sv, len);
11098         }
11099         FREETMPS;
11100         LEAVE;
11101         SvUTF8_on(sv);
11102         return SvPVX(sv);
11103     }
11104     return SvPOKp(sv) ? SvPVX(sv) : NULL;
11105 }
11106
11107 /*
11108 =for apidoc sv_cat_decode
11109
11110 The encoding is assumed to be an Encode object, the PV of the ssv is
11111 assumed to be octets in that encoding and decoding the input starts
11112 from the position which (PV + *offset) pointed to.  The dsv will be
11113 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
11114 when the string tstr appears in decoding output or the input ends on
11115 the PV of the ssv. The value which the offset points will be modified
11116 to the last input position on the ssv.
11117
11118 Returns TRUE if the terminator was found, else returns FALSE.
11119
11120 =cut */
11121
11122 bool
11123 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
11124                    SV *ssv, int *offset, char *tstr, int tlen)
11125 {
11126     dVAR;
11127     bool ret = FALSE;
11128     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
11129         SV *offsv;
11130         dSP;
11131         ENTER;
11132         SAVETMPS;
11133         save_re_context();
11134         PUSHMARK(sp);
11135         EXTEND(SP, 6);
11136         XPUSHs(encoding);
11137         XPUSHs(dsv);
11138         XPUSHs(ssv);
11139         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
11140         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
11141         PUTBACK;
11142         call_method("cat_decode", G_SCALAR);
11143         SPAGAIN;
11144         ret = SvTRUE(TOPs);
11145         *offset = SvIV(offsv);
11146         PUTBACK;
11147         FREETMPS;
11148         LEAVE;
11149     }
11150     else
11151         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
11152     return ret;
11153
11154 }
11155
11156 /* ---------------------------------------------------------------------
11157  *
11158  * support functions for report_uninit()
11159  */
11160
11161 /* the maxiumum size of array or hash where we will scan looking
11162  * for the undefined element that triggered the warning */
11163
11164 #define FUV_MAX_SEARCH_SIZE 1000
11165
11166 /* Look for an entry in the hash whose value has the same SV as val;
11167  * If so, return a mortal copy of the key. */
11168
11169 STATIC SV*
11170 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
11171 {
11172     dVAR;
11173     register HE **array;
11174     I32 i;
11175
11176     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
11177                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
11178         return Nullsv;
11179
11180     array = HvARRAY(hv);
11181
11182     for (i=HvMAX(hv); i>0; i--) {
11183         register HE *entry;
11184         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
11185             if (HeVAL(entry) != val)
11186                 continue;
11187             if (    HeVAL(entry) == &PL_sv_undef ||
11188                     HeVAL(entry) == &PL_sv_placeholder)
11189                 continue;
11190             if (!HeKEY(entry))
11191                 return Nullsv;
11192             if (HeKLEN(entry) == HEf_SVKEY)
11193                 return sv_mortalcopy(HeKEY_sv(entry));
11194             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
11195         }
11196     }
11197     return Nullsv;
11198 }
11199
11200 /* Look for an entry in the array whose value has the same SV as val;
11201  * If so, return the index, otherwise return -1. */
11202
11203 STATIC I32
11204 S_find_array_subscript(pTHX_ AV *av, SV* val)
11205 {
11206     SV** svp;
11207     I32 i;
11208     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
11209                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
11210         return -1;
11211
11212     svp = AvARRAY(av);
11213     for (i=AvFILLp(av); i>=0; i--) {
11214         if (svp[i] == val && svp[i] != &PL_sv_undef)
11215             return i;
11216     }
11217     return -1;
11218 }
11219
11220 /* S_varname(): return the name of a variable, optionally with a subscript.
11221  * If gv is non-zero, use the name of that global, along with gvtype (one
11222  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11223  * targ.  Depending on the value of the subscript_type flag, return:
11224  */
11225
11226 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11227 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11228 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11229 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11230
11231 STATIC SV*
11232 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11233         SV* keyname, I32 aindex, int subscript_type)
11234 {
11235
11236     SV * const name = sv_newmortal();
11237     if (gv) {
11238         char buffer[2];
11239         buffer[0] = gvtype;
11240         buffer[1] = 0;
11241
11242         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11243
11244         gv_fullname4(name, gv, buffer, 0);
11245
11246         if ((unsigned int)SvPVX(name)[1] <= 26) {
11247             buffer[0] = '^';
11248             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11249
11250             /* Swap the 1 unprintable control character for the 2 byte pretty
11251                version - ie substr($name, 1, 1) = $buffer; */
11252             sv_insert(name, 1, 1, buffer, 2);
11253         }
11254     }
11255     else {
11256         U32 unused;
11257         CV * const cv = find_runcv(&unused);
11258         SV *sv;
11259         AV *av;
11260
11261         if (!cv || !CvPADLIST(cv))
11262             return Nullsv;
11263         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11264         sv = *av_fetch(av, targ, FALSE);
11265         /* SvLEN in a pad name is not to be trusted */
11266         sv_setpv(name, SvPV_nolen_const(sv));
11267     }
11268
11269     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11270         SV * const sv = NEWSV(0,0);
11271         *SvPVX(name) = '$';
11272         Perl_sv_catpvf(aTHX_ name, "{%s}",
11273             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11274         SvREFCNT_dec(sv);
11275     }
11276     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11277         *SvPVX(name) = '$';
11278         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11279     }
11280     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11281         sv_insert(name, 0, 0,  "within ", 7);
11282
11283     return name;
11284 }
11285
11286
11287 /*
11288 =for apidoc find_uninit_var
11289
11290 Find the name of the undefined variable (if any) that caused the operator o
11291 to issue a "Use of uninitialized value" warning.
11292 If match is true, only return a name if it's value matches uninit_sv.
11293 So roughly speaking, if a unary operator (such as OP_COS) generates a
11294 warning, then following the direct child of the op may yield an
11295 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11296 other hand, with OP_ADD there are two branches to follow, so we only print
11297 the variable name if we get an exact match.
11298
11299 The name is returned as a mortal SV.
11300
11301 Assumes that PL_op is the op that originally triggered the error, and that
11302 PL_comppad/PL_curpad points to the currently executing pad.
11303
11304 =cut
11305 */
11306
11307 STATIC SV *
11308 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11309 {
11310     dVAR;
11311     SV *sv;
11312     AV *av;
11313     GV *gv;
11314     OP *o, *o2, *kid;
11315
11316     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11317                             uninit_sv == &PL_sv_placeholder)))
11318         return Nullsv;
11319
11320     switch (obase->op_type) {
11321
11322     case OP_RV2AV:
11323     case OP_RV2HV:
11324     case OP_PADAV:
11325     case OP_PADHV:
11326       {
11327         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11328         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11329         I32 index = 0;
11330         SV *keysv = Nullsv;
11331         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11332
11333         if (pad) { /* @lex, %lex */
11334             sv = PAD_SVl(obase->op_targ);
11335             gv = Nullgv;
11336         }
11337         else {
11338             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11339             /* @global, %global */
11340                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11341                 if (!gv)
11342                     break;
11343                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11344             }
11345             else /* @{expr}, %{expr} */
11346                 return find_uninit_var(cUNOPx(obase)->op_first,
11347                                                     uninit_sv, match);
11348         }
11349
11350         /* attempt to find a match within the aggregate */
11351         if (hash) {
11352             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11353             if (keysv)
11354                 subscript_type = FUV_SUBSCRIPT_HASH;
11355         }
11356         else {
11357             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11358             if (index >= 0)
11359                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11360         }
11361
11362         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11363             break;
11364
11365         return varname(gv, hash ? '%' : '@', obase->op_targ,
11366                                     keysv, index, subscript_type);
11367       }
11368
11369     case OP_PADSV:
11370         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11371             break;
11372         return varname(Nullgv, '$', obase->op_targ,
11373                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11374
11375     case OP_GVSV:
11376         gv = cGVOPx_gv(obase);
11377         if (!gv || (match && GvSV(gv) != uninit_sv))
11378             break;
11379         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11380
11381     case OP_AELEMFAST:
11382         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11383             if (match) {
11384                 SV **svp;
11385                 av = (AV*)PAD_SV(obase->op_targ);
11386                 if (!av || SvRMAGICAL(av))
11387                     break;
11388                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11389                 if (!svp || *svp != uninit_sv)
11390                     break;
11391             }
11392             return varname(Nullgv, '$', obase->op_targ,
11393                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11394         }
11395         else {
11396             gv = cGVOPx_gv(obase);
11397             if (!gv)
11398                 break;
11399             if (match) {
11400                 SV **svp;
11401                 av = GvAV(gv);
11402                 if (!av || SvRMAGICAL(av))
11403                     break;
11404                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11405                 if (!svp || *svp != uninit_sv)
11406                     break;
11407             }
11408             return varname(gv, '$', 0,
11409                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11410         }
11411         break;
11412
11413     case OP_EXISTS:
11414         o = cUNOPx(obase)->op_first;
11415         if (!o || o->op_type != OP_NULL ||
11416                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11417             break;
11418         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11419
11420     case OP_AELEM:
11421     case OP_HELEM:
11422         if (PL_op == obase)
11423             /* $a[uninit_expr] or $h{uninit_expr} */
11424             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11425
11426         gv = Nullgv;
11427         o = cBINOPx(obase)->op_first;
11428         kid = cBINOPx(obase)->op_last;
11429
11430         /* get the av or hv, and optionally the gv */
11431         sv = Nullsv;
11432         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11433             sv = PAD_SV(o->op_targ);
11434         }
11435         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11436                 && cUNOPo->op_first->op_type == OP_GV)
11437         {
11438             gv = cGVOPx_gv(cUNOPo->op_first);
11439             if (!gv)
11440                 break;
11441             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11442         }
11443         if (!sv)
11444             break;
11445
11446         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11447             /* index is constant */
11448             if (match) {
11449                 if (SvMAGICAL(sv))
11450                     break;
11451                 if (obase->op_type == OP_HELEM) {
11452                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11453                     if (!he || HeVAL(he) != uninit_sv)
11454                         break;
11455                 }
11456                 else {
11457                     SV ** const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11458                     if (!svp || *svp != uninit_sv)
11459                         break;
11460                 }
11461             }
11462             if (obase->op_type == OP_HELEM)
11463                 return varname(gv, '%', o->op_targ,
11464                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11465             else
11466                 return varname(gv, '@', o->op_targ, Nullsv,
11467                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11468             ;
11469         }
11470         else  {
11471             /* index is an expression;
11472              * attempt to find a match within the aggregate */
11473             if (obase->op_type == OP_HELEM) {
11474                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11475                 if (keysv)
11476                     return varname(gv, '%', o->op_targ,
11477                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11478             }
11479             else {
11480                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11481                 if (index >= 0)
11482                     return varname(gv, '@', o->op_targ,
11483                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11484             }
11485             if (match)
11486                 break;
11487             return varname(gv,
11488                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11489                 ? '@' : '%',
11490                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11491         }
11492
11493         break;
11494
11495     case OP_AASSIGN:
11496         /* only examine RHS */
11497         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11498
11499     case OP_OPEN:
11500         o = cUNOPx(obase)->op_first;
11501         if (o->op_type == OP_PUSHMARK)
11502             o = o->op_sibling;
11503
11504         if (!o->op_sibling) {
11505             /* one-arg version of open is highly magical */
11506
11507             if (o->op_type == OP_GV) { /* open FOO; */
11508                 gv = cGVOPx_gv(o);
11509                 if (match && GvSV(gv) != uninit_sv)
11510                     break;
11511                 return varname(gv, '$', 0,
11512                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11513             }
11514             /* other possibilities not handled are:
11515              * open $x; or open my $x;  should return '${*$x}'
11516              * open expr;               should return '$'.expr ideally
11517              */
11518              break;
11519         }
11520         goto do_op;
11521
11522     /* ops where $_ may be an implicit arg */
11523     case OP_TRANS:
11524     case OP_SUBST:
11525     case OP_MATCH:
11526         if ( !(obase->op_flags & OPf_STACKED)) {
11527             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11528                                  ? PAD_SVl(obase->op_targ)
11529                                  : DEFSV))
11530             {
11531                 sv = sv_newmortal();
11532                 sv_setpvn(sv, "$_", 2);
11533                 return sv;
11534             }
11535         }
11536         goto do_op;
11537
11538     case OP_PRTF:
11539     case OP_PRINT:
11540         /* skip filehandle as it can't produce 'undef' warning  */
11541         o = cUNOPx(obase)->op_first;
11542         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11543             o = o->op_sibling->op_sibling;
11544         goto do_op2;
11545
11546
11547     case OP_RV2SV:
11548     case OP_CUSTOM:
11549     case OP_ENTERSUB:
11550         match = 1; /* XS or custom code could trigger random warnings */
11551         goto do_op;
11552
11553     case OP_SCHOMP:
11554     case OP_CHOMP:
11555         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11556             return sv_2mortal(newSVpvn("${$/}", 5));
11557         /* FALL THROUGH */
11558
11559     default:
11560     do_op:
11561         if (!(obase->op_flags & OPf_KIDS))
11562             break;
11563         o = cUNOPx(obase)->op_first;
11564         
11565     do_op2:
11566         if (!o)
11567             break;
11568
11569         /* if all except one arg are constant, or have no side-effects,
11570          * or are optimized away, then it's unambiguous */
11571         o2 = Nullop;
11572         for (kid=o; kid; kid = kid->op_sibling) {
11573             if (kid &&
11574                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11575                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11576                   || (kid->op_type == OP_PUSHMARK)
11577                 )
11578             )
11579                 continue;
11580             if (o2) { /* more than one found */
11581                 o2 = Nullop;
11582                 break;
11583             }
11584             o2 = kid;
11585         }
11586         if (o2)
11587             return find_uninit_var(o2, uninit_sv, match);
11588
11589         /* scan all args */
11590         while (o) {
11591             sv = find_uninit_var(o, uninit_sv, 1);
11592             if (sv)
11593                 return sv;
11594             o = o->op_sibling;
11595         }
11596         break;
11597     }
11598     return Nullsv;
11599 }
11600
11601
11602 /*
11603 =for apidoc report_uninit
11604
11605 Print appropriate "Use of uninitialized variable" warning
11606
11607 =cut
11608 */
11609
11610 void
11611 Perl_report_uninit(pTHX_ SV* uninit_sv)
11612 {
11613     if (PL_op) {
11614         SV* varname = Nullsv;
11615         if (uninit_sv) {
11616             varname = find_uninit_var(PL_op, uninit_sv,0);
11617             if (varname)
11618                 sv_insert(varname, 0, 0, " ", 1);
11619         }
11620         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11621                 varname ? SvPV_nolen_const(varname) : "",
11622                 " in ", OP_DESC(PL_op));
11623     }
11624     else
11625         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11626                     "", "", "");
11627 }
11628
11629 /*
11630  * Local variables:
11631  * c-indentation-style: bsd
11632  * c-basic-offset: 4
11633  * indent-tabs-mode: t
11634  * End:
11635  *
11636  * ex: set ts=8 sts=4 sw=4 noet:
11637  */