Add our repository URL as a 'repository' key in META.yml.
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000,
4  *    2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009 by Larry Wall
5  *    and others
6  *
7  *    You may distribute under the terms of either the GNU General Public
8  *    License or the Artistic License, as specified in the README file.
9  *
10  */
11
12 /*
13  * 'I wonder what the Entish is for "yes" and "no",' he thought.
14  *                                                      --Pippin
15  *
16  *     [p.480 of _The Lord of the Rings_, III/iv: "Treebeard"]
17  */
18
19 /*
20  *
21  *
22  * This file contains the code that creates, manipulates and destroys
23  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
24  * structure of an SV, so their creation and destruction is handled
25  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
26  * level functions (eg. substr, split, join) for each of the types are
27  * in the pp*.c files.
28  */
29
30 #include "EXTERN.h"
31 #define PERL_IN_SV_C
32 #include "perl.h"
33 #include "regcomp.h"
34
35 #define FCALL *f
36
37 #ifdef __Lynx__
38 /* Missing proto on LynxOS */
39   char *gconvert(double, int, int,  char *);
40 #endif
41
42 #ifdef PERL_UTF8_CACHE_ASSERT
43 /* if adding more checks watch out for the following tests:
44  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
45  *   lib/utf8.t lib/Unicode/Collate/t/index.t
46  * --jhi
47  */
48 #   define ASSERT_UTF8_CACHE(cache) \
49     STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); \
50                               assert((cache)[2] <= (cache)[3]); \
51                               assert((cache)[3] <= (cache)[1]);} \
52                               } STMT_END
53 #else
54 #   define ASSERT_UTF8_CACHE(cache) NOOP
55 #endif
56
57 #ifdef PERL_OLD_COPY_ON_WRITE
58 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
59 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
60 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
61    on-write.  */
62 #endif
63
64 /* ============================================================================
65
66 =head1 Allocation and deallocation of SVs.
67
68 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct
69 sv, av, hv...) contains type and reference count information, and for
70 many types, a pointer to the body (struct xrv, xpv, xpviv...), which
71 contains fields specific to each type.  Some types store all they need
72 in the head, so don't have a body.
73
74 In all but the most memory-paranoid configuations (ex: PURIFY), heads
75 and bodies are allocated out of arenas, which by default are
76 approximately 4K chunks of memory parcelled up into N heads or bodies.
77 Sv-bodies are allocated by their sv-type, guaranteeing size
78 consistency needed to allocate safely from arrays.
79
80 For SV-heads, the first slot in each arena is reserved, and holds a
81 link to the next arena, some flags, and a note of the number of slots.
82 Snaked through each arena chain is a linked list of free items; when
83 this becomes empty, an extra arena is allocated and divided up into N
84 items which are threaded into the free list.
85
86 SV-bodies are similar, but they use arena-sets by default, which
87 separate the link and info from the arena itself, and reclaim the 1st
88 slot in the arena.  SV-bodies are further described later.
89
90 The following global variables are associated with arenas:
91
92     PL_sv_arenaroot     pointer to list of SV arenas
93     PL_sv_root          pointer to list of free SV structures
94
95     PL_body_arenas      head of linked-list of body arenas
96     PL_body_roots[]     array of pointers to list of free bodies of svtype
97                         arrays are indexed by the svtype needed
98
99 A few special SV heads are not allocated from an arena, but are
100 instead directly created in the interpreter structure, eg PL_sv_undef.
101 The size of arenas can be changed from the default by setting
102 PERL_ARENA_SIZE appropriately at compile time.
103
104 The SV arena serves the secondary purpose of allowing still-live SVs
105 to be located and destroyed during final cleanup.
106
107 At the lowest level, the macros new_SV() and del_SV() grab and free
108 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
109 to return the SV to the free list with error checking.) new_SV() calls
110 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
111 SVs in the free list have their SvTYPE field set to all ones.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 The function visit() scans the SV arenas list, and calls a specified
118 function for each SV it finds which is still live - ie which has an SvTYPE
119 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
120 following functions (specified as [function that calls visit()] / [function
121 called by visit() for each SV]):
122
123     sv_report_used() / do_report_used()
124                         dump all remaining SVs (debugging aid)
125
126     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
127                         Attempt to free all objects pointed to by RVs,
128                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
129                         try to do the same for all objects indirectly
130                         referenced by typeglobs too.  Called once from
131                         perl_destruct(), prior to calling sv_clean_all()
132                         below.
133
134     sv_clean_all() / do_clean_all()
135                         SvREFCNT_dec(sv) each remaining SV, possibly
136                         triggering an sv_free(). It also sets the
137                         SVf_BREAK flag on the SV to indicate that the
138                         refcnt has been artificially lowered, and thus
139                         stopping sv_free() from giving spurious warnings
140                         about SVs which unexpectedly have a refcnt
141                         of zero.  called repeatedly from perl_destruct()
142                         until there are no SVs left.
143
144 =head2 Arena allocator API Summary
145
146 Private API to rest of sv.c
147
148     new_SV(),  del_SV(),
149
150     new_XIV(), del_XIV(),
151     new_XNV(), del_XNV(),
152     etc
153
154 Public API:
155
156     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
157
158 =cut
159
160  * ========================================================================= */
161
162 /*
163  * "A time to plant, and a time to uproot what was planted..."
164  */
165
166 void
167 Perl_offer_nice_chunk(pTHX_ void *const chunk, const U32 chunk_size)
168 {
169     dVAR;
170     void *new_chunk;
171     U32 new_chunk_size;
172
173     PERL_ARGS_ASSERT_OFFER_NICE_CHUNK;
174
175     new_chunk = (void *)(chunk);
176     new_chunk_size = (chunk_size);
177     if (new_chunk_size > PL_nice_chunk_size) {
178         Safefree(PL_nice_chunk);
179         PL_nice_chunk = (char *) new_chunk;
180         PL_nice_chunk_size = new_chunk_size;
181     } else {
182         Safefree(chunk);
183     }
184 }
185
186 #ifdef PERL_MEM_LOG
187 #  define MEM_LOG_NEW_SV(sv, file, line, func)  \
188             Perl_mem_log_new_sv(sv, file, line, func)
189 #  define MEM_LOG_DEL_SV(sv, file, line, func)  \
190             Perl_mem_log_del_sv(sv, file, line, func)
191 #else
192 #  define MEM_LOG_NEW_SV(sv, file, line, func)  NOOP
193 #  define MEM_LOG_DEL_SV(sv, file, line, func)  NOOP
194 #endif
195
196 #ifdef DEBUG_LEAKING_SCALARS
197 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
198 #  define DEBUG_SV_SERIAL(sv)                                               \
199     DEBUG_m(PerlIO_printf(Perl_debug_log, "0x%"UVxf": (%05ld) del_SV\n",    \
200             PTR2UV(sv), (long)(sv)->sv_debug_serial))
201 #else
202 #  define FREE_SV_DEBUG_FILE(sv)
203 #  define DEBUG_SV_SERIAL(sv)   NOOP
204 #endif
205
206 #ifdef PERL_POISON
207 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
208 #  define SvARENA_CHAIN_SET(sv,val)     (sv)->sv_u.svu_rv = MUTABLE_SV((val))
209 /* Whilst I'd love to do this, it seems that things like to check on
210    unreferenced scalars
211 #  define POSION_SV_HEAD(sv)    PoisonNew(sv, 1, struct STRUCT_SV)
212 */
213 #  define POSION_SV_HEAD(sv)    PoisonNew(&SvANY(sv), 1, void *), \
214                                 PoisonNew(&SvREFCNT(sv), 1, U32)
215 #else
216 #  define SvARENA_CHAIN(sv)     SvANY(sv)
217 #  define SvARENA_CHAIN_SET(sv,val)     SvANY(sv) = (void *)(val)
218 #  define POSION_SV_HEAD(sv)
219 #endif
220
221 /* Mark an SV head as unused, and add to free list.
222  *
223  * If SVf_BREAK is set, skip adding it to the free list, as this SV had
224  * its refcount artificially decremented during global destruction, so
225  * there may be dangling pointers to it. The last thing we want in that
226  * case is for it to be reused. */
227
228 #define plant_SV(p) \
229     STMT_START {                                        \
230         const U32 old_flags = SvFLAGS(p);                       \
231         MEM_LOG_DEL_SV(p, __FILE__, __LINE__, FUNCTION__);  \
232         DEBUG_SV_SERIAL(p);                             \
233         FREE_SV_DEBUG_FILE(p);                          \
234         POSION_SV_HEAD(p);                              \
235         SvFLAGS(p) = SVTYPEMASK;                        \
236         if (!(old_flags & SVf_BREAK)) {         \
237             SvARENA_CHAIN_SET(p, PL_sv_root);   \
238             PL_sv_root = (p);                           \
239         }                                               \
240         --PL_sv_count;                                  \
241     } STMT_END
242
243 #define uproot_SV(p) \
244     STMT_START {                                        \
245         (p) = PL_sv_root;                               \
246         PL_sv_root = MUTABLE_SV(SvARENA_CHAIN(p));              \
247         ++PL_sv_count;                                  \
248     } STMT_END
249
250
251 /* make some more SVs by adding another arena */
252
253 STATIC SV*
254 S_more_sv(pTHX)
255 {
256     dVAR;
257     SV* sv;
258
259     if (PL_nice_chunk) {
260         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
261         PL_nice_chunk = NULL;
262         PL_nice_chunk_size = 0;
263     }
264     else {
265         char *chunk;                /* must use New here to match call to */
266         Newx(chunk,PERL_ARENA_SIZE,char);  /* Safefree() in sv_free_arenas() */
267         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
268     }
269     uproot_SV(sv);
270     return sv;
271 }
272
273 /* new_SV(): return a new, empty SV head */
274
275 #ifdef DEBUG_LEAKING_SCALARS
276 /* provide a real function for a debugger to play with */
277 STATIC SV*
278 S_new_SV(pTHX_ const char *file, int line, const char *func)
279 {
280     SV* sv;
281
282     if (PL_sv_root)
283         uproot_SV(sv);
284     else
285         sv = S_more_sv(aTHX);
286     SvANY(sv) = 0;
287     SvREFCNT(sv) = 1;
288     SvFLAGS(sv) = 0;
289     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
290     sv->sv_debug_line = (U16) (PL_parser && PL_parser->copline != NOLINE
291                 ? PL_parser->copline
292                 :  PL_curcop
293                     ? CopLINE(PL_curcop)
294                     : 0
295             );
296     sv->sv_debug_inpad = 0;
297     sv->sv_debug_cloned = 0;
298     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
299
300     sv->sv_debug_serial = PL_sv_serial++;
301
302     MEM_LOG_NEW_SV(sv, file, line, func);
303     DEBUG_m(PerlIO_printf(Perl_debug_log, "0x%"UVxf": (%05ld) new_SV (from %s:%d [%s])\n",
304             PTR2UV(sv), (long)sv->sv_debug_serial, file, line, func));
305
306     return sv;
307 }
308 #  define new_SV(p) (p)=S_new_SV(aTHX_ __FILE__, __LINE__, FUNCTION__)
309
310 #else
311 #  define new_SV(p) \
312     STMT_START {                                        \
313         if (PL_sv_root)                                 \
314             uproot_SV(p);                               \
315         else                                            \
316             (p) = S_more_sv(aTHX);                      \
317         SvANY(p) = 0;                                   \
318         SvREFCNT(p) = 1;                                \
319         SvFLAGS(p) = 0;                                 \
320         MEM_LOG_NEW_SV(p, __FILE__, __LINE__, FUNCTION__);  \
321     } STMT_END
322 #endif
323
324
325 /* del_SV(): return an empty SV head to the free list */
326
327 #ifdef DEBUGGING
328
329 #define del_SV(p) \
330     STMT_START {                                        \
331         if (DEBUG_D_TEST)                               \
332             del_sv(p);                                  \
333         else                                            \
334             plant_SV(p);                                \
335     } STMT_END
336
337 STATIC void
338 S_del_sv(pTHX_ SV *p)
339 {
340     dVAR;
341
342     PERL_ARGS_ASSERT_DEL_SV;
343
344     if (DEBUG_D_TEST) {
345         SV* sva;
346         bool ok = 0;
347         for (sva = PL_sv_arenaroot; sva; sva = MUTABLE_SV(SvANY(sva))) {
348             const SV * const sv = sva + 1;
349             const SV * const svend = &sva[SvREFCNT(sva)];
350             if (p >= sv && p < svend) {
351                 ok = 1;
352                 break;
353             }
354         }
355         if (!ok) {
356             Perl_ck_warner_d(aTHX_ packWARN(WARN_INTERNAL),
357                              "Attempt to free non-arena SV: 0x%"UVxf
358                              pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
359             return;
360         }
361     }
362     plant_SV(p);
363 }
364
365 #else /* ! DEBUGGING */
366
367 #define del_SV(p)   plant_SV(p)
368
369 #endif /* DEBUGGING */
370
371
372 /*
373 =head1 SV Manipulation Functions
374
375 =for apidoc sv_add_arena
376
377 Given a chunk of memory, link it to the head of the list of arenas,
378 and split it into a list of free SVs.
379
380 =cut
381 */
382
383 static void
384 S_sv_add_arena(pTHX_ char *const ptr, const U32 size, const U32 flags)
385 {
386     dVAR;
387     SV *const sva = MUTABLE_SV(ptr);
388     register SV* sv;
389     register SV* svend;
390
391     PERL_ARGS_ASSERT_SV_ADD_ARENA;
392
393     /* The first SV in an arena isn't an SV. */
394     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
395     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
396     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
397
398     PL_sv_arenaroot = sva;
399     PL_sv_root = sva + 1;
400
401     svend = &sva[SvREFCNT(sva) - 1];
402     sv = sva + 1;
403     while (sv < svend) {
404         SvARENA_CHAIN_SET(sv, (sv + 1));
405 #ifdef DEBUGGING
406         SvREFCNT(sv) = 0;
407 #endif
408         /* Must always set typemask because it's always checked in on cleanup
409            when the arenas are walked looking for objects.  */
410         SvFLAGS(sv) = SVTYPEMASK;
411         sv++;
412     }
413     SvARENA_CHAIN_SET(sv, 0);
414 #ifdef DEBUGGING
415     SvREFCNT(sv) = 0;
416 #endif
417     SvFLAGS(sv) = SVTYPEMASK;
418 }
419
420 /* visit(): call the named function for each non-free SV in the arenas
421  * whose flags field matches the flags/mask args. */
422
423 STATIC I32
424 S_visit(pTHX_ SVFUNC_t f, const U32 flags, const U32 mask)
425 {
426     dVAR;
427     SV* sva;
428     I32 visited = 0;
429
430     PERL_ARGS_ASSERT_VISIT;
431
432     for (sva = PL_sv_arenaroot; sva; sva = MUTABLE_SV(SvANY(sva))) {
433         register const SV * const svend = &sva[SvREFCNT(sva)];
434         register SV* sv;
435         for (sv = sva + 1; sv < svend; ++sv) {
436             if (SvTYPE(sv) != SVTYPEMASK
437                     && (sv->sv_flags & mask) == flags
438                     && SvREFCNT(sv))
439             {
440                 (FCALL)(aTHX_ sv);
441                 ++visited;
442             }
443         }
444     }
445     return visited;
446 }
447
448 #ifdef DEBUGGING
449
450 /* called by sv_report_used() for each live SV */
451
452 static void
453 do_report_used(pTHX_ SV *const sv)
454 {
455     if (SvTYPE(sv) != SVTYPEMASK) {
456         PerlIO_printf(Perl_debug_log, "****\n");
457         sv_dump(sv);
458     }
459 }
460 #endif
461
462 /*
463 =for apidoc sv_report_used
464
465 Dump the contents of all SVs not yet freed. (Debugging aid).
466
467 =cut
468 */
469
470 void
471 Perl_sv_report_used(pTHX)
472 {
473 #ifdef DEBUGGING
474     visit(do_report_used, 0, 0);
475 #else
476     PERL_UNUSED_CONTEXT;
477 #endif
478 }
479
480 /* called by sv_clean_objs() for each live SV */
481
482 static void
483 do_clean_objs(pTHX_ SV *const ref)
484 {
485     dVAR;
486     assert (SvROK(ref));
487     {
488         SV * const target = SvRV(ref);
489         if (SvOBJECT(target)) {
490             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
491             if (SvWEAKREF(ref)) {
492                 sv_del_backref(target, ref);
493                 SvWEAKREF_off(ref);
494                 SvRV_set(ref, NULL);
495             } else {
496                 SvROK_off(ref);
497                 SvRV_set(ref, NULL);
498                 SvREFCNT_dec(target);
499             }
500         }
501     }
502
503     /* XXX Might want to check arrays, etc. */
504 }
505
506 /* called by sv_clean_objs() for each live SV */
507
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509 static void
510 do_clean_named_objs(pTHX_ SV *const sv)
511 {
512     dVAR;
513     assert(SvTYPE(sv) == SVt_PVGV);
514     assert(isGV_with_GP(sv));
515     if (GvGP(sv)) {
516         if ((
517 #ifdef PERL_DONT_CREATE_GVSV
518              GvSV(sv) &&
519 #endif
520              SvOBJECT(GvSV(sv))) ||
521              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
522              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
523              /* In certain rare cases GvIOp(sv) can be NULL, which would make SvOBJECT(GvIO(sv)) dereference NULL. */
524              (GvIO(sv) ? (SvFLAGS(GvIOp(sv)) & SVs_OBJECT) : 0) ||
525              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
526         {
527             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
528             SvFLAGS(sv) |= SVf_BREAK;
529             SvREFCNT_dec(sv);
530         }
531     }
532 }
533 #endif
534
535 /*
536 =for apidoc sv_clean_objs
537
538 Attempt to destroy all objects not yet freed
539
540 =cut
541 */
542
543 void
544 Perl_sv_clean_objs(pTHX)
545 {
546     dVAR;
547     PL_in_clean_objs = TRUE;
548     visit(do_clean_objs, SVf_ROK, SVf_ROK);
549 #ifndef DISABLE_DESTRUCTOR_KLUDGE
550     /* some barnacles may yet remain, clinging to typeglobs */
551     visit(do_clean_named_objs, SVt_PVGV|SVpgv_GP, SVTYPEMASK|SVp_POK|SVpgv_GP);
552 #endif
553     PL_in_clean_objs = FALSE;
554 }
555
556 /* called by sv_clean_all() for each live SV */
557
558 static void
559 do_clean_all(pTHX_ SV *const sv)
560 {
561     dVAR;
562     if (sv == (const SV *) PL_fdpid || sv == (const SV *)PL_strtab) {
563         /* don't clean pid table and strtab */
564         return;
565     }
566     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
567     SvFLAGS(sv) |= SVf_BREAK;
568     SvREFCNT_dec(sv);
569 }
570
571 /*
572 =for apidoc sv_clean_all
573
574 Decrement the refcnt of each remaining SV, possibly triggering a
575 cleanup. This function may have to be called multiple times to free
576 SVs which are in complex self-referential hierarchies.
577
578 =cut
579 */
580
581 I32
582 Perl_sv_clean_all(pTHX)
583 {
584     dVAR;
585     I32 cleaned;
586     PL_in_clean_all = TRUE;
587     cleaned = visit(do_clean_all, 0,0);
588     PL_in_clean_all = FALSE;
589     return cleaned;
590 }
591
592 /*
593   ARENASETS: a meta-arena implementation which separates arena-info
594   into struct arena_set, which contains an array of struct
595   arena_descs, each holding info for a single arena.  By separating
596   the meta-info from the arena, we recover the 1st slot, formerly
597   borrowed for list management.  The arena_set is about the size of an
598   arena, avoiding the needless malloc overhead of a naive linked-list.
599
600   The cost is 1 arena-set malloc per ~320 arena-mallocs, + the unused
601   memory in the last arena-set (1/2 on average).  In trade, we get
602   back the 1st slot in each arena (ie 1.7% of a CV-arena, less for
603   smaller types).  The recovery of the wasted space allows use of
604   small arenas for large, rare body types, by changing array* fields
605   in body_details_by_type[] below.
606 */
607 struct arena_desc {
608     char       *arena;          /* the raw storage, allocated aligned */
609     size_t      size;           /* its size ~4k typ */
610     svtype      utype;          /* bodytype stored in arena */
611 };
612
613 struct arena_set;
614
615 /* Get the maximum number of elements in set[] such that struct arena_set
616    will fit within PERL_ARENA_SIZE, which is probably just under 4K, and
617    therefore likely to be 1 aligned memory page.  */
618
619 #define ARENAS_PER_SET  ((PERL_ARENA_SIZE - sizeof(struct arena_set*) \
620                           - 2 * sizeof(int)) / sizeof (struct arena_desc))
621
622 struct arena_set {
623     struct arena_set* next;
624     unsigned int   set_size;    /* ie ARENAS_PER_SET */
625     unsigned int   curr;        /* index of next available arena-desc */
626     struct arena_desc set[ARENAS_PER_SET];
627 };
628
629 /*
630 =for apidoc sv_free_arenas
631
632 Deallocate the memory used by all arenas. Note that all the individual SV
633 heads and bodies within the arenas must already have been freed.
634
635 =cut
636 */
637 void
638 Perl_sv_free_arenas(pTHX)
639 {
640     dVAR;
641     SV* sva;
642     SV* svanext;
643     unsigned int i;
644
645     /* Free arenas here, but be careful about fake ones.  (We assume
646        contiguity of the fake ones with the corresponding real ones.) */
647
648     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
649         svanext = MUTABLE_SV(SvANY(sva));
650         while (svanext && SvFAKE(svanext))
651             svanext = MUTABLE_SV(SvANY(svanext));
652
653         if (!SvFAKE(sva))
654             Safefree(sva);
655     }
656
657     {
658         struct arena_set *aroot = (struct arena_set*) PL_body_arenas;
659
660         while (aroot) {
661             struct arena_set *current = aroot;
662             i = aroot->curr;
663             while (i--) {
664                 assert(aroot->set[i].arena);
665                 Safefree(aroot->set[i].arena);
666             }
667             aroot = aroot->next;
668             Safefree(current);
669         }
670     }
671     PL_body_arenas = 0;
672
673     i = PERL_ARENA_ROOTS_SIZE;
674     while (i--)
675         PL_body_roots[i] = 0;
676
677     Safefree(PL_nice_chunk);
678     PL_nice_chunk = NULL;
679     PL_nice_chunk_size = 0;
680     PL_sv_arenaroot = 0;
681     PL_sv_root = 0;
682 }
683
684 /*
685   Here are mid-level routines that manage the allocation of bodies out
686   of the various arenas.  There are 5 kinds of arenas:
687
688   1. SV-head arenas, which are discussed and handled above
689   2. regular body arenas
690   3. arenas for reduced-size bodies
691   4. Hash-Entry arenas
692   5. pte arenas (thread related)
693
694   Arena types 2 & 3 are chained by body-type off an array of
695   arena-root pointers, which is indexed by svtype.  Some of the
696   larger/less used body types are malloced singly, since a large
697   unused block of them is wasteful.  Also, several svtypes dont have
698   bodies; the data fits into the sv-head itself.  The arena-root
699   pointer thus has a few unused root-pointers (which may be hijacked
700   later for arena types 4,5)
701
702   3 differs from 2 as an optimization; some body types have several
703   unused fields in the front of the structure (which are kept in-place
704   for consistency).  These bodies can be allocated in smaller chunks,
705   because the leading fields arent accessed.  Pointers to such bodies
706   are decremented to point at the unused 'ghost' memory, knowing that
707   the pointers are used with offsets to the real memory.
708
709   HE, HEK arenas are managed separately, with separate code, but may
710   be merge-able later..
711
712   PTE arenas are not sv-bodies, but they share these mid-level
713   mechanics, so are considered here.  The new mid-level mechanics rely
714   on the sv_type of the body being allocated, so we just reserve one
715   of the unused body-slots for PTEs, then use it in those (2) PTE
716   contexts below (line ~10k)
717 */
718
719 /* get_arena(size): this creates custom-sized arenas
720    TBD: export properly for hv.c: S_more_he().
721 */
722 void*
723 Perl_get_arena(pTHX_ const size_t arena_size, const svtype bodytype)
724 {
725     dVAR;
726     struct arena_desc* adesc;
727     struct arena_set *aroot = (struct arena_set*) PL_body_arenas;
728     unsigned int curr;
729
730     /* shouldnt need this
731     if (!arena_size)    arena_size = PERL_ARENA_SIZE;
732     */
733
734     /* may need new arena-set to hold new arena */
735     if (!aroot || aroot->curr >= aroot->set_size) {
736         struct arena_set *newroot;
737         Newxz(newroot, 1, struct arena_set);
738         newroot->set_size = ARENAS_PER_SET;
739         newroot->next = aroot;
740         aroot = newroot;
741         PL_body_arenas = (void *) newroot;
742         DEBUG_m(PerlIO_printf(Perl_debug_log, "new arenaset %p\n", (void*)aroot));
743     }
744
745     /* ok, now have arena-set with at least 1 empty/available arena-desc */
746     curr = aroot->curr++;
747     adesc = &(aroot->set[curr]);
748     assert(!adesc->arena);
749     
750     Newx(adesc->arena, arena_size, char);
751     adesc->size = arena_size;
752     adesc->utype = bodytype;
753     DEBUG_m(PerlIO_printf(Perl_debug_log, "arena %d added: %p size %"UVuf"\n", 
754                           curr, (void*)adesc->arena, (UV)arena_size));
755
756     return adesc->arena;
757 }
758
759
760 /* return a thing to the free list */
761
762 #define del_body(thing, root)                   \
763     STMT_START {                                \
764         void ** const thing_copy = (void **)thing;\
765         *thing_copy = *root;                    \
766         *root = (void*)thing_copy;              \
767     } STMT_END
768
769 /* 
770
771 =head1 SV-Body Allocation
772
773 Allocation of SV-bodies is similar to SV-heads, differing as follows;
774 the allocation mechanism is used for many body types, so is somewhat
775 more complicated, it uses arena-sets, and has no need for still-live
776 SV detection.
777
778 At the outermost level, (new|del)_X*V macros return bodies of the
779 appropriate type.  These macros call either (new|del)_body_type or
780 (new|del)_body_allocated macro pairs, depending on specifics of the
781 type.  Most body types use the former pair, the latter pair is used to
782 allocate body types with "ghost fields".
783
784 "ghost fields" are fields that are unused in certain types, and
785 consequently don't need to actually exist.  They are declared because
786 they're part of a "base type", which allows use of functions as
787 methods.  The simplest examples are AVs and HVs, 2 aggregate types
788 which don't use the fields which support SCALAR semantics.
789
790 For these types, the arenas are carved up into appropriately sized
791 chunks, we thus avoid wasted memory for those unaccessed members.
792 When bodies are allocated, we adjust the pointer back in memory by the
793 size of the part not allocated, so it's as if we allocated the full
794 structure.  (But things will all go boom if you write to the part that
795 is "not there", because you'll be overwriting the last members of the
796 preceding structure in memory.)
797
798 We calculate the correction using the STRUCT_OFFSET macro on the first
799 member present. If the allocated structure is smaller (no initial NV
800 actually allocated) then the net effect is to subtract the size of the NV
801 from the pointer, to return a new pointer as if an initial NV were actually
802 allocated. (We were using structures named *_allocated for this, but
803 this turned out to be a subtle bug, because a structure without an NV
804 could have a lower alignment constraint, but the compiler is allowed to
805 optimised accesses based on the alignment constraint of the actual pointer
806 to the full structure, for example, using a single 64 bit load instruction
807 because it "knows" that two adjacent 32 bit members will be 8-byte aligned.)
808
809 This is the same trick as was used for NV and IV bodies. Ironically it
810 doesn't need to be used for NV bodies any more, because NV is now at
811 the start of the structure. IV bodies don't need it either, because
812 they are no longer allocated.
813
814 In turn, the new_body_* allocators call S_new_body(), which invokes
815 new_body_inline macro, which takes a lock, and takes a body off the
816 linked list at PL_body_roots[sv_type], calling S_more_bodies() if
817 necessary to refresh an empty list.  Then the lock is released, and
818 the body is returned.
819
820 S_more_bodies calls get_arena(), and carves it up into an array of N
821 bodies, which it strings into a linked list.  It looks up arena-size
822 and body-size from the body_details table described below, thus
823 supporting the multiple body-types.
824
825 If PURIFY is defined, or PERL_ARENA_SIZE=0, arenas are not used, and
826 the (new|del)_X*V macros are mapped directly to malloc/free.
827
828 */
829
830 /* 
831
832 For each sv-type, struct body_details bodies_by_type[] carries
833 parameters which control these aspects of SV handling:
834
835 Arena_size determines whether arenas are used for this body type, and if
836 so, how big they are.  PURIFY or PERL_ARENA_SIZE=0 set this field to
837 zero, forcing individual mallocs and frees.
838
839 Body_size determines how big a body is, and therefore how many fit into
840 each arena.  Offset carries the body-pointer adjustment needed for
841 "ghost fields", and is used in *_allocated macros.
842
843 But its main purpose is to parameterize info needed in
844 Perl_sv_upgrade().  The info here dramatically simplifies the function
845 vs the implementation in 5.8.8, making it table-driven.  All fields
846 are used for this, except for arena_size.
847
848 For the sv-types that have no bodies, arenas are not used, so those
849 PL_body_roots[sv_type] are unused, and can be overloaded.  In
850 something of a special case, SVt_NULL is borrowed for HE arenas;
851 PL_body_roots[HE_SVSLOT=SVt_NULL] is filled by S_more_he, but the
852 bodies_by_type[SVt_NULL] slot is not used, as the table is not
853 available in hv.c.
854
855 PTEs also use arenas, but are never seen in Perl_sv_upgrade. Nonetheless,
856 they get their own slot in bodies_by_type[PTE_SVSLOT =SVt_IV], so they can
857 just use the same allocation semantics.  At first, PTEs were also
858 overloaded to a non-body sv-type, but this yielded hard-to-find malloc
859 bugs, so was simplified by claiming a new slot.  This choice has no
860 consequence at this time.
861
862 */
863
864 struct body_details {
865     U8 body_size;       /* Size to allocate  */
866     U8 copy;            /* Size of structure to copy (may be shorter)  */
867     U8 offset;
868     unsigned int type : 4;          /* We have space for a sanity check.  */
869     unsigned int cant_upgrade : 1;  /* Cannot upgrade this type */
870     unsigned int zero_nv : 1;       /* zero the NV when upgrading from this */
871     unsigned int arena : 1;         /* Allocated from an arena */
872     size_t arena_size;              /* Size of arena to allocate */
873 };
874
875 #define HADNV FALSE
876 #define NONV TRUE
877
878
879 #ifdef PURIFY
880 /* With -DPURFIY we allocate everything directly, and don't use arenas.
881    This seems a rather elegant way to simplify some of the code below.  */
882 #define HASARENA FALSE
883 #else
884 #define HASARENA TRUE
885 #endif
886 #define NOARENA FALSE
887
888 /* Size the arenas to exactly fit a given number of bodies.  A count
889    of 0 fits the max number bodies into a PERL_ARENA_SIZE.block,
890    simplifying the default.  If count > 0, the arena is sized to fit
891    only that many bodies, allowing arenas to be used for large, rare
892    bodies (XPVFM, XPVIO) without undue waste.  The arena size is
893    limited by PERL_ARENA_SIZE, so we can safely oversize the
894    declarations.
895  */
896 #define FIT_ARENA0(body_size)                           \
897     ((size_t)(PERL_ARENA_SIZE / body_size) * body_size)
898 #define FIT_ARENAn(count,body_size)                     \
899     ( count * body_size <= PERL_ARENA_SIZE)             \
900     ? count * body_size                                 \
901     : FIT_ARENA0 (body_size)
902 #define FIT_ARENA(count,body_size)                      \
903     count                                               \
904     ? FIT_ARENAn (count, body_size)                     \
905     : FIT_ARENA0 (body_size)
906
907 /* Calculate the length to copy. Specifically work out the length less any
908    final padding the compiler needed to add.  See the comment in sv_upgrade
909    for why copying the padding proved to be a bug.  */
910
911 #define copy_length(type, last_member) \
912         STRUCT_OFFSET(type, last_member) \
913         + sizeof (((type*)SvANY((const SV *)0))->last_member)
914
915 static const struct body_details bodies_by_type[] = {
916     { sizeof(HE), 0, 0, SVt_NULL,
917       FALSE, NONV, NOARENA, FIT_ARENA(0, sizeof(HE)) },
918
919     /* The bind placeholder pretends to be an RV for now.
920        Also it's marked as "can't upgrade" to stop anyone using it before it's
921        implemented.  */
922     { 0, 0, 0, SVt_BIND, TRUE, NONV, NOARENA, 0 },
923
924     /* IVs are in the head, so the allocation size is 0.
925        However, the slot is overloaded for PTEs.  */
926     { sizeof(struct ptr_tbl_ent), /* This is used for PTEs.  */
927       sizeof(IV), /* This is used to copy out the IV body.  */
928       STRUCT_OFFSET(XPVIV, xiv_iv), SVt_IV, FALSE, NONV,
929       NOARENA /* IVS don't need an arena  */,
930       /* But PTEs need to know the size of their arena  */
931       FIT_ARENA(0, sizeof(struct ptr_tbl_ent))
932     },
933
934     /* 8 bytes on most ILP32 with IEEE doubles */
935     { sizeof(NV), sizeof(NV), 0, SVt_NV, FALSE, HADNV, HASARENA,
936       FIT_ARENA(0, sizeof(NV)) },
937
938     /* 8 bytes on most ILP32 with IEEE doubles */
939     { sizeof(XPV) - STRUCT_OFFSET(XPV, xpv_cur),
940       copy_length(XPV, xpv_len) - STRUCT_OFFSET(XPV, xpv_cur),
941       + STRUCT_OFFSET(XPV, xpv_cur),
942       SVt_PV, FALSE, NONV, HASARENA,
943       FIT_ARENA(0, sizeof(XPV) - STRUCT_OFFSET(XPV, xpv_cur)) },
944
945     /* 12 */
946     { sizeof(XPVIV) - STRUCT_OFFSET(XPV, xpv_cur),
947       copy_length(XPVIV, xiv_u) - STRUCT_OFFSET(XPV, xpv_cur),
948       + STRUCT_OFFSET(XPVIV, xpv_cur),
949       SVt_PVIV, FALSE, NONV, HASARENA,
950       FIT_ARENA(0, sizeof(XPV) - STRUCT_OFFSET(XPV, xpv_cur)) },
951
952     /* 20 */
953     { sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, SVt_PVNV, FALSE, HADNV,
954       HASARENA, FIT_ARENA(0, sizeof(XPVNV)) },
955
956     /* 28 */
957     { sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, SVt_PVMG, FALSE, HADNV,
958       HASARENA, FIT_ARENA(0, sizeof(XPVMG)) },
959
960     /* something big */
961     { sizeof(regexp) - STRUCT_OFFSET(regexp, xpv_cur),
962       sizeof(regexp) - STRUCT_OFFSET(regexp, xpv_cur),
963       + STRUCT_OFFSET(regexp, xpv_cur),
964       SVt_REGEXP, FALSE, NONV, HASARENA,
965       FIT_ARENA(0, sizeof(regexp) - STRUCT_OFFSET(regexp, xpv_cur))
966     },
967
968     /* 48 */
969     { sizeof(XPVGV), sizeof(XPVGV), 0, SVt_PVGV, TRUE, HADNV,
970       HASARENA, FIT_ARENA(0, sizeof(XPVGV)) },
971     
972     /* 64 */
973     { sizeof(XPVLV), sizeof(XPVLV), 0, SVt_PVLV, TRUE, HADNV,
974       HASARENA, FIT_ARENA(0, sizeof(XPVLV)) },
975
976     { sizeof(XPVAV) - STRUCT_OFFSET(XPVAV, xav_fill),
977       copy_length(XPVAV, xmg_stash) - STRUCT_OFFSET(XPVAV, xav_fill),
978       + STRUCT_OFFSET(XPVAV, xav_fill),
979       SVt_PVAV, TRUE, NONV, HASARENA,
980       FIT_ARENA(0, sizeof(XPVAV) - STRUCT_OFFSET(XPVAV, xav_fill)) },
981
982     { sizeof(XPVHV) - STRUCT_OFFSET(XPVHV, xhv_fill),
983       copy_length(XPVHV, xmg_stash) - STRUCT_OFFSET(XPVHV, xhv_fill),
984       + STRUCT_OFFSET(XPVHV, xhv_fill),
985       SVt_PVHV, TRUE, NONV, HASARENA,
986       FIT_ARENA(0, sizeof(XPVHV) - STRUCT_OFFSET(XPVHV, xhv_fill)) },
987
988     /* 56 */
989     { sizeof(XPVCV) - STRUCT_OFFSET(XPVCV, xpv_cur),
990       sizeof(XPVCV) - STRUCT_OFFSET(XPVCV, xpv_cur),
991       + STRUCT_OFFSET(XPVCV, xpv_cur),
992       SVt_PVCV, TRUE, NONV, HASARENA,
993       FIT_ARENA(0, sizeof(XPVCV) - STRUCT_OFFSET(XPVCV, xpv_cur)) },
994
995     { sizeof(XPVFM) - STRUCT_OFFSET(XPVFM, xpv_cur),
996       sizeof(XPVFM) - STRUCT_OFFSET(XPVFM, xpv_cur),
997       + STRUCT_OFFSET(XPVFM, xpv_cur),
998       SVt_PVFM, TRUE, NONV, NOARENA,
999       FIT_ARENA(20, sizeof(XPVFM) - STRUCT_OFFSET(XPVFM, xpv_cur)) },
1000
1001     /* XPVIO is 84 bytes, fits 48x */
1002     { sizeof(XPVIO) - STRUCT_OFFSET(XPVIO, xpv_cur),
1003       sizeof(XPVIO) - STRUCT_OFFSET(XPVIO, xpv_cur),
1004       + STRUCT_OFFSET(XPVIO, xpv_cur),
1005       SVt_PVIO, TRUE, NONV, HASARENA,
1006       FIT_ARENA(24, sizeof(XPVIO) - STRUCT_OFFSET(XPVIO, xpv_cur)) },
1007 };
1008
1009 #define new_body_type(sv_type)          \
1010     (void *)((char *)S_new_body(aTHX_ sv_type))
1011
1012 #define del_body_type(p, sv_type)       \
1013     del_body(p, &PL_body_roots[sv_type])
1014
1015
1016 #define new_body_allocated(sv_type)             \
1017     (void *)((char *)S_new_body(aTHX_ sv_type)  \
1018              - bodies_by_type[sv_type].offset)
1019
1020 #define del_body_allocated(p, sv_type)          \
1021     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
1022
1023
1024 #define my_safemalloc(s)        (void*)safemalloc(s)
1025 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
1026 #define my_safefree(p)  safefree((char*)p)
1027
1028 #ifdef PURIFY
1029
1030 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
1031 #define del_XNV(p)      my_safefree(p)
1032
1033 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
1034 #define del_XPVNV(p)    my_safefree(p)
1035
1036 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
1037 #define del_XPVAV(p)    my_safefree(p)
1038
1039 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
1040 #define del_XPVHV(p)    my_safefree(p)
1041
1042 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
1043 #define del_XPVMG(p)    my_safefree(p)
1044
1045 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
1046 #define del_XPVGV(p)    my_safefree(p)
1047
1048 #else /* !PURIFY */
1049
1050 #define new_XNV()       new_body_type(SVt_NV)
1051 #define del_XNV(p)      del_body_type(p, SVt_NV)
1052
1053 #define new_XPVNV()     new_body_type(SVt_PVNV)
1054 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
1055
1056 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
1057 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
1058
1059 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
1060 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
1061
1062 #define new_XPVMG()     new_body_type(SVt_PVMG)
1063 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
1064
1065 #define new_XPVGV()     new_body_type(SVt_PVGV)
1066 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
1067
1068 #endif /* PURIFY */
1069
1070 /* no arena for you! */
1071
1072 #define new_NOARENA(details) \
1073         my_safemalloc((details)->body_size + (details)->offset)
1074 #define new_NOARENAZ(details) \
1075         my_safecalloc((details)->body_size + (details)->offset)
1076
1077 STATIC void *
1078 S_more_bodies (pTHX_ const svtype sv_type)
1079 {
1080     dVAR;
1081     void ** const root = &PL_body_roots[sv_type];
1082     const struct body_details * const bdp = &bodies_by_type[sv_type];
1083     const size_t body_size = bdp->body_size;
1084     char *start;
1085     const char *end;
1086     const size_t arena_size = Perl_malloc_good_size(bdp->arena_size);
1087 #if defined(DEBUGGING) && !defined(PERL_GLOBAL_STRUCT_PRIVATE)
1088     static bool done_sanity_check;
1089
1090     /* PERL_GLOBAL_STRUCT_PRIVATE cannot coexist with global
1091      * variables like done_sanity_check. */
1092     if (!done_sanity_check) {
1093         unsigned int i = SVt_LAST;
1094
1095         done_sanity_check = TRUE;
1096
1097         while (i--)
1098             assert (bodies_by_type[i].type == i);
1099     }
1100 #endif
1101
1102     assert(bdp->arena_size);
1103
1104     start = (char*) Perl_get_arena(aTHX_ arena_size, sv_type);
1105
1106     end = start + arena_size - 2 * body_size;
1107
1108     /* computed count doesnt reflect the 1st slot reservation */
1109 #if defined(MYMALLOC) || defined(HAS_MALLOC_GOOD_SIZE)
1110     DEBUG_m(PerlIO_printf(Perl_debug_log,
1111                           "arena %p end %p arena-size %d (from %d) type %d "
1112                           "size %d ct %d\n",
1113                           (void*)start, (void*)end, (int)arena_size,
1114                           (int)bdp->arena_size, sv_type, (int)body_size,
1115                           (int)arena_size / (int)body_size));
1116 #else
1117     DEBUG_m(PerlIO_printf(Perl_debug_log,
1118                           "arena %p end %p arena-size %d type %d size %d ct %d\n",
1119                           (void*)start, (void*)end,
1120                           (int)bdp->arena_size, sv_type, (int)body_size,
1121                           (int)bdp->arena_size / (int)body_size));
1122 #endif
1123     *root = (void *)start;
1124
1125     while (start <= end) {
1126         char * const next = start + body_size;
1127         *(void**) start = (void *)next;
1128         start = next;
1129     }
1130     *(void **)start = 0;
1131
1132     return *root;
1133 }
1134
1135 /* grab a new thing from the free list, allocating more if necessary.
1136    The inline version is used for speed in hot routines, and the
1137    function using it serves the rest (unless PURIFY).
1138 */
1139 #define new_body_inline(xpv, sv_type) \
1140     STMT_START { \
1141         void ** const r3wt = &PL_body_roots[sv_type]; \
1142         xpv = (PTR_TBL_ENT_t*) (*((void **)(r3wt))      \
1143           ? *((void **)(r3wt)) : more_bodies(sv_type)); \
1144         *(r3wt) = *(void**)(xpv); \
1145     } STMT_END
1146
1147 #ifndef PURIFY
1148
1149 STATIC void *
1150 S_new_body(pTHX_ const svtype sv_type)
1151 {
1152     dVAR;
1153     void *xpv;
1154     new_body_inline(xpv, sv_type);
1155     return xpv;
1156 }
1157
1158 #endif
1159
1160 static const struct body_details fake_rv =
1161     { 0, 0, 0, SVt_IV, FALSE, NONV, NOARENA, 0 };
1162
1163 /*
1164 =for apidoc sv_upgrade
1165
1166 Upgrade an SV to a more complex form.  Generally adds a new body type to the
1167 SV, then copies across as much information as possible from the old body.
1168 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
1169
1170 =cut
1171 */
1172
1173 void
1174 Perl_sv_upgrade(pTHX_ register SV *const sv, svtype new_type)
1175 {
1176     dVAR;
1177     void*       old_body;
1178     void*       new_body;
1179     const svtype old_type = SvTYPE(sv);
1180     const struct body_details *new_type_details;
1181     const struct body_details *old_type_details
1182         = bodies_by_type + old_type;
1183     SV *referant = NULL;
1184
1185     PERL_ARGS_ASSERT_SV_UPGRADE;
1186
1187     if (old_type == new_type)
1188         return;
1189
1190     /* This clause was purposefully added ahead of the early return above to
1191        the shared string hackery for (sort {$a <=> $b} keys %hash), with the
1192        inference by Nick I-S that it would fix other troublesome cases. See
1193        changes 7162, 7163 (f130fd4589cf5fbb24149cd4db4137c8326f49c1 and parent)
1194
1195        Given that shared hash key scalars are no longer PVIV, but PV, there is
1196        no longer need to unshare so as to free up the IVX slot for its proper
1197        purpose. So it's safe to move the early return earlier.  */
1198
1199     if (new_type != SVt_PV && SvIsCOW(sv)) {
1200         sv_force_normal_flags(sv, 0);
1201     }
1202
1203     old_body = SvANY(sv);
1204
1205     /* Copying structures onto other structures that have been neatly zeroed
1206        has a subtle gotcha. Consider XPVMG
1207
1208        +------+------+------+------+------+-------+-------+
1209        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
1210        +------+------+------+------+------+-------+-------+
1211        0      4      8     12     16     20      24      28
1212
1213        where NVs are aligned to 8 bytes, so that sizeof that structure is
1214        actually 32 bytes long, with 4 bytes of padding at the end:
1215
1216        +------+------+------+------+------+-------+-------+------+
1217        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
1218        +------+------+------+------+------+-------+-------+------+
1219        0      4      8     12     16     20      24      28     32
1220
1221        so what happens if you allocate memory for this structure:
1222
1223        +------+------+------+------+------+-------+-------+------+------+...
1224        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
1225        +------+------+------+------+------+-------+-------+------+------+...
1226        0      4      8     12     16     20      24      28     32     36
1227
1228        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
1229        expect, because you copy the area marked ??? onto GP. Now, ??? may have
1230        started out as zero once, but it's quite possible that it isn't. So now,
1231        rather than a nicely zeroed GP, you have it pointing somewhere random.
1232        Bugs ensue.
1233
1234        (In fact, GP ends up pointing at a previous GP structure, because the
1235        principle cause of the padding in XPVMG getting garbage is a copy of
1236        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob. Right now
1237        this happens to be moot because XPVGV has been re-ordered, with GP
1238        no longer after STASH)
1239
1240        So we are careful and work out the size of used parts of all the
1241        structures.  */
1242
1243     switch (old_type) {
1244     case SVt_NULL:
1245         break;
1246     case SVt_IV:
1247         if (SvROK(sv)) {
1248             referant = SvRV(sv);
1249             old_type_details = &fake_rv;
1250             if (new_type == SVt_NV)
1251                 new_type = SVt_PVNV;
1252         } else {
1253             if (new_type < SVt_PVIV) {
1254                 new_type = (new_type == SVt_NV)
1255                     ? SVt_PVNV : SVt_PVIV;
1256             }
1257         }
1258         break;
1259     case SVt_NV:
1260         if (new_type < SVt_PVNV) {
1261             new_type = SVt_PVNV;
1262         }
1263         break;
1264     case SVt_PV:
1265         assert(new_type > SVt_PV);
1266         assert(SVt_IV < SVt_PV);
1267         assert(SVt_NV < SVt_PV);
1268         break;
1269     case SVt_PVIV:
1270         break;
1271     case SVt_PVNV:
1272         break;
1273     case SVt_PVMG:
1274         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1275            there's no way that it can be safely upgraded, because perl.c
1276            expects to Safefree(SvANY(PL_mess_sv))  */
1277         assert(sv != PL_mess_sv);
1278         /* This flag bit is used to mean other things in other scalar types.
1279            Given that it only has meaning inside the pad, it shouldn't be set
1280            on anything that can get upgraded.  */
1281         assert(!SvPAD_TYPED(sv));
1282         break;
1283     default:
1284         if (old_type_details->cant_upgrade)
1285             Perl_croak(aTHX_ "Can't upgrade %s (%" UVuf ") to %" UVuf,
1286                        sv_reftype(sv, 0), (UV) old_type, (UV) new_type);
1287     }
1288
1289     if (old_type > new_type)
1290         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
1291                 (int)old_type, (int)new_type);
1292
1293     new_type_details = bodies_by_type + new_type;
1294
1295     SvFLAGS(sv) &= ~SVTYPEMASK;
1296     SvFLAGS(sv) |= new_type;
1297
1298     /* This can't happen, as SVt_NULL is <= all values of new_type, so one of
1299        the return statements above will have triggered.  */
1300     assert (new_type != SVt_NULL);
1301     switch (new_type) {
1302     case SVt_IV:
1303         assert(old_type == SVt_NULL);
1304         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1305         SvIV_set(sv, 0);
1306         return;
1307     case SVt_NV:
1308         assert(old_type == SVt_NULL);
1309         SvANY(sv) = new_XNV();
1310         SvNV_set(sv, 0);
1311         return;
1312     case SVt_PVHV:
1313     case SVt_PVAV:
1314         assert(new_type_details->body_size);
1315
1316 #ifndef PURIFY  
1317         assert(new_type_details->arena);
1318         assert(new_type_details->arena_size);
1319         /* This points to the start of the allocated area.  */
1320         new_body_inline(new_body, new_type);
1321         Zero(new_body, new_type_details->body_size, char);
1322         new_body = ((char *)new_body) - new_type_details->offset;
1323 #else
1324         /* We always allocated the full length item with PURIFY. To do this
1325            we fake things so that arena is false for all 16 types..  */
1326         new_body = new_NOARENAZ(new_type_details);
1327 #endif
1328         SvANY(sv) = new_body;
1329         if (new_type == SVt_PVAV) {
1330             AvMAX(sv)   = -1;
1331             AvFILLp(sv) = -1;
1332             AvREAL_only(sv);
1333             if (old_type_details->body_size) {
1334                 AvALLOC(sv) = 0;
1335             } else {
1336                 /* It will have been zeroed when the new body was allocated.
1337                    Lets not write to it, in case it confuses a write-back
1338                    cache.  */
1339             }
1340         } else {
1341             assert(!SvOK(sv));
1342             SvOK_off(sv);
1343 #ifndef NODEFAULT_SHAREKEYS
1344             HvSHAREKEYS_on(sv);         /* key-sharing on by default */
1345 #endif
1346             HvMAX(sv) = 7; /* (start with 8 buckets) */
1347             if (old_type_details->body_size) {
1348                 HvFILL(sv) = 0;
1349             } else {
1350                 /* It will have been zeroed when the new body was allocated.
1351                    Lets not write to it, in case it confuses a write-back
1352                    cache.  */
1353             }
1354         }
1355
1356         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1357            The target created by newSVrv also is, and it can have magic.
1358            However, it never has SvPVX set.
1359         */
1360         if (old_type == SVt_IV) {
1361             assert(!SvROK(sv));
1362         } else if (old_type >= SVt_PV) {
1363             assert(SvPVX_const(sv) == 0);
1364         }
1365
1366         if (old_type >= SVt_PVMG) {
1367             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_u.xmg_magic);
1368             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1369         } else {
1370             sv->sv_u.svu_array = NULL; /* or svu_hash  */
1371         }
1372         break;
1373
1374
1375     case SVt_REGEXP:
1376         /* This ensures that SvTHINKFIRST(sv) is true, and hence that
1377            sv_force_normal_flags(sv) is called.  */
1378         SvFAKE_on(sv);
1379     case SVt_PVIV:
1380         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1381            no route from NV to PVIV, NOK can never be true  */
1382         assert(!SvNOKp(sv));
1383         assert(!SvNOK(sv));
1384     case SVt_PVIO:
1385     case SVt_PVFM:
1386     case SVt_PVGV:
1387     case SVt_PVCV:
1388     case SVt_PVLV:
1389     case SVt_PVMG:
1390     case SVt_PVNV:
1391     case SVt_PV:
1392
1393         assert(new_type_details->body_size);
1394         /* We always allocated the full length item with PURIFY. To do this
1395            we fake things so that arena is false for all 16 types..  */
1396         if(new_type_details->arena) {
1397             /* This points to the start of the allocated area.  */
1398             new_body_inline(new_body, new_type);
1399             Zero(new_body, new_type_details->body_size, char);
1400             new_body = ((char *)new_body) - new_type_details->offset;
1401         } else {
1402             new_body = new_NOARENAZ(new_type_details);
1403         }
1404         SvANY(sv) = new_body;
1405
1406         if (old_type_details->copy) {
1407             /* There is now the potential for an upgrade from something without
1408                an offset (PVNV or PVMG) to something with one (PVCV, PVFM)  */
1409             int offset = old_type_details->offset;
1410             int length = old_type_details->copy;
1411
1412             if (new_type_details->offset > old_type_details->offset) {
1413                 const int difference
1414                     = new_type_details->offset - old_type_details->offset;
1415                 offset += difference;
1416                 length -= difference;
1417             }
1418             assert (length >= 0);
1419                 
1420             Copy((char *)old_body + offset, (char *)new_body + offset, length,
1421                  char);
1422         }
1423
1424 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1425         /* If NV 0.0 is stores as all bits 0 then Zero() already creates a
1426          * correct 0.0 for us.  Otherwise, if the old body didn't have an
1427          * NV slot, but the new one does, then we need to initialise the
1428          * freshly created NV slot with whatever the correct bit pattern is
1429          * for 0.0  */
1430         if (old_type_details->zero_nv && !new_type_details->zero_nv
1431             && !isGV_with_GP(sv))
1432             SvNV_set(sv, 0);
1433 #endif
1434
1435         if (new_type == SVt_PVIO) {
1436             IO * const io = MUTABLE_IO(sv);
1437             GV *iogv = gv_fetchpvs("IO::File::", GV_ADD, SVt_PVHV);
1438
1439             SvOBJECT_on(io);
1440             /* Clear the stashcache because a new IO could overrule a package
1441                name */
1442             hv_clear(PL_stashcache);
1443
1444             SvSTASH_set(io, MUTABLE_HV(SvREFCNT_inc(GvHV(iogv))));
1445             IoPAGE_LEN(sv) = 60;
1446         }
1447         if (old_type < SVt_PV) {
1448             /* referant will be NULL unless the old type was SVt_IV emulating
1449                SVt_RV */
1450             sv->sv_u.svu_rv = referant;
1451         }
1452         break;
1453     default:
1454         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu",
1455                    (unsigned long)new_type);
1456     }
1457
1458     if (old_type > SVt_IV) { /* SVt_IVs are overloaded for PTEs */
1459 #ifdef PURIFY
1460         my_safefree(old_body);
1461 #else
1462         /* Note that there is an assumption that all bodies of types that
1463            can be upgraded came from arenas. Only the more complex non-
1464            upgradable types are allowed to be directly malloc()ed.  */
1465         assert(old_type_details->arena);
1466         del_body((void*)((char*)old_body + old_type_details->offset),
1467                  &PL_body_roots[old_type]);
1468 #endif
1469     }
1470 }
1471
1472 /*
1473 =for apidoc sv_backoff
1474
1475 Remove any string offset. You should normally use the C<SvOOK_off> macro
1476 wrapper instead.
1477
1478 =cut
1479 */
1480
1481 int
1482 Perl_sv_backoff(pTHX_ register SV *const sv)
1483 {
1484     STRLEN delta;
1485     const char * const s = SvPVX_const(sv);
1486
1487     PERL_ARGS_ASSERT_SV_BACKOFF;
1488     PERL_UNUSED_CONTEXT;
1489
1490     assert(SvOOK(sv));
1491     assert(SvTYPE(sv) != SVt_PVHV);
1492     assert(SvTYPE(sv) != SVt_PVAV);
1493
1494     SvOOK_offset(sv, delta);
1495     
1496     SvLEN_set(sv, SvLEN(sv) + delta);
1497     SvPV_set(sv, SvPVX(sv) - delta);
1498     Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1499     SvFLAGS(sv) &= ~SVf_OOK;
1500     return 0;
1501 }
1502
1503 /*
1504 =for apidoc sv_grow
1505
1506 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1507 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1508 Use the C<SvGROW> wrapper instead.
1509
1510 =cut
1511 */
1512
1513 char *
1514 Perl_sv_grow(pTHX_ register SV *const sv, register STRLEN newlen)
1515 {
1516     register char *s;
1517
1518     PERL_ARGS_ASSERT_SV_GROW;
1519
1520     if (PL_madskills && newlen >= 0x100000) {
1521         PerlIO_printf(Perl_debug_log,
1522                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1523     }
1524 #ifdef HAS_64K_LIMIT
1525     if (newlen >= 0x10000) {
1526         PerlIO_printf(Perl_debug_log,
1527                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1528         my_exit(1);
1529     }
1530 #endif /* HAS_64K_LIMIT */
1531     if (SvROK(sv))
1532         sv_unref(sv);
1533     if (SvTYPE(sv) < SVt_PV) {
1534         sv_upgrade(sv, SVt_PV);
1535         s = SvPVX_mutable(sv);
1536     }
1537     else if (SvOOK(sv)) {       /* pv is offset? */
1538         sv_backoff(sv);
1539         s = SvPVX_mutable(sv);
1540         if (newlen > SvLEN(sv))
1541             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1542 #ifdef HAS_64K_LIMIT
1543         if (newlen >= 0x10000)
1544             newlen = 0xFFFF;
1545 #endif
1546     }
1547     else
1548         s = SvPVX_mutable(sv);
1549
1550     if (newlen > SvLEN(sv)) {           /* need more room? */
1551 #ifndef Perl_safesysmalloc_size
1552         newlen = PERL_STRLEN_ROUNDUP(newlen);
1553 #endif
1554         if (SvLEN(sv) && s) {
1555             s = (char*)saferealloc(s, newlen);
1556         }
1557         else {
1558             s = (char*)safemalloc(newlen);
1559             if (SvPVX_const(sv) && SvCUR(sv)) {
1560                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1561             }
1562         }
1563         SvPV_set(sv, s);
1564 #ifdef Perl_safesysmalloc_size
1565         /* Do this here, do it once, do it right, and then we will never get
1566            called back into sv_grow() unless there really is some growing
1567            needed.  */
1568         SvLEN_set(sv, Perl_safesysmalloc_size(s));
1569 #else
1570         SvLEN_set(sv, newlen);
1571 #endif
1572     }
1573     return s;
1574 }
1575
1576 /*
1577 =for apidoc sv_setiv
1578
1579 Copies an integer into the given SV, upgrading first if necessary.
1580 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1581
1582 =cut
1583 */
1584
1585 void
1586 Perl_sv_setiv(pTHX_ register SV *const sv, const IV i)
1587 {
1588     dVAR;
1589
1590     PERL_ARGS_ASSERT_SV_SETIV;
1591
1592     SV_CHECK_THINKFIRST_COW_DROP(sv);
1593     switch (SvTYPE(sv)) {
1594     case SVt_NULL:
1595     case SVt_NV:
1596         sv_upgrade(sv, SVt_IV);
1597         break;
1598     case SVt_PV:
1599         sv_upgrade(sv, SVt_PVIV);
1600         break;
1601
1602     case SVt_PVGV:
1603         if (!isGV_with_GP(sv))
1604             break;
1605     case SVt_PVAV:
1606     case SVt_PVHV:
1607     case SVt_PVCV:
1608     case SVt_PVFM:
1609     case SVt_PVIO:
1610         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1611                    OP_DESC(PL_op));
1612     default: NOOP;
1613     }
1614     (void)SvIOK_only(sv);                       /* validate number */
1615     SvIV_set(sv, i);
1616     SvTAINT(sv);
1617 }
1618
1619 /*
1620 =for apidoc sv_setiv_mg
1621
1622 Like C<sv_setiv>, but also handles 'set' magic.
1623
1624 =cut
1625 */
1626
1627 void
1628 Perl_sv_setiv_mg(pTHX_ register SV *const sv, const IV i)
1629 {
1630     PERL_ARGS_ASSERT_SV_SETIV_MG;
1631
1632     sv_setiv(sv,i);
1633     SvSETMAGIC(sv);
1634 }
1635
1636 /*
1637 =for apidoc sv_setuv
1638
1639 Copies an unsigned integer into the given SV, upgrading first if necessary.
1640 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1641
1642 =cut
1643 */
1644
1645 void
1646 Perl_sv_setuv(pTHX_ register SV *const sv, const UV u)
1647 {
1648     PERL_ARGS_ASSERT_SV_SETUV;
1649
1650     /* With these two if statements:
1651        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1652
1653        without
1654        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1655
1656        If you wish to remove them, please benchmark to see what the effect is
1657     */
1658     if (u <= (UV)IV_MAX) {
1659        sv_setiv(sv, (IV)u);
1660        return;
1661     }
1662     sv_setiv(sv, 0);
1663     SvIsUV_on(sv);
1664     SvUV_set(sv, u);
1665 }
1666
1667 /*
1668 =for apidoc sv_setuv_mg
1669
1670 Like C<sv_setuv>, but also handles 'set' magic.
1671
1672 =cut
1673 */
1674
1675 void
1676 Perl_sv_setuv_mg(pTHX_ register SV *const sv, const UV u)
1677 {
1678     PERL_ARGS_ASSERT_SV_SETUV_MG;
1679
1680     sv_setuv(sv,u);
1681     SvSETMAGIC(sv);
1682 }
1683
1684 /*
1685 =for apidoc sv_setnv
1686
1687 Copies a double into the given SV, upgrading first if necessary.
1688 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1689
1690 =cut
1691 */
1692
1693 void
1694 Perl_sv_setnv(pTHX_ register SV *const sv, const NV num)
1695 {
1696     dVAR;
1697
1698     PERL_ARGS_ASSERT_SV_SETNV;
1699
1700     SV_CHECK_THINKFIRST_COW_DROP(sv);
1701     switch (SvTYPE(sv)) {
1702     case SVt_NULL:
1703     case SVt_IV:
1704         sv_upgrade(sv, SVt_NV);
1705         break;
1706     case SVt_PV:
1707     case SVt_PVIV:
1708         sv_upgrade(sv, SVt_PVNV);
1709         break;
1710
1711     case SVt_PVGV:
1712         if (!isGV_with_GP(sv))
1713             break;
1714     case SVt_PVAV:
1715     case SVt_PVHV:
1716     case SVt_PVCV:
1717     case SVt_PVFM:
1718     case SVt_PVIO:
1719         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1720                    OP_NAME(PL_op));
1721     default: NOOP;
1722     }
1723     SvNV_set(sv, num);
1724     (void)SvNOK_only(sv);                       /* validate number */
1725     SvTAINT(sv);
1726 }
1727
1728 /*
1729 =for apidoc sv_setnv_mg
1730
1731 Like C<sv_setnv>, but also handles 'set' magic.
1732
1733 =cut
1734 */
1735
1736 void
1737 Perl_sv_setnv_mg(pTHX_ register SV *const sv, const NV num)
1738 {
1739     PERL_ARGS_ASSERT_SV_SETNV_MG;
1740
1741     sv_setnv(sv,num);
1742     SvSETMAGIC(sv);
1743 }
1744
1745 /* Print an "isn't numeric" warning, using a cleaned-up,
1746  * printable version of the offending string
1747  */
1748
1749 STATIC void
1750 S_not_a_number(pTHX_ SV *const sv)
1751 {
1752      dVAR;
1753      SV *dsv;
1754      char tmpbuf[64];
1755      const char *pv;
1756
1757      PERL_ARGS_ASSERT_NOT_A_NUMBER;
1758
1759      if (DO_UTF8(sv)) {
1760           dsv = newSVpvs_flags("", SVs_TEMP);
1761           pv = sv_uni_display(dsv, sv, 10, 0);
1762      } else {
1763           char *d = tmpbuf;
1764           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1765           /* each *s can expand to 4 chars + "...\0",
1766              i.e. need room for 8 chars */
1767         
1768           const char *s = SvPVX_const(sv);
1769           const char * const end = s + SvCUR(sv);
1770           for ( ; s < end && d < limit; s++ ) {
1771                int ch = *s & 0xFF;
1772                if (ch & 128 && !isPRINT_LC(ch)) {
1773                     *d++ = 'M';
1774                     *d++ = '-';
1775                     ch &= 127;
1776                }
1777                if (ch == '\n') {
1778                     *d++ = '\\';
1779                     *d++ = 'n';
1780                }
1781                else if (ch == '\r') {
1782                     *d++ = '\\';
1783                     *d++ = 'r';
1784                }
1785                else if (ch == '\f') {
1786                     *d++ = '\\';
1787                     *d++ = 'f';
1788                }
1789                else if (ch == '\\') {
1790                     *d++ = '\\';
1791                     *d++ = '\\';
1792                }
1793                else if (ch == '\0') {
1794                     *d++ = '\\';
1795                     *d++ = '0';
1796                }
1797                else if (isPRINT_LC(ch))
1798                     *d++ = ch;
1799                else {
1800                     *d++ = '^';
1801                     *d++ = toCTRL(ch);
1802                }
1803           }
1804           if (s < end) {
1805                *d++ = '.';
1806                *d++ = '.';
1807                *d++ = '.';
1808           }
1809           *d = '\0';
1810           pv = tmpbuf;
1811     }
1812
1813     if (PL_op)
1814         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1815                     "Argument \"%s\" isn't numeric in %s", pv,
1816                     OP_DESC(PL_op));
1817     else
1818         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1819                     "Argument \"%s\" isn't numeric", pv);
1820 }
1821
1822 /*
1823 =for apidoc looks_like_number
1824
1825 Test if the content of an SV looks like a number (or is a number).
1826 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1827 non-numeric warning), even if your atof() doesn't grok them.
1828
1829 =cut
1830 */
1831
1832 I32
1833 Perl_looks_like_number(pTHX_ SV *const sv)
1834 {
1835     register const char *sbegin;
1836     STRLEN len;
1837
1838     PERL_ARGS_ASSERT_LOOKS_LIKE_NUMBER;
1839
1840     if (SvPOK(sv)) {
1841         sbegin = SvPVX_const(sv);
1842         len = SvCUR(sv);
1843     }
1844     else if (SvPOKp(sv))
1845         sbegin = SvPV_const(sv, len);
1846     else
1847         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1848     return grok_number(sbegin, len, NULL);
1849 }
1850
1851 STATIC bool
1852 S_glob_2number(pTHX_ GV * const gv)
1853 {
1854     const U32 wasfake = SvFLAGS(gv) & SVf_FAKE;
1855     SV *const buffer = sv_newmortal();
1856
1857     PERL_ARGS_ASSERT_GLOB_2NUMBER;
1858
1859     /* FAKE globs can get coerced, so need to turn this off temporarily if it
1860        is on.  */
1861     SvFAKE_off(gv);
1862     gv_efullname3(buffer, gv, "*");
1863     SvFLAGS(gv) |= wasfake;
1864
1865     /* We know that all GVs stringify to something that is not-a-number,
1866         so no need to test that.  */
1867     if (ckWARN(WARN_NUMERIC))
1868         not_a_number(buffer);
1869     /* We just want something true to return, so that S_sv_2iuv_common
1870         can tail call us and return true.  */
1871     return TRUE;
1872 }
1873
1874 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1875    until proven guilty, assume that things are not that bad... */
1876
1877 /*
1878    NV_PRESERVES_UV:
1879
1880    As 64 bit platforms often have an NV that doesn't preserve all bits of
1881    an IV (an assumption perl has been based on to date) it becomes necessary
1882    to remove the assumption that the NV always carries enough precision to
1883    recreate the IV whenever needed, and that the NV is the canonical form.
1884    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1885    precision as a side effect of conversion (which would lead to insanity
1886    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1887    1) to distinguish between IV/UV/NV slots that have cached a valid
1888       conversion where precision was lost and IV/UV/NV slots that have a
1889       valid conversion which has lost no precision
1890    2) to ensure that if a numeric conversion to one form is requested that
1891       would lose precision, the precise conversion (or differently
1892       imprecise conversion) is also performed and cached, to prevent
1893       requests for different numeric formats on the same SV causing
1894       lossy conversion chains. (lossless conversion chains are perfectly
1895       acceptable (still))
1896
1897
1898    flags are used:
1899    SvIOKp is true if the IV slot contains a valid value
1900    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1901    SvNOKp is true if the NV slot contains a valid value
1902    SvNOK  is true only if the NV value is accurate
1903
1904    so
1905    while converting from PV to NV, check to see if converting that NV to an
1906    IV(or UV) would lose accuracy over a direct conversion from PV to
1907    IV(or UV). If it would, cache both conversions, return NV, but mark
1908    SV as IOK NOKp (ie not NOK).
1909
1910    While converting from PV to IV, check to see if converting that IV to an
1911    NV would lose accuracy over a direct conversion from PV to NV. If it
1912    would, cache both conversions, flag similarly.
1913
1914    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1915    correctly because if IV & NV were set NV *always* overruled.
1916    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1917    changes - now IV and NV together means that the two are interchangeable:
1918    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1919
1920    The benefit of this is that operations such as pp_add know that if
1921    SvIOK is true for both left and right operands, then integer addition
1922    can be used instead of floating point (for cases where the result won't
1923    overflow). Before, floating point was always used, which could lead to
1924    loss of precision compared with integer addition.
1925
1926    * making IV and NV equal status should make maths accurate on 64 bit
1927      platforms
1928    * may speed up maths somewhat if pp_add and friends start to use
1929      integers when possible instead of fp. (Hopefully the overhead in
1930      looking for SvIOK and checking for overflow will not outweigh the
1931      fp to integer speedup)
1932    * will slow down integer operations (callers of SvIV) on "inaccurate"
1933      values, as the change from SvIOK to SvIOKp will cause a call into
1934      sv_2iv each time rather than a macro access direct to the IV slot
1935    * should speed up number->string conversion on integers as IV is
1936      favoured when IV and NV are equally accurate
1937
1938    ####################################################################
1939    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1940    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1941    On the other hand, SvUOK is true iff UV.
1942    ####################################################################
1943
1944    Your mileage will vary depending your CPU's relative fp to integer
1945    performance ratio.
1946 */
1947
1948 #ifndef NV_PRESERVES_UV
1949 #  define IS_NUMBER_UNDERFLOW_IV 1
1950 #  define IS_NUMBER_UNDERFLOW_UV 2
1951 #  define IS_NUMBER_IV_AND_UV    2
1952 #  define IS_NUMBER_OVERFLOW_IV  4
1953 #  define IS_NUMBER_OVERFLOW_UV  5
1954
1955 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1956
1957 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1958 STATIC int
1959 S_sv_2iuv_non_preserve(pTHX_ register SV *const sv
1960 #  ifdef DEBUGGING
1961                        , I32 numtype
1962 #  endif
1963                        )
1964 {
1965     dVAR;
1966
1967     PERL_ARGS_ASSERT_SV_2IUV_NON_PRESERVE;
1968
1969     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1970     if (SvNVX(sv) < (NV)IV_MIN) {
1971         (void)SvIOKp_on(sv);
1972         (void)SvNOK_on(sv);
1973         SvIV_set(sv, IV_MIN);
1974         return IS_NUMBER_UNDERFLOW_IV;
1975     }
1976     if (SvNVX(sv) > (NV)UV_MAX) {
1977         (void)SvIOKp_on(sv);
1978         (void)SvNOK_on(sv);
1979         SvIsUV_on(sv);
1980         SvUV_set(sv, UV_MAX);
1981         return IS_NUMBER_OVERFLOW_UV;
1982     }
1983     (void)SvIOKp_on(sv);
1984     (void)SvNOK_on(sv);
1985     /* Can't use strtol etc to convert this string.  (See truth table in
1986        sv_2iv  */
1987     if (SvNVX(sv) <= (UV)IV_MAX) {
1988         SvIV_set(sv, I_V(SvNVX(sv)));
1989         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1990             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1991         } else {
1992             /* Integer is imprecise. NOK, IOKp */
1993         }
1994         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1995     }
1996     SvIsUV_on(sv);
1997     SvUV_set(sv, U_V(SvNVX(sv)));
1998     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1999         if (SvUVX(sv) == UV_MAX) {
2000             /* As we know that NVs don't preserve UVs, UV_MAX cannot
2001                possibly be preserved by NV. Hence, it must be overflow.
2002                NOK, IOKp */
2003             return IS_NUMBER_OVERFLOW_UV;
2004         }
2005         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
2006     } else {
2007         /* Integer is imprecise. NOK, IOKp */
2008     }
2009     return IS_NUMBER_OVERFLOW_IV;
2010 }
2011 #endif /* !NV_PRESERVES_UV*/
2012
2013 STATIC bool
2014 S_sv_2iuv_common(pTHX_ SV *const sv)
2015 {
2016     dVAR;
2017
2018     PERL_ARGS_ASSERT_SV_2IUV_COMMON;
2019
2020     if (SvNOKp(sv)) {
2021         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
2022          * without also getting a cached IV/UV from it at the same time
2023          * (ie PV->NV conversion should detect loss of accuracy and cache
2024          * IV or UV at same time to avoid this. */
2025         /* IV-over-UV optimisation - choose to cache IV if possible */
2026
2027         if (SvTYPE(sv) == SVt_NV)
2028             sv_upgrade(sv, SVt_PVNV);
2029
2030         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
2031         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
2032            certainly cast into the IV range at IV_MAX, whereas the correct
2033            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
2034            cases go to UV */
2035 #if defined(NAN_COMPARE_BROKEN) && defined(Perl_isnan)
2036         if (Perl_isnan(SvNVX(sv))) {
2037             SvUV_set(sv, 0);
2038             SvIsUV_on(sv);
2039             return FALSE;
2040         }
2041 #endif
2042         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2043             SvIV_set(sv, I_V(SvNVX(sv)));
2044             if (SvNVX(sv) == (NV) SvIVX(sv)
2045 #ifndef NV_PRESERVES_UV
2046                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
2047                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
2048                 /* Don't flag it as "accurately an integer" if the number
2049                    came from a (by definition imprecise) NV operation, and
2050                    we're outside the range of NV integer precision */
2051 #endif
2052                 ) {
2053                 if (SvNOK(sv))
2054                     SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
2055                 else {
2056                     /* scalar has trailing garbage, eg "42a" */
2057                 }
2058                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2059                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
2060                                       PTR2UV(sv),
2061                                       SvNVX(sv),
2062                                       SvIVX(sv)));
2063
2064             } else {
2065                 /* IV not precise.  No need to convert from PV, as NV
2066                    conversion would already have cached IV if it detected
2067                    that PV->IV would be better than PV->NV->IV
2068                    flags already correct - don't set public IOK.  */
2069                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2070                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
2071                                       PTR2UV(sv),
2072                                       SvNVX(sv),
2073                                       SvIVX(sv)));
2074             }
2075             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
2076                but the cast (NV)IV_MIN rounds to a the value less (more
2077                negative) than IV_MIN which happens to be equal to SvNVX ??
2078                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
2079                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
2080                (NV)UVX == NVX are both true, but the values differ. :-(
2081                Hopefully for 2s complement IV_MIN is something like
2082                0x8000000000000000 which will be exact. NWC */
2083         }
2084         else {
2085             SvUV_set(sv, U_V(SvNVX(sv)));
2086             if (
2087                 (SvNVX(sv) == (NV) SvUVX(sv))
2088 #ifndef  NV_PRESERVES_UV
2089                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
2090                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
2091                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
2092                 /* Don't flag it as "accurately an integer" if the number
2093                    came from a (by definition imprecise) NV operation, and
2094                    we're outside the range of NV integer precision */
2095 #endif
2096                 && SvNOK(sv)
2097                 )
2098                 SvIOK_on(sv);
2099             SvIsUV_on(sv);
2100             DEBUG_c(PerlIO_printf(Perl_debug_log,
2101                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
2102                                   PTR2UV(sv),
2103                                   SvUVX(sv),
2104                                   SvUVX(sv)));
2105         }
2106     }
2107     else if (SvPOKp(sv) && SvLEN(sv)) {
2108         UV value;
2109         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2110         /* We want to avoid a possible problem when we cache an IV/ a UV which
2111            may be later translated to an NV, and the resulting NV is not
2112            the same as the direct translation of the initial string
2113            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
2114            be careful to ensure that the value with the .456 is around if the
2115            NV value is requested in the future).
2116         
2117            This means that if we cache such an IV/a UV, we need to cache the
2118            NV as well.  Moreover, we trade speed for space, and do not
2119            cache the NV if we are sure it's not needed.
2120          */
2121
2122         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
2123         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2124              == IS_NUMBER_IN_UV) {
2125             /* It's definitely an integer, only upgrade to PVIV */
2126             if (SvTYPE(sv) < SVt_PVIV)
2127                 sv_upgrade(sv, SVt_PVIV);
2128             (void)SvIOK_on(sv);
2129         } else if (SvTYPE(sv) < SVt_PVNV)
2130             sv_upgrade(sv, SVt_PVNV);
2131
2132         /* If NVs preserve UVs then we only use the UV value if we know that
2133            we aren't going to call atof() below. If NVs don't preserve UVs
2134            then the value returned may have more precision than atof() will
2135            return, even though value isn't perfectly accurate.  */
2136         if ((numtype & (IS_NUMBER_IN_UV
2137 #ifdef NV_PRESERVES_UV
2138                         | IS_NUMBER_NOT_INT
2139 #endif
2140             )) == IS_NUMBER_IN_UV) {
2141             /* This won't turn off the public IOK flag if it was set above  */
2142             (void)SvIOKp_on(sv);
2143
2144             if (!(numtype & IS_NUMBER_NEG)) {
2145                 /* positive */;
2146                 if (value <= (UV)IV_MAX) {
2147                     SvIV_set(sv, (IV)value);
2148                 } else {
2149                     /* it didn't overflow, and it was positive. */
2150                     SvUV_set(sv, value);
2151                     SvIsUV_on(sv);
2152                 }
2153             } else {
2154                 /* 2s complement assumption  */
2155                 if (value <= (UV)IV_MIN) {
2156                     SvIV_set(sv, -(IV)value);
2157                 } else {
2158                     /* Too negative for an IV.  This is a double upgrade, but
2159                        I'm assuming it will be rare.  */
2160                     if (SvTYPE(sv) < SVt_PVNV)
2161                         sv_upgrade(sv, SVt_PVNV);
2162                     SvNOK_on(sv);
2163                     SvIOK_off(sv);
2164                     SvIOKp_on(sv);
2165                     SvNV_set(sv, -(NV)value);
2166                     SvIV_set(sv, IV_MIN);
2167                 }
2168             }
2169         }
2170         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
2171            will be in the previous block to set the IV slot, and the next
2172            block to set the NV slot.  So no else here.  */
2173         
2174         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2175             != IS_NUMBER_IN_UV) {
2176             /* It wasn't an (integer that doesn't overflow the UV). */
2177             SvNV_set(sv, Atof(SvPVX_const(sv)));
2178
2179             if (! numtype && ckWARN(WARN_NUMERIC))
2180                 not_a_number(sv);
2181
2182 #if defined(USE_LONG_DOUBLE)
2183             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
2184                                   PTR2UV(sv), SvNVX(sv)));
2185 #else
2186             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
2187                                   PTR2UV(sv), SvNVX(sv)));
2188 #endif
2189
2190 #ifdef NV_PRESERVES_UV
2191             (void)SvIOKp_on(sv);
2192             (void)SvNOK_on(sv);
2193             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2194                 SvIV_set(sv, I_V(SvNVX(sv)));
2195                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
2196                     SvIOK_on(sv);
2197                 } else {
2198                     NOOP;  /* Integer is imprecise. NOK, IOKp */
2199                 }
2200                 /* UV will not work better than IV */
2201             } else {
2202                 if (SvNVX(sv) > (NV)UV_MAX) {
2203                     SvIsUV_on(sv);
2204                     /* Integer is inaccurate. NOK, IOKp, is UV */
2205                     SvUV_set(sv, UV_MAX);
2206                 } else {
2207                     SvUV_set(sv, U_V(SvNVX(sv)));
2208                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
2209                        NV preservse UV so can do correct comparison.  */
2210                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
2211                         SvIOK_on(sv);
2212                     } else {
2213                         NOOP;   /* Integer is imprecise. NOK, IOKp, is UV */
2214                     }
2215                 }
2216                 SvIsUV_on(sv);
2217             }
2218 #else /* NV_PRESERVES_UV */
2219             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2220                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
2221                 /* The IV/UV slot will have been set from value returned by
2222                    grok_number above.  The NV slot has just been set using
2223                    Atof.  */
2224                 SvNOK_on(sv);
2225                 assert (SvIOKp(sv));
2226             } else {
2227                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
2228                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2229                     /* Small enough to preserve all bits. */
2230                     (void)SvIOKp_on(sv);
2231                     SvNOK_on(sv);
2232                     SvIV_set(sv, I_V(SvNVX(sv)));
2233                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
2234                         SvIOK_on(sv);
2235                     /* Assumption: first non-preserved integer is < IV_MAX,
2236                        this NV is in the preserved range, therefore: */
2237                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
2238                           < (UV)IV_MAX)) {
2239                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
2240                     }
2241                 } else {
2242                     /* IN_UV NOT_INT
2243                          0      0       already failed to read UV.
2244                          0      1       already failed to read UV.
2245                          1      0       you won't get here in this case. IV/UV
2246                                         slot set, public IOK, Atof() unneeded.
2247                          1      1       already read UV.
2248                        so there's no point in sv_2iuv_non_preserve() attempting
2249                        to use atol, strtol, strtoul etc.  */
2250 #  ifdef DEBUGGING
2251                     sv_2iuv_non_preserve (sv, numtype);
2252 #  else
2253                     sv_2iuv_non_preserve (sv);
2254 #  endif
2255                 }
2256             }
2257 #endif /* NV_PRESERVES_UV */
2258         /* It might be more code efficient to go through the entire logic above
2259            and conditionally set with SvIOKp_on() rather than SvIOK(), but it
2260            gets complex and potentially buggy, so more programmer efficient
2261            to do it this way, by turning off the public flags:  */
2262         if (!numtype)
2263             SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK);
2264         }
2265     }
2266     else  {
2267         if (isGV_with_GP(sv))
2268             return glob_2number(MUTABLE_GV(sv));
2269
2270         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2271             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2272                 report_uninit(sv);
2273         }
2274         if (SvTYPE(sv) < SVt_IV)
2275             /* Typically the caller expects that sv_any is not NULL now.  */
2276             sv_upgrade(sv, SVt_IV);
2277         /* Return 0 from the caller.  */
2278         return TRUE;
2279     }
2280     return FALSE;
2281 }
2282
2283 /*
2284 =for apidoc sv_2iv_flags
2285
2286 Return the integer value of an SV, doing any necessary string
2287 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
2288 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
2289
2290 =cut
2291 */
2292
2293 IV
2294 Perl_sv_2iv_flags(pTHX_ register SV *const sv, const I32 flags)
2295 {
2296     dVAR;
2297     if (!sv)
2298         return 0;
2299     if (SvGMAGICAL(sv) || (SvTYPE(sv) == SVt_PVGV && SvVALID(sv))) {
2300         /* FBMs use the same flag bit as SVf_IVisUV, so must let them
2301            cache IVs just in case. In practice it seems that they never
2302            actually anywhere accessible by user Perl code, let alone get used
2303            in anything other than a string context.  */
2304         if (flags & SV_GMAGIC)
2305             mg_get(sv);
2306         if (SvIOKp(sv))
2307             return SvIVX(sv);
2308         if (SvNOKp(sv)) {
2309             return I_V(SvNVX(sv));
2310         }
2311         if (SvPOKp(sv) && SvLEN(sv)) {
2312             UV value;
2313             const int numtype
2314                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2315
2316             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2317                 == IS_NUMBER_IN_UV) {
2318                 /* It's definitely an integer */
2319                 if (numtype & IS_NUMBER_NEG) {
2320                     if (value < (UV)IV_MIN)
2321                         return -(IV)value;
2322                 } else {
2323                     if (value < (UV)IV_MAX)
2324                         return (IV)value;
2325                 }
2326             }
2327             if (!numtype) {
2328                 if (ckWARN(WARN_NUMERIC))
2329                     not_a_number(sv);
2330             }
2331             return I_V(Atof(SvPVX_const(sv)));
2332         }
2333         if (SvROK(sv)) {
2334             goto return_rok;
2335         }
2336         assert(SvTYPE(sv) >= SVt_PVMG);
2337         /* This falls through to the report_uninit inside S_sv_2iuv_common.  */
2338     } else if (SvTHINKFIRST(sv)) {
2339         if (SvROK(sv)) {
2340         return_rok:
2341             if (SvAMAGIC(sv)) {
2342                 SV * const tmpstr=AMG_CALLun(sv,numer);
2343                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2344                     return SvIV(tmpstr);
2345                 }
2346             }
2347             return PTR2IV(SvRV(sv));
2348         }
2349         if (SvIsCOW(sv)) {
2350             sv_force_normal_flags(sv, 0);
2351         }
2352         if (SvREADONLY(sv) && !SvOK(sv)) {
2353             if (ckWARN(WARN_UNINITIALIZED))
2354                 report_uninit(sv);
2355             return 0;
2356         }
2357     }
2358     if (!SvIOKp(sv)) {
2359         if (S_sv_2iuv_common(aTHX_ sv))
2360             return 0;
2361     }
2362     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
2363         PTR2UV(sv),SvIVX(sv)));
2364     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
2365 }
2366
2367 /*
2368 =for apidoc sv_2uv_flags
2369
2370 Return the unsigned integer value of an SV, doing any necessary string
2371 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
2372 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
2373
2374 =cut
2375 */
2376
2377 UV
2378 Perl_sv_2uv_flags(pTHX_ register SV *const sv, const I32 flags)
2379 {
2380     dVAR;
2381     if (!sv)
2382         return 0;
2383     if (SvGMAGICAL(sv) || (SvTYPE(sv) == SVt_PVGV && SvVALID(sv))) {
2384         /* FBMs use the same flag bit as SVf_IVisUV, so must let them
2385            cache IVs just in case.  */
2386         if (flags & SV_GMAGIC)
2387             mg_get(sv);
2388         if (SvIOKp(sv))
2389             return SvUVX(sv);
2390         if (SvNOKp(sv))
2391             return U_V(SvNVX(sv));
2392         if (SvPOKp(sv) && SvLEN(sv)) {
2393             UV value;
2394             const int numtype
2395                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2396
2397             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2398                 == IS_NUMBER_IN_UV) {
2399                 /* It's definitely an integer */
2400                 if (!(numtype & IS_NUMBER_NEG))
2401                     return value;
2402             }
2403             if (!numtype) {
2404                 if (ckWARN(WARN_NUMERIC))
2405                     not_a_number(sv);
2406             }
2407             return U_V(Atof(SvPVX_const(sv)));
2408         }
2409         if (SvROK(sv)) {
2410             goto return_rok;
2411         }
2412         assert(SvTYPE(sv) >= SVt_PVMG);
2413         /* This falls through to the report_uninit inside S_sv_2iuv_common.  */
2414     } else if (SvTHINKFIRST(sv)) {
2415         if (SvROK(sv)) {
2416         return_rok:
2417             if (SvAMAGIC(sv)) {
2418                 SV *const tmpstr = AMG_CALLun(sv,numer);
2419                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2420                     return SvUV(tmpstr);
2421                 }
2422             }
2423             return PTR2UV(SvRV(sv));
2424         }
2425         if (SvIsCOW(sv)) {
2426             sv_force_normal_flags(sv, 0);
2427         }
2428         if (SvREADONLY(sv) && !SvOK(sv)) {
2429             if (ckWARN(WARN_UNINITIALIZED))
2430                 report_uninit(sv);
2431             return 0;
2432         }
2433     }
2434     if (!SvIOKp(sv)) {
2435         if (S_sv_2iuv_common(aTHX_ sv))
2436             return 0;
2437     }
2438
2439     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2440                           PTR2UV(sv),SvUVX(sv)));
2441     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2442 }
2443
2444 /*
2445 =for apidoc sv_2nv
2446
2447 Return the num value of an SV, doing any necessary string or integer
2448 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2449 macros.
2450
2451 =cut
2452 */
2453
2454 NV
2455 Perl_sv_2nv(pTHX_ register SV *const sv)
2456 {
2457     dVAR;
2458     if (!sv)
2459         return 0.0;
2460     if (SvGMAGICAL(sv) || (SvTYPE(sv) == SVt_PVGV && SvVALID(sv))) {
2461         /* FBMs use the same flag bit as SVf_IVisUV, so must let them
2462            cache IVs just in case.  */
2463         mg_get(sv);
2464         if (SvNOKp(sv))
2465             return SvNVX(sv);
2466         if ((SvPOKp(sv) && SvLEN(sv)) && !SvIOKp(sv)) {
2467             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2468                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2469                 not_a_number(sv);
2470             return Atof(SvPVX_const(sv));
2471         }
2472         if (SvIOKp(sv)) {
2473             if (SvIsUV(sv))
2474                 return (NV)SvUVX(sv);
2475             else
2476                 return (NV)SvIVX(sv);
2477         }
2478         if (SvROK(sv)) {
2479             goto return_rok;
2480         }
2481         assert(SvTYPE(sv) >= SVt_PVMG);
2482         /* This falls through to the report_uninit near the end of the
2483            function. */
2484     } else if (SvTHINKFIRST(sv)) {
2485         if (SvROK(sv)) {
2486         return_rok:
2487             if (SvAMAGIC(sv)) {
2488                 SV *const tmpstr = AMG_CALLun(sv,numer);
2489                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2490                     return SvNV(tmpstr);
2491                 }
2492             }
2493             return PTR2NV(SvRV(sv));
2494         }
2495         if (SvIsCOW(sv)) {
2496             sv_force_normal_flags(sv, 0);
2497         }
2498         if (SvREADONLY(sv) && !SvOK(sv)) {
2499             if (ckWARN(WARN_UNINITIALIZED))
2500                 report_uninit(sv);
2501             return 0.0;
2502         }
2503     }
2504     if (SvTYPE(sv) < SVt_NV) {
2505         /* The logic to use SVt_PVNV if necessary is in sv_upgrade.  */
2506         sv_upgrade(sv, SVt_NV);
2507 #ifdef USE_LONG_DOUBLE
2508         DEBUG_c({
2509             STORE_NUMERIC_LOCAL_SET_STANDARD();
2510             PerlIO_printf(Perl_debug_log,
2511                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2512                           PTR2UV(sv), SvNVX(sv));
2513             RESTORE_NUMERIC_LOCAL();
2514         });
2515 #else
2516         DEBUG_c({
2517             STORE_NUMERIC_LOCAL_SET_STANDARD();
2518             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2519                           PTR2UV(sv), SvNVX(sv));
2520             RESTORE_NUMERIC_LOCAL();
2521         });
2522 #endif
2523     }
2524     else if (SvTYPE(sv) < SVt_PVNV)
2525         sv_upgrade(sv, SVt_PVNV);
2526     if (SvNOKp(sv)) {
2527         return SvNVX(sv);
2528     }
2529     if (SvIOKp(sv)) {
2530         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2531 #ifdef NV_PRESERVES_UV
2532         if (SvIOK(sv))
2533             SvNOK_on(sv);
2534         else
2535             SvNOKp_on(sv);
2536 #else
2537         /* Only set the public NV OK flag if this NV preserves the IV  */
2538         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2539         if (SvIOK(sv) &&
2540             SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2541                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2542             SvNOK_on(sv);
2543         else
2544             SvNOKp_on(sv);
2545 #endif
2546     }
2547     else if (SvPOKp(sv) && SvLEN(sv)) {
2548         UV value;
2549         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2550         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2551             not_a_number(sv);
2552 #ifdef NV_PRESERVES_UV
2553         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2554             == IS_NUMBER_IN_UV) {
2555             /* It's definitely an integer */
2556             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2557         } else
2558             SvNV_set(sv, Atof(SvPVX_const(sv)));
2559         if (numtype)
2560             SvNOK_on(sv);
2561         else
2562             SvNOKp_on(sv);
2563 #else
2564         SvNV_set(sv, Atof(SvPVX_const(sv)));
2565         /* Only set the public NV OK flag if this NV preserves the value in
2566            the PV at least as well as an IV/UV would.
2567            Not sure how to do this 100% reliably. */
2568         /* if that shift count is out of range then Configure's test is
2569            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2570            UV_BITS */
2571         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2572             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2573             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2574         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2575             /* Can't use strtol etc to convert this string, so don't try.
2576                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2577             SvNOK_on(sv);
2578         } else {
2579             /* value has been set.  It may not be precise.  */
2580             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2581                 /* 2s complement assumption for (UV)IV_MIN  */
2582                 SvNOK_on(sv); /* Integer is too negative.  */
2583             } else {
2584                 SvNOKp_on(sv);
2585                 SvIOKp_on(sv);
2586
2587                 if (numtype & IS_NUMBER_NEG) {
2588                     SvIV_set(sv, -(IV)value);
2589                 } else if (value <= (UV)IV_MAX) {
2590                     SvIV_set(sv, (IV)value);
2591                 } else {
2592                     SvUV_set(sv, value);
2593                     SvIsUV_on(sv);
2594                 }
2595
2596                 if (numtype & IS_NUMBER_NOT_INT) {
2597                     /* I believe that even if the original PV had decimals,
2598                        they are lost beyond the limit of the FP precision.
2599                        However, neither is canonical, so both only get p
2600                        flags.  NWC, 2000/11/25 */
2601                     /* Both already have p flags, so do nothing */
2602                 } else {
2603                     const NV nv = SvNVX(sv);
2604                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2605                         if (SvIVX(sv) == I_V(nv)) {
2606                             SvNOK_on(sv);
2607                         } else {
2608                             /* It had no "." so it must be integer.  */
2609                         }
2610                         SvIOK_on(sv);
2611                     } else {
2612                         /* between IV_MAX and NV(UV_MAX).
2613                            Could be slightly > UV_MAX */
2614
2615                         if (numtype & IS_NUMBER_NOT_INT) {
2616                             /* UV and NV both imprecise.  */
2617                         } else {
2618                             const UV nv_as_uv = U_V(nv);
2619
2620                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2621                                 SvNOK_on(sv);
2622                             }
2623                             SvIOK_on(sv);
2624                         }
2625                     }
2626                 }
2627             }
2628         }
2629         /* It might be more code efficient to go through the entire logic above
2630            and conditionally set with SvNOKp_on() rather than SvNOK(), but it
2631            gets complex and potentially buggy, so more programmer efficient
2632            to do it this way, by turning off the public flags:  */
2633         if (!numtype)
2634             SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK);
2635 #endif /* NV_PRESERVES_UV */
2636     }
2637     else  {
2638         if (isGV_with_GP(sv)) {
2639             glob_2number(MUTABLE_GV(sv));
2640             return 0.0;
2641         }
2642
2643         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2644             report_uninit(sv);
2645         assert (SvTYPE(sv) >= SVt_NV);
2646         /* Typically the caller expects that sv_any is not NULL now.  */
2647         /* XXX Ilya implies that this is a bug in callers that assume this
2648            and ideally should be fixed.  */
2649         return 0.0;
2650     }
2651 #if defined(USE_LONG_DOUBLE)
2652     DEBUG_c({
2653         STORE_NUMERIC_LOCAL_SET_STANDARD();
2654         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2655                       PTR2UV(sv), SvNVX(sv));
2656         RESTORE_NUMERIC_LOCAL();
2657     });
2658 #else
2659     DEBUG_c({
2660         STORE_NUMERIC_LOCAL_SET_STANDARD();
2661         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2662                       PTR2UV(sv), SvNVX(sv));
2663         RESTORE_NUMERIC_LOCAL();
2664     });
2665 #endif
2666     return SvNVX(sv);
2667 }
2668
2669 /*
2670 =for apidoc sv_2num
2671
2672 Return an SV with the numeric value of the source SV, doing any necessary
2673 reference or overload conversion.  You must use the C<SvNUM(sv)> macro to
2674 access this function.
2675
2676 =cut
2677 */
2678
2679 SV *
2680 Perl_sv_2num(pTHX_ register SV *const sv)
2681 {
2682     PERL_ARGS_ASSERT_SV_2NUM;
2683
2684     if (!SvROK(sv))
2685         return sv;
2686     if (SvAMAGIC(sv)) {
2687         SV * const tmpsv = AMG_CALLun(sv,numer);
2688         if (tmpsv && (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2689             return sv_2num(tmpsv);
2690     }
2691     return sv_2mortal(newSVuv(PTR2UV(SvRV(sv))));
2692 }
2693
2694 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2695  * UV as a string towards the end of buf, and return pointers to start and
2696  * end of it.
2697  *
2698  * We assume that buf is at least TYPE_CHARS(UV) long.
2699  */
2700
2701 static char *
2702 S_uiv_2buf(char *const buf, const IV iv, UV uv, const int is_uv, char **const peob)
2703 {
2704     char *ptr = buf + TYPE_CHARS(UV);
2705     char * const ebuf = ptr;
2706     int sign;
2707
2708     PERL_ARGS_ASSERT_UIV_2BUF;
2709
2710     if (is_uv)
2711         sign = 0;
2712     else if (iv >= 0) {
2713         uv = iv;
2714         sign = 0;
2715     } else {
2716         uv = -iv;
2717         sign = 1;
2718     }
2719     do {
2720         *--ptr = '0' + (char)(uv % 10);
2721     } while (uv /= 10);
2722     if (sign)
2723         *--ptr = '-';
2724     *peob = ebuf;
2725     return ptr;
2726 }
2727
2728 /*
2729 =for apidoc sv_2pv_flags
2730
2731 Returns a pointer to the string value of an SV, and sets *lp to its length.
2732 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2733 if necessary.
2734 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2735 usually end up here too.
2736
2737 =cut
2738 */
2739
2740 char *
2741 Perl_sv_2pv_flags(pTHX_ register SV *const sv, STRLEN *const lp, const I32 flags)
2742 {
2743     dVAR;
2744     register char *s;
2745
2746     if (!sv) {
2747         if (lp)
2748             *lp = 0;
2749         return (char *)"";
2750     }
2751     if (SvGMAGICAL(sv)) {
2752         if (flags & SV_GMAGIC)
2753             mg_get(sv);
2754         if (SvPOKp(sv)) {
2755             if (lp)
2756                 *lp = SvCUR(sv);
2757             if (flags & SV_MUTABLE_RETURN)
2758                 return SvPVX_mutable(sv);
2759             if (flags & SV_CONST_RETURN)
2760                 return (char *)SvPVX_const(sv);
2761             return SvPVX(sv);
2762         }
2763         if (SvIOKp(sv) || SvNOKp(sv)) {
2764             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2765             STRLEN len;
2766
2767             if (SvIOKp(sv)) {
2768                 len = SvIsUV(sv)
2769                     ? my_snprintf(tbuf, sizeof(tbuf), "%"UVuf, (UV)SvUVX(sv))
2770                     : my_snprintf(tbuf, sizeof(tbuf), "%"IVdf, (IV)SvIVX(sv));
2771             } else {
2772                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2773                 len = strlen(tbuf);
2774             }
2775             assert(!SvROK(sv));
2776             {
2777                 dVAR;
2778
2779 #ifdef FIXNEGATIVEZERO
2780                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2781                     tbuf[0] = '0';
2782                     tbuf[1] = 0;
2783                     len = 1;
2784                 }
2785 #endif
2786                 SvUPGRADE(sv, SVt_PV);
2787                 if (lp)
2788                     *lp = len;
2789                 s = SvGROW_mutable(sv, len + 1);
2790                 SvCUR_set(sv, len);
2791                 SvPOKp_on(sv);
2792                 return (char*)memcpy(s, tbuf, len + 1);
2793             }
2794         }
2795         if (SvROK(sv)) {
2796             goto return_rok;
2797         }
2798         assert(SvTYPE(sv) >= SVt_PVMG);
2799         /* This falls through to the report_uninit near the end of the
2800            function. */
2801     } else if (SvTHINKFIRST(sv)) {
2802         if (SvROK(sv)) {
2803         return_rok:
2804             if (SvAMAGIC(sv)) {
2805                 SV *const tmpstr = AMG_CALLun(sv,string);
2806                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2807                     /* Unwrap this:  */
2808                     /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr);
2809                      */
2810
2811                     char *pv;
2812                     if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2813                         if (flags & SV_CONST_RETURN) {
2814                             pv = (char *) SvPVX_const(tmpstr);
2815                         } else {
2816                             pv = (flags & SV_MUTABLE_RETURN)
2817                                 ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2818                         }
2819                         if (lp)
2820                             *lp = SvCUR(tmpstr);
2821                     } else {
2822                         pv = sv_2pv_flags(tmpstr, lp, flags);
2823                     }
2824                     if (SvUTF8(tmpstr))
2825                         SvUTF8_on(sv);
2826                     else
2827                         SvUTF8_off(sv);
2828                     return pv;
2829                 }
2830             }
2831             {
2832                 STRLEN len;
2833                 char *retval;
2834                 char *buffer;
2835                 SV *const referent = SvRV(sv);
2836
2837                 if (!referent) {
2838                     len = 7;
2839                     retval = buffer = savepvn("NULLREF", len);
2840                 } else if (SvTYPE(referent) == SVt_REGEXP) {
2841                     REGEXP * const re = (REGEXP *)MUTABLE_PTR(referent);
2842                     I32 seen_evals = 0;
2843
2844                     assert(re);
2845                         
2846                     /* If the regex is UTF-8 we want the containing scalar to
2847                        have an UTF-8 flag too */
2848                     if (RX_UTF8(re))
2849                         SvUTF8_on(sv);
2850                     else
2851                         SvUTF8_off(sv); 
2852
2853                     if ((seen_evals = RX_SEEN_EVALS(re)))
2854                         PL_reginterp_cnt += seen_evals;
2855
2856                     if (lp)
2857                         *lp = RX_WRAPLEN(re);
2858  
2859                     return RX_WRAPPED(re);
2860                 } else {
2861                     const char *const typestr = sv_reftype(referent, 0);
2862                     const STRLEN typelen = strlen(typestr);
2863                     UV addr = PTR2UV(referent);
2864                     const char *stashname = NULL;
2865                     STRLEN stashnamelen = 0; /* hush, gcc */
2866                     const char *buffer_end;
2867
2868                     if (SvOBJECT(referent)) {
2869                         const HEK *const name = HvNAME_HEK(SvSTASH(referent));
2870
2871                         if (name) {
2872                             stashname = HEK_KEY(name);
2873                             stashnamelen = HEK_LEN(name);
2874
2875                             if (HEK_UTF8(name)) {
2876                                 SvUTF8_on(sv);
2877                             } else {
2878                                 SvUTF8_off(sv);
2879                             }
2880                         } else {
2881                             stashname = "__ANON__";
2882                             stashnamelen = 8;
2883                         }
2884                         len = stashnamelen + 1 /* = */ + typelen + 3 /* (0x */
2885                             + 2 * sizeof(UV) + 2 /* )\0 */;
2886                     } else {
2887                         len = typelen + 3 /* (0x */
2888                             + 2 * sizeof(UV) + 2 /* )\0 */;
2889                     }
2890
2891                     Newx(buffer, len, char);
2892                     buffer_end = retval = buffer + len;
2893
2894                     /* Working backwards  */
2895                     *--retval = '\0';
2896                     *--retval = ')';
2897                     do {
2898                         *--retval = PL_hexdigit[addr & 15];
2899                     } while (addr >>= 4);
2900                     *--retval = 'x';
2901                     *--retval = '0';
2902                     *--retval = '(';
2903
2904                     retval -= typelen;
2905                     memcpy(retval, typestr, typelen);
2906
2907                     if (stashname) {
2908                         *--retval = '=';
2909                         retval -= stashnamelen;
2910                         memcpy(retval, stashname, stashnamelen);
2911                     }
2912                     /* retval may not neccesarily have reached the start of the
2913                        buffer here.  */
2914                     assert (retval >= buffer);
2915
2916                     len = buffer_end - retval - 1; /* -1 for that \0  */
2917                 }
2918                 if (lp)
2919                     *lp = len;
2920                 SAVEFREEPV(buffer);
2921                 return retval;
2922             }
2923         }
2924         if (SvREADONLY(sv) && !SvOK(sv)) {
2925             if (lp)
2926                 *lp = 0;
2927             if (flags & SV_UNDEF_RETURNS_NULL)
2928                 return NULL;
2929             if (ckWARN(WARN_UNINITIALIZED))
2930                 report_uninit(sv);
2931             return (char *)"";
2932         }
2933     }
2934     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2935         /* I'm assuming that if both IV and NV are equally valid then
2936            converting the IV is going to be more efficient */
2937         const U32 isUIOK = SvIsUV(sv);
2938         char buf[TYPE_CHARS(UV)];
2939         char *ebuf, *ptr;
2940         STRLEN len;
2941
2942         if (SvTYPE(sv) < SVt_PVIV)
2943             sv_upgrade(sv, SVt_PVIV);
2944         ptr = uiv_2buf(buf, SvIVX(sv), SvUVX(sv), isUIOK, &ebuf);
2945         len = ebuf - ptr;
2946         /* inlined from sv_setpvn */
2947         s = SvGROW_mutable(sv, len + 1);
2948         Move(ptr, s, len, char);
2949         s += len;
2950         *s = '\0';
2951     }
2952     else if (SvNOKp(sv)) {
2953         dSAVE_ERRNO;
2954         if (SvTYPE(sv) < SVt_PVNV)
2955             sv_upgrade(sv, SVt_PVNV);
2956         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2957         s = SvGROW_mutable(sv, NV_DIG + 20);
2958         /* some Xenix systems wipe out errno here */
2959 #ifdef apollo
2960         if (SvNVX(sv) == 0.0)
2961             my_strlcpy(s, "0", SvLEN(sv));
2962         else
2963 #endif /*apollo*/
2964         {
2965             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2966         }
2967         RESTORE_ERRNO;
2968 #ifdef FIXNEGATIVEZERO
2969         if (*s == '-' && s[1] == '0' && !s[2]) {
2970             s[0] = '0';
2971             s[1] = 0;
2972         }
2973 #endif
2974         while (*s) s++;
2975 #ifdef hcx
2976         if (s[-1] == '.')
2977             *--s = '\0';
2978 #endif
2979     }
2980     else {
2981         if (isGV_with_GP(sv)) {
2982             GV *const gv = MUTABLE_GV(sv);
2983             const U32 wasfake = SvFLAGS(gv) & SVf_FAKE;
2984             SV *const buffer = sv_newmortal();
2985
2986             /* FAKE globs can get coerced, so need to turn this off temporarily
2987                if it is on.  */
2988             SvFAKE_off(gv);
2989             gv_efullname3(buffer, gv, "*");
2990             SvFLAGS(gv) |= wasfake;
2991
2992             if (SvPOK(buffer)) {
2993                 if (lp) {
2994                     *lp = SvCUR(buffer);
2995                 }
2996                 return SvPVX(buffer);
2997             }
2998             else {
2999                 if (lp)
3000                     *lp = 0;
3001                 return (char *)"";
3002             }
3003         }
3004
3005         if (lp)
3006             *lp = 0;
3007         if (flags & SV_UNDEF_RETURNS_NULL)
3008             return NULL;
3009         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
3010             report_uninit(sv);
3011         if (SvTYPE(sv) < SVt_PV)
3012             /* Typically the caller expects that sv_any is not NULL now.  */
3013             sv_upgrade(sv, SVt_PV);
3014         return (char *)"";
3015     }
3016     {
3017         const STRLEN len = s - SvPVX_const(sv);
3018         if (lp) 
3019             *lp = len;
3020         SvCUR_set(sv, len);
3021     }
3022     SvPOK_on(sv);
3023     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
3024                           PTR2UV(sv),SvPVX_const(sv)));
3025     if (flags & SV_CONST_RETURN)
3026         return (char *)SvPVX_const(sv);
3027     if (flags & SV_MUTABLE_RETURN)
3028         return SvPVX_mutable(sv);
3029     return SvPVX(sv);
3030 }
3031
3032 /*
3033 =for apidoc sv_copypv
3034
3035 Copies a stringified representation of the source SV into the
3036 destination SV.  Automatically performs any necessary mg_get and
3037 coercion of numeric values into strings.  Guaranteed to preserve
3038 UTF8 flag even from overloaded objects.  Similar in nature to
3039 sv_2pv[_flags] but operates directly on an SV instead of just the
3040 string.  Mostly uses sv_2pv_flags to do its work, except when that
3041 would lose the UTF-8'ness of the PV.
3042
3043 =cut
3044 */
3045
3046 void
3047 Perl_sv_copypv(pTHX_ SV *const dsv, register SV *const ssv)
3048 {
3049     STRLEN len;
3050     const char * const s = SvPV_const(ssv,len);
3051
3052     PERL_ARGS_ASSERT_SV_COPYPV;
3053
3054     sv_setpvn(dsv,s,len);
3055     if (SvUTF8(ssv))
3056         SvUTF8_on(dsv);
3057     else
3058         SvUTF8_off(dsv);
3059 }
3060
3061 /*
3062 =for apidoc sv_2pvbyte
3063
3064 Return a pointer to the byte-encoded representation of the SV, and set *lp
3065 to its length.  May cause the SV to be downgraded from UTF-8 as a
3066 side-effect.
3067
3068 Usually accessed via the C<SvPVbyte> macro.
3069
3070 =cut
3071 */
3072
3073 char *
3074 Perl_sv_2pvbyte(pTHX_ register SV *const sv, STRLEN *const lp)
3075 {
3076     PERL_ARGS_ASSERT_SV_2PVBYTE;
3077
3078     sv_utf8_downgrade(sv,0);
3079     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
3080 }
3081
3082 /*
3083 =for apidoc sv_2pvutf8
3084
3085 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
3086 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
3087
3088 Usually accessed via the C<SvPVutf8> macro.
3089
3090 =cut
3091 */
3092
3093 char *
3094 Perl_sv_2pvutf8(pTHX_ register SV *const sv, STRLEN *const lp)
3095 {
3096     PERL_ARGS_ASSERT_SV_2PVUTF8;
3097
3098     sv_utf8_upgrade(sv);
3099     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
3100 }
3101
3102
3103 /*
3104 =for apidoc sv_2bool
3105
3106 This function is only called on magical items, and is only used by
3107 sv_true() or its macro equivalent.
3108
3109 =cut
3110 */
3111
3112 bool
3113 Perl_sv_2bool(pTHX_ register SV *const sv)
3114 {
3115     dVAR;
3116
3117     PERL_ARGS_ASSERT_SV_2BOOL;
3118
3119     SvGETMAGIC(sv);
3120
3121     if (!SvOK(sv))
3122         return 0;
3123     if (SvROK(sv)) {
3124         if (SvAMAGIC(sv)) {
3125             SV * const tmpsv = AMG_CALLun(sv,bool_);
3126             if (tmpsv && (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
3127                 return (bool)SvTRUE(tmpsv);
3128         }
3129         return SvRV(sv) != 0;
3130     }
3131     if (SvPOKp(sv)) {
3132         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
3133         if (Xpvtmp &&
3134                 (*sv->sv_u.svu_pv > '0' ||
3135                 Xpvtmp->xpv_cur > 1 ||
3136                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
3137             return 1;
3138         else
3139             return 0;
3140     }
3141     else {
3142         if (SvIOKp(sv))
3143             return SvIVX(sv) != 0;
3144         else {
3145             if (SvNOKp(sv))
3146                 return SvNVX(sv) != 0.0;
3147             else {
3148                 if (isGV_with_GP(sv))
3149                     return TRUE;
3150                 else
3151                     return FALSE;
3152             }
3153         }
3154     }
3155 }
3156
3157 /*
3158 =for apidoc sv_utf8_upgrade
3159
3160 Converts the PV of an SV to its UTF-8-encoded form.
3161 Forces the SV to string form if it is not already.
3162 Will C<mg_get> on C<sv> if appropriate.
3163 Always sets the SvUTF8 flag to avoid future validity checks even
3164 if the whole string is the same in UTF-8 as not.
3165 Returns the number of bytes in the converted string
3166
3167 This is not as a general purpose byte encoding to Unicode interface:
3168 use the Encode extension for that.
3169
3170 =for apidoc sv_utf8_upgrade_nomg
3171
3172 Like sv_utf8_upgrade, but doesn't do magic on C<sv>
3173
3174 =for apidoc sv_utf8_upgrade_flags
3175
3176 Converts the PV of an SV to its UTF-8-encoded form.
3177 Forces the SV to string form if it is not already.
3178 Always sets the SvUTF8 flag to avoid future validity checks even
3179 if all the bytes are invariant in UTF-8. If C<flags> has C<SV_GMAGIC> bit set,
3180 will C<mg_get> on C<sv> if appropriate, else not.
3181 Returns the number of bytes in the converted string
3182 C<sv_utf8_upgrade> and
3183 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
3184
3185 This is not as a general purpose byte encoding to Unicode interface:
3186 use the Encode extension for that.
3187
3188 =cut
3189
3190 The grow version is currently not externally documented.  It adds a parameter,
3191 extra, which is the number of unused bytes the string of 'sv' is guaranteed to
3192 have free after it upon return.  This allows the caller to reserve extra space
3193 that it intends to fill, to avoid extra grows.
3194
3195 Also externally undocumented for the moment is the flag SV_FORCE_UTF8_UPGRADE,
3196 which can be used to tell this function to not first check to see if there are
3197 any characters that are different in UTF-8 (variant characters) which would
3198 force it to allocate a new string to sv, but to assume there are.  Typically
3199 this flag is used by a routine that has already parsed the string to find that
3200 there are such characters, and passes this information on so that the work
3201 doesn't have to be repeated.
3202
3203 (One might think that the calling routine could pass in the position of the
3204 first such variant, so it wouldn't have to be found again.  But that is not the
3205 case, because typically when the caller is likely to use this flag, it won't be
3206 calling this routine unless it finds something that won't fit into a byte.
3207 Otherwise it tries to not upgrade and just use bytes.  But some things that
3208 do fit into a byte are variants in utf8, and the caller may not have been
3209 keeping track of these.)
3210
3211 If the routine itself changes the string, it adds a trailing NUL.  Such a NUL
3212 isn't guaranteed due to having other routines do the work in some input cases,
3213 or if the input is already flagged as being in utf8.
3214
3215 The speed of this could perhaps be improved for many cases if someone wanted to
3216 write a fast function that counts the number of variant characters in a string,
3217 especially if it could return the position of the first one.
3218
3219 */
3220
3221 STRLEN
3222 Perl_sv_utf8_upgrade_flags_grow(pTHX_ register SV *const sv, const I32 flags, STRLEN extra)
3223 {
3224     dVAR;
3225
3226     PERL_ARGS_ASSERT_SV_UTF8_UPGRADE_FLAGS_GROW;
3227
3228     if (sv == &PL_sv_undef)
3229         return 0;
3230     if (!SvPOK(sv)) {
3231         STRLEN len = 0;
3232         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
3233             (void) sv_2pv_flags(sv,&len, flags);
3234             if (SvUTF8(sv)) {
3235                 if (extra) SvGROW(sv, SvCUR(sv) + extra);
3236                 return len;
3237             }
3238         } else {
3239             (void) SvPV_force(sv,len);
3240         }
3241     }
3242
3243     if (SvUTF8(sv)) {
3244         if (extra) SvGROW(sv, SvCUR(sv) + extra);
3245         return SvCUR(sv);
3246     }
3247
3248     if (SvIsCOW(sv)) {
3249         sv_force_normal_flags(sv, 0);
3250     }
3251
3252     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING)) {
3253         sv_recode_to_utf8(sv, PL_encoding);
3254         if (extra) SvGROW(sv, SvCUR(sv) + extra);
3255         return SvCUR(sv);
3256     }
3257
3258     if (SvCUR(sv) == 0) {
3259         if (extra) SvGROW(sv, extra);
3260     } else { /* Assume Latin-1/EBCDIC */
3261         /* This function could be much more efficient if we
3262          * had a FLAG in SVs to signal if there are any variant
3263          * chars in the PV.  Given that there isn't such a flag
3264          * make the loop as fast as possible (although there are certainly ways
3265          * to speed this up, eg. through vectorization) */
3266         U8 * s = (U8 *) SvPVX_const(sv);
3267         U8 * e = (U8 *) SvEND(sv);
3268         U8 *t = s;
3269         STRLEN two_byte_count = 0;
3270         
3271         if (flags & SV_FORCE_UTF8_UPGRADE) goto must_be_utf8;
3272
3273         /* See if really will need to convert to utf8.  We mustn't rely on our
3274          * incoming SV being well formed and having a trailing '\0', as certain
3275          * code in pp_formline can send us partially built SVs. */
3276
3277         while (t < e) {
3278             const U8 ch = *t++;
3279             if (NATIVE_IS_INVARIANT(ch)) continue;
3280
3281             t--;    /* t already incremented; re-point to first variant */
3282             two_byte_count = 1;
3283             goto must_be_utf8;
3284         }
3285
3286         /* utf8 conversion not needed because all are invariants.  Mark as
3287          * UTF-8 even if no variant - saves scanning loop */
3288         SvUTF8_on(sv);
3289         return SvCUR(sv);
3290
3291 must_be_utf8:
3292
3293         /* Here, the string should be converted to utf8, either because of an
3294          * input flag (two_byte_count = 0), or because a character that
3295          * requires 2 bytes was found (two_byte_count = 1).  t points either to
3296          * the beginning of the string (if we didn't examine anything), or to
3297          * the first variant.  In either case, everything from s to t - 1 will
3298          * occupy only 1 byte each on output.
3299          *
3300          * There are two main ways to convert.  One is to create a new string
3301          * and go through the input starting from the beginning, appending each
3302          * converted value onto the new string as we go along.  It's probably
3303          * best to allocate enough space in the string for the worst possible
3304          * case rather than possibly running out of space and having to
3305          * reallocate and then copy what we've done so far.  Since everything
3306          * from s to t - 1 is invariant, the destination can be initialized
3307          * with these using a fast memory copy
3308          *
3309          * The other way is to figure out exactly how big the string should be
3310          * by parsing the entire input.  Then you don't have to make it big
3311          * enough to handle the worst possible case, and more importantly, if
3312          * the string you already have is large enough, you don't have to
3313          * allocate a new string, you can copy the last character in the input
3314          * string to the final position(s) that will be occupied by the
3315          * converted string and go backwards, stopping at t, since everything
3316          * before that is invariant.
3317          *
3318          * There are advantages and disadvantages to each method.
3319          *
3320          * In the first method, we can allocate a new string, do the memory
3321          * copy from the s to t - 1, and then proceed through the rest of the
3322          * string byte-by-byte.
3323          *
3324          * In the second method, we proceed through the rest of the input
3325          * string just calculating how big the converted string will be.  Then
3326          * there are two cases:
3327          *  1)  if the string has enough extra space to handle the converted
3328          *      value.  We go backwards through the string, converting until we
3329          *      get to the position we are at now, and then stop.  If this
3330          *      position is far enough along in the string, this method is
3331          *      faster than the other method.  If the memory copy were the same
3332          *      speed as the byte-by-byte loop, that position would be about
3333          *      half-way, as at the half-way mark, parsing to the end and back
3334          *      is one complete string's parse, the same amount as starting
3335          *      over and going all the way through.  Actually, it would be
3336          *      somewhat less than half-way, as it's faster to just count bytes
3337          *      than to also copy, and we don't have the overhead of allocating
3338          *      a new string, changing the scalar to use it, and freeing the
3339          *      existing one.  But if the memory copy is fast, the break-even
3340          *      point is somewhere after half way.  The counting loop could be
3341          *      sped up by vectorization, etc, to move the break-even point
3342          *      further towards the beginning.
3343          *  2)  if the string doesn't have enough space to handle the converted
3344          *      value.  A new string will have to be allocated, and one might
3345          *      as well, given that, start from the beginning doing the first
3346          *      method.  We've spent extra time parsing the string and in
3347          *      exchange all we've gotten is that we know precisely how big to
3348          *      make the new one.  Perl is more optimized for time than space,
3349          *      so this case is a loser.
3350          * So what I've decided to do is not use the 2nd method unless it is
3351          * guaranteed that a new string won't have to be allocated, assuming
3352          * the worst case.  I also decided not to put any more conditions on it
3353          * than this, for now.  It seems likely that, since the worst case is
3354          * twice as big as the unknown portion of the string (plus 1), we won't
3355          * be guaranteed enough space, causing us to go to the first method,
3356          * unless the string is short, or the first variant character is near
3357          * the end of it.  In either of these cases, it seems best to use the
3358          * 2nd method.  The only circumstance I can think of where this would
3359          * be really slower is if the string had once had much more data in it
3360          * than it does now, but there is still a substantial amount in it  */
3361
3362         {
3363             STRLEN invariant_head = t - s;
3364             STRLEN size = invariant_head + (e - t) * 2 + 1 + extra;
3365             if (SvLEN(sv) < size) {
3366
3367                 /* Here, have decided to allocate a new string */
3368
3369                 U8 *dst;
3370                 U8 *d;
3371
3372                 Newx(dst, size, U8);
3373
3374                 /* If no known invariants at the beginning of the input string,
3375                  * set so starts from there.  Otherwise, can use memory copy to
3376                  * get up to where we are now, and then start from here */
3377
3378                 if (invariant_head <= 0) {
3379                     d = dst;
3380                 } else {
3381                     Copy(s, dst, invariant_head, char);
3382                     d = dst + invariant_head;
3383                 }
3384
3385                 while (t < e) {
3386                     const UV uv = NATIVE8_TO_UNI(*t++);
3387                     if (UNI_IS_INVARIANT(uv))
3388                         *d++ = (U8)UNI_TO_NATIVE(uv);
3389                     else {
3390                         *d++ = (U8)UTF8_EIGHT_BIT_HI(uv);
3391                         *d++ = (U8)UTF8_EIGHT_BIT_LO(uv);
3392                     }
3393                 }
3394                 *d = '\0';
3395                 SvPV_free(sv); /* No longer using pre-existing string */
3396                 SvPV_set(sv, (char*)dst);
3397                 SvCUR_set(sv, d - dst);
3398                 SvLEN_set(sv, size);
3399             } else {
3400
3401                 /* Here, have decided to get the exact size of the string.
3402                  * Currently this happens only when we know that there is
3403                  * guaranteed enough space to fit the converted string, so
3404                  * don't have to worry about growing.  If two_byte_count is 0,
3405                  * then t points to the first byte of the string which hasn't
3406                  * been examined yet.  Otherwise two_byte_count is 1, and t
3407                  * points to the first byte in the string that will expand to
3408                  * two.  Depending on this, start examining at t or 1 after t.
3409                  * */
3410
3411                 U8 *d = t + two_byte_count;
3412
3413
3414                 /* Count up the remaining bytes that expand to two */
3415
3416                 while (d < e) {
3417                     const U8 chr = *d++;
3418                     if (! NATIVE_IS_INVARIANT(chr)) two_byte_count++;
3419                 }
3420
3421                 /* The string will expand by just the number of bytes that
3422                  * occupy two positions.  But we are one afterwards because of
3423                  * the increment just above.  This is the place to put the
3424                  * trailing NUL, and to set the length before we decrement */
3425
3426                 d += two_byte_count;
3427                 SvCUR_set(sv, d - s);
3428                 *d-- = '\0';
3429
3430
3431                 /* Having decremented d, it points to the position to put the
3432                  * very last byte of the expanded string.  Go backwards through
3433                  * the string, copying and expanding as we go, stopping when we
3434                  * get to the part that is invariant the rest of the way down */
3435
3436                 e--;
3437                 while (e >= t) {
3438                     const U8 ch = NATIVE8_TO_UNI(*e--);
3439                     if (UNI_IS_INVARIANT(ch)) {
3440                         *d-- = UNI_TO_NATIVE(ch);
3441                     } else {
3442                         *d-- = (U8)UTF8_EIGHT_BIT_LO(ch);
3443                         *d-- = (U8)UTF8_EIGHT_BIT_HI(ch);
3444                     }
3445                 }
3446             }
3447         }
3448     }
3449
3450     /* Mark as UTF-8 even if no variant - saves scanning loop */
3451     SvUTF8_on(sv);
3452     return SvCUR(sv);
3453 }
3454
3455 /*
3456 =for apidoc sv_utf8_downgrade
3457
3458 Attempts to convert the PV of an SV from characters to bytes.
3459 If the PV contains a character that cannot fit
3460 in a byte, this conversion will fail;
3461 in this case, either returns false or, if C<fail_ok> is not
3462 true, croaks.
3463
3464 This is not as a general purpose Unicode to byte encoding interface:
3465 use the Encode extension for that.
3466
3467 =cut
3468 */
3469
3470 bool
3471 Perl_sv_utf8_downgrade(pTHX_ register SV *const sv, const bool fail_ok)
3472 {
3473     dVAR;
3474
3475     PERL_ARGS_ASSERT_SV_UTF8_DOWNGRADE;
3476
3477     if (SvPOKp(sv) && SvUTF8(sv)) {
3478         if (SvCUR(sv)) {
3479             U8 *s;
3480             STRLEN len;
3481
3482             if (SvIsCOW(sv)) {
3483                 sv_force_normal_flags(sv, 0);
3484             }
3485             s = (U8 *) SvPV(sv, len);
3486             if (!utf8_to_bytes(s, &len)) {
3487                 if (fail_ok)
3488                     return FALSE;
3489                 else {
3490                     if (PL_op)
3491                         Perl_croak(aTHX_ "Wide character in %s",
3492                                    OP_DESC(PL_op));
3493                     else
3494                         Perl_croak(aTHX_ "Wide character");
3495                 }
3496             }
3497             SvCUR_set(sv, len);
3498         }
3499     }
3500     SvUTF8_off(sv);
3501     return TRUE;
3502 }
3503
3504 /*
3505 =for apidoc sv_utf8_encode
3506
3507 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
3508 flag off so that it looks like octets again.
3509
3510 =cut
3511 */
3512
3513 void
3514 Perl_sv_utf8_encode(pTHX_ register SV *const sv)
3515 {
3516     PERL_ARGS_ASSERT_SV_UTF8_ENCODE;
3517
3518     if (SvIsCOW(sv)) {
3519         sv_force_normal_flags(sv, 0);
3520     }
3521     if (SvREADONLY(sv)) {
3522         Perl_croak(aTHX_ "%s", PL_no_modify);
3523     }
3524     (void) sv_utf8_upgrade(sv);
3525     SvUTF8_off(sv);
3526 }
3527
3528 /*
3529 =for apidoc sv_utf8_decode
3530
3531 If the PV of the SV is an octet sequence in UTF-8
3532 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
3533 so that it looks like a character. If the PV contains only single-byte
3534 characters, the C<SvUTF8> flag stays being off.
3535 Scans PV for validity and returns false if the PV is invalid UTF-8.
3536
3537 =cut
3538 */
3539
3540 bool
3541 Perl_sv_utf8_decode(pTHX_ register SV *const sv)
3542 {
3543     PERL_ARGS_ASSERT_SV_UTF8_DECODE;
3544
3545     if (SvPOKp(sv)) {
3546         const U8 *c;
3547         const U8 *e;
3548
3549         /* The octets may have got themselves encoded - get them back as
3550          * bytes
3551          */
3552         if (!sv_utf8_downgrade(sv, TRUE))
3553             return FALSE;
3554
3555         /* it is actually just a matter of turning the utf8 flag on, but
3556          * we want to make sure everything inside is valid utf8 first.
3557          */
3558         c = (const U8 *) SvPVX_const(sv);
3559         if (!is_utf8_string(c, SvCUR(sv)+1))
3560             return FALSE;
3561         e = (const U8 *) SvEND(sv);
3562         while (c < e) {
3563             const U8 ch = *c++;
3564             if (!UTF8_IS_INVARIANT(ch)) {
3565                 SvUTF8_on(sv);
3566                 break;
3567             }
3568         }
3569     }
3570     return TRUE;
3571 }
3572
3573 /*
3574 =for apidoc sv_setsv
3575
3576 Copies the contents of the source SV C<ssv> into the destination SV
3577 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3578 function if the source SV needs to be reused. Does not handle 'set' magic.
3579 Loosely speaking, it performs a copy-by-value, obliterating any previous
3580 content of the destination.
3581
3582 You probably want to use one of the assortment of wrappers, such as
3583 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3584 C<SvSetMagicSV_nosteal>.
3585
3586 =for apidoc sv_setsv_flags
3587
3588 Copies the contents of the source SV C<ssv> into the destination SV
3589 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3590 function if the source SV needs to be reused. Does not handle 'set' magic.
3591 Loosely speaking, it performs a copy-by-value, obliterating any previous
3592 content of the destination.
3593 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
3594 C<ssv> if appropriate, else not. If the C<flags> parameter has the
3595 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
3596 and C<sv_setsv_nomg> are implemented in terms of this function.
3597
3598 You probably want to use one of the assortment of wrappers, such as
3599 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3600 C<SvSetMagicSV_nosteal>.
3601
3602 This is the primary function for copying scalars, and most other
3603 copy-ish functions and macros use this underneath.
3604
3605 =cut
3606 */
3607
3608 static void
3609 S_glob_assign_glob(pTHX_ SV *const dstr, SV *const sstr, const int dtype)
3610 {
3611     I32 mro_changes = 0; /* 1 = method, 2 = isa */
3612
3613     PERL_ARGS_ASSERT_GLOB_ASSIGN_GLOB;
3614
3615     if (dtype != SVt_PVGV) {
3616         const char * const name = GvNAME(sstr);
3617         const STRLEN len = GvNAMELEN(sstr);
3618         {
3619             if (dtype >= SVt_PV) {
3620                 SvPV_free(dstr);
3621                 SvPV_set(dstr, 0);
3622                 SvLEN_set(dstr, 0);
3623                 SvCUR_set(dstr, 0);
3624             }
3625             SvUPGRADE(dstr, SVt_PVGV);
3626             (void)SvOK_off(dstr);
3627             /* FIXME - why are we doing this, then turning it off and on again
3628                below?  */
3629             isGV_with_GP_on(dstr);
3630         }
3631         GvSTASH(dstr) = GvSTASH(sstr);
3632         if (GvSTASH(dstr))
3633             Perl_sv_add_backref(aTHX_ MUTABLE_SV(GvSTASH(dstr)), dstr);
3634         gv_name_set(MUTABLE_GV(dstr), name, len, GV_ADD);
3635         SvFAKE_on(dstr);        /* can coerce to non-glob */
3636     }
3637
3638     if(GvGP(MUTABLE_GV(sstr))) {
3639         /* If source has method cache entry, clear it */
3640         if(GvCVGEN(sstr)) {
3641             SvREFCNT_dec(GvCV(sstr));
3642             GvCV(sstr) = NULL;
3643             GvCVGEN(sstr) = 0;
3644         }
3645         /* If source has a real method, then a method is
3646            going to change */
3647         else if(GvCV((const GV *)sstr)) {
3648             mro_changes = 1;
3649         }
3650     }
3651
3652     /* If dest already had a real method, that's a change as well */
3653     if(!mro_changes && GvGP(MUTABLE_GV(dstr)) && GvCVu((const GV *)dstr)) {
3654         mro_changes = 1;
3655     }
3656
3657     if(strEQ(GvNAME((const GV *)dstr),"ISA"))
3658         mro_changes = 2;
3659
3660     gp_free(MUTABLE_GV(dstr));
3661     isGV_with_GP_off(dstr);
3662     (void)SvOK_off(dstr);
3663     isGV_with_GP_on(dstr);
3664     GvINTRO_off(dstr);          /* one-shot flag */
3665     GvGP(dstr) = gp_ref(GvGP(sstr));
3666     if (SvTAINTED(sstr))
3667         SvTAINT(dstr);
3668     if (GvIMPORTED(dstr) != GVf_IMPORTED
3669         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3670         {
3671             GvIMPORTED_on(dstr);
3672         }
3673     GvMULTI_on(dstr);
3674     if(mro_changes == 2) mro_isa_changed_in(GvSTASH(dstr));
3675     else if(mro_changes) mro_method_changed_in(GvSTASH(dstr));
3676     return;
3677 }
3678
3679 static void
3680 S_glob_assign_ref(pTHX_ SV *const dstr, SV *const sstr)
3681 {
3682     SV * const sref = SvREFCNT_inc(SvRV(sstr));
3683     SV *dref = NULL;
3684     const int intro = GvINTRO(dstr);
3685     SV **location;
3686     U8 import_flag = 0;
3687     const U32 stype = SvTYPE(sref);
3688     bool mro_changes = FALSE;
3689
3690     PERL_ARGS_ASSERT_GLOB_ASSIGN_REF;
3691
3692     if (intro) {
3693         GvINTRO_off(dstr);      /* one-shot flag */
3694         GvLINE(dstr) = CopLINE(PL_curcop);
3695         GvEGV(dstr) = MUTABLE_GV(dstr);
3696     }
3697     GvMULTI_on(dstr);
3698     switch (stype) {
3699     case SVt_PVCV:
3700         location = (SV **) &GvCV(dstr);
3701         import_flag = GVf_IMPORTED_CV;
3702         goto common;
3703     case SVt_PVHV:
3704         location = (SV **) &GvHV(dstr);
3705         import_flag = GVf_IMPORTED_HV;
3706         goto common;
3707     case SVt_PVAV:
3708         location = (SV **) &GvAV(dstr);
3709         if (strEQ(GvNAME((GV*)dstr), "ISA"))
3710             mro_changes = TRUE;
3711         import_flag = GVf_IMPORTED_AV;
3712         goto common;
3713     case SVt_PVIO:
3714         location = (SV **) &GvIOp(dstr);
3715         goto common;
3716     case SVt_PVFM:
3717         location = (SV **) &GvFORM(dstr);
3718         goto common;
3719     default:
3720         location = &GvSV(dstr);
3721         import_flag = GVf_IMPORTED_SV;
3722     common:
3723         if (intro) {
3724             if (stype == SVt_PVCV) {
3725                 /*if (GvCVGEN(dstr) && (GvCV(dstr) != (const CV *)sref || GvCVGEN(dstr))) {*/
3726                 if (GvCVGEN(dstr)) {
3727                     SvREFCNT_dec(GvCV(dstr));
3728                     GvCV(dstr) = NULL;
3729                     GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3730                 }
3731             }
3732             SAVEGENERICSV(*location);
3733         }
3734         else
3735             dref = *location;
3736         if (stype == SVt_PVCV && (*location != sref || GvCVGEN(dstr))) {
3737             CV* const cv = MUTABLE_CV(*location);
3738             if (cv) {
3739                 if (!GvCVGEN((const GV *)dstr) &&
3740                     (CvROOT(cv) || CvXSUB(cv)))
3741                     {
3742                         /* Redefining a sub - warning is mandatory if
3743                            it was a const and its value changed. */
3744                         if (CvCONST(cv) && CvCONST((const CV *)sref)
3745                             && cv_const_sv(cv)
3746                             == cv_const_sv((const CV *)sref)) {
3747                             NOOP;
3748                             /* They are 2 constant subroutines generated from
3749                                the same constant. This probably means that
3750                                they are really the "same" proxy subroutine
3751                                instantiated in 2 places. Most likely this is
3752                                when a constant is exported twice.  Don't warn.
3753                             */
3754                         }
3755                         else if (ckWARN(WARN_REDEFINE)
3756                                  || (CvCONST(cv)
3757                                      && (!CvCONST((const CV *)sref)
3758                                          || sv_cmp(cv_const_sv(cv),
3759                                                    cv_const_sv((const CV *)
3760                                                                sref))))) {
3761                             Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3762                                         (const char *)
3763                                         (CvCONST(cv)
3764                                          ? "Constant subroutine %s::%s redefined"
3765                                          : "Subroutine %s::%s redefined"),
3766                                         HvNAME_get(GvSTASH((const GV *)dstr)),
3767                                         GvENAME(MUTABLE_GV(dstr)));
3768                         }
3769                     }
3770                 if (!intro)
3771                     cv_ckproto_len(cv, (const GV *)dstr,
3772                                    SvPOK(sref) ? SvPVX_const(sref) : NULL,
3773                                    SvPOK(sref) ? SvCUR(sref) : 0);
3774             }
3775             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3776             GvASSUMECV_on(dstr);
3777             if(GvSTASH(dstr)) mro_method_changed_in(GvSTASH(dstr)); /* sub foo { 1 } sub bar { 2 } *bar = \&foo */
3778         }
3779         *location = sref;
3780         if (import_flag && !(GvFLAGS(dstr) & import_flag)
3781             && CopSTASH_ne(PL_curcop, GvSTASH(dstr))) {
3782             GvFLAGS(dstr) |= import_flag;
3783         }
3784         break;
3785     }
3786     SvREFCNT_dec(dref);
3787     if (SvTAINTED(sstr))
3788         SvTAINT(dstr);
3789     if (mro_changes) mro_isa_changed_in(GvSTASH(dstr));
3790     return;
3791 }
3792
3793 void
3794 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV* sstr, const I32 flags)
3795 {
3796     dVAR;
3797     register U32 sflags;
3798     register int dtype;
3799     register svtype stype;
3800
3801     PERL_ARGS_ASSERT_SV_SETSV_FLAGS;
3802
3803     if (sstr == dstr)
3804         return;
3805
3806     if (SvIS_FREED(dstr)) {
3807         Perl_croak(aTHX_ "panic: attempt to copy value %" SVf
3808                    " to a freed scalar %p", SVfARG(sstr), (void *)dstr);
3809     }
3810     SV_CHECK_THINKFIRST_COW_DROP(dstr);
3811     if (!sstr)
3812         sstr = &PL_sv_undef;
3813     if (SvIS_FREED(sstr)) {
3814         Perl_croak(aTHX_ "panic: attempt to copy freed scalar %p to %p",
3815                    (void*)sstr, (void*)dstr);
3816     }
3817     stype = SvTYPE(sstr);
3818     dtype = SvTYPE(dstr);
3819
3820     (void)SvAMAGIC_off(dstr);
3821     if ( SvVOK(dstr) )
3822     {
3823         /* need to nuke the magic */
3824         mg_free(dstr);
3825     }
3826
3827     /* There's a lot of redundancy below but we're going for speed here */
3828
3829     switch (stype) {
3830     case SVt_NULL:
3831       undef_sstr:
3832         if (dtype != SVt_PVGV) {
3833             (void)SvOK_off(dstr);
3834             return;
3835         }
3836         break;
3837     case SVt_IV:
3838         if (SvIOK(sstr)) {
3839             switch (dtype) {
3840             case SVt_NULL:
3841                 sv_upgrade(dstr, SVt_IV);
3842                 break;
3843             case SVt_NV:
3844             case SVt_PV:
3845                 sv_upgrade(dstr, SVt_PVIV);
3846                 break;
3847             case SVt_PVGV:
3848                 goto end_of_first_switch;
3849             }
3850             (void)SvIOK_only(dstr);
3851             SvIV_set(dstr,  SvIVX(sstr));
3852             if (SvIsUV(sstr))
3853                 SvIsUV_on(dstr);
3854             /* SvTAINTED can only be true if the SV has taint magic, which in
3855                turn means that the SV type is PVMG (or greater). This is the
3856                case statement for SVt_IV, so this cannot be true (whatever gcov
3857                may say).  */
3858             assert(!SvTAINTED(sstr));
3859             return;
3860         }
3861         if (!SvROK(sstr))
3862             goto undef_sstr;
3863         if (dtype < SVt_PV && dtype != SVt_IV)
3864             sv_upgrade(dstr, SVt_IV);
3865         break;
3866
3867     case SVt_NV:
3868         if (SvNOK(sstr)) {
3869             switch (dtype) {
3870             case SVt_NULL:
3871             case SVt_IV:
3872                 sv_upgrade(dstr, SVt_NV);
3873                 break;
3874             case SVt_PV:
3875             case SVt_PVIV:
3876                 sv_upgrade(dstr, SVt_PVNV);
3877                 break;
3878             case SVt_PVGV:
3879                 goto end_of_first_switch;
3880             }
3881             SvNV_set(dstr, SvNVX(sstr));
3882             (void)SvNOK_only(dstr);
3883             /* SvTAINTED can only be true if the SV has taint magic, which in
3884                turn means that the SV type is PVMG (or greater). This is the
3885                case statement for SVt_NV, so this cannot be true (whatever gcov
3886                may say).  */
3887             assert(!SvTAINTED(sstr));
3888             return;
3889         }
3890         goto undef_sstr;
3891
3892     case SVt_PVFM:
3893 #ifdef PERL_OLD_COPY_ON_WRITE
3894         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3895             if (dtype < SVt_PVIV)
3896                 sv_upgrade(dstr, SVt_PVIV);
3897             break;
3898         }
3899         /* Fall through */
3900 #endif
3901     case SVt_PV:
3902         if (dtype < SVt_PV)
3903             sv_upgrade(dstr, SVt_PV);
3904         break;
3905     case SVt_PVIV:
3906         if (dtype < SVt_PVIV)
3907             sv_upgrade(dstr, SVt_PVIV);
3908         break;
3909     case SVt_PVNV:
3910         if (dtype < SVt_PVNV)
3911             sv_upgrade(dstr, SVt_PVNV);
3912         break;
3913     default:
3914         {
3915         const char * const type = sv_reftype(sstr,0);
3916         if (PL_op)
3917             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3918         else
3919             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3920         }
3921         break;
3922
3923     case SVt_REGEXP:
3924         if (dtype < SVt_REGEXP)
3925             sv_upgrade(dstr, SVt_REGEXP);
3926         break;
3927
3928         /* case SVt_BIND: */
3929     case SVt_PVLV:
3930     case SVt_PVGV:
3931         if (isGV_with_GP(sstr) && dtype <= SVt_PVGV) {
3932             glob_assign_glob(dstr, sstr, dtype);
3933             return;
3934         }
3935         /* SvVALID means that this PVGV is playing at being an FBM.  */
3936         /*FALLTHROUGH*/
3937
3938     case SVt_PVMG:
3939         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3940             mg_get(sstr);
3941             if (SvTYPE(sstr) != stype) {
3942                 stype = SvTYPE(sstr);
3943                 if (isGV_with_GP(sstr) && stype == SVt_PVGV && dtype <= SVt_PVGV) {
3944                     glob_assign_glob(dstr, sstr, dtype);
3945                     return;
3946                 }
3947             }
3948         }
3949         if (stype == SVt_PVLV)
3950             SvUPGRADE(dstr, SVt_PVNV);
3951         else
3952             SvUPGRADE(dstr, (svtype)stype);
3953     }
3954  end_of_first_switch:
3955
3956     /* dstr may have been upgraded.  */
3957     dtype = SvTYPE(dstr);
3958     sflags = SvFLAGS(sstr);
3959
3960     if (dtype == SVt_PVCV || dtype == SVt_PVFM) {
3961         /* Assigning to a subroutine sets the prototype.  */
3962         if (SvOK(sstr)) {
3963             STRLEN len;
3964             const char *const ptr = SvPV_const(sstr, len);
3965
3966             SvGROW(dstr, len + 1);
3967             Copy(ptr, SvPVX(dstr), len + 1, char);
3968             SvCUR_set(dstr, len);
3969             SvPOK_only(dstr);
3970             SvFLAGS(dstr) |= sflags & SVf_UTF8;
3971         } else {
3972             SvOK_off(dstr);
3973         }
3974     } else if (dtype == SVt_PVAV || dtype == SVt_PVHV) {
3975         const char * const type = sv_reftype(dstr,0);
3976         if (PL_op)
3977             Perl_croak(aTHX_ "Cannot copy to %s in %s", type, OP_NAME(PL_op));
3978         else
3979             Perl_croak(aTHX_ "Cannot copy to %s", type);
3980     } else if (sflags & SVf_ROK) {
3981         if (isGV_with_GP(dstr) && dtype == SVt_PVGV
3982             && SvTYPE(SvRV(sstr)) == SVt_PVGV && isGV_with_GP(SvRV(sstr))) {
3983             sstr = SvRV(sstr);
3984             if (sstr == dstr) {
3985                 if (GvIMPORTED(dstr) != GVf_IMPORTED
3986                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3987                 {
3988                     GvIMPORTED_on(dstr);
3989                 }
3990                 GvMULTI_on(dstr);
3991                 return;
3992             }
3993             glob_assign_glob(dstr, sstr, dtype);
3994             return;
3995         }
3996
3997         if (dtype >= SVt_PV) {
3998             if (dtype == SVt_PVGV && isGV_with_GP(dstr)) {
3999                 glob_assign_ref(dstr, sstr);
4000                 return;
4001             }
4002             if (SvPVX_const(dstr)) {
4003                 SvPV_free(dstr);
4004                 SvLEN_set(dstr, 0);
4005                 SvCUR_set(dstr, 0);
4006             }
4007         }
4008         (void)SvOK_off(dstr);
4009         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
4010         SvFLAGS(dstr) |= sflags & SVf_ROK;
4011         assert(!(sflags & SVp_NOK));
4012         assert(!(sflags & SVp_IOK));
4013         assert(!(sflags & SVf_NOK));
4014         assert(!(sflags & SVf_IOK));
4015     }
4016     else if (dtype == SVt_PVGV && isGV_with_GP(dstr)) {
4017         if (!(sflags & SVf_OK)) {
4018             Perl_ck_warner(aTHX_ packWARN(WARN_MISC),
4019                            "Undefined value assigned to typeglob");
4020         }
4021         else {
4022             GV *gv = gv_fetchsv(sstr, GV_ADD, SVt_PVGV);
4023             if (dstr != (const SV *)gv) {
4024                 if (GvGP(dstr))
4025                     gp_free(MUTABLE_GV(dstr));
4026                 GvGP(dstr) = gp_ref(GvGP(gv));
4027             }
4028         }
4029     }
4030     else if (dtype == SVt_REGEXP && stype == SVt_REGEXP) {
4031         reg_temp_copy((REGEXP*)dstr, (REGEXP*)sstr);
4032     }
4033     else if (sflags & SVp_POK) {
4034         bool isSwipe = 0;
4035
4036         /*
4037          * Check to see if we can just swipe the string.  If so, it's a
4038          * possible small lose on short strings, but a big win on long ones.
4039          * It might even be a win on short strings if SvPVX_const(dstr)
4040          * has to be allocated and SvPVX_const(sstr) has to be freed.
4041          * Likewise if we can set up COW rather than doing an actual copy, we
4042          * drop to the else clause, as the swipe code and the COW setup code
4043          * have much in common.
4044          */
4045
4046         /* Whichever path we take through the next code, we want this true,
4047            and doing it now facilitates the COW check.  */
4048         (void)SvPOK_only(dstr);
4049
4050         if (
4051             /* If we're already COW then this clause is not true, and if COW
4052                is allowed then we drop down to the else and make dest COW 
4053                with us.  If caller hasn't said that we're allowed to COW
4054                shared hash keys then we don't do the COW setup, even if the
4055                source scalar is a shared hash key scalar.  */
4056             (((flags & SV_COW_SHARED_HASH_KEYS)
4057                ? (sflags & (SVf_FAKE|SVf_READONLY)) != (SVf_FAKE|SVf_READONLY)
4058                : 1 /* If making a COW copy is forbidden then the behaviour we
4059                        desire is as if the source SV isn't actually already
4060                        COW, even if it is.  So we act as if the source flags
4061                        are not COW, rather than actually testing them.  */
4062               )
4063 #ifndef PERL_OLD_COPY_ON_WRITE
4064              /* The change that added SV_COW_SHARED_HASH_KEYS makes the logic
4065                 when PERL_OLD_COPY_ON_WRITE is defined a little wrong.
4066                 Conceptually PERL_OLD_COPY_ON_WRITE being defined should
4067                 override SV_COW_SHARED_HASH_KEYS, because it means "always COW"
4068                 but in turn, it's somewhat dead code, never expected to go
4069                 live, but more kept as a placeholder on how to do it better
4070                 in a newer implementation.  */
4071              /* If we are COW and dstr is a suitable target then we drop down
4072                 into the else and make dest a COW of us.  */
4073              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
4074 #endif
4075              )
4076             &&
4077             !(isSwipe =
4078                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
4079                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
4080                  (!(flags & SV_NOSTEAL)) &&
4081                                         /* and we're allowed to steal temps */
4082                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
4083                  SvLEN(sstr)    &&        /* and really is a string */
4084                                 /* and won't be needed again, potentially */
4085               !(PL_op && PL_op->op_type == OP_AASSIGN))
4086 #ifdef PERL_OLD_COPY_ON_WRITE
4087             && ((flags & SV_COW_SHARED_HASH_KEYS)
4088                 ? (!((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
4089                      && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
4090                      && SvTYPE(sstr) >= SVt_PVIV && SvTYPE(sstr) != SVt_PVFM))
4091                 : 1)
4092 #endif
4093             ) {
4094             /* Failed the swipe test, and it's not a shared hash key either.
4095                Have to copy the string.  */
4096             STRLEN len = SvCUR(sstr);
4097             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
4098             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
4099             SvCUR_set(dstr, len);
4100             *SvEND(dstr) = '\0';
4101         } else {
4102             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
4103                be true in here.  */
4104             /* Either it's a shared hash key, or it's suitable for
4105                copy-on-write or we can swipe the string.  */
4106             if (DEBUG_C_TEST) {
4107                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
4108                 sv_dump(sstr);
4109                 sv_dump(dstr);
4110             }
4111 #ifdef PERL_OLD_COPY_ON_WRITE
4112             if (!isSwipe) {
4113                 if ((sflags & (SVf_FAKE | SVf_READONLY))
4114                     != (SVf_FAKE | SVf_READONLY)) {
4115                     SvREADONLY_on(sstr);
4116                     SvFAKE_on(sstr);
4117                     /* Make the source SV into a loop of 1.
4118                        (about to become 2) */
4119                     SV_COW_NEXT_SV_SET(sstr, sstr);
4120                 }
4121             }
4122 #endif
4123             /* Initial code is common.  */
4124             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
4125                 SvPV_free(dstr);
4126             }
4127
4128             if (!isSwipe) {
4129                 /* making another shared SV.  */
4130                 STRLEN cur = SvCUR(sstr);
4131                 STRLEN len = SvLEN(sstr);
4132 #ifdef PERL_OLD_COPY_ON_WRITE
4133                 if (len) {
4134                     assert (SvTYPE(dstr) >= SVt_PVIV);
4135                     /* SvIsCOW_normal */
4136                     /* splice us in between source and next-after-source.  */
4137                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
4138                     SV_COW_NEXT_SV_SET(sstr, dstr);
4139                     SvPV_set(dstr, SvPVX_mutable(sstr));
4140                 } else
4141 #endif
4142                 {
4143                     /* SvIsCOW_shared_hash */
4144                     DEBUG_C(PerlIO_printf(Perl_debug_log,
4145                                           "Copy on write: Sharing hash\n"));
4146
4147                     assert (SvTYPE(dstr) >= SVt_PV);
4148                     SvPV_set(dstr,
4149                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
4150                 }
4151                 SvLEN_set(dstr, len);
4152                 SvCUR_set(dstr, cur);
4153                 SvREADONLY_on(dstr);
4154                 SvFAKE_on(dstr);
4155             }
4156             else
4157                 {       /* Passes the swipe test.  */
4158                 SvPV_set(dstr, SvPVX_mutable(sstr));
4159                 SvLEN_set(dstr, SvLEN(sstr));
4160                 SvCUR_set(dstr, SvCUR(sstr));
4161
4162                 SvTEMP_off(dstr);
4163                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
4164                 SvPV_set(sstr, NULL);
4165                 SvLEN_set(sstr, 0);
4166                 SvCUR_set(sstr, 0);
4167                 SvTEMP_off(sstr);
4168             }
4169         }
4170         if (sflags & SVp_NOK) {
4171             SvNV_set(dstr, SvNVX(sstr));
4172         }
4173         if (sflags & SVp_IOK) {
4174             SvIV_set(dstr, SvIVX(sstr));
4175             /* Must do this otherwise some other overloaded use of 0x80000000
4176                gets confused. I guess SVpbm_VALID */
4177             if (sflags & SVf_IVisUV)
4178                 SvIsUV_on(dstr);
4179         }
4180         SvFLAGS(dstr) |= sflags & (SVf_IOK|SVp_IOK|SVf_NOK|SVp_NOK|SVf_UTF8);
4181         {
4182             const MAGIC * const smg = SvVSTRING_mg(sstr);
4183             if (smg) {
4184                 sv_magic(dstr, NULL, PERL_MAGIC_vstring,
4185                          smg->mg_ptr, smg->mg_len);
4186                 SvRMAGICAL_on(dstr);
4187             }
4188         }
4189     }
4190     else if (sflags & (SVp_IOK|SVp_NOK)) {
4191         (void)SvOK_off(dstr);
4192         SvFLAGS(dstr) |= sflags & (SVf_IOK|SVp_IOK|SVf_IVisUV|SVf_NOK|SVp_NOK);
4193         if (sflags & SVp_IOK) {
4194             /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
4195             SvIV_set(dstr, SvIVX(sstr));
4196         }
4197         if (sflags & SVp_NOK) {
4198             SvNV_set(dstr, SvNVX(sstr));
4199         }
4200     }
4201     else {
4202         if (isGV_with_GP(sstr)) {
4203             /* This stringification rule for globs is spread in 3 places.
4204                This feels bad. FIXME.  */
4205             const U32 wasfake = sflags & SVf_FAKE;
4206
4207             /* FAKE globs can get coerced, so need to turn this off
4208                temporarily if it is on.  */
4209             SvFAKE_off(sstr);
4210             gv_efullname3(dstr, MUTABLE_GV(sstr), "*");
4211             SvFLAGS(sstr) |= wasfake;
4212         }
4213         else
4214             (void)SvOK_off(dstr);
4215     }
4216     if (SvTAINTED(sstr))
4217         SvTAINT(dstr);
4218 }
4219
4220 /*
4221 =for apidoc sv_setsv_mg
4222
4223 Like C<sv_setsv>, but also handles 'set' magic.
4224
4225 =cut
4226 */
4227
4228 void
4229 Perl_sv_setsv_mg(pTHX_ SV *const dstr, register SV *const sstr)
4230 {
4231     PERL_ARGS_ASSERT_SV_SETSV_MG;
4232
4233     sv_setsv(dstr,sstr);
4234     SvSETMAGIC(dstr);
4235 }
4236
4237 #ifdef PERL_OLD_COPY_ON_WRITE
4238 SV *
4239 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
4240 {
4241     STRLEN cur = SvCUR(sstr);
4242     STRLEN len = SvLEN(sstr);
4243     register char *new_pv;
4244
4245     PERL_ARGS_ASSERT_SV_SETSV_COW;
4246
4247     if (DEBUG_C_TEST) {
4248         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
4249                       (void*)sstr, (void*)dstr);
4250         sv_dump(sstr);
4251         if (dstr)
4252                     sv_dump(dstr);
4253     }
4254
4255     if (dstr) {
4256         if (SvTHINKFIRST(dstr))
4257             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
4258         else if (SvPVX_const(dstr))
4259             Safefree(SvPVX_const(dstr));
4260     }
4261     else
4262         new_SV(dstr);
4263     SvUPGRADE(dstr, SVt_PVIV);
4264
4265     assert (SvPOK(sstr));
4266     assert (SvPOKp(sstr));
4267     assert (!SvIOK(sstr));
4268     assert (!SvIOKp(sstr));
4269     assert (!SvNOK(sstr));
4270     assert (!SvNOKp(sstr));
4271
4272     if (SvIsCOW(sstr)) {
4273
4274         if (SvLEN(sstr) == 0) {
4275             /* source is a COW shared hash key.  */
4276             DEBUG_C(PerlIO_printf(Perl_debug_log,
4277                                   "Fast copy on write: Sharing hash\n"));
4278             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
4279             goto common_exit;
4280         }
4281         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
4282     } else {
4283         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
4284         SvUPGRADE(sstr, SVt_PVIV);
4285         SvREADONLY_on(sstr);
4286         SvFAKE_on(sstr);
4287         DEBUG_C(PerlIO_printf(Perl_debug_log,
4288                               "Fast copy on write: Converting sstr to COW\n"));
4289         SV_COW_NEXT_SV_SET(dstr, sstr);
4290     }
4291     SV_COW_NEXT_SV_SET(sstr, dstr);
4292     new_pv = SvPVX_mutable(sstr);
4293
4294   common_exit:
4295     SvPV_set(dstr, new_pv);
4296     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
4297     if (SvUTF8(sstr))
4298         SvUTF8_on(dstr);
4299     SvLEN_set(dstr, len);
4300     SvCUR_set(dstr, cur);
4301     if (DEBUG_C_TEST) {
4302         sv_dump(dstr);
4303     }
4304     return dstr;
4305 }
4306 #endif
4307
4308 /*
4309 =for apidoc sv_setpvn
4310
4311 Copies a string into an SV.  The C<len> parameter indicates the number of
4312 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
4313 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
4314
4315 =cut
4316 */
4317
4318 void
4319 Perl_sv_setpvn(pTHX_ register SV *const sv, register const char *const ptr, register const STRLEN len)
4320 {
4321     dVAR;
4322     register char *dptr;
4323
4324     PERL_ARGS_ASSERT_SV_SETPVN;
4325
4326     SV_CHECK_THINKFIRST_COW_DROP(sv);
4327     if (!ptr) {
4328         (void)SvOK_off(sv);
4329         return;
4330     }
4331     else {
4332         /* len is STRLEN which is unsigned, need to copy to signed */
4333         const IV iv = len;
4334         if (iv < 0)
4335             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
4336     }
4337     SvUPGRADE(sv, SVt_PV);
4338
4339     dptr = SvGROW(sv, len + 1);
4340     Move(ptr,dptr,len,char);
4341     dptr[len] = '\0';
4342     SvCUR_set(sv, len);
4343     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
4344     SvTAINT(sv);
4345 }
4346
4347 /*
4348 =for apidoc sv_setpvn_mg
4349
4350 Like C<sv_setpvn>, but also handles 'set' magic.
4351
4352 =cut
4353 */
4354
4355 void
4356 Perl_sv_setpvn_mg(pTHX_ register SV *const sv, register const char *const ptr, register const STRLEN len)
4357 {
4358     PERL_ARGS_ASSERT_SV_SETPVN_MG;
4359
4360     sv_setpvn(sv,ptr,len);
4361     SvSETMAGIC(sv);
4362 }
4363
4364 /*
4365 =for apidoc sv_setpv
4366
4367 Copies a string into an SV.  The string must be null-terminated.  Does not
4368 handle 'set' magic.  See C<sv_setpv_mg>.
4369
4370 =cut
4371 */
4372
4373 void
4374 Perl_sv_setpv(pTHX_ register SV *const sv, register const char *const ptr)
4375 {
4376     dVAR;
4377     register STRLEN len;
4378
4379     PERL_ARGS_ASSERT_SV_SETPV;
4380
4381     SV_CHECK_THINKFIRST_COW_DROP(sv);
4382     if (!ptr) {
4383         (void)SvOK_off(sv);
4384         return;
4385     }
4386     len = strlen(ptr);
4387     SvUPGRADE(sv, SVt_PV);
4388
4389     SvGROW(sv, len + 1);
4390     Move(ptr,SvPVX(sv),len+1,char);
4391     SvCUR_set(sv, len);
4392     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
4393     SvTAINT(sv);
4394 }
4395
4396 /*
4397 =for apidoc sv_setpv_mg
4398
4399 Like C<sv_setpv>, but also handles 'set' magic.
4400
4401 =cut
4402 */
4403
4404 void
4405 Perl_sv_setpv_mg(pTHX_ register SV *const sv, register const char *const ptr)
4406 {
4407     PERL_ARGS_ASSERT_SV_SETPV_MG;
4408
4409     sv_setpv(sv,ptr);
4410     SvSETMAGIC(sv);
4411 }
4412
4413 /*
4414 =for apidoc sv_usepvn_flags
4415
4416 Tells an SV to use C<ptr> to find its string value.  Normally the
4417 string is stored inside the SV but sv_usepvn allows the SV to use an
4418 outside string.  The C<ptr> should point to memory that was allocated
4419 by C<malloc>.  The string length, C<len>, must be supplied.  By default
4420 this function will realloc (i.e. move) the memory pointed to by C<ptr>,
4421 so that pointer should not be freed or used by the programmer after
4422 giving it to sv_usepvn, and neither should any pointers from "behind"
4423 that pointer (e.g. ptr + 1) be used.
4424
4425 If C<flags> & SV_SMAGIC is true, will call SvSETMAGIC. If C<flags> &
4426 SV_HAS_TRAILING_NUL is true, then C<ptr[len]> must be NUL, and the realloc
4427 will be skipped. (i.e. the buffer is actually at least 1 byte longer than
4428 C<len>, and already meets the requirements for storing in C<SvPVX>)
4429
4430 =cut
4431 */
4432
4433 void
4434 Perl_sv_usepvn_flags(pTHX_ SV *const sv, char *ptr, const STRLEN len, const U32 flags)
4435 {
4436     dVAR;
4437     STRLEN allocate;
4438
4439     PERL_ARGS_ASSERT_SV_USEPVN_FLAGS;
4440
4441     SV_CHECK_THINKFIRST_COW_DROP(sv);
4442     SvUPGRADE(sv, SVt_PV);
4443     if (!ptr) {
4444         (void)SvOK_off(sv);
4445         if (flags & SV_SMAGIC)
4446             SvSETMAGIC(sv);
4447         return;
4448     }
4449     if (SvPVX_const(sv))
4450         SvPV_free(sv);
4451
4452 #ifdef DEBUGGING
4453     if (flags & SV_HAS_TRAILING_NUL)
4454         assert(ptr[len] == '\0');
4455 #endif
4456
4457     allocate = (flags & SV_HAS_TRAILING_NUL)
4458         ? len + 1 :
4459 #ifdef Perl_safesysmalloc_size
4460         len + 1;
4461 #else 
4462         PERL_STRLEN_ROUNDUP(len + 1);
4463 #endif
4464     if (flags & SV_HAS_TRAILING_NUL) {
4465         /* It's long enough - do nothing.
4466            Specfically Perl_newCONSTSUB is relying on this.  */
4467     } else {
4468 #ifdef DEBUGGING
4469         /* Force a move to shake out bugs in callers.  */
4470         char *new_ptr = (char*)safemalloc(allocate);
4471         Copy(ptr, new_ptr, len, char);
4472         PoisonFree(ptr,len,char);
4473         Safefree(ptr);
4474         ptr = new_ptr;
4475 #else
4476         ptr = (char*) saferealloc (ptr, allocate);
4477 #endif
4478     }
4479 #ifdef Perl_safesysmalloc_size
4480     SvLEN_set(sv, Perl_safesysmalloc_size(ptr));
4481 #else
4482     SvLEN_set(sv, allocate);
4483 #endif
4484     SvCUR_set(sv, len);
4485     SvPV_set(sv, ptr);
4486     if (!(flags & SV_HAS_TRAILING_NUL)) {
4487         ptr[len] = '\0';
4488     }
4489     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
4490     SvTAINT(sv);
4491     if (flags & SV_SMAGIC)
4492         SvSETMAGIC(sv);
4493 }
4494
4495 #ifdef PERL_OLD_COPY_ON_WRITE
4496 /* Need to do this *after* making the SV normal, as we need the buffer
4497    pointer to remain valid until after we've copied it.  If we let go too early,
4498    another thread could invalidate it by unsharing last of the same hash key
4499    (which it can do by means other than releasing copy-on-write Svs)
4500    or by changing the other copy-on-write SVs in the loop.  */
4501 STATIC void
4502 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, SV *after)
4503 {
4504     PERL_ARGS_ASSERT_SV_RELEASE_COW;
4505
4506     { /* this SV was SvIsCOW_normal(sv) */
4507          /* we need to find the SV pointing to us.  */
4508         SV *current = SV_COW_NEXT_SV(after);
4509
4510         if (current == sv) {
4511             /* The SV we point to points back to us (there were only two of us
4512                in the loop.)
4513                Hence other SV is no longer copy on write either.  */
4514             SvFAKE_off(after);
4515             SvREADONLY_off(after);
4516         } else {
4517             /* We need to follow the pointers around the loop.  */
4518             SV *next;
4519             while ((next = SV_COW_NEXT_SV(current)) != sv) {
4520                 assert (next);
4521                 current = next;
4522                  /* don't loop forever if the structure is bust, and we have
4523                     a pointer into a closed loop.  */
4524                 assert (current != after);
4525                 assert (SvPVX_const(current) == pvx);
4526             }
4527             /* Make the SV before us point to the SV after us.  */
4528             SV_COW_NEXT_SV_SET(current, after);
4529         }
4530     }
4531 }
4532 #endif
4533 /*
4534 =for apidoc sv_force_normal_flags
4535
4536 Undo various types of fakery on an SV: if the PV is a shared string, make
4537 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
4538 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
4539 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
4540 then a copy-on-write scalar drops its PV buffer (if any) and becomes
4541 SvPOK_off rather than making a copy. (Used where this scalar is about to be
4542 set to some other value.) In addition, the C<flags> parameter gets passed to
4543 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
4544 with flags set to 0.
4545
4546 =cut
4547 */
4548
4549 void
4550 Perl_sv_force_normal_flags(pTHX_ register SV *const sv, const U32 flags)
4551 {
4552     dVAR;
4553
4554     PERL_ARGS_ASSERT_SV_FORCE_NORMAL_FLAGS;
4555
4556 #ifdef PERL_OLD_COPY_ON_WRITE
4557     if (SvREADONLY(sv)) {
4558         if (SvFAKE(sv)) {
4559             const char * const pvx = SvPVX_const(sv);
4560             const STRLEN len = SvLEN(sv);
4561             const STRLEN cur = SvCUR(sv);
4562             /* next COW sv in the loop.  If len is 0 then this is a shared-hash
4563                key scalar, so we mustn't attempt to call SV_COW_NEXT_SV(), as
4564                we'll fail an assertion.  */
4565             SV * const next = len ? SV_COW_NEXT_SV(sv) : 0;
4566
4567             if (DEBUG_C_TEST) {
4568                 PerlIO_printf(Perl_debug_log,
4569                               "Copy on write: Force normal %ld\n",
4570                               (long) flags);
4571                 sv_dump(sv);
4572             }
4573             SvFAKE_off(sv);
4574             SvREADONLY_off(sv);
4575             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
4576             SvPV_set(sv, NULL);
4577             SvLEN_set(sv, 0);
4578             if (flags & SV_COW_DROP_PV) {
4579                 /* OK, so we don't need to copy our buffer.  */
4580                 SvPOK_off(sv);
4581             } else {
4582                 SvGROW(sv, cur + 1);
4583                 Move(pvx,SvPVX(sv),cur,char);
4584                 SvCUR_set(sv, cur);
4585                 *SvEND(sv) = '\0';
4586             }
4587             if (len) {
4588                 sv_release_COW(sv, pvx, next);
4589             } else {
4590                 unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
4591             }
4592             if (DEBUG_C_TEST) {
4593                 sv_dump(sv);
4594             }
4595         }
4596         else if (IN_PERL_RUNTIME)
4597             Perl_croak(aTHX_ "%s", PL_no_modify);
4598     }
4599 #else
4600     if (SvREADONLY(sv)) {
4601         if (SvFAKE(sv)) {
4602             const char * const pvx = SvPVX_const(sv);
4603             const STRLEN len = SvCUR(sv);
4604             SvFAKE_off(sv);
4605             SvREADONLY_off(sv);
4606             SvPV_set(sv, NULL);
4607             SvLEN_set(sv, 0);
4608             SvGROW(sv, len + 1);
4609             Move(pvx,SvPVX(sv),len,char);
4610             *SvEND(sv) = '\0';
4611             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
4612         }
4613         else if (IN_PERL_RUNTIME)
4614             Perl_croak(aTHX_ "%s", PL_no_modify);
4615     }
4616 #endif
4617     if (SvROK(sv))
4618         sv_unref_flags(sv, flags);
4619     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
4620         sv_unglob(sv);
4621     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_REGEXP) {
4622         /* Need to downgrade the REGEXP to a simple(r) scalar. This is analagous
4623            to sv_unglob. We only need it here, so inline it.  */
4624         const svtype new_type = SvMAGIC(sv) || SvSTASH(sv) ? SVt_PVMG : SVt_PV;
4625         SV *const temp = newSV_type(new_type);
4626         void *const temp_p = SvANY(sv);
4627
4628         if (new_type == SVt_PVMG) {
4629             SvMAGIC_set(temp, SvMAGIC(sv));
4630             SvMAGIC_set(sv, NULL);
4631             SvSTASH_set(temp, SvSTASH(sv));
4632             SvSTASH_set(sv, NULL);
4633         }
4634         SvCUR_set(temp, SvCUR(sv));
4635         /* Remember that SvPVX is in the head, not the body. */
4636         if (SvLEN(temp)) {
4637             SvLEN_set(temp, SvLEN(sv));
4638             /* This signals "buffer is owned by someone else" in sv_clear,
4639                which is the least effort way to stop it freeing the buffer.
4640             */
4641             SvLEN_set(sv, SvLEN(sv)+1);
4642         } else {
4643             /* Their buffer is already owned by someone else. */
4644             SvPVX(sv) = savepvn(SvPVX(sv), SvCUR(sv));
4645             SvLEN_set(temp, SvCUR(sv)+1);
4646         }
4647
4648         /* Now swap the rest of the bodies. */
4649
4650         SvFLAGS(sv) &= ~(SVf_FAKE|SVTYPEMASK);
4651         SvFLAGS(sv) |= new_type;
4652         SvANY(sv) = SvANY(temp);
4653
4654         SvFLAGS(temp) &= ~(SVTYPEMASK);
4655         SvFLAGS(temp) |= SVt_REGEXP|SVf_FAKE;
4656         SvANY(temp) = temp_p;
4657
4658         SvREFCNT_dec(temp);
4659     }
4660 }
4661
4662 /*
4663 =for apidoc sv_chop
4664
4665 Efficient removal of characters from the beginning of the string buffer.
4666 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
4667 the string buffer.  The C<ptr> becomes the first character of the adjusted
4668 string. Uses the "OOK hack".
4669 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
4670 refer to the same chunk of data.
4671
4672 =cut
4673 */
4674
4675 void
4676 Perl_sv_chop(pTHX_ register SV *const sv, register const char *const ptr)
4677 {
4678     STRLEN delta;
4679     STRLEN old_delta;
4680     U8 *p;
4681 #ifdef DEBUGGING
4682     const U8 *real_start;
4683 #endif
4684     STRLEN max_delta;
4685
4686     PERL_ARGS_ASSERT_SV_CHOP;
4687
4688     if (!ptr || !SvPOKp(sv))
4689         return;
4690     delta = ptr - SvPVX_const(sv);
4691     if (!delta) {
4692         /* Nothing to do.  */
4693         return;
4694     }
4695     /* SvPVX(sv) may move in SV_CHECK_THINKFIRST(sv), but after this line,
4696        nothing uses the value of ptr any more.  */
4697     max_delta = SvLEN(sv) ? SvLEN(sv) : SvCUR(sv);
4698     if (ptr <= SvPVX_const(sv))
4699         Perl_croak(aTHX_ "panic: sv_chop ptr=%p, start=%p, end=%p",
4700                    ptr, SvPVX_const(sv), SvPVX_const(sv) + max_delta);
4701     SV_CHECK_THINKFIRST(sv);
4702     if (delta > max_delta)
4703         Perl_croak(aTHX_ "panic: sv_chop ptr=%p (was %p), start=%p, end=%p",
4704                    SvPVX_const(sv) + delta, ptr, SvPVX_const(sv),
4705                    SvPVX_const(sv) + max_delta);
4706
4707     if (!SvOOK(sv)) {
4708         if (!SvLEN(sv)) { /* make copy of shared string */
4709             const char *pvx = SvPVX_const(sv);
4710             const STRLEN len = SvCUR(sv);
4711             SvGROW(sv, len + 1);
4712             Move(pvx,SvPVX(sv),len,char);
4713             *SvEND(sv) = '\0';
4714         }
4715         SvFLAGS(sv) |= SVf_OOK;
4716         old_delta = 0;
4717     } else {
4718         SvOOK_offset(sv, old_delta);
4719     }
4720     SvLEN_set(sv, SvLEN(sv) - delta);
4721     SvCUR_set(sv, SvCUR(sv) - delta);
4722     SvPV_set(sv, SvPVX(sv) + delta);
4723
4724     p = (U8 *)SvPVX_const(sv);
4725
4726     delta += old_delta;
4727
4728 #ifdef DEBUGGING
4729     real_start = p - delta;
4730 #endif
4731
4732     assert(delta);
4733     if (delta < 0x100) {
4734         *--p = (U8) delta;
4735     } else {
4736         *--p = 0;
4737         p -= sizeof(STRLEN);
4738         Copy((U8*)&delta, p, sizeof(STRLEN), U8);
4739     }
4740
4741 #ifdef DEBUGGING
4742     /* Fill the preceding buffer with sentinals to verify that no-one is
4743        using it.  */
4744     while (p > real_start) {
4745         --p;
4746         *p = (U8)PTR2UV(p);
4747     }
4748 #endif
4749 }
4750
4751 /*
4752 =for apidoc sv_catpvn
4753
4754 Concatenates the string onto the end of the string which is in the SV.  The
4755 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4756 status set, then the bytes appended should be valid UTF-8.
4757 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
4758
4759 =for apidoc sv_catpvn_flags
4760
4761 Concatenates the string onto the end of the string which is in the SV.  The
4762 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4763 status set, then the bytes appended should be valid UTF-8.
4764 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
4765 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
4766 in terms of this function.
4767
4768 =cut
4769 */
4770
4771 void
4772 Perl_sv_catpvn_flags(pTHX_ register SV *const dsv, register const char *sstr, register const STRLEN slen, const I32 flags)
4773 {
4774     dVAR;
4775     STRLEN dlen;
4776     const char * const dstr = SvPV_force_flags(dsv, dlen, flags);
4777
4778     PERL_ARGS_ASSERT_SV_CATPVN_FLAGS;
4779
4780     SvGROW(dsv, dlen + slen + 1);
4781     if (sstr == dstr)
4782         sstr = SvPVX_const(dsv);
4783     Move(sstr, SvPVX(dsv) + dlen, slen, char);
4784     SvCUR_set(dsv, SvCUR(dsv) + slen);
4785     *SvEND(dsv) = '\0';
4786     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
4787     SvTAINT(dsv);
4788     if (flags & SV_SMAGIC)
4789         SvSETMAGIC(dsv);
4790 }
4791
4792 /*
4793 =for apidoc sv_catsv
4794
4795 Concatenates the string from SV C<ssv> onto the end of the string in
4796 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
4797 not 'set' magic.  See C<sv_catsv_mg>.
4798
4799 =for apidoc sv_catsv_flags
4800
4801 Concatenates the string from SV C<ssv> onto the end of the string in
4802 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
4803 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
4804 and C<sv_catsv_nomg> are implemented in terms of this function.
4805
4806 =cut */
4807
4808 void
4809 Perl_sv_catsv_flags(pTHX_ SV *const dsv, register SV *const ssv, const I32 flags)
4810 {
4811     dVAR;
4812  
4813     PERL_ARGS_ASSERT_SV_CATSV_FLAGS;
4814
4815    if (ssv) {
4816         STRLEN slen;
4817         const char *spv = SvPV_const(ssv, slen);
4818         if (spv) {
4819             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
4820                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
4821                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
4822                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
4823                 dsv->sv_flags doesn't have that bit set.
4824                 Andy Dougherty  12 Oct 2001
4825             */
4826             const I32 sutf8 = DO_UTF8(ssv);
4827             I32 dutf8;
4828
4829             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
4830                 mg_get(dsv);
4831             dutf8 = DO_UTF8(dsv);
4832
4833             if (dutf8 != sutf8) {
4834                 if (dutf8) {
4835                     /* Not modifying source SV, so taking a temporary copy. */
4836                     SV* const csv = newSVpvn_flags(spv, slen, SVs_TEMP);
4837
4838                     sv_utf8_upgrade(csv);
4839                     spv = SvPV_const(csv, slen);
4840                 }
4841                 else
4842                     /* Leave enough space for the cat that's about to happen */
4843                     sv_utf8_upgrade_flags_grow(dsv, 0, slen);
4844             }
4845             sv_catpvn_nomg(dsv, spv, slen);
4846         }
4847     }
4848     if (flags & SV_SMAGIC)
4849         SvSETMAGIC(dsv);
4850 }
4851
4852 /*
4853 =for apidoc sv_catpv
4854
4855 Concatenates the string onto the end of the string which is in the SV.
4856 If the SV has the UTF-8 status set, then the bytes appended should be
4857 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
4858
4859 =cut */
4860
4861 void
4862 Perl_sv_catpv(pTHX_ register SV *const sv, register const char *ptr)
4863 {
4864     dVAR;
4865     register STRLEN len;
4866     STRLEN tlen;
4867     char *junk;
4868
4869     PERL_ARGS_ASSERT_SV_CATPV;
4870
4871     if (!ptr)
4872         return;
4873     junk = SvPV_force(sv, tlen);
4874     len = strlen(ptr);
4875     SvGROW(sv, tlen + len + 1);
4876     if (ptr == junk)
4877         ptr = SvPVX_const(sv);
4878     Move(ptr,SvPVX(sv)+tlen,len+1,char);
4879     SvCUR_set(sv, SvCUR(sv) + len);
4880     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
4881     SvTAINT(sv);
4882 }
4883
4884 /*
4885 =for apidoc sv_catpv_mg
4886
4887 Like C<sv_catpv>, but also handles 'set' magic.
4888
4889 =cut
4890 */
4891
4892 void
4893 Perl_sv_catpv_mg(pTHX_ register SV *const sv, register const char *const ptr)
4894 {
4895     PERL_ARGS_ASSERT_SV_CATPV_MG;
4896
4897     sv_catpv(sv,ptr);
4898     SvSETMAGIC(sv);
4899 }
4900
4901 /*
4902 =for apidoc newSV
4903
4904 Creates a new SV.  A non-zero C<len> parameter indicates the number of
4905 bytes of preallocated string space the SV should have.  An extra byte for a
4906 trailing NUL is also reserved.  (SvPOK is not set for the SV even if string
4907 space is allocated.)  The reference count for the new SV is set to 1.
4908
4909 In 5.9.3, newSV() replaces the older NEWSV() API, and drops the first
4910 parameter, I<x>, a debug aid which allowed callers to identify themselves.
4911 This aid has been superseded by a new build option, PERL_MEM_LOG (see
4912 L<perlhack/PERL_MEM_LOG>).  The older API is still there for use in XS
4913 modules supporting older perls.
4914
4915 =cut
4916 */
4917
4918 SV *
4919 Perl_newSV(pTHX_ const STRLEN len)
4920 {
4921     dVAR;
4922     register SV *sv;
4923
4924     new_SV(sv);
4925     if (len) {
4926         sv_upgrade(sv, SVt_PV);
4927         SvGROW(sv, len + 1);
4928     }
4929     return sv;
4930 }
4931 /*
4932 =for apidoc sv_magicext
4933
4934 Adds magic to an SV, upgrading it if necessary. Applies the
4935 supplied vtable and returns a pointer to the magic added.
4936
4937 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4938 In particular, you can add magic to SvREADONLY SVs, and add more than
4939 one instance of the same 'how'.
4940
4941 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4942 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4943 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4944 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4945
4946 (This is now used as a subroutine by C<sv_magic>.)
4947
4948 =cut
4949 */
4950 MAGIC * 
4951 Perl_sv_magicext(pTHX_ SV *const sv, SV *const obj, const int how, 
4952                 const MGVTBL *const vtable, const char *const name, const I32 namlen)
4953 {
4954     dVAR;
4955     MAGIC* mg;
4956
4957     PERL_ARGS_ASSERT_SV_MAGICEXT;
4958
4959     SvUPGRADE(sv, SVt_PVMG);
4960     Newxz(mg, 1, MAGIC);
4961     mg->mg_moremagic = SvMAGIC(sv);
4962     SvMAGIC_set(sv, mg);
4963
4964     /* Sometimes a magic contains a reference loop, where the sv and
4965        object refer to each other.  To prevent a reference loop that
4966        would prevent such objects being freed, we look for such loops
4967        and if we find one we avoid incrementing the object refcount.
4968
4969        Note we cannot do this to avoid self-tie loops as intervening RV must
4970        have its REFCNT incremented to keep it in existence.
4971
4972     */
4973     if (!obj || obj == sv ||
4974         how == PERL_MAGIC_arylen ||
4975         how == PERL_MAGIC_symtab ||
4976         (SvTYPE(obj) == SVt_PVGV &&
4977             (GvSV(obj) == sv || GvHV(obj) == (const HV *)sv
4978              || GvAV(obj) == (const AV *)sv || GvCV(obj) == (const CV *)sv
4979              || GvIOp(obj) == (const IO *)sv || GvFORM(obj) == (const CV *)sv)))
4980     {
4981         mg->mg_obj = obj;
4982     }
4983     else {
4984         mg->mg_obj = SvREFCNT_inc_simple(obj);
4985         mg->mg_flags |= MGf_REFCOUNTED;
4986     }
4987
4988     /* Normal self-ties simply pass a null object, and instead of
4989        using mg_obj directly, use the SvTIED_obj macro to produce a
4990        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4991        with an RV obj pointing to the glob containing the PVIO.  In
4992        this case, to avoid a reference loop, we need to weaken the
4993        reference.
4994     */
4995
4996     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4997         obj && SvROK(obj) && GvIO(SvRV(obj)) == (const IO *)sv)
4998     {
4999       sv_rvweaken(obj);
5000     }
5001
5002     mg->mg_type = how;
5003     mg->mg_len = namlen;
5004     if (name) {
5005         if (namlen > 0)
5006             mg->mg_ptr = savepvn(name, namlen);
5007         else if (namlen == HEf_SVKEY) {
5008             /* Yes, this is casting away const. This is only for the case of
5009                HEf_SVKEY. I think we need to document this abberation of the
5010                constness of the API, rather than making name non-const, as
5011                that change propagating outwards a long way.  */
5012             mg->mg_ptr = (char*)SvREFCNT_inc_simple_NN((SV *)name);
5013         } else
5014             mg->mg_ptr = (char *) name;
5015     }
5016     mg->mg_virtual = (MGVTBL *) vtable;
5017
5018     mg_magical(sv);
5019     if (SvGMAGICAL(sv))
5020         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
5021     return mg;
5022 }
5023
5024 /*
5025 =for apidoc sv_magic
5026
5027 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
5028 then adds a new magic item of type C<how> to the head of the magic list.
5029
5030 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
5031 handling of the C<name> and C<namlen> arguments.
5032
5033 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
5034 to add more than one instance of the same 'how'.
5035
5036 =cut
5037 */
5038
5039 void
5040 Perl_sv_magic(pTHX_ register SV *const sv, SV *const obj, const int how, 
5041              const char *const name, const I32 namlen)
5042 {
5043     dVAR;
5044     const MGVTBL *vtable;
5045     MAGIC* mg;
5046
5047     PERL_ARGS_ASSERT_SV_MAGIC;
5048
5049 #ifdef PERL_OLD_COPY_ON_WRITE
5050     if (SvIsCOW(sv))
5051         sv_force_normal_flags(sv, 0);
5052 #endif
5053     if (SvREADONLY(sv)) {
5054         if (
5055             /* its okay to attach magic to shared strings; the subsequent
5056              * upgrade to PVMG will unshare the string */
5057             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
5058
5059             && IN_PERL_RUNTIME
5060             && how != PERL_MAGIC_regex_global
5061             && how != PERL_MAGIC_bm
5062             && how != PERL_MAGIC_fm
5063             && how != PERL_MAGIC_sv
5064             && how != PERL_MAGIC_backref
5065            )
5066         {
5067             Perl_croak(aTHX_ "%s", PL_no_modify);
5068         }
5069     }
5070     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
5071         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
5072             /* sv_magic() refuses to add a magic of the same 'how' as an
5073                existing one
5074              */
5075             if (how == PERL_MAGIC_taint) {
5076                 mg->mg_len |= 1;
5077                 /* Any scalar which already had taint magic on which someone
5078                    (erroneously?) did SvIOK_on() or similar will now be
5079                    incorrectly sporting public "OK" flags.  */
5080                 SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
5081             }
5082             return;
5083         }
5084     }
5085
5086     switch (how) {
5087     case PERL_MAGIC_sv:
5088         vtable = &PL_vtbl_sv;
5089         break;
5090     case PERL_MAGIC_overload:
5091         vtable = &PL_vtbl_amagic;
5092         break;
5093     case PERL_MAGIC_overload_elem:
5094         vtable = &PL_vtbl_amagicelem;
5095         break;
5096     case PERL_MAGIC_overload_table:
5097         vtable = &PL_vtbl_ovrld;
5098         break;
5099     case PERL_MAGIC_bm:
5100         vtable = &PL_vtbl_bm;
5101         break;
5102     case PERL_MAGIC_regdata:
5103         vtable = &PL_vtbl_regdata;
5104         break;
5105     case PERL_MAGIC_regdatum:
5106         vtable = &PL_vtbl_regdatum;
5107         break;
5108     case PERL_MAGIC_env:
5109         vtable = &PL_vtbl_env;
5110         break;
5111     case PERL_MAGIC_fm:
5112         vtable = &PL_vtbl_fm;
5113         break;
5114     case PERL_MAGIC_envelem:
5115         vtable = &PL_vtbl_envelem;
5116         break;
5117     case PERL_MAGIC_regex_global:
5118         vtable = &PL_vtbl_mglob;
5119         break;
5120     case PERL_MAGIC_isa:
5121         vtable = &PL_vtbl_isa;
5122         break;
5123     case PERL_MAGIC_isaelem:
5124         vtable = &PL_vtbl_isaelem;
5125         break;
5126     case PERL_MAGIC_nkeys:
5127         vtable = &PL_vtbl_nkeys;
5128         break;
5129     case PERL_MAGIC_dbfile:
5130         vtable = NULL;
5131         break;
5132     case PERL_MAGIC_dbline:
5133         vtable = &PL_vtbl_dbline;
5134         break;
5135 #ifdef USE_LOCALE_COLLATE
5136     case PERL_MAGIC_collxfrm:
5137         vtable = &PL_vtbl_collxfrm;
5138         break;
5139 #endif /* USE_LOCALE_COLLATE */
5140     case PERL_MAGIC_tied:
5141         vtable = &PL_vtbl_pack;
5142         break;
5143     case PERL_MAGIC_tiedelem:
5144     case PERL_MAGIC_tiedscalar:
5145         vtable = &PL_vtbl_packelem;
5146         break;
5147     case PERL_MAGIC_qr:
5148         vtable = &PL_vtbl_regexp;
5149         break;
5150     case PERL_MAGIC_sig:
5151         vtable = &PL_vtbl_sig;
5152         break;
5153     case PERL_MAGIC_sigelem:
5154         vtable = &PL_vtbl_sigelem;
5155         break;
5156     case PERL_MAGIC_taint:
5157         vtable = &PL_vtbl_taint;
5158         break;
5159     case PERL_MAGIC_uvar:
5160         vtable = &PL_vtbl_uvar;
5161         break;
5162     case PERL_MAGIC_vec:
5163         vtable = &PL_vtbl_vec;
5164         break;
5165     case PERL_MAGIC_arylen_p:
5166     case PERL_MAGIC_rhash:
5167     case PERL_MAGIC_symtab:
5168     case PERL_MAGIC_vstring:
5169         vtable = NULL;
5170         break;
5171     case PERL_MAGIC_utf8:
5172         vtable = &PL_vtbl_utf8;
5173         break;
5174     case PERL_MAGIC_substr:
5175         vtable = &PL_vtbl_substr;
5176         break;
5177     case PERL_MAGIC_defelem:
5178         vtable = &PL_vtbl_defelem;
5179         break;
5180     case PERL_MAGIC_arylen:
5181         vtable = &PL_vtbl_arylen;
5182         break;
5183     case PERL_MAGIC_pos:
5184         vtable = &PL_vtbl_pos;
5185         break;
5186     case PERL_MAGIC_backref:
5187         vtable = &PL_vtbl_backref;
5188         break;
5189     case PERL_MAGIC_hintselem:
5190         vtable = &PL_vtbl_hintselem;
5191         break;
5192     case PERL_MAGIC_hints:
5193         vtable = &PL_vtbl_hints;
5194         break;
5195     case PERL_MAGIC_ext:
5196         /* Reserved for use by extensions not perl internals.           */
5197         /* Useful for attaching extension internal data to perl vars.   */
5198         /* Note that multiple extensions may clash if magical scalars   */
5199         /* etc holding private data from one are passed to another.     */
5200         vtable = NULL;
5201         break;
5202     default:
5203         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
5204     }
5205
5206     /* Rest of work is done else where */
5207     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
5208
5209     switch (how) {
5210     case PERL_MAGIC_taint:
5211         mg->mg_len = 1;
5212         break;
5213     case PERL_MAGIC_ext:
5214     case PERL_MAGIC_dbfile:
5215         SvRMAGICAL_on(sv);
5216         break;
5217     }
5218 }
5219
5220 /*
5221 =for apidoc sv_unmagic
5222
5223 Removes all magic of type C<type> from an SV.
5224
5225 =cut
5226 */
5227
5228 int
5229 Perl_sv_unmagic(pTHX_ SV *const sv, const int type)
5230 {
5231     MAGIC* mg;
5232     MAGIC** mgp;
5233
5234     PERL_ARGS_ASSERT_SV_UNMAGIC;
5235
5236     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
5237         return 0;
5238     mgp = &(((XPVMG*) SvANY(sv))->xmg_u.xmg_magic);
5239     for (mg = *mgp; mg; mg = *mgp) {
5240         if (mg->mg_type == type) {
5241             const MGVTBL* const vtbl = mg->mg_virtual;
5242             *mgp = mg->mg_moremagic;
5243             if (vtbl && vtbl->svt_free)
5244                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
5245             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
5246                 if (mg->mg_len > 0)
5247                     Safefree(mg->mg_ptr);
5248                 else if (mg->mg_len == HEf_SVKEY)
5249                     SvREFCNT_dec(MUTABLE_SV(mg->mg_ptr));
5250                 else if (mg->mg_type == PERL_MAGIC_utf8)
5251                     Safefree(mg->mg_ptr);
5252             }
5253             if (mg->mg_flags & MGf_REFCOUNTED)
5254                 SvREFCNT_dec(mg->mg_obj);
5255             Safefree(mg);
5256         }
5257         else
5258             mgp = &mg->mg_moremagic;
5259     }
5260     if (SvMAGIC(sv)) {
5261         if (SvMAGICAL(sv))      /* if we're under save_magic, wait for restore_magic; */
5262             mg_magical(sv);     /*    else fix the flags now */
5263     }
5264     else {
5265         SvMAGICAL_off(sv);
5266         SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_IOK|SVp_NOK|SVp_POK)) >> PRIVSHIFT;
5267     }
5268     return 0;
5269 }
5270
5271 /*
5272 =for apidoc sv_rvweaken
5273
5274 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
5275 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
5276 push a back-reference to this RV onto the array of backreferences
5277 associated with that magic. If the RV is magical, set magic will be
5278 called after the RV is cleared.
5279
5280 =cut
5281 */
5282
5283 SV *
5284 Perl_sv_rvweaken(pTHX_ SV *const sv)
5285 {
5286     SV *tsv;
5287
5288     PERL_ARGS_ASSERT_SV_RVWEAKEN;
5289
5290     if (!SvOK(sv))  /* let undefs pass */
5291         return sv;
5292     if (!SvROK(sv))
5293         Perl_croak(aTHX_ "Can't weaken a nonreference");
5294     else if (SvWEAKREF(sv)) {
5295         Perl_ck_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
5296         return sv;
5297     }
5298     tsv = SvRV(sv);
5299     Perl_sv_add_backref(aTHX_ tsv, sv);
5300     SvWEAKREF_on(sv);
5301     SvREFCNT_dec(tsv);
5302     return sv;
5303 }
5304
5305 /* Give tsv backref magic if it hasn't already got it, then push a
5306  * back-reference to sv onto the array associated with the backref magic.
5307  */
5308
5309 /* A discussion about the backreferences array and its refcount:
5310  *
5311  * The AV holding the backreferences is pointed to either as the mg_obj of
5312  * PERL_MAGIC_backref, or in the specific case of a HV that has the hv_aux
5313  * structure, from the xhv_backreferences field. (A HV without hv_aux will
5314  * have the standard magic instead.) The array is created with a refcount
5315  * of 2. This means that if during global destruction the array gets
5316  * picked on first to have its refcount decremented by the random zapper,
5317  * it won't actually be freed, meaning it's still theere for when its
5318  * parent gets freed.
5319  * When the parent SV is freed, in the case of magic, the magic is freed,
5320  * Perl_magic_killbackrefs is called which decrements one refcount, then
5321  * mg_obj is freed which kills the second count.
5322  * In the vase of a HV being freed, one ref is removed by
5323  * Perl_hv_kill_backrefs, the other by Perl_sv_kill_backrefs, which it
5324  * calls.
5325  */
5326
5327 void
5328 Perl_sv_add_backref(pTHX_ SV *const tsv, SV *const sv)
5329 {
5330     dVAR;
5331     AV *av;
5332
5333     PERL_ARGS_ASSERT_SV_ADD_BACKREF;
5334
5335     if (SvTYPE(tsv) == SVt_PVHV) {
5336         AV **const avp = Perl_hv_backreferences_p(aTHX_ MUTABLE_HV(tsv));
5337
5338         av = *avp;
5339         if (!av) {
5340             /* There is no AV in the offical place - try a fixup.  */
5341             MAGIC *const mg = mg_find(tsv, PERL_MAGIC_backref);
5342
5343             if (mg) {
5344                 /* Aha. They've got it stowed in magic.  Bring it back.  */
5345                 av = MUTABLE_AV(mg->mg_obj);
5346                 /* Stop mg_free decreasing the refernce count.  */
5347                 mg->mg_obj = NULL;
5348                 /* Stop mg_free even calling the destructor, given that
5349                    there's no AV to free up.  */
5350                 mg->mg_virtual = 0;
5351                 sv_unmagic(tsv, PERL_MAGIC_backref);
5352             } else {
5353                 av = newAV();
5354                 AvREAL_off(av);
5355                 SvREFCNT_inc_simple_void(av); /* see discussion above */
5356             }
5357             *avp = av;
5358         }
5359     } else {
5360         const MAGIC *const mg
5361             = SvMAGICAL(tsv) ? mg_find(tsv, PERL_MAGIC_backref) : NULL;
5362         if (mg)
5363             av = MUTABLE_AV(mg->mg_obj);
5364         else {
5365             av = newAV();
5366             AvREAL_off(av);
5367             sv_magic(tsv, MUTABLE_SV(av), PERL_MAGIC_backref, NULL, 0);
5368             /* av now has a refcnt of 2; see discussion above */
5369         }
5370     }
5371     if (AvFILLp(av) >= AvMAX(av)) {
5372         av_extend(av, AvFILLp(av)+1);
5373     }
5374     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
5375 }
5376
5377 /* delete a back-reference to ourselves from the backref magic associated
5378  * with the SV we point to.
5379  */
5380
5381 STATIC void
5382 S_sv_del_backref(pTHX_ SV *const tsv, SV *const sv)
5383 {
5384     dVAR;
5385     AV *av = NULL;
5386     SV **svp;
5387     I32 i;
5388
5389     PERL_ARGS_ASSERT_SV_DEL_BACKREF;
5390
5391     if (SvTYPE(tsv) == SVt_PVHV && SvOOK(tsv)) {
5392         av = *Perl_hv_backreferences_p(aTHX_ MUTABLE_HV(tsv));
5393         /* We mustn't attempt to "fix up" the hash here by moving the
5394            backreference array back to the hv_aux structure, as that is stored
5395            in the main HvARRAY(), and hfreentries assumes that no-one
5396            reallocates HvARRAY() while it is running.  */
5397     }
5398     if (!av) {
5399         const MAGIC *const mg
5400             = SvMAGICAL(tsv) ? mg_find(tsv, PERL_MAGIC_backref) : NULL;
5401         if (mg)
5402             av = MUTABLE_AV(mg->mg_obj);
5403     }
5404
5405     if (!av)
5406         Perl_croak(aTHX_ "panic: del_backref");
5407
5408     assert(!SvIS_FREED(av));
5409
5410     svp = AvARRAY(av);
5411     /* We shouldn't be in here more than once, but for paranoia reasons lets
5412        not assume this.  */
5413     for (i = AvFILLp(av); i >= 0; i--) {
5414         if (svp[i] == sv) {
5415             const SSize_t fill = AvFILLp(av);
5416             if (i != fill) {
5417                 /* We weren't the last entry.
5418                    An unordered list has this property that you can take the
5419                    last element off the end to fill the hole, and it's still
5420                    an unordered list :-)
5421                 */
5422                 svp[i] = svp[fill];
5423             }
5424             svp[fill] = NULL;
5425             AvFILLp(av) = fill - 1;
5426         }
5427     }
5428 }
5429
5430 int
5431 Perl_sv_kill_backrefs(pTHX_ SV *const sv, AV *const av)
5432 {
5433     SV **svp = AvARRAY(av);
5434
5435     PERL_ARGS_ASSERT_SV_KILL_BACKREFS;
5436     PERL_UNUSED_ARG(sv);
5437
5438     assert(!svp || !SvIS_FREED(av));
5439     if (svp) {
5440         SV *const *const last = svp + AvFILLp(av);
5441
5442         while (svp <= last) {
5443             if (*svp) {
5444                 SV *const referrer = *svp;
5445                 if (SvWEAKREF(referrer)) {
5446                     /* XXX Should we check that it hasn't changed? */
5447                     SvRV_set(referrer, 0);
5448                     SvOK_off(referrer);
5449                     SvWEAKREF_off(referrer);
5450                     SvSETMAGIC(referrer);
5451                 } else if (SvTYPE(referrer) == SVt_PVGV ||
5452                            SvTYPE(referrer) == SVt_PVLV) {
5453                     /* You lookin' at me?  */
5454                     assert(GvSTASH(referrer));
5455                     assert(GvSTASH(referrer) == (const HV *)sv);
5456                     GvSTASH(referrer) = 0;
5457                 } else {
5458                     Perl_croak(aTHX_
5459                                "panic: magic_killbackrefs (flags=%"UVxf")",
5460                                (UV)SvFLAGS(referrer));
5461                 }
5462
5463                 *svp = NULL;
5464             }
5465             svp++;
5466         }
5467     }
5468     SvREFCNT_dec(av); /* remove extra count added by sv_add_backref() */
5469     return 0;
5470 }
5471
5472 /*
5473 =for apidoc sv_insert
5474
5475 Inserts a string at the specified offset/length within the SV. Similar to
5476 the Perl substr() function. Handles get magic.
5477
5478 =for apidoc sv_insert_flags
5479
5480 Same as C<sv_insert>, but the extra C<flags> are passed the C<SvPV_force_flags> that applies to C<bigstr>.
5481
5482 =cut
5483 */
5484
5485 void
5486 Perl_sv_insert_flags(pTHX_ SV *const bigstr, const STRLEN offset, const STRLEN len, const char *const little, const STRLEN littlelen, const U32 flags)
5487 {
5488     dVAR;
5489     register char *big;
5490     register char *mid;
5491     register char *midend;
5492     register char *bigend;
5493     register I32 i;
5494     STRLEN curlen;
5495
5496     PERL_ARGS_ASSERT_SV_INSERT_FLAGS;
5497
5498     if (!bigstr)
5499         Perl_croak(aTHX_ "Can't modify non-existent substring");
5500     SvPV_force_flags(bigstr, curlen, flags);
5501     (void)SvPOK_only_UTF8(bigstr);
5502     if (offset + len > curlen) {
5503         SvGROW(bigstr, offset+len+1);
5504         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
5505         SvCUR_set(bigstr, offset+len);
5506     }
5507
5508     SvTAINT(bigstr);
5509     i = littlelen - len;
5510     if (i > 0) {                        /* string might grow */
5511         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
5512         mid = big + offset + len;
5513         midend = bigend = big + SvCUR(bigstr);
5514         bigend += i;
5515         *bigend = '\0';
5516         while (midend > mid)            /* shove everything down */
5517             *--bigend = *--midend;
5518         Move(little,big+offset,littlelen,char);
5519         SvCUR_set(bigstr, SvCUR(bigstr) + i);
5520         SvSETMAGIC(bigstr);
5521         return;
5522     }
5523     else if (i == 0) {
5524         Move(little,SvPVX(bigstr)+offset,len,char);
5525         SvSETMAGIC(bigstr);
5526         return;
5527     }
5528
5529     big = SvPVX(bigstr);
5530     mid = big + offset;
5531     midend = mid + len;
5532     bigend = big + SvCUR(bigstr);
5533
5534     if (midend > bigend)
5535         Perl_croak(aTHX_ "panic: sv_insert");
5536
5537     if (mid - big > bigend - midend) {  /* faster to shorten from end */
5538         if (littlelen) {
5539             Move(little, mid, littlelen,char);
5540             mid += littlelen;
5541         }
5542         i = bigend - midend;
5543         if (i > 0) {
5544             Move(midend, mid, i,char);
5545             mid += i;
5546         }
5547         *mid = '\0';
5548         SvCUR_set(bigstr, mid - big);
5549     }
5550     else if ((i = mid - big)) { /* faster from front */
5551         midend -= littlelen;
5552         mid = midend;
5553         Move(big, midend - i, i, char);
5554         sv_chop(bigstr,midend-i);
5555         if (littlelen)
5556             Move(little, mid, littlelen,char);
5557     }
5558     else if (littlelen) {
5559         midend -= littlelen;
5560         sv_chop(bigstr,midend);
5561         Move(little,midend,littlelen,char);
5562     }
5563     else {
5564         sv_chop(bigstr,midend);
5565     }
5566     SvSETMAGIC(bigstr);
5567 }
5568
5569 /*
5570 =for apidoc sv_replace
5571
5572 Make the first argument a copy of the second, then delete the original.
5573 The target SV physically takes over ownership of the body of the source SV
5574 and inherits its flags; however, the target keeps any magic it owns,
5575 and any magic in the source is discarded.
5576 Note that this is a rather specialist SV copying operation; most of the
5577 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
5578
5579 =cut
5580 */
5581
5582 void
5583 Perl_sv_replace(pTHX_ register SV *const sv, register SV *const nsv)
5584 {
5585     dVAR;
5586     const U32 refcnt = SvREFCNT(sv);
5587
5588     PERL_ARGS_ASSERT_SV_REPLACE;
5589
5590     SV_CHECK_THINKFIRST_COW_DROP(sv);
5591     if (SvREFCNT(nsv) != 1) {
5592         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace()"
5593                    " (%" UVuf " != 1)", (UV) SvREFCNT(nsv));
5594     }
5595     if (SvMAGICAL(sv)) {
5596         if (SvMAGICAL(nsv))
5597             mg_free(nsv);
5598         else
5599             sv_upgrade(nsv, SVt_PVMG);
5600         SvMAGIC_set(nsv, SvMAGIC(sv));
5601         SvFLAGS(nsv) |= SvMAGICAL(sv);
5602         SvMAGICAL_off(sv);
5603         SvMAGIC_set(sv, NULL);
5604     }
5605     SvREFCNT(sv) = 0;
5606     sv_clear(sv);
5607     assert(!SvREFCNT(sv));
5608 #ifdef DEBUG_LEAKING_SCALARS
5609     sv->sv_flags  = nsv->sv_flags;
5610     sv->sv_any    = nsv->sv_any;
5611     sv->sv_refcnt = nsv->sv_refcnt;
5612     sv->sv_u      = nsv->sv_u;
5613 #else
5614     StructCopy(nsv,sv,SV);
5615 #endif
5616     if(SvTYPE(sv) == SVt_IV) {
5617         SvANY(sv)
5618             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
5619     }
5620         
5621
5622 #ifdef PERL_OLD_COPY_ON_WRITE
5623     if (SvIsCOW_normal(nsv)) {
5624         /* We need to follow the pointers around the loop to make the
5625            previous SV point to sv, rather than nsv.  */
5626         SV *next;
5627         SV *current = nsv;
5628         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
5629             assert(next);
5630             current = next;
5631             assert(SvPVX_const(current) == SvPVX_const(nsv));
5632         }
5633         /* Make the SV before us point to the SV after us.  */
5634         if (DEBUG_C_TEST) {
5635             PerlIO_printf(Perl_debug_log, "previous is\n");
5636             sv_dump(current);
5637             PerlIO_printf(Perl_debug_log,
5638                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
5639                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
5640         }
5641         SV_COW_NEXT_SV_SET(current, sv);
5642     }
5643 #endif
5644     SvREFCNT(sv) = refcnt;
5645     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
5646     SvREFCNT(nsv) = 0;
5647     del_SV(nsv);
5648 }
5649
5650 /*
5651 =for apidoc sv_clear
5652
5653 Clear an SV: call any destructors, free up any memory used by the body,
5654 and free the body itself. The SV's head is I<not> freed, although
5655 its type is set to all 1's so that it won't inadvertently be assumed
5656 to be live during global destruction etc.
5657 This function should only be called when REFCNT is zero. Most of the time
5658 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
5659 instead.
5660
5661 =cut
5662 */
5663
5664 void
5665 Perl_sv_clear(pTHX_ register SV *const sv)
5666 {
5667     dVAR;
5668     const U32 type = SvTYPE(sv);
5669     const struct body_details *const sv_type_details
5670         = bodies_by_type + type;
5671     HV *stash;
5672
5673     PERL_ARGS_ASSERT_SV_CLEAR;
5674     assert(SvREFCNT(sv) == 0);
5675     assert(SvTYPE(sv) != SVTYPEMASK);
5676
5677     if (type <= SVt_IV) {
5678         /* See the comment in sv.h about the collusion between this early
5679            return and the overloading of the NULL and IV slots in the size
5680            table.  */
5681         if (SvROK(sv)) {
5682             SV * const target = SvRV(sv);
5683             if (SvWEAKREF(sv))
5684                 sv_del_backref(target, sv);
5685             else
5686                 SvREFCNT_dec(target);
5687         }
5688         SvFLAGS(sv) &= SVf_BREAK;
5689         SvFLAGS(sv) |= SVTYPEMASK;
5690         return;
5691     }
5692
5693     if (SvOBJECT(sv)) {
5694         if (PL_defstash &&      /* Still have a symbol table? */
5695             SvDESTROYABLE(sv))
5696         {
5697             dSP;
5698             HV* stash;
5699             do {        
5700                 CV* destructor;
5701                 stash = SvSTASH(sv);
5702                 destructor = StashHANDLER(stash,DESTROY);
5703                 if (destructor
5704                         /* A constant subroutine can have no side effects, so
5705                            don't bother calling it.  */
5706                         && !CvCONST(destructor)
5707                         /* Don't bother calling an empty destructor */
5708                         && (CvISXSUB(destructor)
5709                         || (CvSTART(destructor)
5710                             && (CvSTART(destructor)->op_next->op_type != OP_LEAVESUB))))
5711                 {
5712                     SV* const tmpref = newRV(sv);
5713                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
5714                     ENTER;
5715                     PUSHSTACKi(PERLSI_DESTROY);
5716                     EXTEND(SP, 2);
5717                     PUSHMARK(SP);
5718                     PUSHs(tmpref);
5719                     PUTBACK;
5720                     call_sv(MUTABLE_SV(destructor), G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
5721                 
5722                 
5723                     POPSTACK;
5724                     SPAGAIN;
5725                     LEAVE;
5726                     if(SvREFCNT(tmpref) < 2) {
5727                         /* tmpref is not kept alive! */
5728                         SvREFCNT(sv)--;
5729                         SvRV_set(tmpref, NULL);
5730                         SvROK_off(tmpref);
5731                     }
5732                     SvREFCNT_dec(tmpref);
5733                 }
5734             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
5735
5736
5737             if (SvREFCNT(sv)) {
5738                 if (PL_in_clean_objs)
5739                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
5740                           HvNAME_get(stash));
5741                 /* DESTROY gave object new lease on life */
5742                 return;
5743             }
5744         }
5745
5746         if (SvOBJECT(sv)) {
5747             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
5748             SvOBJECT_off(sv);   /* Curse the object. */
5749             if (type != SVt_PVIO)
5750                 --PL_sv_objcount;       /* XXX Might want something more general */
5751         }
5752     }
5753     if (type >= SVt_PVMG) {
5754         if (type == SVt_PVMG && SvPAD_OUR(sv)) {
5755             SvREFCNT_dec(SvOURSTASH(sv));
5756         } else if (SvMAGIC(sv))
5757             mg_free(sv);
5758         if (type == SVt_PVMG && SvPAD_TYPED(sv))
5759             SvREFCNT_dec(SvSTASH(sv));
5760     }
5761     switch (type) {
5762         /* case SVt_BIND: */
5763     case SVt_PVIO:
5764         if (IoIFP(sv) &&
5765             IoIFP(sv) != PerlIO_stdin() &&
5766             IoIFP(sv) != PerlIO_stdout() &&
5767             IoIFP(sv) != PerlIO_stderr())
5768         {
5769             io_close(MUTABLE_IO(sv), FALSE);
5770         }
5771         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
5772             PerlDir_close(IoDIRP(sv));
5773         IoDIRP(sv) = (DIR*)NULL;
5774         Safefree(IoTOP_NAME(sv));
5775         Safefree(IoFMT_NAME(sv));
5776         Safefree(IoBOTTOM_NAME(sv));
5777         goto freescalar;
5778     case SVt_REGEXP:
5779         /* FIXME for plugins */
5780         pregfree2((REGEXP*) sv);
5781         goto freescalar;
5782     case SVt_PVCV:
5783     case SVt_PVFM:
5784         cv_undef(MUTABLE_CV(sv));
5785         goto freescalar;
5786     case SVt_PVHV:
5787         if (PL_last_swash_hv == (const HV *)sv) {
5788             PL_last_swash_hv = NULL;
5789         }
5790         Perl_hv_kill_backrefs(aTHX_ MUTABLE_HV(sv));
5791         hv_undef(MUTABLE_HV(sv));
5792         break;
5793     case SVt_PVAV:
5794         if (PL_comppad == MUTABLE_AV(sv)) {
5795             PL_comppad = NULL;
5796             PL_curpad = NULL;
5797         }
5798         av_undef(MUTABLE_AV(sv));
5799         break;
5800     case SVt_PVLV:
5801         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
5802             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
5803             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
5804             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
5805         }
5806         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
5807             SvREFCNT_dec(LvTARG(sv));
5808     case SVt_PVGV:
5809         if (isGV_with_GP(sv)) {
5810             if(GvCVu((const GV *)sv) && (stash = GvSTASH(MUTABLE_GV(sv)))
5811                && HvNAME_get(stash))
5812                 mro_method_changed_in(stash);
5813             gp_free(MUTABLE_GV(sv));
5814             if (GvNAME_HEK(sv))
5815                 unshare_hek(GvNAME_HEK(sv));
5816             /* If we're in a stash, we don't own a reference to it. However it does
5817                have a back reference to us, which needs to be cleared.  */
5818             if (!SvVALID(sv) && (stash = GvSTASH(sv)))
5819                     sv_del_backref(MUTABLE_SV(stash), sv);
5820         }
5821         /* FIXME. There are probably more unreferenced pointers to SVs in the
5822            interpreter struct that we should check and tidy in a similar
5823            fashion to this:  */
5824         if ((const GV *)sv == PL_last_in_gv)
5825             PL_last_in_gv = NULL;
5826     case SVt_PVMG:
5827     case SVt_PVNV:
5828     case SVt_PVIV:
5829     case SVt_PV:
5830       freescalar:
5831         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
5832         if (SvOOK(sv)) {
5833             STRLEN offset;
5834             SvOOK_offset(sv, offset);
5835             SvPV_set(sv, SvPVX_mutable(sv) - offset);
5836             /* Don't even bother with turning off the OOK flag.  */
5837         }
5838         if (SvROK(sv)) {
5839             SV * const target = SvRV(sv);
5840             if (SvWEAKREF(sv))
5841                 sv_del_backref(target, sv);
5842             else
5843                 SvREFCNT_dec(target);
5844         }
5845 #ifdef PERL_OLD_COPY_ON_WRITE
5846         else if (SvPVX_const(sv)) {
5847             if (SvIsCOW(sv)) {
5848                 if (DEBUG_C_TEST) {
5849                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
5850                     sv_dump(sv);
5851                 }
5852                 if (SvLEN(sv)) {
5853                     sv_release_COW(sv, SvPVX_const(sv), SV_COW_NEXT_SV(sv));
5854                 } else {
5855                     unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
5856                 }
5857
5858                 SvFAKE_off(sv);
5859             } else if (SvLEN(sv)) {
5860                 Safefree(SvPVX_const(sv));
5861             }
5862         }
5863 #else
5864         else if (SvPVX_const(sv) && SvLEN(sv))
5865             Safefree(SvPVX_mutable(sv));
5866         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
5867             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
5868             SvFAKE_off(sv);
5869         }
5870 #endif
5871         break;
5872     case SVt_NV:
5873         break;
5874     }
5875
5876     SvFLAGS(sv) &= SVf_BREAK;
5877     SvFLAGS(sv) |= SVTYPEMASK;
5878
5879     if (sv_type_details->arena) {
5880         del_body(((char *)SvANY(sv) + sv_type_details->offset),
5881                  &PL_body_roots[type]);
5882     }
5883     else if (sv_type_details->body_size) {
5884         my_safefree(SvANY(sv));
5885     }
5886 }
5887
5888 /*
5889 =for apidoc sv_newref
5890
5891 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
5892 instead.
5893
5894 =cut
5895 */
5896
5897 SV *
5898 Perl_sv_newref(pTHX_ SV *const sv)
5899 {
5900     PERL_UNUSED_CONTEXT;
5901     if (sv)
5902         (SvREFCNT(sv))++;
5903     return sv;
5904 }
5905
5906 /*
5907 =for apidoc sv_free
5908
5909 Decrement an SV's reference count, and if it drops to zero, call
5910 C<sv_clear> to invoke destructors and free up any memory used by
5911 the body; finally, deallocate the SV's head itself.
5912 Normally called via a wrapper macro C<SvREFCNT_dec>.
5913
5914 =cut
5915 */
5916
5917 void
5918 Perl_sv_free(pTHX_ SV *const sv)
5919 {
5920     dVAR;
5921     if (!sv)
5922         return;
5923     if (SvREFCNT(sv) == 0) {
5924         if (SvFLAGS(sv) & SVf_BREAK)
5925             /* this SV's refcnt has been artificially decremented to
5926              * trigger cleanup */
5927             return;
5928         if (PL_in_clean_all) /* All is fair */
5929             return;
5930         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5931             /* make sure SvREFCNT(sv)==0 happens very seldom */
5932             SvREFCNT(sv) = (~(U32)0)/2;
5933             return;
5934         }
5935         if (ckWARN_d(WARN_INTERNAL)) {
5936 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
5937             Perl_dump_sv_child(aTHX_ sv);
5938 #else
5939   #ifdef DEBUG_LEAKING_SCALARS
5940             sv_dump(sv);
5941   #endif
5942 #ifdef DEBUG_LEAKING_SCALARS_ABORT
5943             if (PL_warnhook == PERL_WARNHOOK_FATAL
5944                 || ckDEAD(packWARN(WARN_INTERNAL))) {
5945                 /* Don't let Perl_warner cause us to escape our fate:  */
5946                 abort();
5947             }
5948 #endif
5949             /* This may not return:  */
5950             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
5951                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
5952                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5953 #endif
5954         }
5955 #ifdef DEBUG_LEAKING_SCALARS_ABORT
5956         abort();
5957 #endif
5958         return;
5959     }
5960     if (--(SvREFCNT(sv)) > 0)
5961         return;
5962     Perl_sv_free2(aTHX_ sv);
5963 }
5964
5965 void
5966 Perl_sv_free2(pTHX_ SV *const sv)
5967 {
5968     dVAR;
5969
5970     PERL_ARGS_ASSERT_SV_FREE2;
5971
5972 #ifdef DEBUGGING
5973     if (SvTEMP(sv)) {
5974         Perl_ck_warner_d(aTHX_ packWARN(WARN_DEBUGGING),
5975                          "Attempt to free temp prematurely: SV 0x%"UVxf
5976                          pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5977         return;
5978     }
5979 #endif
5980     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5981         /* make sure SvREFCNT(sv)==0 happens very seldom */
5982         SvREFCNT(sv) = (~(U32)0)/2;
5983         return;
5984     }
5985     sv_clear(sv);
5986     if (! SvREFCNT(sv))
5987         del_SV(sv);
5988 }
5989
5990 /*
5991 =for apidoc sv_len
5992
5993 Returns the length of the string in the SV. Handles magic and type
5994 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
5995
5996 =cut
5997 */
5998
5999 STRLEN
6000 Perl_sv_len(pTHX_ register SV *const sv)
6001 {
6002     STRLEN len;
6003
6004     if (!sv)
6005         return 0;
6006
6007     if (SvGMAGICAL(sv))
6008         len = mg_length(sv);
6009     else
6010         (void)SvPV_const(sv, len);
6011     return len;
6012 }
6013
6014 /*
6015 =for apidoc sv_len_utf8
6016
6017 Returns the number of characters in the string in an SV, counting wide
6018 UTF-8 bytes as a single character. Handles magic and type coercion.
6019
6020 =cut
6021 */
6022
6023 /*
6024  * The length is cached in PERL_MAGIC_utf8, in the mg_len field.  Also the
6025  * mg_ptr is used, by sv_pos_u2b() and sv_pos_b2u() - see the comments below.
6026  * (Note that the mg_len is not the length of the mg_ptr field.
6027  * This allows the cache to store the character length of the string without
6028  * needing to malloc() extra storage to attach to the mg_ptr.)
6029  *
6030  */
6031
6032 STRLEN
6033 Perl_sv_len_utf8(pTHX_ register SV *const sv)
6034 {
6035     if (!sv)
6036         return 0;
6037
6038     if (SvGMAGICAL(sv))
6039         return mg_length(sv);
6040     else
6041     {
6042         STRLEN len;
6043         const U8 *s = (U8*)SvPV_const(sv, len);
6044
6045         if (PL_utf8cache) {
6046             STRLEN ulen;
6047             MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : NULL;
6048
6049             if (mg && mg->mg_len != -1) {
6050                 ulen = mg->mg_len;
6051                 if (PL_utf8cache < 0) {
6052                     const STRLEN real = Perl_utf8_length(aTHX_ s, s + len);
6053                     if (real != ulen) {
6054                         /* Need to turn the assertions off otherwise we may
6055                            recurse infinitely while printing error messages.
6056                         */
6057                         SAVEI8(PL_utf8cache);
6058                         PL_utf8cache = 0;
6059                         Perl_croak(aTHX_ "panic: sv_len_utf8 cache %"UVuf
6060                                    " real %"UVuf" for %"SVf,
6061                                    (UV) ulen, (UV) real, SVfARG(sv));
6062                     }
6063                 }
6064             }
6065             else {
6066                 ulen = Perl_utf8_length(aTHX_ s, s + len);
6067                 if (!SvREADONLY(sv)) {
6068                     if (!mg && (SvTYPE(sv) < SVt_PVMG ||
6069                                 !(mg = mg_find(sv, PERL_MAGIC_utf8)))) {
6070                         mg = sv_magicext(sv, 0, PERL_MAGIC_utf8,
6071                                          &PL_vtbl_utf8, 0, 0);
6072                     }
6073                     assert(mg);
6074                     mg->mg_len = ulen;
6075                 }
6076             }
6077             return ulen;
6078         }
6079         return Perl_utf8_length(aTHX_ s, s + len);
6080     }
6081 }
6082
6083 /* Walk forwards to find the byte corresponding to the passed in UTF-8
6084    offset.  */
6085 static STRLEN
6086 S_sv_pos_u2b_forwards(const U8 *const start, const U8 *const send,
6087                       STRLEN uoffset)
6088 {
6089     const U8 *s = start;
6090
6091     PERL_ARGS_ASSERT_SV_POS_U2B_FORWARDS;
6092
6093     while (s < send && uoffset--)
6094         s += UTF8SKIP(s);
6095     if (s > send) {
6096         /* This is the existing behaviour. Possibly it should be a croak, as
6097            it's actually a bounds error  */
6098         s = send;
6099     }
6100     return s - start;
6101 }
6102
6103 /* Given the length of the string in both bytes and UTF-8 characters, decide
6104    whether to walk forwards or backwards to find the byte corresponding to
6105    the passed in UTF-8 offset.  */
6106 static STRLEN
6107 S_sv_pos_u2b_midway(const U8 *const start, const U8 *send,
6108                       const STRLEN uoffset, const STRLEN uend)
6109 {
6110     STRLEN backw = uend - uoffset;
6111
6112     PERL_ARGS_ASSERT_SV_POS_U2B_MIDWAY;
6113
6114     if (uoffset < 2 * backw) {
6115         /* The assumption is that going forwards is twice the speed of going
6116            forward (that's where the 2 * backw comes from).
6117            (The real figure of course depends on the UTF-8 data.)  */
6118         return sv_pos_u2b_forwards(start, send, uoffset);
6119     }
6120
6121     while (backw--) {
6122         send--;
6123         while (UTF8_IS_CONTINUATION(*send))
6124             send--;
6125     }
6126     return send - start;
6127 }
6128
6129 /* For the string representation of the given scalar, find the byte
6130    corresponding to the passed in UTF-8 offset.  uoffset0 and boffset0
6131    give another position in the string, *before* the sought offset, which
6132    (which is always true, as 0, 0 is a valid pair of positions), which should
6133    help reduce the amount of linear searching.
6134    If *mgp is non-NULL, it should point to the UTF-8 cache magic, which
6135    will be used to reduce the amount of linear searching. The cache will be
6136    created if necessary, and the found value offered to it for update.  */
6137 static STRLEN
6138 S_sv_pos_u2b_cached(pTHX_ SV *const sv, MAGIC **const mgp, const U8 *const start,
6139                     const U8 *const send, const STRLEN uoffset,
6140                     STRLEN uoffset0, STRLEN boffset0)
6141 {
6142     STRLEN boffset = 0; /* Actually always set, but let's keep gcc happy.  */
6143     bool found = FALSE;
6144
6145     PERL_ARGS_ASSERT_SV_POS_U2B_CACHED;
6146
6147     assert (uoffset >= uoffset0);
6148
6149     if (!SvREADONLY(sv)
6150         && PL_utf8cache
6151         && (*mgp || (SvTYPE(sv) >= SVt_PVMG &&
6152                      (*mgp = mg_find(sv, PERL_MAGIC_utf8))))) {
6153         if ((*mgp)->mg_ptr) {
6154             STRLEN *cache = (STRLEN *) (*mgp)->mg_ptr;
6155             if (cache[0] == uoffset) {
6156                 /* An exact match. */
6157                 return cache[1];
6158             }
6159             if (cache[2] == uoffset) {
6160                 /* An exact match. */
6161                 return cache[3];
6162             }
6163
6164             if (cache[0] < uoffset) {
6165                 /* The cache already knows part of the way.   */
6166                 if (cache[0] > uoffset0) {
6167                     /* The cache knows more than the passed in pair  */
6168                     uoffset0 = cache[0];
6169                     boffset0 = cache[1];
6170                 }
6171                 if ((*mgp)->mg_len != -1) {
6172                     /* And we know the end too.  */
6173                     boffset = boffset0
6174                         + sv_pos_u2b_midway(start + boffset0, send,
6175                                               uoffset - uoffset0,
6176                                               (*mgp)->mg_len - uoffset0);
6177                 } else {
6178                     boffset = boffset0
6179                         + sv_pos_u2b_forwards(start + boffset0,
6180                                                 send, uoffset - uoffset0);
6181                 }
6182             }
6183             else if (cache[2] < uoffset) {
6184                 /* We're between the two cache entries.  */
6185                 if (cache[2] > uoffset0) {
6186                     /* and the cache knows more than the passed in pair  */
6187                     uoffset0 = cache[2];
6188                     boffset0 = cache[3];
6189                 }
6190
6191                 boffset = boffset0
6192                     + sv_pos_u2b_midway(start + boffset0,
6193                                           start + cache[1],
6194                                           uoffset - uoffset0,
6195                                           cache[0] - uoffset0);
6196             } else {
6197                 boffset = boffset0
6198                     + sv_pos_u2b_midway(start + boffset0,
6199                                           start + cache[3],
6200                                           uoffset - uoffset0,
6201                                           cache[2] - uoffset0);
6202             }
6203             found = TRUE;
6204         }
6205         else if ((*mgp)->mg_len != -1) {
6206             /* If we can take advantage of a passed in offset, do so.  */
6207             /* In fact, offset0 is either 0, or less than offset, so don't
6208                need to worry about the other possibility.  */
6209             boffset = boffset0
6210                 + sv_pos_u2b_midway(start + boffset0, send,
6211                                       uoffset - uoffset0,
6212                                       (*mgp)->mg_len - uoffset0);
6213             found = TRUE;
6214         }
6215     }
6216
6217     if (!found || PL_utf8cache < 0) {
6218         const STRLEN real_boffset
6219             = boffset0 + sv_pos_u2b_forwards(start + boffset0,
6220                                                send, uoffset - uoffset0);
6221
6222         if (found && PL_utf8cache < 0) {
6223             if (real_boffset != boffset) {
6224                 /* Need to turn the assertions off otherwise we may recurse
6225                    infinitely while printing error messages.  */
6226                 SAVEI8(PL_utf8cache);
6227                 PL_utf8cache = 0;
6228                 Perl_croak(aTHX_ "panic: sv_pos_u2b_cache cache %"UVuf
6229                            " real %"UVuf" for %"SVf,
6230                            (UV) boffset, (UV) real_boffset, SVfARG(sv));
6231             }
6232         }
6233         boffset = real_boffset;
6234     }
6235
6236     if (PL_utf8cache)
6237         utf8_mg_pos_cache_update(sv, mgp, boffset, uoffset, send - start);
6238     return boffset;
6239 }
6240
6241
6242 /*
6243 =for apidoc sv_pos_u2b_flags
6244
6245 Converts the value pointed to by offsetp from a count of UTF-8 chars from
6246 the start of the string, to a count of the equivalent number of bytes; if
6247 lenp is non-zero, it does the same to lenp, but this time starting from
6248 the offset, rather than from the start of the string. Handles type coercion.
6249 I<flags> is passed to C<SvPV_flags>, and usually should be
6250 C<SV_GMAGIC|SV_CONST_RETURN> to handle magic.
6251
6252 =cut
6253 */
6254
6255 /*
6256  * sv_pos_u2b_flags() uses, like sv_pos_b2u(), the mg_ptr of the potential
6257  * PERL_MAGIC_utf8 of the sv to store the mapping between UTF-8 and
6258  * byte offsets.  See also the comments of S_utf8_mg_pos_cache_update().
6259  *
6260  */
6261
6262 STRLEN
6263 Perl_sv_pos_u2b_flags(pTHX_ SV *const sv, STRLEN uoffset, STRLEN *const lenp,
6264                       U32 flags)
6265 {
6266     const U8 *start;
6267     STRLEN len;
6268     STRLEN boffset;
6269
6270     PERL_ARGS_ASSERT_SV_POS_U2B_FLAGS;
6271
6272     start = (U8*)SvPV_flags(sv, len, flags);
6273     if (len) {
6274         const U8 * const send = start + len;
6275         MAGIC *mg = NULL;
6276         boffset = sv_pos_u2b_cached(sv, &mg, start, send, uoffset, 0, 0);
6277
6278         if (lenp) {
6279             /* Convert the relative offset to absolute.  */
6280             const STRLEN uoffset2 = uoffset + *lenp;
6281             const STRLEN boffset2
6282                 = sv_pos_u2b_cached(sv, &mg, start, send, uoffset2,
6283                                       uoffset, boffset) - boffset;
6284
6285             *lenp = boffset2;
6286         }
6287     } else {
6288         if (lenp)
6289             *lenp = 0;
6290         boffset = 0;
6291     }
6292
6293     return boffset;
6294 }
6295
6296 /*
6297 =for apidoc sv_pos_u2b
6298
6299 Converts the value pointed to by offsetp from a count of UTF-8 chars from
6300 the start of the string, to a count of the equivalent number of bytes; if
6301 lenp is non-zero, it does the same to lenp, but this time starting from
6302 the offset, rather than from the start of the string. Handles magic and
6303 type coercion.
6304
6305 Use C<sv_pos_u2b_flags> in preference, which correctly handles strings longer
6306 than 2Gb.
6307
6308 =cut
6309 */
6310
6311 /*
6312  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
6313  * PERL_MAGIC_utf8 of the sv to store the mapping between UTF-8 and
6314  * byte offsets.  See also the comments of S_utf8_mg_pos_cache_update().
6315  *
6316  */
6317
6318 /* This function is subject to size and sign problems */
6319
6320 void
6321 Perl_sv_pos_u2b(pTHX_ register SV *const sv, I32 *const offsetp, I32 *const lenp)
6322 {
6323     STRLEN uoffset = (STRLEN)*offsetp;
6324
6325     PERL_ARGS_ASSERT_SV_POS_U2B;
6326
6327     if (lenp) {
6328         STRLEN ulen = (STRLEN)*lenp;
6329         *offsetp = (I32)sv_pos_u2b_flags(sv, (STRLEN)*offsetp, &ulen,
6330                                          SV_GMAGIC|SV_CONST_RETURN);
6331         *lenp = (I32)ulen;
6332     } else {
6333         *offsetp = (I32)sv_pos_u2b_flags(sv, (STRLEN)*offsetp, NULL,
6334                                          SV_GMAGIC|SV_CONST_RETURN);
6335     }
6336 }
6337
6338 /* Create and update the UTF8 magic offset cache, with the proffered utf8/
6339    byte length pairing. The (byte) length of the total SV is passed in too,
6340    as blen, because for some (more esoteric) SVs, the call to SvPV_const()
6341    may not have updated SvCUR, so we can't rely on reading it directly.
6342
6343    The proffered utf8/byte length pairing isn't used if the cache already has
6344    two pairs, and swapping either for the proffered pair would increase the
6345    RMS of the intervals between known byte offsets.
6346
6347    The cache itself consists of 4 STRLEN values
6348    0: larger UTF-8 offset
6349    1: corresponding byte offset
6350    2: smaller UTF-8 offset
6351    3: corresponding byte offset
6352
6353    Unused cache pairs have the value 0, 0.
6354    Keeping the cache "backwards" means that the invariant of
6355    cache[0] >= cache[2] is maintained even with empty slots, which means that
6356    the code that uses it doesn't need to worry if only 1 entry has actually
6357    been set to non-zero.  It also makes the "position beyond the end of the
6358    cache" logic much simpler, as the first slot is always the one to start
6359    from.   
6360 */
6361 static void
6362 S_utf8_mg_pos_cache_update(pTHX_ SV *const sv, MAGIC **const mgp, const STRLEN byte,
6363                            const STRLEN utf8, const STRLEN blen)
6364 {
6365     STRLEN *cache;
6366
6367     PERL_ARGS_ASSERT_UTF8_MG_POS_CACHE_UPDATE;
6368
6369     if (SvREADONLY(sv))
6370         return;
6371
6372     if (!*mgp && (SvTYPE(sv) < SVt_PVMG ||
6373                   !(*mgp = mg_find(sv, PERL_MAGIC_utf8)))) {
6374         *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0,
6375                            0);
6376         (*mgp)->mg_len = -1;
6377     }
6378     assert(*mgp);
6379
6380     if (!(cache = (STRLEN *)(*mgp)->mg_ptr)) {
6381         Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
6382         (*mgp)->mg_ptr = (char *) cache;
6383     }
6384     assert(cache);
6385
6386     if (PL_utf8cache < 0 && SvPOKp(sv)) {
6387         /* SvPOKp() because it's possible that sv has string overloading, and
6388            therefore is a reference, hence SvPVX() is actually a pointer.
6389            This cures the (very real) symptoms of RT 69422, but I'm not actually
6390            sure whether we should even be caching the results of UTF-8
6391            operations on overloading, given that nothing stops overloading
6392            returning a different value every time it's called.  */
6393         const U8 *start = (const U8 *) SvPVX_const(sv);
6394         const STRLEN realutf8 = utf8_length(start, start + byte);
6395
6396         if (realutf8 != utf8) {
6397             /* Need to turn the assertions off otherwise we may recurse
6398                infinitely while printing error messages.  */
6399             SAVEI8(PL_utf8cache);
6400             PL_utf8cache = 0;
6401             Perl_croak(aTHX_ "panic: utf8_mg_pos_cache_update cache %"UVuf
6402                        " real %"UVuf" for %"SVf, (UV) utf8, (UV) realutf8, SVfARG(sv));
6403         }
6404     }
6405
6406     /* Cache is held with the later position first, to simplify the code
6407        that deals with unbounded ends.  */
6408        
6409     ASSERT_UTF8_CACHE(cache);
6410     if (cache[1] == 0) {
6411         /* Cache is totally empty  */
6412         cache[0] = utf8;
6413         cache[1] = byte;
6414     } else if (cache[3] == 0) {
6415         if (byte > cache[1]) {
6416             /* New one is larger, so goes first.  */
6417             cache[2] = cache[0];
6418             cache[3] = cache[1];
6419             cache[0] = utf8;
6420             cache[1] = byte;
6421         } else {
6422             cache[2] = utf8;
6423             cache[3] = byte;
6424         }
6425     } else {
6426 #define THREEWAY_SQUARE(a,b,c,d) \
6427             ((float)((d) - (c))) * ((float)((d) - (c))) \
6428             + ((float)((c) - (b))) * ((float)((c) - (b))) \
6429                + ((float)((b) - (a))) * ((float)((b) - (a)))
6430
6431         /* Cache has 2 slots in use, and we know three potential pairs.
6432            Keep the two that give the lowest RMS distance. Do the
6433            calcualation in bytes simply because we always know the byte
6434            length.  squareroot has the same ordering as the positive value,
6435            so don't bother with the actual square root.  */
6436         const float existing = THREEWAY_SQUARE(0, cache[3], cache[1], blen);
6437         if (byte > cache[1]) {
6438             /* New position is after the existing pair of pairs.  */
6439             const float keep_earlier
6440                 = THREEWAY_SQUARE(0, cache[3], byte, blen);
6441             const float keep_later
6442                 = THREEWAY_SQUARE(0, cache[1], byte, blen);
6443
6444             if (keep_later < keep_earlier) {
6445                 if (keep_later < existing) {
6446                     cache[2] = cache[0];
6447                     cache[3] = cache[1];
6448                     cache[0] = utf8;
6449                     cache[1] = byte;
6450                 }
6451             }
6452             else {
6453                 if (keep_earlier < existing) {
6454                     cache[0] = utf8;
6455                     cache[1] = byte;
6456                 }
6457             }
6458         }
6459         else if (byte > cache[3]) {
6460             /* New position is between the existing pair of pairs.  */
6461             const float keep_earlier
6462                 = THREEWAY_SQUARE(0, cache[3], byte, blen);
6463             const float keep_later
6464                 = THREEWAY_SQUARE(0, byte, cache[1], blen);
6465
6466             if (keep_later < keep_earlier) {
6467                 if (keep_later < existing) {
6468                     cache[2] = utf8;
6469                     cache[3] = byte;
6470                 }
6471             }
6472             else {
6473                 if (keep_earlier < existing) {
6474                     cache[0] = utf8;
6475                     cache[1] = byte;
6476                 }
6477             }
6478         }
6479         else {
6480             /* New position is before the existing pair of pairs.  */
6481             const float keep_earlier
6482                 = THREEWAY_SQUARE(0, byte, cache[3], blen);
6483             const float keep_later
6484                 = THREEWAY_SQUARE(0, byte, cache[1], blen);
6485
6486             if (keep_later < keep_earlier) {
6487                 if (keep_later < existing) {
6488                     cache[2] = utf8;
6489                     cache[3] = byte;
6490                 }
6491             }
6492             else {
6493                 if (keep_earlier < existing) {
6494                     cache[0] = cache[2];
6495                     cache[1] = cache[3];
6496                     cache[2] = utf8;
6497                     cache[3] = byte;
6498                 }
6499             }
6500         }
6501     }
6502     ASSERT_UTF8_CACHE(cache);
6503 }
6504
6505 /* We already know all of the way, now we may be able to walk back.  The same
6506    assumption is made as in S_sv_pos_u2b_midway(), namely that walking
6507    backward is half the speed of walking forward. */
6508 static STRLEN
6509 S_sv_pos_b2u_midway(pTHX_ const U8 *const s, const U8 *const target,
6510                     const U8 *end, STRLEN endu)
6511 {
6512     const STRLEN forw = target - s;
6513     STRLEN backw = end - target;
6514
6515     PERL_ARGS_ASSERT_SV_POS_B2U_MIDWAY;
6516
6517     if (forw < 2 * backw) {
6518         return utf8_length(s, target);
6519     }
6520
6521     while (end > target) {
6522         end--;
6523         while (UTF8_IS_CONTINUATION(*end)) {
6524             end--;
6525         }
6526         endu--;
6527     }
6528     return endu;
6529 }
6530
6531 /*
6532 =for apidoc sv_pos_b2u
6533
6534 Converts the value pointed to by offsetp from a count of bytes from the
6535 start of the string, to a count of the equivalent number of UTF-8 chars.
6536 Handles magic and type coercion.
6537
6538 =cut
6539 */
6540
6541 /*
6542  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
6543  * PERL_MAGIC_utf8 of the sv to store the mapping between UTF-8 and
6544  * byte offsets.
6545  *
6546  */
6547 void
6548 Perl_sv_pos_b2u(pTHX_ register SV *const sv, I32 *const offsetp)
6549 {
6550     const U8* s;
6551     const STRLEN byte = *offsetp;
6552     STRLEN len = 0; /* Actually always set, but let's keep gcc happy.  */
6553     STRLEN blen;
6554     MAGIC* mg = NULL;
6555     const U8* send;
6556     bool found = FALSE;
6557
6558     PERL_ARGS_ASSERT_SV_POS_B2U;
6559
6560     if (!sv)
6561         return;
6562
6563     s = (const U8*)SvPV_const(sv, blen);
6564
6565     if (blen < byte)
6566         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
6567
6568     send = s + byte;
6569
6570     if (!SvREADONLY(sv)
6571         && PL_utf8cache
6572         && SvTYPE(sv) >= SVt_PVMG
6573         && (mg = mg_find(sv, PERL_MAGIC_utf8)))
6574     {
6575         if (mg->mg_ptr) {
6576             STRLEN * const cache = (STRLEN *) mg->mg_ptr;
6577             if (cache[1] == byte) {
6578                 /* An exact match. */
6579                 *offsetp = cache[0];
6580                 return;
6581             }
6582             if (cache[3] == byte) {
6583                 /* An exact match. */
6584                 *offsetp = cache[2];
6585                 return;
6586             }
6587
6588             if (cache[1] < byte) {
6589                 /* We already know part of the way. */
6590                 if (mg->mg_len != -1) {
6591                     /* Actually, we know the end too.  */
6592                     len = cache[0]
6593                         + S_sv_pos_b2u_midway(aTHX_ s + cache[1], send,
6594                                               s + blen, mg->mg_len - cache[0]);
6595                 } else {
6596                     len = cache[0] + utf8_length(s + cache[1], send);
6597                 }
6598             }
6599             else if (cache[3] < byte) {
6600                 /* We're between the two cached pairs, so we do the calculation
6601                    offset by the byte/utf-8 positions for the earlier pair,
6602                    then add the utf-8 characters from the string start to
6603                    there.  */
6604                 len = S_sv_pos_b2u_midway(aTHX_ s + cache[3], send,
6605                                           s + cache[1], cache[0] - cache[2])
6606                     + cache[2];
6607
6608             }
6609             else { /* cache[3] > byte */
6610                 len = S_sv_pos_b2u_midway(aTHX_ s, send, s + cache[3],
6611                                           cache[2]);
6612
6613             }
6614             ASSERT_UTF8_CACHE(cache);
6615             found = TRUE;
6616         } else if (mg->mg_len != -1) {
6617             len = S_sv_pos_b2u_midway(aTHX_ s, send, s + blen, mg->mg_len);
6618             found = TRUE;
6619         }
6620     }
6621     if (!found || PL_utf8cache < 0) {
6622         const STRLEN real_len = utf8_length(s, send);
6623
6624         if (found && PL_utf8cache < 0) {
6625             if (len != real_len) {
6626                 /* Need to turn the assertions off otherwise we may recurse
6627                    infinitely while printing error messages.  */
6628                 SAVEI8(PL_utf8cache);
6629                 PL_utf8cache = 0;
6630                 Perl_croak(aTHX_ "panic: sv_pos_b2u cache %"UVuf
6631                            " real %"UVuf" for %"SVf,
6632                            (UV) len, (UV) real_len, SVfARG(sv));
6633             }
6634         }
6635         len = real_len;
6636     }
6637     *offsetp = len;
6638
6639     if (PL_utf8cache)
6640         utf8_mg_pos_cache_update(sv, &mg, byte, len, blen);
6641 }
6642
6643 /*
6644 =for apidoc sv_eq
6645
6646 Returns a boolean indicating whether the strings in the two SVs are
6647 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
6648 coerce its args to strings if necessary.
6649
6650 =cut
6651 */
6652
6653 I32
6654 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
6655 {
6656     dVAR;
6657     const char *pv1;
6658     STRLEN cur1;
6659     const char *pv2;
6660     STRLEN cur2;
6661     I32  eq     = 0;
6662     char *tpv   = NULL;
6663     SV* svrecode = NULL;
6664
6665     if (!sv1) {
6666         pv1 = "";
6667         cur1 = 0;
6668     }
6669     else {
6670         /* if pv1 and pv2 are the same, second SvPV_const call may
6671          * invalidate pv1, so we may need to make a copy */
6672         if (sv1 == sv2 && (SvTHINKFIRST(sv1) || SvGMAGICAL(sv1))) {
6673             pv1 = SvPV_const(sv1, cur1);
6674             sv1 = newSVpvn_flags(pv1, cur1, SVs_TEMP | SvUTF8(sv2));
6675         }
6676         pv1 = SvPV_const(sv1, cur1);
6677     }
6678
6679     if (!sv2){
6680         pv2 = "";
6681         cur2 = 0;
6682     }
6683     else
6684         pv2 = SvPV_const(sv2, cur2);
6685
6686     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
6687         /* Differing utf8ness.
6688          * Do not UTF8size the comparands as a side-effect. */
6689          if (PL_encoding) {
6690               if (SvUTF8(sv1)) {
6691                    svrecode = newSVpvn(pv2, cur2);
6692                    sv_recode_to_utf8(svrecode, PL_encoding);
6693                    pv2 = SvPV_const(svrecode, cur2);
6694               }
6695               else {
6696                    svrecode = newSVpvn(pv1, cur1);
6697                    sv_recode_to_utf8(svrecode, PL_encoding);
6698                    pv1 = SvPV_const(svrecode, cur1);
6699               }
6700               /* Now both are in UTF-8. */
6701               if (cur1 != cur2) {
6702                    SvREFCNT_dec(svrecode);
6703                    return FALSE;
6704               }
6705          }
6706          else {
6707               bool is_utf8 = TRUE;
6708
6709               if (SvUTF8(sv1)) {
6710                    /* sv1 is the UTF-8 one,
6711                     * if is equal it must be downgrade-able */
6712                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
6713                                                      &cur1, &is_utf8);
6714                    if (pv != pv1)
6715                         pv1 = tpv = pv;
6716               }
6717               else {
6718                    /* sv2 is the UTF-8 one,
6719                     * if is equal it must be downgrade-able */
6720                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
6721                                                       &cur2, &is_utf8);
6722                    if (pv != pv2)
6723                         pv2 = tpv = pv;
6724               }
6725               if (is_utf8) {
6726                    /* Downgrade not possible - cannot be eq */
6727                    assert (tpv == 0);
6728                    return FALSE;
6729               }
6730          }
6731     }
6732
6733     if (cur1 == cur2)
6734         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
6735         
6736     SvREFCNT_dec(svrecode);
6737     if (tpv)
6738         Safefree(tpv);
6739
6740     return eq;
6741 }
6742
6743 /*
6744 =for apidoc sv_cmp
6745
6746 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
6747 string in C<sv1> is less than, equal to, or greater than the string in
6748 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
6749 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
6750
6751 =cut
6752 */
6753
6754 I32
6755 Perl_sv_cmp(pTHX_ register SV *const sv1, register SV *const sv2)
6756 {
6757     dVAR;
6758     STRLEN cur1, cur2;
6759     const char *pv1, *pv2;
6760     char *tpv = NULL;
6761     I32  cmp;
6762     SV *svrecode = NULL;
6763
6764     if (!sv1) {
6765         pv1 = "";
6766         cur1 = 0;
6767     }
6768     else
6769         pv1 = SvPV_const(sv1, cur1);
6770
6771     if (!sv2) {
6772         pv2 = "";
6773         cur2 = 0;
6774     }
6775     else
6776         pv2 = SvPV_const(sv2, cur2);
6777
6778     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
6779         /* Differing utf8ness.
6780          * Do not UTF8size the comparands as a side-effect. */
6781         if (SvUTF8(sv1)) {
6782             if (PL_encoding) {
6783                  svrecode = newSVpvn(pv2, cur2);
6784                  sv_recode_to_utf8(svrecode, PL_encoding);
6785                  pv2 = SvPV_const(svrecode, cur2);
6786             }
6787             else {
6788                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
6789             }
6790         }
6791         else {
6792             if (PL_encoding) {
6793                  svrecode = newSVpvn(pv1, cur1);
6794                  sv_recode_to_utf8(svrecode, PL_encoding);
6795                  pv1 = SvPV_const(svrecode, cur1);
6796             }
6797             else {
6798                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
6799             }
6800         }
6801     }
6802
6803     if (!cur1) {
6804         cmp = cur2 ? -1 : 0;
6805     } else if (!cur2) {
6806         cmp = 1;
6807     } else {
6808         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
6809
6810         if (retval) {
6811             cmp = retval < 0 ? -1 : 1;
6812         } else if (cur1 == cur2) {
6813             cmp = 0;
6814         } else {
6815             cmp = cur1 < cur2 ? -1 : 1;
6816         }
6817     }
6818
6819     SvREFCNT_dec(svrecode);
6820     if (tpv)
6821         Safefree(tpv);
6822
6823     return cmp;
6824 }
6825
6826 /*
6827 =for apidoc sv_cmp_locale
6828
6829 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
6830 'use bytes' aware, handles get magic, and will coerce its args to strings
6831 if necessary.  See also C<sv_cmp>.
6832
6833 =cut
6834 */
6835
6836 I32
6837 Perl_sv_cmp_locale(pTHX_ register SV *const sv1, register SV *const sv2)
6838 {
6839     dVAR;
6840 #ifdef USE_LOCALE_COLLATE
6841
6842     char *pv1, *pv2;
6843     STRLEN len1, len2;
6844     I32 retval;
6845
6846     if (PL_collation_standard)
6847         goto raw_compare;
6848
6849     len1 = 0;
6850     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
6851     len2 = 0;
6852     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
6853
6854     if (!pv1 || !len1) {
6855         if (pv2 && len2)
6856             return -1;
6857         else
6858             goto raw_compare;
6859     }
6860     else {
6861         if (!pv2 || !len2)
6862             return 1;
6863     }
6864
6865     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
6866
6867     if (retval)
6868         return retval < 0 ? -1 : 1;
6869
6870     /*
6871      * When the result of collation is equality, that doesn't mean
6872      * that there are no differences -- some locales exclude some
6873      * characters from consideration.  So to avoid false equalities,
6874      * we use the raw string as a tiebreaker.
6875      */
6876
6877   raw_compare:
6878     /*FALLTHROUGH*/
6879
6880 #endif /* USE_LOCALE_COLLATE */
6881
6882     return sv_cmp(sv1, sv2);
6883 }
6884
6885
6886 #ifdef USE_LOCALE_COLLATE
6887
6888 /*
6889 =for apidoc sv_collxfrm
6890
6891 Add Collate Transform magic to an SV if it doesn't already have it.
6892
6893 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
6894 scalar data of the variable, but transformed to such a format that a normal
6895 memory comparison can be used to compare the data according to the locale
6896 settings.
6897
6898 =cut
6899 */
6900
6901 char *
6902 Perl_sv_collxfrm(pTHX_ SV *const sv, STRLEN *const nxp)
6903 {
6904     dVAR;
6905     MAGIC *mg;
6906
6907     PERL_ARGS_ASSERT_SV_COLLXFRM;
6908
6909     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
6910     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
6911         const char *s;
6912         char *xf;
6913         STRLEN len, xlen;
6914
6915         if (mg)
6916             Safefree(mg->mg_ptr);
6917         s = SvPV_const(sv, len);
6918         if ((xf = mem_collxfrm(s, len, &xlen))) {
6919             if (! mg) {
6920 #ifdef PERL_OLD_COPY_ON_WRITE
6921                 if (SvIsCOW(sv))
6922                     sv_force_normal_flags(sv, 0);
6923 #endif
6924                 mg = sv_magicext(sv, 0, PERL_MAGIC_collxfrm, &PL_vtbl_collxfrm,
6925                                  0, 0);
6926                 assert(mg);
6927             }
6928             mg->mg_ptr = xf;
6929             mg->mg_len = xlen;
6930         }
6931         else {
6932             if (mg) {
6933                 mg->mg_ptr = NULL;
6934                 mg->mg_len = -1;
6935             }
6936         }
6937     }
6938     if (mg && mg->mg_ptr) {
6939         *nxp = mg->mg_len;
6940         return mg->mg_ptr + sizeof(PL_collation_ix);
6941     }
6942     else {
6943         *nxp = 0;
6944         return NULL;
6945     }
6946 }
6947
6948 #endif /* USE_LOCALE_COLLATE */
6949
6950 /*
6951 =for apidoc sv_gets
6952
6953 Get a line from the filehandle and store it into the SV, optionally
6954 appending to the currently-stored string.
6955
6956 =cut
6957 */
6958
6959 char *
6960 Perl_sv_gets(pTHX_ register SV *const sv, register PerlIO *const fp, I32 append)
6961 {
6962     dVAR;
6963     const char *rsptr;
6964     STRLEN rslen;
6965     register STDCHAR rslast;
6966     register STDCHAR *bp;
6967     register I32 cnt;
6968     I32 i = 0;
6969     I32 rspara = 0;
6970
6971     PERL_ARGS_ASSERT_SV_GETS;
6972
6973     if (SvTHINKFIRST(sv))
6974         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
6975     /* XXX. If you make this PVIV, then copy on write can copy scalars read
6976        from <>.
6977        However, perlbench says it's slower, because the existing swipe code
6978        is faster than copy on write.
6979        Swings and roundabouts.  */
6980     SvUPGRADE(sv, SVt_PV);
6981
6982     SvSCREAM_off(sv);
6983
6984     if (append) {
6985         if (PerlIO_isutf8(fp)) {
6986             if (!SvUTF8(sv)) {
6987                 sv_utf8_upgrade_nomg(sv);
6988                 sv_pos_u2b(sv,&append,0);
6989             }
6990         } else if (SvUTF8(sv)) {
6991             SV * const tsv = newSV(0);
6992             sv_gets(tsv, fp, 0);
6993             sv_utf8_upgrade_nomg(tsv);
6994             SvCUR_set(sv,append);
6995             sv_catsv(sv,tsv);
6996             sv_free(tsv);
6997             goto return_string_or_null;
6998         }
6999     }
7000
7001     SvPOK_only(sv);
7002     if (PerlIO_isutf8(fp))
7003         SvUTF8_on(sv);
7004
7005     if (IN_PERL_COMPILETIME) {
7006         /* we always read code in line mode */
7007         rsptr = "\n";
7008         rslen = 1;
7009     }
7010     else if (RsSNARF(PL_rs)) {
7011         /* If it is a regular disk file use size from stat() as estimate
7012            of amount we are going to read -- may result in mallocing
7013            more memory than we really need if the layers below reduce
7014            the size we read (e.g. CRLF or a gzip layer).
7015          */
7016         Stat_t st;
7017         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
7018             const Off_t offset = PerlIO_tell(fp);
7019             if (offset != (Off_t) -1 && st.st_size + append > offset) {
7020                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
7021             }
7022         }
7023         rsptr = NULL;
7024         rslen = 0;
7025     }
7026     else if (RsRECORD(PL_rs)) {
7027       I32 bytesread;
7028       char *buffer;
7029       U32 recsize;
7030 #ifdef VMS
7031       int fd;
7032 #endif
7033
7034       /* Grab the size of the record we're getting */
7035       recsize = SvUV(SvRV(PL_rs)); /* RsRECORD() guarantees > 0. */
7036       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
7037       /* Go yank in */
7038 #ifdef VMS
7039       /* VMS wants read instead of fread, because fread doesn't respect */
7040       /* RMS record boundaries. This is not necessarily a good thing to be */
7041       /* doing, but we've got no other real choice - except avoid stdio
7042          as implementation - perhaps write a :vms layer ?
7043        */
7044       fd = PerlIO_fileno(fp);
7045       if (fd == -1) { /* in-memory file from PerlIO::Scalar */
7046           bytesread = PerlIO_read(fp, buffer, recsize);
7047       }
7048       else {
7049           bytesread = PerlLIO_read(fd, buffer, recsize);
7050       }
7051 #else
7052       bytesread = PerlIO_read(fp, buffer, recsize);
7053 #endif
7054       if (bytesread < 0)
7055           bytesread = 0;
7056       SvCUR_set(sv, bytesread + append);
7057       buffer[bytesread] = '\0';
7058       goto return_string_or_null;
7059     }
7060     else if (RsPARA(PL_rs)) {
7061         rsptr = "\n\n";
7062         rslen = 2;
7063         rspara = 1;
7064     }
7065     else {
7066         /* Get $/ i.e. PL_rs into same encoding as stream wants */
7067         if (PerlIO_isutf8(fp)) {
7068             rsptr = SvPVutf8(PL_rs, rslen);
7069         }
7070         else {
7071             if (SvUTF8(PL_rs)) {
7072                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
7073                     Perl_croak(aTHX_ "Wide character in $/");
7074                 }
7075             }
7076             rsptr = SvPV_const(PL_rs, rslen);
7077         }
7078     }
7079
7080     rslast = rslen ? rsptr[rslen - 1] : '\0';
7081
7082     if (rspara) {               /* have to do this both before and after */
7083         do {                    /* to make sure file boundaries work right */
7084             if (PerlIO_eof(fp))
7085                 return 0;
7086             i = PerlIO_getc(fp);
7087             if (i != '\n') {
7088                 if (i == -1)
7089                     return 0;
7090                 PerlIO_ungetc(fp,i);
7091                 break;
7092             }
7093         } while (i != EOF);
7094     }
7095
7096     /* See if we know enough about I/O mechanism to cheat it ! */
7097
7098     /* This used to be #ifdef test - it is made run-time test for ease
7099        of abstracting out stdio interface. One call should be cheap
7100        enough here - and may even be a macro allowing compile
7101        time optimization.
7102      */
7103
7104     if (PerlIO_fast_gets(fp)) {
7105
7106     /*
7107      * We're going to steal some values from the stdio struct
7108      * and put EVERYTHING in the innermost loop into registers.
7109      */
7110     register STDCHAR *ptr;
7111     STRLEN bpx;
7112     I32 shortbuffered;
7113
7114 #if defined(VMS) && defined(PERLIO_IS_STDIO)
7115     /* An ungetc()d char is handled separately from the regular
7116      * buffer, so we getc() it back out and stuff it in the buffer.
7117      */
7118     i = PerlIO_getc(fp);
7119     if (i == EOF) return 0;
7120     *(--((*fp)->_ptr)) = (unsigned char) i;
7121     (*fp)->_cnt++;
7122 #endif
7123
7124     /* Here is some breathtakingly efficient cheating */
7125
7126     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
7127     /* make sure we have the room */
7128     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
7129         /* Not room for all of it
7130            if we are looking for a separator and room for some
7131          */
7132         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
7133             /* just process what we have room for */
7134             shortbuffered = cnt - SvLEN(sv) + append + 1;
7135             cnt -= shortbuffered;
7136         }
7137         else {
7138             shortbuffered = 0;
7139             /* remember that cnt can be negative */
7140             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
7141         }
7142     }
7143     else
7144         shortbuffered = 0;
7145     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
7146     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
7147     DEBUG_P(PerlIO_printf(Perl_debug_log,
7148         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
7149     DEBUG_P(PerlIO_printf(Perl_debug_log,
7150         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
7151                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
7152                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
7153     for (;;) {
7154       screamer:
7155         if (cnt > 0) {
7156             if (rslen) {
7157                 while (cnt > 0) {                    /* this     |  eat */
7158                     cnt--;
7159                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
7160                         goto thats_all_folks;        /* screams  |  sed :-) */
7161                 }
7162             }
7163             else {
7164                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
7165                 bp += cnt;                           /* screams  |  dust */
7166                 ptr += cnt;                          /* louder   |  sed :-) */
7167                 cnt = 0;
7168             }
7169         }
7170         
7171         if (shortbuffered) {            /* oh well, must extend */
7172             cnt = shortbuffered;
7173             shortbuffered = 0;
7174             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
7175             SvCUR_set(sv, bpx);
7176             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
7177             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
7178             continue;
7179         }
7180
7181         DEBUG_P(PerlIO_printf(Perl_debug_log,
7182                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
7183                               PTR2UV(ptr),(long)cnt));
7184         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
7185 #if 0
7186         DEBUG_P(PerlIO_printf(Perl_debug_log,
7187             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
7188             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
7189             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
7190 #endif
7191         /* This used to call 'filbuf' in stdio form, but as that behaves like
7192            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
7193            another abstraction.  */
7194         i   = PerlIO_getc(fp);          /* get more characters */
7195 #if 0
7196         DEBUG_P(PerlIO_printf(Perl_debug_log,
7197             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
7198             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
7199             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
7200 #endif
7201         cnt = PerlIO_get_cnt(fp);
7202         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
7203         DEBUG_P(PerlIO_printf(Perl_debug_log,
7204             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
7205
7206         if (i == EOF)                   /* all done for ever? */
7207             goto thats_really_all_folks;
7208
7209         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
7210         SvCUR_set(sv, bpx);
7211         SvGROW(sv, bpx + cnt + 2);
7212         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
7213
7214         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
7215
7216         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
7217             goto thats_all_folks;
7218     }
7219
7220 thats_all_folks:
7221     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
7222           memNE((char*)bp - rslen, rsptr, rslen))
7223         goto screamer;                          /* go back to the fray */
7224 thats_really_all_folks:
7225     if (shortbuffered)
7226         cnt += shortbuffered;
7227         DEBUG_P(PerlIO_printf(Perl_debug_log,
7228             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
7229     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
7230     DEBUG_P(PerlIO_printf(Perl_debug_log,
7231         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
7232         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
7233         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
7234     *bp = '\0';
7235     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
7236     DEBUG_P(PerlIO_printf(Perl_debug_log,
7237         "Screamer: done, len=%ld, string=|%.*s|\n",
7238         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
7239     }
7240    else
7241     {
7242        /*The big, slow, and stupid way. */
7243 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
7244         STDCHAR *buf = NULL;
7245         Newx(buf, 8192, STDCHAR);
7246         assert(buf);
7247 #else
7248         STDCHAR buf[8192];
7249 #endif
7250
7251 screamer2:
7252         if (rslen) {
7253             register const STDCHAR * const bpe = buf + sizeof(buf);
7254             bp = buf;
7255             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
7256                 ; /* keep reading */
7257             cnt = bp - buf;
7258         }
7259         else {
7260             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
7261             /* Accomodate broken VAXC compiler, which applies U8 cast to
7262              * both args of ?: operator, causing EOF to change into 255
7263              */
7264             if (cnt > 0)
7265                  i = (U8)buf[cnt - 1];
7266             else
7267                  i = EOF;
7268         }
7269
7270         if (cnt < 0)
7271             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
7272         if (append)
7273              sv_catpvn(sv, (char *) buf, cnt);
7274         else
7275              sv_setpvn(sv, (char *) buf, cnt);
7276
7277         if (i != EOF &&                 /* joy */
7278             (!rslen ||
7279              SvCUR(sv) < rslen ||
7280              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
7281         {
7282             append = -1;
7283             /*
7284              * If we're reading from a TTY and we get a short read,
7285              * indicating that the user hit his EOF character, we need
7286              * to notice it now, because if we try to read from the TTY
7287              * again, the EOF condition will disappear.
7288              *
7289              * The comparison of cnt to sizeof(buf) is an optimization
7290              * that prevents unnecessary calls to feof().
7291              *
7292              * - jik 9/25/96
7293              */
7294             if (!(cnt < (I32)sizeof(buf) && PerlIO_eof(fp)))
7295                 goto screamer2;
7296         }
7297
7298 #ifdef USE_HEAP_INSTEAD_OF_STACK
7299         Safefree(buf);
7300 #endif
7301     }
7302
7303     if (rspara) {               /* have to do this both before and after */
7304         while (i != EOF) {      /* to make sure file boundaries work right */
7305             i = PerlIO_getc(fp);
7306             if (i != '\n') {
7307                 PerlIO_ungetc(fp,i);
7308                 break;
7309             }
7310         }
7311     }
7312
7313 return_string_or_null:
7314     return (SvCUR(sv) - append) ? SvPVX(sv) : NULL;
7315 }
7316
7317 /*
7318 =for apidoc sv_inc
7319
7320 Auto-increment of the value in the SV, doing string to numeric conversion
7321 if necessary. Handles 'get' magic.
7322
7323 =cut
7324 */
7325
7326 void
7327 Perl_sv_inc(pTHX_ register SV *const sv)
7328 {
7329     dVAR;
7330     register char *d;
7331     int flags;
7332
7333     if (!sv)
7334         return;
7335     SvGETMAGIC(sv);
7336     if (SvTHINKFIRST(sv)) {
7337         if (SvIsCOW(sv))
7338             sv_force_normal_flags(sv, 0);
7339         if (SvREADONLY(sv)) {
7340             if (IN_PERL_RUNTIME)
7341                 Perl_croak(aTHX_ "%s", PL_no_modify);
7342         }
7343         if (SvROK(sv)) {
7344             IV i;
7345             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
7346                 return;
7347             i = PTR2IV(SvRV(sv));
7348             sv_unref(sv);
7349             sv_setiv(sv, i);
7350         }
7351     }
7352     flags = SvFLAGS(sv);
7353     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
7354         /* It's (privately or publicly) a float, but not tested as an
7355            integer, so test it to see. */
7356         (void) SvIV(sv);
7357         flags = SvFLAGS(sv);
7358     }
7359     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
7360         /* It's publicly an integer, or privately an integer-not-float */
7361 #ifdef PERL_PRESERVE_IVUV
7362       oops_its_int:
7363 #endif
7364         if (SvIsUV(sv)) {
7365             if (SvUVX(sv) == UV_MAX)
7366                 sv_setnv(sv, UV_MAX_P1);
7367             else
7368                 (void)SvIOK_only_UV(sv);
7369                 SvUV_set(sv, SvUVX(sv) + 1);
7370         } else {
7371             if (SvIVX(sv) == IV_MAX)
7372                 sv_setuv(sv, (UV)IV_MAX + 1);
7373             else {
7374                 (void)SvIOK_only(sv);
7375                 SvIV_set(sv, SvIVX(sv) + 1);
7376             }   
7377         }
7378         return;
7379     }
7380     if (flags & SVp_NOK) {
7381         const NV was = SvNVX(sv);
7382         if (NV_OVERFLOWS_INTEGERS_AT &&
7383             was >= NV_OVERFLOWS_INTEGERS_AT) {
7384             Perl_ck_warner(aTHX_ packWARN(WARN_IMPRECISION),
7385                            "Lost precision when incrementing %" NVff " by 1",
7386                            was);
7387         }
7388         (void)SvNOK_only(sv);
7389         SvNV_set(sv, was + 1.0);
7390         return;
7391     }
7392
7393     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
7394         if ((flags & SVTYPEMASK) < SVt_PVIV)
7395             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
7396         (void)SvIOK_only(sv);
7397         SvIV_set(sv, 1);
7398         return;
7399     }
7400     d = SvPVX(sv);
7401     while (isALPHA(*d)) d++;
7402     while (isDIGIT(*d)) d++;
7403     if (d < SvEND(sv)) {
7404 #ifdef PERL_PRESERVE_IVUV
7405         /* Got to punt this as an integer if needs be, but we don't issue
7406            warnings. Probably ought to make the sv_iv_please() that does
7407            the conversion if possible, and silently.  */
7408         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
7409         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
7410             /* Need to try really hard to see if it's an integer.
7411                9.22337203685478e+18 is an integer.
7412                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
7413                so $a="9.22337203685478e+18"; $a+0; $a++
7414                needs to be the same as $a="9.22337203685478e+18"; $a++
7415                or we go insane. */
7416         
7417             (void) sv_2iv(sv);
7418             if (SvIOK(sv))
7419                 goto oops_its_int;
7420
7421             /* sv_2iv *should* have made this an NV */
7422             if (flags & SVp_NOK) {
7423                 (void)SvNOK_only(sv);
7424                 SvNV_set(sv, SvNVX(sv) + 1.0);
7425                 return;
7426             }
7427             /* I don't think we can get here. Maybe I should assert this
7428                And if we do get here I suspect that sv_setnv will croak. NWC
7429                Fall through. */
7430 #if defined(USE_LONG_DOUBLE)
7431             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
7432                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
7433 #else
7434             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
7435                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
7436 #endif
7437         }
7438 #endif /* PERL_PRESERVE_IVUV */
7439         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
7440         return;
7441     }
7442     d--;
7443     while (d >= SvPVX_const(sv)) {
7444         if (isDIGIT(*d)) {
7445             if (++*d <= '9')
7446                 return;
7447             *(d--) = '0';
7448         }
7449         else {
7450 #ifdef EBCDIC
7451             /* MKS: The original code here died if letters weren't consecutive.
7452              * at least it didn't have to worry about non-C locales.  The
7453              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
7454              * arranged in order (although not consecutively) and that only
7455              * [A-Za-z] are accepted by isALPHA in the C locale.
7456              */
7457             if (*d != 'z' && *d != 'Z') {
7458                 do { ++*d; } while (!isALPHA(*d));
7459                 return;
7460             }
7461             *(d--) -= 'z' - 'a';
7462 #else
7463             ++*d;
7464             if (isALPHA(*d))
7465                 return;
7466             *(d--) -= 'z' - 'a' + 1;
7467 #endif
7468         }
7469     }
7470     /* oh,oh, the number grew */
7471     SvGROW(sv, SvCUR(sv) + 2);
7472     SvCUR_set(sv, SvCUR(sv) + 1);
7473     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
7474         *d = d[-1];
7475     if (isDIGIT(d[1]))
7476         *d = '1';
7477     else
7478         *d = d[1];
7479 }
7480
7481 /*
7482 =for apidoc sv_dec
7483
7484 Auto-decrement of the value in the SV, doing string to numeric conversion
7485 if necessary. Handles 'get' magic.
7486
7487 =cut
7488 */
7489
7490 void
7491 Perl_sv_dec(pTHX_ register SV *const sv)
7492 {
7493     dVAR;
7494     int flags;
7495
7496     if (!sv)
7497         return;
7498     SvGETMAGIC(sv);
7499     if (SvTHINKFIRST(sv)) {
7500         if (SvIsCOW(sv))
7501             sv_force_normal_flags(sv, 0);
7502         if (SvREADONLY(sv)) {
7503             if (IN_PERL_RUNTIME)
7504                 Perl_croak(aTHX_ "%s", PL_no_modify);
7505         }
7506         if (SvROK(sv)) {
7507             IV i;
7508             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
7509                 return;
7510             i = PTR2IV(SvRV(sv));
7511             sv_unref(sv);
7512             sv_setiv(sv, i);
7513         }
7514     }
7515     /* Unlike sv_inc we don't have to worry about string-never-numbers
7516        and keeping them magic. But we mustn't warn on punting */
7517     flags = SvFLAGS(sv);
7518     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
7519         /* It's publicly an integer, or privately an integer-not-float */
7520 #ifdef PERL_PRESERVE_IVUV
7521       oops_its_int:
7522 #endif
7523         if (SvIsUV(sv)) {
7524             if (SvUVX(sv) == 0) {
7525                 (void)SvIOK_only(sv);
7526                 SvIV_set(sv, -1);
7527             }
7528             else {
7529                 (void)SvIOK_only_UV(sv);
7530                 SvUV_set(sv, SvUVX(sv) - 1);
7531             }   
7532         } else {
7533             if (SvIVX(sv) == IV_MIN) {
7534                 sv_setnv(sv, (NV)IV_MIN);
7535                 goto oops_its_num;
7536             }
7537             else {
7538                 (void)SvIOK_only(sv);
7539                 SvIV_set(sv, SvIVX(sv) - 1);
7540             }   
7541         }
7542         return;
7543     }
7544     if (flags & SVp_NOK) {
7545     oops_its_num:
7546         {
7547             const NV was = SvNVX(sv);
7548             if (NV_OVERFLOWS_INTEGERS_AT &&
7549                 was <= -NV_OVERFLOWS_INTEGERS_AT) {
7550                 Perl_ck_warner(aTHX_ packWARN(WARN_IMPRECISION),
7551                                "Lost precision when decrementing %" NVff " by 1",
7552                                was);
7553             }
7554             (void)SvNOK_only(sv);
7555             SvNV_set(sv, was - 1.0);
7556             return;
7557         }
7558     }
7559     if (!(flags & SVp_POK)) {
7560         if ((flags & SVTYPEMASK) < SVt_PVIV)
7561             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
7562         SvIV_set(sv, -1);
7563         (void)SvIOK_only(sv);
7564         return;
7565     }
7566 #ifdef PERL_PRESERVE_IVUV
7567     {
7568         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
7569         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
7570             /* Need to try really hard to see if it's an integer.
7571                9.22337203685478e+18 is an integer.
7572                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
7573                so $a="9.22337203685478e+18"; $a+0; $a--
7574                needs to be the same as $a="9.22337203685478e+18"; $a--
7575                or we go insane. */
7576         
7577             (void) sv_2iv(sv);
7578             if (SvIOK(sv))
7579                 goto oops_its_int;
7580
7581             /* sv_2iv *should* have made this an NV */
7582             if (flags & SVp_NOK) {
7583                 (void)SvNOK_only(sv);
7584                 SvNV_set(sv, SvNVX(sv) - 1.0);
7585                 return;
7586             }
7587             /* I don't think we can get here. Maybe I should assert this
7588                And if we do get here I suspect that sv_setnv will croak. NWC
7589                Fall through. */
7590 #if defined(USE_LONG_DOUBLE)
7591             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
7592                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
7593 #else
7594             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
7595                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
7596 #endif
7597         }
7598     }
7599 #endif /* PERL_PRESERVE_IVUV */
7600     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
7601 }
7602
7603 /* this define is used to eliminate a chunk of duplicated but shared logic
7604  * it has the suffix __SV_C to signal that it isnt API, and isnt meant to be
7605  * used anywhere but here - yves
7606  */
7607 #define PUSH_EXTEND_MORTAL__SV_C(AnSv) \
7608     STMT_START {      \
7609         EXTEND_MORTAL(1); \
7610         PL_tmps_stack[++PL_tmps_ix] = (AnSv); \
7611     } STMT_END
7612
7613 /*
7614 =for apidoc sv_mortalcopy
7615
7616 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
7617 The new SV is marked as mortal. It will be destroyed "soon", either by an
7618 explicit call to FREETMPS, or by an implicit call at places such as
7619 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
7620
7621 =cut
7622 */
7623
7624 /* Make a string that will exist for the duration of the expression
7625  * evaluation.  Actually, it may have to last longer than that, but
7626  * hopefully we won't free it until it has been assigned to a
7627  * permanent location. */
7628
7629 SV *
7630 Perl_sv_mortalcopy(pTHX_ SV *const oldstr)
7631 {
7632     dVAR;
7633     register SV *sv;
7634
7635     new_SV(sv);
7636     sv_setsv(sv,oldstr);
7637     PUSH_EXTEND_MORTAL__SV_C(sv);
7638     SvTEMP_on(sv);
7639     return sv;
7640 }
7641
7642 /*
7643 =for apidoc sv_newmortal
7644
7645 Creates a new null SV which is mortal.  The reference count of the SV is
7646 set to 1. It will be destroyed "soon", either by an explicit call to
7647 FREETMPS, or by an implicit call at places such as statement boundaries.
7648 See also C<sv_mortalcopy> and C<sv_2mortal>.
7649
7650 =cut
7651 */
7652
7653 SV *
7654 Perl_sv_newmortal(pTHX)
7655 {
7656     dVAR;
7657     register SV *sv;
7658
7659     new_SV(sv);
7660     SvFLAGS(sv) = SVs_TEMP;
7661     PUSH_EXTEND_MORTAL__SV_C(sv);
7662     return sv;
7663 }
7664
7665
7666 /*
7667 =for apidoc newSVpvn_flags
7668
7669 Creates a new SV and copies a string into it.  The reference count for the
7670 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
7671 string.  You are responsible for ensuring that the source string is at least
7672 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
7673 Currently the only flag bits accepted are C<SVf_UTF8> and C<SVs_TEMP>.
7674 If C<SVs_TEMP> is set, then C<sv2mortal()> is called on the result before
7675 returning. If C<SVf_UTF8> is set, then it will be set on the new SV.
7676 C<newSVpvn_utf8()> is a convenience wrapper for this function, defined as
7677
7678     #define newSVpvn_utf8(s, len, u)                    \
7679         newSVpvn_flags((s), (len), (u) ? SVf_UTF8 : 0)
7680
7681 =cut
7682 */
7683
7684 SV *
7685 Perl_newSVpvn_flags(pTHX_ const char *const s, const STRLEN len, const U32 flags)
7686 {
7687     dVAR;
7688     register SV *sv;
7689
7690     /* All the flags we don't support must be zero.
7691        And we're new code so I'm going to assert this from the start.  */
7692     assert(!(flags & ~(SVf_UTF8|SVs_TEMP)));
7693     new_SV(sv);
7694     sv_setpvn(sv,s,len);
7695
7696     /* This code used to a sv_2mortal(), however we now unroll the call to sv_2mortal()
7697      * and do what it does outselves here.
7698      * Since we have asserted that flags can only have the SVf_UTF8 and/or SVs_TEMP flags
7699      * set above we can use it to enable the sv flags directly (bypassing SvTEMP_on), which
7700      * in turn means we dont need to mask out the SVf_UTF8 flag below, which means that we
7701      * eleminate quite a few steps than it looks - Yves (explaining patch by gfx)
7702      */
7703
7704     SvFLAGS(sv) |= flags;
7705
7706     if(flags & SVs_TEMP){
7707         PUSH_EXTEND_MORTAL__SV_C(sv);
7708     }
7709
7710     return sv;
7711 }
7712
7713 /*
7714 =for apidoc sv_2mortal
7715
7716 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
7717 by an explicit call to FREETMPS, or by an implicit call at places such as
7718 statement boundaries.  SvTEMP() is turned on which means that the SV's
7719 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
7720 and C<sv_mortalcopy>.
7721
7722 =cut
7723 */
7724
7725 SV *
7726 Perl_sv_2mortal(pTHX_ register SV *const sv)
7727 {
7728     dVAR;
7729     if (!sv)
7730         return NULL;
7731     if (SvREADONLY(sv) && SvIMMORTAL(sv))
7732         return sv;
7733     PUSH_EXTEND_MORTAL__SV_C(sv);
7734     SvTEMP_on(sv);
7735     return sv;
7736 }
7737
7738 /*
7739 =for apidoc newSVpv
7740
7741 Creates a new SV and copies a string into it.  The reference count for the
7742 SV is set to 1.  If C<len> is zero, Perl will compute the length using
7743 strlen().  For efficiency, consider using C<newSVpvn> instead.
7744
7745 =cut
7746 */
7747
7748 SV *
7749 Perl_newSVpv(pTHX_ const char *const s, const STRLEN len)
7750 {
7751     dVAR;
7752     register SV *sv;
7753
7754     new_SV(sv);
7755     sv_setpvn(sv, s, len || s == NULL ? len : strlen(s));
7756     return sv;
7757 }
7758
7759 /*
7760 =for apidoc newSVpvn
7761
7762 Creates a new SV and copies a string into it.  The reference count for the
7763 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
7764 string.  You are responsible for ensuring that the source string is at least
7765 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
7766
7767 =cut
7768 */
7769
7770 SV *
7771 Perl_newSVpvn(pTHX_ const char *const s, const STRLEN len)
7772 {
7773     dVAR;
7774     register SV *sv;
7775
7776     new_SV(sv);
7777     sv_setpvn(sv,s,len);
7778     return sv;
7779 }
7780
7781 /*
7782 =for apidoc newSVhek
7783
7784 Creates a new SV from the hash key structure.  It will generate scalars that
7785 point to the shared string table where possible. Returns a new (undefined)
7786 SV if the hek is NULL.
7787
7788 =cut
7789 */
7790
7791 SV *
7792 Perl_newSVhek(pTHX_ const HEK *const hek)
7793 {
7794     dVAR;
7795     if (!hek) {
7796         SV *sv;
7797
7798         new_SV(sv);
7799         return sv;
7800     }
7801
7802     if (HEK_LEN(hek) == HEf_SVKEY) {
7803         return newSVsv(*(SV**)HEK_KEY(hek));
7804     } else {
7805         const int flags = HEK_FLAGS(hek);
7806         if (flags & HVhek_WASUTF8) {
7807             /* Trouble :-)
7808                Andreas would like keys he put in as utf8 to come back as utf8
7809             */
7810             STRLEN utf8_len = HEK_LEN(hek);
7811             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
7812             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
7813
7814             SvUTF8_on (sv);
7815             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
7816             return sv;
7817         } else if (flags & (HVhek_REHASH|HVhek_UNSHARED)) {
7818             /* We don't have a pointer to the hv, so we have to replicate the
7819                flag into every HEK. This hv is using custom a hasing
7820                algorithm. Hence we can't return a shared string scalar, as
7821                that would contain the (wrong) hash value, and might get passed
7822                into an hv routine with a regular hash.
7823                Similarly, a hash that isn't using shared hash keys has to have
7824                the flag in every key so that we know not to try to call
7825                share_hek_kek on it.  */
7826
7827             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
7828             if (HEK_UTF8(hek))
7829                 SvUTF8_on (sv);
7830             return sv;
7831         }
7832         /* This will be overwhelminly the most common case.  */
7833         {
7834             /* Inline most of newSVpvn_share(), because share_hek_hek() is far
7835                more efficient than sharepvn().  */
7836             SV *sv;
7837
7838             new_SV(sv);
7839             sv_upgrade(sv, SVt_PV);
7840             SvPV_set(sv, (char *)HEK_KEY(share_hek_hek(hek)));
7841             SvCUR_set(sv, HEK_LEN(hek));
7842             SvLEN_set(sv, 0);
7843             SvREADONLY_on(sv);
7844             SvFAKE_on(sv);
7845             SvPOK_on(sv);
7846             if (HEK_UTF8(hek))
7847                 SvUTF8_on(sv);
7848             return sv;
7849         }
7850     }
7851 }
7852
7853 /*
7854 =for apidoc newSVpvn_share
7855
7856 Creates a new SV with its SvPVX_const pointing to a shared string in the string
7857 table. If the string does not already exist in the table, it is created
7858 first.  Turns on READONLY and FAKE. If the C<hash> parameter is non-zero, that
7859 value is used; otherwise the hash is computed. The string's hash can be later
7860 be retrieved from the SV with the C<SvSHARED_HASH()> macro. The idea here is
7861 that as the string table is used for shared hash keys these strings will have
7862 SvPVX_const == HeKEY and hash lookup will avoid string compare.
7863
7864 =cut
7865 */
7866
7867 SV *
7868 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
7869 {
7870     dVAR;
7871     register SV *sv;
7872     bool is_utf8 = FALSE;
7873     const char *const orig_src = src;
7874
7875     if (len < 0) {
7876         STRLEN tmplen = -len;
7877         is_utf8 = TRUE;
7878         /* See the note in hv.c:hv_fetch() --jhi */
7879         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
7880         len = tmplen;
7881     }
7882     if (!hash)
7883         PERL_HASH(hash, src, len);
7884     new_SV(sv);
7885     /* The logic for this is inlined in S_mro_get_linear_isa_dfs(), so if it
7886        changes here, update it there too.  */
7887     sv_upgrade(sv, SVt_PV);
7888     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
7889     SvCUR_set(sv, len);
7890     SvLEN_set(sv, 0);
7891     SvREADONLY_on(sv);
7892     SvFAKE_on(sv);
7893     SvPOK_on(sv);
7894     if (is_utf8)
7895         SvUTF8_on(sv);
7896     if (src != orig_src)
7897         Safefree(src);
7898     return sv;
7899 }
7900
7901
7902 #if defined(PERL_IMPLICIT_CONTEXT)
7903
7904 /* pTHX_ magic can't cope with varargs, so this is a no-context
7905  * version of the main function, (which may itself be aliased to us).
7906  * Don't access this version directly.
7907  */
7908
7909 SV *
7910 Perl_newSVpvf_nocontext(const char *const pat, ...)
7911 {
7912     dTHX;
7913     register SV *sv;
7914     va_list args;
7915
7916     PERL_ARGS_ASSERT_NEWSVPVF_NOCONTEXT;
7917
7918     va_start(args, pat);
7919     sv = vnewSVpvf(pat, &args);
7920     va_end(args);
7921     return sv;
7922 }
7923 #endif
7924
7925 /*
7926 =for apidoc newSVpvf
7927
7928 Creates a new SV and initializes it with the string formatted like
7929 C<sprintf>.
7930
7931 =cut
7932 */
7933
7934 SV *
7935 Perl_newSVpvf(pTHX_ const char *const pat, ...)
7936 {
7937     register SV *sv;
7938     va_list args;
7939
7940     PERL_ARGS_ASSERT_NEWSVPVF;
7941
7942     va_start(args, pat);
7943     sv = vnewSVpvf(pat, &args);
7944     va_end(args);
7945     return sv;
7946 }
7947
7948 /* backend for newSVpvf() and newSVpvf_nocontext() */
7949
7950 SV *
7951 Perl_vnewSVpvf(pTHX_ const char *const pat, va_list *const args)
7952 {
7953     dVAR;
7954     register SV *sv;
7955
7956     PERL_ARGS_ASSERT_VNEWSVPVF;
7957
7958     new_SV(sv);
7959     sv_vsetpvfn(sv, pat, strlen(pat), args, NULL, 0, NULL);
7960     return sv;
7961 }
7962
7963 /*
7964 =for apidoc newSVnv
7965
7966 Creates a new SV and copies a floating point value into it.
7967 The reference count for the SV is set to 1.
7968
7969 =cut
7970 */
7971
7972 SV *
7973 Perl_newSVnv(pTHX_ const NV n)
7974 {
7975     dVAR;
7976     register SV *sv;
7977
7978     new_SV(sv);
7979     sv_setnv(sv,n);
7980     return sv;
7981 }
7982
7983 /*
7984 =for apidoc newSViv
7985
7986 Creates a new SV and copies an integer into it.  The reference count for the
7987 SV is set to 1.
7988
7989 =cut
7990 */
7991
7992 SV *
7993 Perl_newSViv(pTHX_ const IV i)
7994 {
7995     dVAR;
7996     register SV *sv;
7997
7998     new_SV(sv);
7999     sv_setiv(sv,i);
8000     return sv;
8001 }
8002
8003 /*
8004 =for apidoc newSVuv
8005
8006 Creates a new SV and copies an unsigned integer into it.
8007 The reference count for the SV is set to 1.
8008
8009 =cut
8010 */
8011
8012 SV *
8013 Perl_newSVuv(pTHX_ const UV u)
8014 {
8015     dVAR;
8016     register SV *sv;
8017
8018     new_SV(sv);
8019     sv_setuv(sv,u);
8020     return sv;
8021 }
8022
8023 /*
8024 =for apidoc newSV_type
8025
8026 Creates a new SV, of the type specified.  The reference count for the new SV
8027 is set to 1.
8028
8029 =cut
8030 */
8031
8032 SV *
8033 Perl_newSV_type(pTHX_ const svtype type)
8034 {
8035     register SV *sv;
8036
8037     new_SV(sv);
8038     sv_upgrade(sv, type);
8039     return sv;
8040 }
8041
8042 /*
8043 =for apidoc newRV_noinc
8044
8045 Creates an RV wrapper for an SV.  The reference count for the original
8046 SV is B<not> incremented.
8047
8048 =cut
8049 */
8050
8051 SV *
8052 Perl_newRV_noinc(pTHX_ SV *const tmpRef)
8053 {
8054     dVAR;
8055     register SV *sv = newSV_type(SVt_IV);
8056
8057     PERL_ARGS_ASSERT_NEWRV_NOINC;
8058
8059     SvTEMP_off(tmpRef);
8060     SvRV_set(sv, tmpRef);
8061     SvROK_on(sv);
8062     return sv;
8063 }
8064
8065 /* newRV_inc is the official function name to use now.
8066  * newRV_inc is in fact #defined to newRV in sv.h
8067  */
8068
8069 SV *
8070 Perl_newRV(pTHX_ SV *const sv)
8071 {
8072     dVAR;
8073
8074     PERL_ARGS_ASSERT_NEWRV;
8075
8076     return newRV_noinc(SvREFCNT_inc_simple_NN(sv));
8077 }
8078
8079 /*
8080 =for apidoc newSVsv
8081
8082 Creates a new SV which is an exact duplicate of the original SV.
8083 (Uses C<sv_setsv>).
8084
8085 =cut
8086 */
8087
8088 SV *
8089 Perl_newSVsv(pTHX_ register SV *const old)
8090 {
8091     dVAR;
8092     register SV *sv;
8093
8094     if (!old)
8095         return NULL;
8096     if (SvTYPE(old) == SVTYPEMASK) {
8097         Perl_ck_warner_d(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
8098         return NULL;
8099     }
8100     new_SV(sv);
8101     /* SV_GMAGIC is the default for sv_setv()
8102        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
8103        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
8104     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
8105     return sv;
8106 }
8107
8108 /*
8109 =for apidoc sv_reset
8110
8111 Underlying implementation for the C<reset> Perl function.
8112 Note that the perl-level function is vaguely deprecated.
8113
8114 =cut
8115 */
8116
8117 void
8118 Perl_sv_reset(pTHX_ register const char *s, HV *const stash)
8119 {
8120     dVAR;
8121     char todo[PERL_UCHAR_MAX+1];
8122
8123     PERL_ARGS_ASSERT_SV_RESET;
8124
8125     if (!stash)
8126         return;
8127
8128     if (!*s) {          /* reset ?? searches */
8129         MAGIC * const mg = mg_find((const SV *)stash, PERL_MAGIC_symtab);
8130         if (mg) {
8131             const U32 count = mg->mg_len / sizeof(PMOP**);
8132             PMOP **pmp = (PMOP**) mg->mg_ptr;
8133             PMOP *const *const end = pmp + count;
8134
8135             while (pmp < end) {
8136 #ifdef USE_ITHREADS
8137                 SvREADONLY_off(PL_regex_pad[(*pmp)->op_pmoffset]);
8138 #else
8139                 (*pmp)->op_pmflags &= ~PMf_USED;
8140 #endif
8141                 ++pmp;
8142             }
8143         }
8144         return;
8145     }
8146
8147     /* reset variables */
8148
8149     if (!HvARRAY(stash))
8150         return;
8151
8152     Zero(todo, 256, char);
8153     while (*s) {
8154         I32 max;
8155         I32 i = (unsigned char)*s;
8156         if (s[1] == '-') {
8157             s += 2;
8158         }
8159         max = (unsigned char)*s++;
8160         for ( ; i <= max; i++) {
8161             todo[i] = 1;
8162         }
8163         for (i = 0; i <= (I32) HvMAX(stash); i++) {
8164             HE *entry;
8165             for (entry = HvARRAY(stash)[i];
8166                  entry;
8167                  entry = HeNEXT(entry))
8168             {
8169                 register GV *gv;
8170                 register SV *sv;
8171
8172                 if (!todo[(U8)*HeKEY(entry)])
8173                     continue;
8174                 gv = MUTABLE_GV(HeVAL(entry));
8175                 sv = GvSV(gv);
8176                 if (sv) {
8177                     if (SvTHINKFIRST(sv)) {
8178                         if (!SvREADONLY(sv) && SvROK(sv))
8179                             sv_unref(sv);
8180                         /* XXX Is this continue a bug? Why should THINKFIRST
8181                            exempt us from resetting arrays and hashes?  */
8182                         continue;
8183                     }
8184                     SvOK_off(sv);
8185                     if (SvTYPE(sv) >= SVt_PV) {
8186                         SvCUR_set(sv, 0);
8187                         if (SvPVX_const(sv) != NULL)
8188                             *SvPVX(sv) = '\0';
8189                         SvTAINT(sv);
8190                     }
8191                 }
8192                 if (GvAV(gv)) {
8193                     av_clear(GvAV(gv));
8194                 }
8195                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
8196 #if defined(VMS)
8197                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
8198 #else /* ! VMS */
8199                     hv_clear(GvHV(gv));
8200 #  if defined(USE_ENVIRON_ARRAY)
8201                     if (gv == PL_envgv)
8202                         my_clearenv();
8203 #  endif /* USE_ENVIRON_ARRAY */
8204 #endif /* VMS */
8205                 }
8206             }
8207         }
8208     }
8209 }
8210
8211 /*
8212 =for apidoc sv_2io
8213
8214 Using various gambits, try to get an IO from an SV: the IO slot if its a
8215 GV; or the recursive result if we're an RV; or the IO slot of the symbol
8216 named after the PV if we're a string.
8217
8218 =cut
8219 */
8220
8221 IO*
8222 Perl_sv_2io(pTHX_ SV *const sv)
8223 {
8224     IO* io;
8225     GV* gv;
8226
8227     PERL_ARGS_ASSERT_SV_2IO;
8228
8229     switch (SvTYPE(sv)) {
8230     case SVt_PVIO:
8231         io = MUTABLE_IO(sv);
8232         break;
8233     case SVt_PVGV:
8234         if (isGV_with_GP(sv)) {
8235             gv = MUTABLE_GV(sv);
8236             io = GvIO(gv);
8237             if (!io)
8238                 Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
8239             break;
8240         }
8241         /* FALL THROUGH */
8242     default:
8243         if (!SvOK(sv))
8244             Perl_croak(aTHX_ PL_no_usym, "filehandle");
8245         if (SvROK(sv))
8246             return sv_2io(SvRV(sv));
8247         gv = gv_fetchsv(sv, 0, SVt_PVIO);
8248         if (gv)
8249             io = GvIO(gv);
8250         else
8251             io = 0;
8252         if (!io)
8253             Perl_croak(aTHX_ "Bad filehandle: %"SVf, SVfARG(sv));
8254         break;
8255     }
8256     return io;
8257 }
8258
8259 /*
8260 =for apidoc sv_2cv
8261
8262 Using various gambits, try to get a CV from an SV; in addition, try if
8263 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
8264 The flags in C<lref> are passed to gv_fetchsv.
8265
8266 =cut
8267 */
8268
8269 CV *
8270 Perl_sv_2cv(pTHX_ SV *sv, HV **const st, GV **const gvp, const I32 lref)
8271 {
8272     dVAR;
8273     GV *gv = NULL;
8274     CV *cv = NULL;
8275
8276     PERL_ARGS_ASSERT_SV_2CV;
8277
8278     if (!sv) {
8279         *st = NULL;
8280         *gvp = NULL;
8281         return NULL;
8282     }
8283     switch (SvTYPE(sv)) {
8284     case SVt_PVCV:
8285         *st = CvSTASH(sv);
8286         *gvp = NULL;
8287         return MUTABLE_CV(sv);
8288     case SVt_PVHV:
8289     case SVt_PVAV:
8290         *st = NULL;
8291         *gvp = NULL;
8292         return NULL;
8293     case SVt_PVGV:
8294         if (isGV_with_GP(sv)) {
8295             gv = MUTABLE_GV(sv);
8296             *gvp = gv;
8297             *st = GvESTASH(gv);
8298             goto fix_gv;
8299         }
8300         /* FALL THROUGH */
8301
8302     default:
8303         if (SvROK(sv)) {
8304             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
8305             SvGETMAGIC(sv);
8306             tryAMAGICunDEREF(to_cv);
8307
8308             sv = SvRV(sv);
8309             if (SvTYPE(sv) == SVt_PVCV) {
8310                 cv = MUTABLE_CV(sv);
8311                 *gvp = NULL;
8312                 *st = CvSTASH(cv);
8313                 return cv;
8314             }
8315             else if(isGV_with_GP(sv))
8316                 gv = MUTABLE_GV(sv);
8317             else
8318                 Perl_croak(aTHX_ "Not a subroutine reference");
8319         }
8320         else if (isGV_with_GP(sv)) {
8321             SvGETMAGIC(sv);
8322             gv = MUTABLE_GV(sv);
8323         }
8324         else
8325             gv = gv_fetchsv(sv, lref, SVt_PVCV); /* Calls get magic */
8326         *gvp = gv;
8327         if (!gv) {
8328             *st = NULL;
8329             return NULL;
8330         }
8331         /* Some flags to gv_fetchsv mean don't really create the GV  */
8332         if (!isGV_with_GP(gv)) {
8333             *st = NULL;
8334             return NULL;
8335         }
8336         *st = GvESTASH(gv);
8337     fix_gv:
8338         if (lref && !GvCVu(gv)) {
8339             SV *tmpsv;
8340             ENTER;
8341             tmpsv = newSV(0);
8342             gv_efullname3(tmpsv, gv, NULL);
8343             /* XXX this is probably not what they think they're getting.
8344              * It has the same effect as "sub name;", i.e. just a forward
8345              * declaration! */
8346             newSUB(start_subparse(FALSE, 0),
8347                    newSVOP(OP_CONST, 0, tmpsv),
8348                    NULL, NULL);
8349             LEAVE;
8350             if (!GvCVu(gv))
8351                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
8352                            SVfARG(SvOK(sv) ? sv : &PL_sv_no));
8353         }
8354         return GvCVu(gv);
8355     }
8356 }
8357
8358 /*
8359 =for apidoc sv_true
8360
8361 Returns true if the SV has a true value by Perl's rules.
8362 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
8363 instead use an in-line version.
8364
8365 =cut
8366 */
8367
8368 I32
8369 Perl_sv_true(pTHX_ register SV *const sv)
8370 {
8371     if (!sv)
8372         return 0;
8373     if (SvPOK(sv)) {
8374         register const XPV* const tXpv = (XPV*)SvANY(sv);
8375         if (tXpv &&
8376                 (tXpv->xpv_cur > 1 ||
8377                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
8378             return 1;
8379         else
8380             return 0;
8381     }
8382     else {
8383         if (SvIOK(sv))
8384             return SvIVX(sv) != 0;
8385         else {
8386             if (SvNOK(sv))
8387                 return SvNVX(sv) != 0.0;
8388             else
8389                 return sv_2bool(sv);
8390         }
8391     }
8392 }
8393
8394 /*
8395 =for apidoc sv_pvn_force
8396
8397 Get a sensible string out of the SV somehow.
8398 A private implementation of the C<SvPV_force> macro for compilers which
8399 can't cope with complex macro expressions. Always use the macro instead.
8400
8401 =for apidoc sv_pvn_force_flags
8402
8403 Get a sensible string out of the SV somehow.
8404 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
8405 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
8406 implemented in terms of this function.
8407 You normally want to use the various wrapper macros instead: see
8408 C<SvPV_force> and C<SvPV_force_nomg>
8409
8410 =cut
8411 */
8412
8413 char *
8414 Perl_sv_pvn_force_flags(pTHX_ SV *const sv, STRLEN *const lp, const I32 flags)
8415 {
8416     dVAR;
8417
8418     PERL_ARGS_ASSERT_SV_PVN_FORCE_FLAGS;
8419
8420     if (SvTHINKFIRST(sv) && !SvROK(sv))
8421         sv_force_normal_flags(sv, 0);
8422
8423     if (SvPOK(sv)) {
8424         if (lp)
8425             *lp = SvCUR(sv);
8426     }
8427     else {
8428         char *s;
8429         STRLEN len;
8430  
8431         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
8432             const char * const ref = sv_reftype(sv,0);
8433             if (PL_op)
8434                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
8435                            ref, OP_NAME(PL_op));
8436             else
8437                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
8438         }
8439         if ((SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
8440             || isGV_with_GP(sv))
8441             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
8442                 OP_NAME(PL_op));
8443         s = sv_2pv_flags(sv, &len, flags);
8444         if (lp)
8445             *lp = len;
8446
8447         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
8448             if (SvROK(sv))
8449                 sv_unref(sv);
8450             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
8451             SvGROW(sv, len + 1);
8452             Move(s,SvPVX(sv),len,char);
8453             SvCUR_set(sv, len);
8454             SvPVX(sv)[len] = '\0';
8455         }
8456         if (!SvPOK(sv)) {
8457             SvPOK_on(sv);               /* validate pointer */
8458             SvTAINT(sv);
8459             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
8460                                   PTR2UV(sv),SvPVX_const(sv)));
8461         }
8462     }
8463     return SvPVX_mutable(sv);
8464 }
8465
8466 /*
8467 =for apidoc sv_pvbyten_force
8468
8469 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
8470
8471 =cut
8472 */
8473
8474 char *
8475 Perl_sv_pvbyten_force(pTHX_ SV *const sv, STRLEN *const lp)
8476 {
8477     PERL_ARGS_ASSERT_SV_PVBYTEN_FORCE;
8478
8479     sv_pvn_force(sv,lp);
8480     sv_utf8_downgrade(sv,0);
8481     *lp = SvCUR(sv);
8482     return SvPVX(sv);
8483 }
8484
8485 /*
8486 =for apidoc sv_pvutf8n_force
8487
8488 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
8489
8490 =cut
8491 */
8492
8493 char *
8494 Perl_sv_pvutf8n_force(pTHX_ SV *const sv, STRLEN *const lp)
8495 {
8496     PERL_ARGS_ASSERT_SV_PVUTF8N_FORCE;
8497
8498     sv_pvn_force(sv,lp);
8499     sv_utf8_upgrade(sv);
8500     *lp = SvCUR(sv);
8501     return SvPVX(sv);
8502 }
8503
8504 /*
8505 =for apidoc sv_reftype
8506
8507 Returns a string describing what the SV is a reference to.
8508
8509 =cut
8510 */
8511
8512 const char *
8513 Perl_sv_reftype(pTHX_ const SV *const sv, const int ob)
8514 {
8515     PERL_ARGS_ASSERT_SV_REFTYPE;
8516
8517     /* The fact that I don't need to downcast to char * everywhere, only in ?:
8518        inside return suggests a const propagation bug in g++.  */
8519     if (ob && SvOBJECT(sv)) {
8520         char * const name = HvNAME_get(SvSTASH(sv));
8521         return name ? name : (char *) "__ANON__";
8522     }
8523     else {
8524         switch (SvTYPE(sv)) {
8525         case SVt_NULL:
8526         case SVt_IV:
8527         case SVt_NV:
8528         case SVt_PV:
8529         case SVt_PVIV:
8530         case SVt_PVNV:
8531         case SVt_PVMG:
8532                                 if (SvVOK(sv))
8533                                     return "VSTRING";
8534                                 if (SvROK(sv))
8535                                     return "REF";
8536                                 else
8537                                     return "SCALAR";
8538
8539         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
8540                                 /* tied lvalues should appear to be
8541                                  * scalars for backwards compatitbility */
8542                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
8543                                     ? "SCALAR" : "LVALUE");
8544         case SVt_PVAV:          return "ARRAY";
8545         case SVt_PVHV:          return "HASH";
8546         case SVt_PVCV:          return "CODE";
8547         case SVt_PVGV:          return (char *) (isGV_with_GP(sv)
8548                                     ? "GLOB" : "SCALAR");
8549         case SVt_PVFM:          return "FORMAT";
8550         case SVt_PVIO:          return "IO";
8551         case SVt_BIND:          return "BIND";
8552         case SVt_REGEXP:        return "REGEXP"; 
8553         default:                return "UNKNOWN";
8554         }
8555     }
8556 }
8557
8558 /*
8559 =for apidoc sv_isobject
8560
8561 Returns a boolean indicating whether the SV is an RV pointing to a blessed
8562 object.  If the SV is not an RV, or if the object is not blessed, then this
8563 will return false.
8564
8565 =cut
8566 */
8567
8568 int
8569 Perl_sv_isobject(pTHX_ SV *sv)
8570 {
8571     if (!sv)
8572         return 0;
8573     SvGETMAGIC(sv);
8574     if (!SvROK(sv))
8575         return 0;
8576     sv = SvRV(sv);
8577     if (!SvOBJECT(sv))
8578         return 0;
8579     return 1;
8580 }
8581
8582 /*
8583 =for apidoc sv_isa
8584
8585 Returns a boolean indicating whether the SV is blessed into the specified
8586 class.  This does not check for subtypes; use C<sv_derived_from> to verify
8587 an inheritance relationship.
8588
8589 =cut
8590 */
8591
8592 int
8593 Perl_sv_isa(pTHX_ SV *sv, const char *const name)
8594 {
8595     const char *hvname;
8596
8597     PERL_ARGS_ASSERT_SV_ISA;
8598
8599     if (!sv)
8600         return 0;
8601     SvGETMAGIC(sv);
8602     if (!SvROK(sv))
8603         return 0;
8604     sv = SvRV(sv);
8605     if (!SvOBJECT(sv))
8606         return 0;
8607     hvname = HvNAME_get(SvSTASH(sv));
8608     if (!hvname)
8609         return 0;
8610
8611     return strEQ(hvname, name);
8612 }
8613
8614 /*
8615 =for apidoc newSVrv
8616
8617 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
8618 it will be upgraded to one.  If C<classname> is non-null then the new SV will
8619 be blessed in the specified package.  The new SV is returned and its
8620 reference count is 1.
8621
8622 =cut
8623 */
8624
8625 SV*
8626 Perl_newSVrv(pTHX_ SV *const rv, const char *const classname)
8627 {
8628     dVAR;
8629     SV *sv;
8630
8631     PERL_ARGS_ASSERT_NEWSVRV;
8632
8633     new_SV(sv);
8634
8635     SV_CHECK_THINKFIRST_COW_DROP(rv);
8636     (void)SvAMAGIC_off(rv);
8637
8638     if (SvTYPE(rv) >= SVt_PVMG) {
8639         const U32 refcnt = SvREFCNT(rv);
8640         SvREFCNT(rv) = 0;
8641         sv_clear(rv);
8642         SvFLAGS(rv) = 0;
8643         SvREFCNT(rv) = refcnt;
8644
8645         sv_upgrade(rv, SVt_IV);
8646     } else if (SvROK(rv)) {
8647         SvREFCNT_dec(SvRV(rv));
8648     } else {
8649         prepare_SV_for_RV(rv);
8650     }
8651
8652     SvOK_off(rv);
8653     SvRV_set(rv, sv);
8654     SvROK_on(rv);
8655
8656     if (classname) {
8657         HV* const stash = gv_stashpv(classname, GV_ADD);
8658         (void)sv_bless(rv, stash);
8659     }
8660     return sv;
8661 }
8662
8663 /*
8664 =for apidoc sv_setref_pv
8665
8666 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
8667 argument will be upgraded to an RV.  That RV will be modified to point to
8668 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
8669 into the SV.  The C<classname> argument indicates the package for the
8670 blessing.  Set C<classname> to C<NULL> to avoid the blessing.  The new SV
8671 will have a reference count of 1, and the RV will be returned.
8672
8673 Do not use with other Perl types such as HV, AV, SV, CV, because those
8674 objects will become corrupted by the pointer copy process.
8675
8676 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
8677
8678 =cut
8679 */
8680
8681 SV*
8682 Perl_sv_setref_pv(pTHX_ SV *const rv, const char *const classname, void *const pv)
8683 {
8684     dVAR;
8685
8686     PERL_ARGS_ASSERT_SV_SETREF_PV;
8687
8688     if (!pv) {
8689         sv_setsv(rv, &PL_sv_undef);
8690         SvSETMAGIC(rv);
8691     }
8692     else
8693         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
8694     return rv;
8695 }
8696
8697 /*
8698 =for apidoc sv_setref_iv
8699
8700 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
8701 argument will be upgraded to an RV.  That RV will be modified to point to
8702 the new SV.  The C<classname> argument indicates the package for the
8703 blessing.  Set C<classname> to C<NULL> to avoid the blessing.  The new SV
8704 will have a reference count of 1, and the RV will be returned.
8705
8706 =cut
8707 */
8708
8709 SV*
8710 Perl_sv_setref_iv(pTHX_ SV *const rv, const char *const classname, const IV iv)
8711 {
8712     PERL_ARGS_ASSERT_SV_SETREF_IV;
8713
8714     sv_setiv(newSVrv(rv,classname), iv);
8715     return rv;
8716 }
8717
8718 /*
8719 =for apidoc sv_setref_uv
8720
8721 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
8722 argument will be upgraded to an RV.  That RV will be modified to point to
8723 the new SV.  The C<classname> argument indicates the package for the
8724 blessing.  Set C<classname> to C<NULL> to avoid the blessing.  The new SV
8725 will have a reference count of 1, and the RV will be returned.
8726
8727 =cut
8728 */
8729
8730 SV*
8731 Perl_sv_setref_uv(pTHX_ SV *const rv, const char *const classname, const UV uv)
8732 {
8733     PERL_ARGS_ASSERT_SV_SETREF_UV;
8734
8735     sv_setuv(newSVrv(rv,classname), uv);
8736     return rv;
8737 }
8738
8739 /*
8740 =for apidoc sv_setref_nv
8741
8742 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
8743 argument will be upgraded to an RV.  That RV will be modified to point to
8744 the new SV.  The C<classname> argument indicates the package for the
8745 blessing.  Set C<classname> to C<NULL> to avoid the blessing.  The new SV
8746 will have a reference count of 1, and the RV will be returned.
8747
8748 =cut
8749 */
8750
8751 SV*
8752 Perl_sv_setref_nv(pTHX_ SV *const rv, const char *const classname, const NV nv)
8753 {
8754     PERL_ARGS_ASSERT_SV_SETREF_NV;
8755
8756     sv_setnv(newSVrv(rv,classname), nv);
8757     return rv;
8758 }
8759
8760 /*
8761 =for apidoc sv_setref_pvn
8762
8763 Copies a string into a new SV, optionally blessing the SV.  The length of the
8764 string must be specified with C<n>.  The C<rv> argument will be upgraded to
8765 an RV.  That RV will be modified to point to the new SV.  The C<classname>
8766 argument indicates the package for the blessing.  Set C<classname> to
8767 C<NULL> to avoid the blessing.  The new SV will have a reference count
8768 of 1, and the RV will be returned.
8769
8770 Note that C<sv_setref_pv> copies the pointer while this copies the string.
8771
8772 =cut
8773 */
8774
8775 SV*
8776 Perl_sv_setref_pvn(pTHX_ SV *const rv, const char *const classname,
8777                    const char *const pv, const STRLEN n)
8778 {
8779     PERL_ARGS_ASSERT_SV_SETREF_PVN;
8780
8781     sv_setpvn(newSVrv(rv,classname), pv, n);
8782     return rv;
8783 }
8784
8785 /*
8786 =for apidoc sv_bless
8787
8788 Blesses an SV into a specified package.  The SV must be an RV.  The package
8789 must be designated by its stash (see C<gv_stashpv()>).  The reference count
8790 of the SV is unaffected.
8791
8792 =cut
8793 */
8794
8795 SV*
8796 Perl_sv_bless(pTHX_ SV *const sv, HV *const stash)
8797 {
8798     dVAR;
8799     SV *tmpRef;
8800
8801     PERL_ARGS_ASSERT_SV_BLESS;
8802
8803     if (!SvROK(sv))
8804         Perl_croak(aTHX_ "Can't bless non-reference value");
8805     tmpRef = SvRV(sv);
8806     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
8807         if (SvIsCOW(tmpRef))
8808             sv_force_normal_flags(tmpRef, 0);
8809         if (SvREADONLY(tmpRef))
8810             Perl_croak(aTHX_ "%s", PL_no_modify);
8811         if (SvOBJECT(tmpRef)) {
8812             if (SvTYPE(tmpRef) != SVt_PVIO)
8813                 --PL_sv_objcount;
8814             SvREFCNT_dec(SvSTASH(tmpRef));
8815         }
8816     }
8817     SvOBJECT_on(tmpRef);
8818     if (SvTYPE(tmpRef) != SVt_PVIO)
8819         ++PL_sv_objcount;
8820     SvUPGRADE(tmpRef, SVt_PVMG);
8821     SvSTASH_set(tmpRef, MUTABLE_HV(SvREFCNT_inc_simple(stash)));
8822
8823     if (Gv_AMG(stash))
8824         SvAMAGIC_on(sv);
8825     else
8826         (void)SvAMAGIC_off(sv);
8827
8828     if(SvSMAGICAL(tmpRef))
8829         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
8830             mg_set(tmpRef);
8831
8832
8833
8834     return sv;
8835 }
8836
8837 /* Downgrades a PVGV to a PVMG.
8838  */
8839
8840 STATIC void
8841 S_sv_unglob(pTHX_ SV *const sv)
8842 {
8843     dVAR;
8844     void *xpvmg;
8845     HV *stash;
8846     SV * const temp = sv_newmortal();
8847
8848     PERL_ARGS_ASSERT_SV_UNGLOB;
8849
8850     assert(SvTYPE(sv) == SVt_PVGV);
8851     SvFAKE_off(sv);
8852     gv_efullname3(temp, MUTABLE_GV(sv), "*");
8853
8854     if (GvGP(sv)) {
8855         if(GvCVu((const GV *)sv) && (stash = GvSTASH(MUTABLE_GV(sv)))
8856            && HvNAME_get(stash))
8857             mro_method_changed_in(stash);
8858         gp_free(MUTABLE_GV(sv));
8859     }
8860     if (GvSTASH(sv)) {
8861         sv_del_backref(MUTABLE_SV(GvSTASH(sv)), sv);
8862         GvSTASH(sv) = NULL;
8863     }
8864     GvMULTI_off(sv);
8865     if (GvNAME_HEK(sv)) {
8866         unshare_hek(GvNAME_HEK(sv));
8867     }
8868     isGV_with_GP_off(sv);
8869
8870     /* need to keep SvANY(sv) in the right arena */
8871     xpvmg = new_XPVMG();
8872     StructCopy(SvANY(sv), xpvmg, XPVMG);
8873     del_XPVGV(SvANY(sv));
8874     SvANY(sv) = xpvmg;
8875
8876     SvFLAGS(sv) &= ~SVTYPEMASK;
8877     SvFLAGS(sv) |= SVt_PVMG;
8878
8879     /* Intentionally not calling any local SET magic, as this isn't so much a
8880        set operation as merely an internal storage change.  */
8881     sv_setsv_flags(sv, temp, 0);
8882 }
8883
8884 /*
8885 =for apidoc sv_unref_flags
8886
8887 Unsets the RV status of the SV, and decrements the reference count of
8888 whatever was being referenced by the RV.  This can almost be thought of
8889 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
8890 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
8891 (otherwise the decrementing is conditional on the reference count being
8892 different from one or the reference being a readonly SV).
8893 See C<SvROK_off>.
8894
8895 =cut
8896 */
8897
8898 void
8899 Perl_sv_unref_flags(pTHX_ SV *const ref, const U32 flags)
8900 {
8901     SV* const target = SvRV(ref);
8902
8903     PERL_ARGS_ASSERT_SV_UNREF_FLAGS;
8904
8905     if (SvWEAKREF(ref)) {
8906         sv_del_backref(target, ref);
8907         SvWEAKREF_off(ref);
8908         SvRV_set(ref, NULL);
8909         return;
8910     }
8911     SvRV_set(ref, NULL);
8912     SvROK_off(ref);
8913     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
8914        assigned to as BEGIN {$a = \"Foo"} will fail.  */
8915     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
8916         SvREFCNT_dec(target);
8917     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
8918         sv_2mortal(target);     /* Schedule for freeing later */
8919 }
8920
8921 /*
8922 =for apidoc sv_untaint
8923
8924 Untaint an SV. Use C<SvTAINTED_off> instead.
8925 =cut
8926 */
8927
8928 void
8929 Perl_sv_untaint(pTHX_ SV *const sv)
8930 {
8931     PERL_ARGS_ASSERT_SV_UNTAINT;
8932
8933     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
8934         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
8935         if (mg)
8936             mg->mg_len &= ~1;
8937     }
8938 }
8939
8940 /*
8941 =for apidoc sv_tainted
8942
8943 Test an SV for taintedness. Use C<SvTAINTED> instead.
8944 =cut
8945 */
8946
8947 bool
8948 Perl_sv_tainted(pTHX_ SV *const sv)
8949 {
8950     PERL_ARGS_ASSERT_SV_TAINTED;
8951
8952     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
8953         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
8954         if (mg && (mg->mg_len & 1) )
8955             return TRUE;
8956     }
8957     return FALSE;
8958 }
8959
8960 /*
8961 =for apidoc sv_setpviv
8962
8963 Copies an integer into the given SV, also updating its string value.
8964 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
8965
8966 =cut
8967 */
8968
8969 void
8970 Perl_sv_setpviv(pTHX_ SV *const sv, const IV iv)
8971 {
8972     char buf[TYPE_CHARS(UV)];
8973     char *ebuf;
8974     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
8975
8976     PERL_ARGS_ASSERT_SV_SETPVIV;
8977
8978     sv_setpvn(sv, ptr, ebuf - ptr);
8979 }
8980
8981 /*
8982 =for apidoc sv_setpviv_mg
8983
8984 Like C<sv_setpviv>, but also handles 'set' magic.
8985
8986 =cut
8987 */
8988
8989 void
8990 Perl_sv_setpviv_mg(pTHX_ SV *const sv, const IV iv)
8991 {
8992     PERL_ARGS_ASSERT_SV_SETPVIV_MG;
8993
8994     sv_setpviv(sv, iv);
8995     SvSETMAGIC(sv);
8996 }
8997
8998 #if defined(PERL_IMPLICIT_CONTEXT)
8999
9000 /* pTHX_ magic can't cope with varargs, so this is a no-context
9001  * version of the main function, (which may itself be aliased to us).
9002  * Don't access this version directly.
9003  */
9004
9005 void
9006 Perl_sv_setpvf_nocontext(SV *const sv, const char *const pat, ...)
9007 {
9008     dTHX;
9009     va_list args;
9010
9011     PERL_ARGS_ASSERT_SV_SETPVF_NOCONTEXT;
9012
9013     va_start(args, pat);
9014     sv_vsetpvf(sv, pat, &args);
9015     va_end(args);
9016 }
9017
9018 /* pTHX_ magic can't cope with varargs, so this is a no-context
9019  * version of the main function, (which may itself be aliased to us).
9020  * Don't access this version directly.
9021  */
9022
9023 void
9024 Perl_sv_setpvf_mg_nocontext(SV *const sv, const char *const pat, ...)
9025 {
9026     dTHX;
9027     va_list args;
9028
9029     PERL_ARGS_ASSERT_SV_SETPVF_MG_NOCONTEXT;
9030
9031     va_start(args, pat);
9032     sv_vsetpvf_mg(sv, pat, &args);
9033     va_end(args);
9034 }
9035 #endif
9036
9037 /*
9038 =for apidoc sv_setpvf
9039
9040 Works like C<sv_catpvf> but copies the text into the SV instead of
9041 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
9042
9043 =cut
9044 */
9045
9046 void
9047 Perl_sv_setpvf(pTHX_ SV *const sv, const char *const pat, ...)
9048 {
9049     va_list args;
9050
9051     PERL_ARGS_ASSERT_SV_SETPVF;
9052
9053     va_start(args, pat);
9054     sv_vsetpvf(sv, pat, &args);
9055     va_end(args);
9056 }
9057
9058 /*
9059 =for apidoc sv_vsetpvf
9060
9061 Works like C<sv_vcatpvf> but copies the text into the SV instead of
9062 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
9063
9064 Usually used via its frontend C<sv_setpvf>.
9065
9066 =cut
9067 */
9068
9069 void
9070 Perl_sv_vsetpvf(pTHX_ SV *const sv, const char *const pat, va_list *const args)
9071 {
9072     PERL_ARGS_ASSERT_SV_VSETPVF;
9073
9074     sv_vsetpvfn(sv, pat, strlen(pat), args, NULL, 0, NULL);
9075 }
9076
9077 /*
9078 =for apidoc sv_setpvf_mg
9079
9080 Like C<sv_setpvf>, but also handles 'set' magic.
9081
9082 =cut
9083 */
9084
9085 void
9086 Perl_sv_setpvf_mg(pTHX_ SV *const sv, const char *const pat, ...)
9087 {
9088     va_list args;
9089
9090     PERL_ARGS_ASSERT_SV_SETPVF_MG;
9091
9092     va_start(args, pat);
9093     sv_vsetpvf_mg(sv, pat, &args);
9094     va_end(args);
9095 }
9096
9097 /*
9098 =for apidoc sv_vsetpvf_mg
9099
9100 Like C<sv_vsetpvf>, but also handles 'set' magic.
9101
9102 Usually used via its frontend C<sv_setpvf_mg>.
9103
9104 =cut
9105 */
9106
9107 void
9108 Perl_sv_vsetpvf_mg(pTHX_ SV *const sv, const char *const pat, va_list *const args)
9109 {
9110     PERL_ARGS_ASSERT_SV_VSETPVF_MG;
9111
9112     sv_vsetpvfn(sv, pat, strlen(pat), args, NULL, 0, NULL);
9113     SvSETMAGIC(sv);
9114 }
9115
9116 #if defined(PERL_IMPLICIT_CONTEXT)
9117
9118 /* pTHX_ magic can't cope with varargs, so this is a no-context
9119  * version of the main function, (which may itself be aliased to us).
9120  * Don't access this version directly.
9121  */
9122
9123 void
9124 Perl_sv_catpvf_nocontext(SV *const sv, const char *const pat, ...)
9125 {
9126     dTHX;
9127     va_list args;
9128
9129     PERL_ARGS_ASSERT_SV_CATPVF_NOCONTEXT;
9130
9131     va_start(args, pat);
9132     sv_vcatpvf(sv, pat, &args);
9133     va_end(args);
9134 }
9135
9136 /* pTHX_ magic can't cope with varargs, so this is a no-context
9137  * version of the main function, (which may itself be aliased to us).
9138  * Don't access this version directly.
9139  */
9140
9141 void
9142 Perl_sv_catpvf_mg_nocontext(SV *const sv, const char *const pat, ...)
9143 {
9144     dTHX;
9145     va_list args;
9146
9147     PERL_ARGS_ASSERT_SV_CATPVF_MG_NOCONTEXT;
9148
9149     va_start(args, pat);
9150     sv_vcatpvf_mg(sv, pat, &args);
9151     va_end(args);
9152 }
9153 #endif
9154
9155 /*
9156 =for apidoc sv_catpvf
9157
9158 Processes its arguments like C<sprintf> and appends the formatted
9159 output to an SV.  If the appended data contains "wide" characters
9160 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
9161 and characters >255 formatted with %c), the original SV might get
9162 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
9163 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
9164 valid UTF-8; if the original SV was bytes, the pattern should be too.
9165
9166 =cut */
9167
9168 void
9169 Perl_sv_catpvf(pTHX_ SV *const sv, const char *const pat, ...)
9170 {
9171     va_list args;
9172
9173     PERL_ARGS_ASSERT_SV_CATPVF;
9174
9175     va_start(args, pat);
9176     sv_vcatpvf(sv, pat, &args);
9177     va_end(args);
9178 }
9179
9180 /*
9181 =for apidoc sv_vcatpvf
9182
9183 Processes its arguments like C<vsprintf> and appends the formatted output
9184 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
9185
9186 Usually used via its frontend C<sv_catpvf>.
9187
9188 =cut
9189 */
9190
9191 void
9192 Perl_sv_vcatpvf(pTHX_ SV *const sv, const char *const pat, va_list *const args)
9193 {
9194     PERL_ARGS_ASSERT_SV_VCATPVF;
9195
9196     sv_vcatpvfn(sv, pat, strlen(pat), args, NULL, 0, NULL);
9197 }
9198
9199 /*
9200 =for apidoc sv_catpvf_mg
9201
9202 Like C<sv_catpvf>, but also handles 'set' magic.
9203
9204 =cut
9205 */
9206
9207 void
9208 Perl_sv_catpvf_mg(pTHX_ SV *const sv, const char *const pat, ...)
9209 {
9210     va_list args;
9211
9212     PERL_ARGS_ASSERT_SV_CATPVF_MG;
9213
9214     va_start(args, pat);
9215     sv_vcatpvf_mg(sv, pat, &args);
9216     va_end(args);
9217 }
9218
9219 /*
9220 =for apidoc sv_vcatpvf_mg
9221
9222 Like C<sv_vcatpvf>, but also handles 'set' magic.
9223
9224 Usually used via its frontend C<sv_catpvf_mg>.
9225
9226 =cut
9227 */
9228
9229 void
9230 Perl_sv_vcatpvf_mg(pTHX_ SV *const sv, const char *const pat, va_list *const args)
9231 {
9232     PERL_ARGS_ASSERT_SV_VCATPVF_MG;
9233
9234     sv_vcatpvfn(sv, pat, strlen(pat), args, NULL, 0, NULL);
9235     SvSETMAGIC(sv);
9236 }
9237
9238 /*
9239 =for apidoc sv_vsetpvfn
9240
9241 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
9242 appending it.
9243
9244 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
9245
9246 =cut
9247 */
9248
9249 void
9250 Perl_sv_vsetpvfn(pTHX_ SV *const sv, const char *const pat, const STRLEN patlen,
9251                  va_list *const args, SV **const svargs, const I32 svmax, bool *const maybe_tainted)
9252 {
9253     PERL_ARGS_ASSERT_SV_VSETPVFN;
9254
9255     sv_setpvs(sv, "");
9256     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
9257 }
9258
9259
9260 /*
9261  * Warn of missing argument to sprintf, and then return a defined value
9262  * to avoid inappropriate "use of uninit" warnings [perl #71000].
9263  */
9264 #define WARN_MISSING WARN_UNINITIALIZED /* Not sure we want a new category */
9265 STATIC SV*
9266 S_vcatpvfn_missing_argument(pTHX) {
9267     if (ckWARN(WARN_MISSING)) {
9268         Perl_warner(aTHX_ packWARN(WARN_MISSING), "Missing argument in %s",
9269                 PL_op ? OP_DESC(PL_op) : "sv_vcatpvfn()");
9270     }
9271     return &PL_sv_no;
9272 }
9273
9274
9275 STATIC I32
9276 S_expect_number(pTHX_ char **const pattern)
9277 {
9278     dVAR;
9279     I32 var = 0;
9280
9281     PERL_ARGS_ASSERT_EXPECT_NUMBER;
9282
9283     switch (**pattern) {
9284     case '1': case '2': case '3':
9285     case '4': case '5': case '6':
9286     case '7': case '8': case '9':
9287         var = *(*pattern)++ - '0';
9288         while (isDIGIT(**pattern)) {
9289             const I32 tmp = var * 10 + (*(*pattern)++ - '0');
9290             if (tmp < var)
9291                 Perl_croak(aTHX_ "Integer overflow in format string for %s", (PL_op ? OP_NAME(PL_op) : "sv_vcatpvfn"));
9292             var = tmp;
9293         }
9294     }
9295     return var;
9296 }
9297
9298 STATIC char *
9299 S_F0convert(NV nv, char *const endbuf, STRLEN *const len)
9300 {
9301     const int neg = nv < 0;
9302     UV uv;
9303
9304     PERL_ARGS_ASSERT_F0CONVERT;
9305
9306     if (neg)
9307         nv = -nv;
9308     if (nv < UV_MAX) {
9309         char *p = endbuf;
9310         nv += 0.5;
9311         uv = (UV)nv;
9312         if (uv & 1 && uv == nv)
9313             uv--;                       /* Round to even */
9314         do {
9315             const unsigned dig = uv % 10;
9316             *--p = '0' + dig;
9317         } while (uv /= 10);
9318         if (neg)
9319             *--p = '-';
9320         *len = endbuf - p;
9321         return p;
9322     }
9323     return NULL;
9324 }
9325
9326
9327 /*
9328 =for apidoc sv_vcatpvfn
9329
9330 Processes its arguments like C<vsprintf> and appends the formatted output
9331 to an SV.  Uses an array of SVs if the C style variable argument list is
9332 missing (NULL).  When running with taint checks enabled, indicates via
9333 C<maybe_tainted> if results are untrustworthy (often due to the use of
9334 locales).
9335
9336 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
9337
9338 =cut
9339 */
9340
9341
9342 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
9343                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
9344                         vec_utf8 = DO_UTF8(vecsv);
9345
9346 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
9347
9348 void
9349 Perl_sv_vcatpvfn(pTHX_ SV *const sv, const char *const pat, const STRLEN patlen,
9350                  va_list *const args, SV **const svargs, const I32 svmax, bool *const maybe_tainted)
9351 {
9352     dVAR;
9353     char *p;
9354     char *q;
9355     const char *patend;
9356     STRLEN origlen;
9357     I32 svix = 0;
9358     static const char nullstr[] = "(null)";
9359     SV *argsv = NULL;
9360     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
9361     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
9362     SV *nsv = NULL;
9363     /* Times 4: a decimal digit takes more than 3 binary digits.
9364      * NV_DIG: mantissa takes than many decimal digits.
9365      * Plus 32: Playing safe. */
9366     char ebuf[IV_DIG * 4 + NV_DIG + 32];
9367     /* large enough for "%#.#f" --chip */
9368     /* what about long double NVs? --jhi */
9369
9370     PERL_ARGS_ASSERT_SV_VCATPVFN;
9371     PERL_UNUSED_ARG(maybe_tainted);
9372
9373     /* no matter what, this is a string now */
9374     (void)SvPV_force(sv, origlen);
9375
9376     /* special-case "", "%s", and "%-p" (SVf - see below) */
9377     if (patlen == 0)
9378         return;
9379     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
9380         if (args) {
9381             const char * const s = va_arg(*args, char*);
9382             sv_catpv(sv, s ? s : nullstr);
9383         }
9384         else if (svix < svmax) {
9385             sv_catsv(sv, *svargs);
9386         }
9387         return;
9388     }
9389     if (args && patlen == 3 && pat[0] == '%' &&
9390                 pat[1] == '-' && pat[2] == 'p') {
9391         argsv = MUTABLE_SV(va_arg(*args, void*));
9392         sv_catsv(sv, argsv);
9393         return;
9394     }
9395
9396 #ifndef USE_LONG_DOUBLE
9397     /* special-case "%.<number>[gf]" */
9398     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
9399          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
9400         unsigned digits = 0;
9401         const char *pp;
9402
9403         pp = pat + 2;
9404         while (*pp >= '0' && *pp <= '9')
9405             digits = 10 * digits + (*pp++ - '0');
9406         if (pp - pat == (int)patlen - 1) {
9407             NV nv;
9408
9409             if (svix < svmax)
9410                 nv = SvNV(*svargs);
9411             else
9412                 return;
9413             if (*pp == 'g') {
9414                 /* Add check for digits != 0 because it seems that some
9415                    gconverts are buggy in this case, and we don't yet have
9416                    a Configure test for this.  */
9417                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
9418                      /* 0, point, slack */
9419                     Gconvert(nv, (int)digits, 0, ebuf);
9420                     sv_catpv(sv, ebuf);
9421                     if (*ebuf)  /* May return an empty string for digits==0 */
9422                         return;
9423                 }
9424             } else if (!digits) {
9425                 STRLEN l;
9426
9427                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
9428                     sv_catpvn(sv, p, l);
9429                     return;
9430                 }
9431             }
9432         }
9433     }
9434 #endif /* !USE_LONG_DOUBLE */
9435
9436     if (!args && svix < svmax && DO_UTF8(*svargs))
9437         has_utf8 = TRUE;
9438
9439     patend = (char*)pat + patlen;
9440     for (p = (char*)pat; p < patend; p = q) {
9441         bool alt = FALSE;
9442         bool left = FALSE;
9443         bool vectorize = FALSE;
9444         bool vectorarg = FALSE;
9445         bool vec_utf8 = FALSE;
9446         char fill = ' ';
9447         char plus = 0;
9448         char intsize = 0;
9449         STRLEN width = 0;
9450         STRLEN zeros = 0;
9451         bool has_precis = FALSE;
9452         STRLEN precis = 0;
9453         const I32 osvix = svix;
9454         bool is_utf8 = FALSE;  /* is this item utf8?   */
9455 #ifdef HAS_LDBL_SPRINTF_BUG
9456         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
9457            with sfio - Allen <allens@cpan.org> */
9458         bool fix_ldbl_sprintf_bug = FALSE;
9459 #endif
9460
9461         char esignbuf[4];
9462         U8 utf8buf[UTF8_MAXBYTES+1];
9463         STRLEN esignlen = 0;
9464
9465         const char *eptr = NULL;
9466         const char *fmtstart;
9467         STRLEN elen = 0;
9468         SV *vecsv = NULL;
9469         const U8 *vecstr = NULL;
9470         STRLEN veclen = 0;
9471         char c = 0;
9472         int i;
9473         unsigned base = 0;
9474         IV iv = 0;
9475         UV uv = 0;
9476         /* we need a long double target in case HAS_LONG_DOUBLE but
9477            not USE_LONG_DOUBLE
9478         */
9479 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
9480         long double nv;
9481 #else
9482         NV nv;
9483 #endif
9484         STRLEN have;
9485         STRLEN need;
9486         STRLEN gap;
9487         const char *dotstr = ".";
9488         STRLEN dotstrlen = 1;
9489         I32 efix = 0; /* explicit format parameter index */
9490         I32 ewix = 0; /* explicit width index */
9491         I32 epix = 0; /* explicit precision index */
9492         I32 evix = 0; /* explicit vector index */
9493         bool asterisk = FALSE;
9494
9495         /* echo everything up to the next format specification */
9496         for (q = p; q < patend && *q != '%'; ++q) ;
9497         if (q > p) {
9498             if (has_utf8 && !pat_utf8)
9499                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
9500             else
9501                 sv_catpvn(sv, p, q - p);
9502             p = q;
9503         }
9504         if (q++ >= patend)
9505             break;
9506
9507         fmtstart = q;
9508
9509 /*
9510     We allow format specification elements in this order:
9511         \d+\$              explicit format parameter index
9512         [-+ 0#]+           flags
9513         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
9514         0                  flag (as above): repeated to allow "v02"     
9515         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
9516         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
9517         [hlqLV]            size
9518     [%bcdefginopsuxDFOUX] format (mandatory)
9519 */
9520
9521         if (args) {
9522 /*  
9523         As of perl5.9.3, printf format checking is on by default.
9524         Internally, perl uses %p formats to provide an escape to
9525         some extended formatting.  This block deals with those
9526         extensions: if it does not match, (char*)q is reset and
9527         the normal format processing code is used.
9528
9529         Currently defined extensions are:
9530                 %p              include pointer address (standard)      
9531                 %-p     (SVf)   include an SV (previously %_)
9532                 %-<num>p        include an SV with precision <num>      
9533                 %<num>p         reserved for future extensions
9534
9535         Robin Barker 2005-07-14
9536
9537                 %1p     (VDf)   removed.  RMB 2007-10-19
9538 */
9539             char* r = q; 
9540             bool sv = FALSE;    
9541             STRLEN n = 0;
9542             if (*q == '-')
9543                 sv = *q++;
9544             n = expect_number(&q);
9545             if (*q++ == 'p') {
9546                 if (sv) {                       /* SVf */
9547                     if (n) {
9548                         precis = n;
9549                         has_precis = TRUE;
9550                     }
9551                     argsv = MUTABLE_SV(va_arg(*args, void*));
9552                     eptr = SvPV_const(argsv, elen);
9553                     if (DO_UTF8(argsv))
9554                         is_utf8 = TRUE;
9555                     goto string;
9556                 }
9557                 else if (n) {
9558                     Perl_ck_warner_d(aTHX_ packWARN(WARN_INTERNAL),
9559                                      "internal %%<num>p might conflict with future printf extensions");
9560                 }
9561             }
9562             q = r; 
9563         }
9564
9565         if ( (width = expect_number(&q)) ) {
9566             if (*q == '$') {
9567                 ++q;
9568                 efix = width;
9569             } else {
9570                 goto gotwidth;
9571             }
9572         }
9573
9574         /* FLAGS */
9575
9576         while (*q) {
9577             switch (*q) {
9578             case ' ':
9579             case '+':
9580                 if (plus == '+' && *q == ' ') /* '+' over ' ' */
9581                     q++;
9582                 else
9583                     plus = *q++;
9584                 continue;
9585
9586             case '-':
9587                 left = TRUE;
9588                 q++;
9589                 continue;
9590
9591             case '0':
9592                 fill = *q++;
9593                 continue;
9594
9595             case '#':
9596                 alt = TRUE;
9597                 q++;
9598                 continue;
9599
9600             default:
9601                 break;
9602             }
9603             break;
9604         }
9605
9606       tryasterisk:
9607         if (*q == '*') {
9608             q++;
9609             if ( (ewix = expect_number(&q)) )
9610                 if (*q++ != '$')
9611                     goto unknown;
9612             asterisk = TRUE;
9613         }
9614         if (*q == 'v') {
9615             q++;
9616             if (vectorize)
9617                 goto unknown;
9618             if ((vectorarg = asterisk)) {
9619                 evix = ewix;
9620                 ewix = 0;
9621                 asterisk = FALSE;
9622             }
9623             vectorize = TRUE;
9624             goto tryasterisk;
9625         }
9626
9627         if (!asterisk)
9628         {
9629             if( *q == '0' )
9630                 fill = *q++;
9631             width = expect_number(&q);
9632         }
9633
9634         if (vectorize) {
9635             if (vectorarg) {
9636                 if (args)
9637                     vecsv = va_arg(*args, SV*);
9638                 else if (evix) {
9639                     vecsv = (evix > 0 && evix <= svmax)
9640                         ? svargs[evix-1] : S_vcatpvfn_missing_argument(aTHX);
9641                 } else {
9642                     vecsv = svix < svmax
9643                         ? svargs[svix++] : S_vcatpvfn_missing_argument(aTHX);
9644                 }
9645                 dotstr = SvPV_const(vecsv, dotstrlen);
9646                 /* Keep the DO_UTF8 test *after* the SvPV call, else things go
9647                    bad with tied or overloaded values that return UTF8.  */
9648                 if (DO_UTF8(vecsv))
9649                     is_utf8 = TRUE;
9650                 else if (has_utf8) {
9651                     vecsv = sv_mortalcopy(vecsv);
9652                     sv_utf8_upgrade(vecsv);
9653                     dotstr = SvPV_const(vecsv, dotstrlen);
9654                     is_utf8 = TRUE;
9655                 }                   
9656             }
9657             if (args) {
9658                 VECTORIZE_ARGS
9659             }
9660             else if (efix ? (efix > 0 && efix <= svmax) : svix < svmax) {
9661                 vecsv = svargs[efix ? efix-1 : svix++];
9662                 vecstr = (U8*)SvPV_const(vecsv,veclen);
9663                 vec_utf8 = DO_UTF8(vecsv);
9664
9665                 /* if this is a version object, we need to convert
9666                  * back into v-string notation and then let the
9667                  * vectorize happen normally
9668                  */
9669                 if (sv_derived_from(vecsv, "version")) {
9670                     char *version = savesvpv(vecsv);
9671                     if ( hv_exists(MUTABLE_HV(SvRV(vecsv)), "alpha", 5 ) ) {
9672                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
9673                         "vector argument not supported with alpha versions");
9674                         goto unknown;
9675                     }
9676                     vecsv = sv_newmortal();
9677                     scan_vstring(version, version + veclen, vecsv);
9678                     vecstr = (U8*)SvPV_const(vecsv, veclen);
9679                     vec_utf8 = DO_UTF8(vecsv);
9680                     Safefree(version);
9681                 }
9682             }
9683             else {
9684                 vecstr = (U8*)"";
9685                 veclen = 0;
9686             }
9687         }
9688
9689         if (asterisk) {
9690             if (args)
9691                 i = va_arg(*args, int);
9692             else
9693                 i = (ewix ? ewix <= svmax : svix < svmax) ?
9694                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
9695             left |= (i < 0);
9696             width = (i < 0) ? -i : i;
9697         }
9698       gotwidth:
9699
9700         /* PRECISION */
9701
9702         if (*q == '.') {
9703             q++;
9704             if (*q == '*') {
9705                 q++;
9706                 if ( ((epix = expect_number(&q))) && (*q++ != '$') )
9707                     goto unknown;
9708                 /* XXX: todo, support specified precision parameter */
9709                 if (epix)
9710                     goto unknown;
9711                 if (args)
9712                     i = va_arg(*args, int);
9713                 else
9714                     i = (ewix ? ewix <= svmax : svix < svmax)
9715                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
9716                 precis = i;
9717                 has_precis = !(i < 0);
9718             }
9719             else {
9720                 precis = 0;
9721                 while (isDIGIT(*q))
9722                     precis = precis * 10 + (*q++ - '0');
9723                 has_precis = TRUE;
9724             }
9725         }
9726
9727         /* SIZE */
9728
9729         switch (*q) {
9730 #ifdef WIN32
9731         case 'I':                       /* Ix, I32x, and I64x */
9732 #  ifdef WIN64
9733             if (q[1] == '6' && q[2] == '4') {
9734                 q += 3;
9735                 intsize = 'q';
9736                 break;
9737             }
9738 #  endif
9739             if (q[1] == '3' && q[2] == '2') {
9740                 q += 3;
9741                 break;
9742             }
9743 #  ifdef WIN64
9744             intsize = 'q';
9745 #  endif
9746             q++;
9747             break;
9748 #endif
9749 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
9750         case 'L':                       /* Ld */
9751             /*FALLTHROUGH*/
9752 #ifdef HAS_QUAD
9753         case 'q':                       /* qd */
9754 #endif
9755             intsize = 'q';
9756             q++;
9757             break;
9758 #endif
9759         case 'l':
9760 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
9761             if (*(q + 1) == 'l') {      /* lld, llf */
9762                 intsize = 'q';
9763                 q += 2;
9764                 break;
9765              }
9766 #endif
9767             /*FALLTHROUGH*/
9768         case 'h':
9769             /*FALLTHROUGH*/
9770         case 'V':
9771             intsize = *q++;
9772             break;
9773         }
9774
9775         /* CONVERSION */
9776
9777         if (*q == '%') {
9778             eptr = q++;
9779             elen = 1;
9780             if (vectorize) {
9781                 c = '%';
9782                 goto unknown;
9783             }
9784             goto string;
9785         }
9786
9787         if (!vectorize && !args) {
9788             if (efix) {
9789                 const I32 i = efix-1;
9790                 argsv = (i >= 0 && i < svmax)
9791                     ? svargs[i] : S_vcatpvfn_missing_argument(aTHX);
9792             } else {
9793                 argsv = (svix >= 0 && svix < svmax)
9794                     ? svargs[svix++] : S_vcatpvfn_missing_argument(aTHX);
9795             }
9796         }
9797
9798         switch (c = *q++) {
9799
9800             /* STRINGS */
9801
9802         case 'c':
9803             if (vectorize)
9804                 goto unknown;
9805             uv = (args) ? va_arg(*args, int) : SvIV(argsv);
9806             if ((uv > 255 ||
9807                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
9808                 && !IN_BYTES) {
9809                 eptr = (char*)utf8buf;
9810                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
9811                 is_utf8 = TRUE;
9812             }
9813             else {
9814                 c = (char)uv;
9815                 eptr = &c;
9816                 elen = 1;
9817             }
9818             goto string;
9819
9820         case 's':
9821             if (vectorize)
9822                 goto unknown;
9823             if (args) {
9824                 eptr = va_arg(*args, char*);
9825                 if (eptr)
9826                     elen = strlen(eptr);
9827                 else {
9828                     eptr = (char *)nullstr;
9829                     elen = sizeof nullstr - 1;
9830                 }
9831             }
9832             else {
9833                 eptr = SvPV_const(argsv, elen);
9834                 if (DO_UTF8(argsv)) {
9835                     STRLEN old_precis = precis;
9836                     if (has_precis && precis < elen) {
9837                         STRLEN ulen = sv_len_utf8(argsv);
9838                         I32 p = precis > ulen ? ulen : precis;
9839                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
9840                         precis = p;
9841                     }
9842                     if (width) { /* fudge width (can't fudge elen) */
9843                         if (has_precis && precis < elen)
9844                             width += precis - old_precis;
9845                         else
9846                             width += elen - sv_len_utf8(argsv);
9847                     }
9848                     is_utf8 = TRUE;
9849                 }
9850             }
9851
9852         string:
9853             if (has_precis && precis < elen)
9854                 elen = precis;
9855             break;
9856
9857             /* INTEGERS */
9858
9859         case 'p':
9860             if (alt || vectorize)
9861                 goto unknown;
9862             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
9863             base = 16;
9864             goto integer;
9865
9866         case 'D':
9867 #ifdef IV_IS_QUAD
9868             intsize = 'q';
9869 #else
9870             intsize = 'l';
9871 #endif
9872             /*FALLTHROUGH*/
9873         case 'd':
9874         case 'i':
9875 #if vdNUMBER
9876         format_vd:
9877 #endif
9878             if (vectorize) {
9879                 STRLEN ulen;
9880                 if (!veclen)
9881                     continue;
9882                 if (vec_utf8)
9883                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
9884                                         UTF8_ALLOW_ANYUV);
9885                 else {
9886                     uv = *vecstr;
9887                     ulen = 1;
9888                 }
9889                 vecstr += ulen;
9890                 veclen -= ulen;
9891                 if (plus)
9892                      esignbuf[esignlen++] = plus;
9893             }
9894             else if (args) {
9895                 switch (intsize) {
9896                 case 'h':       iv = (short)va_arg(*args, int); break;
9897                 case 'l':       iv = va_arg(*args, long); break;
9898                 case 'V':       iv = va_arg(*args, IV); break;
9899                 default:        iv = va_arg(*args, int); break;
9900                 case 'q':
9901 #ifdef HAS_QUAD
9902                                 iv = va_arg(*args, Quad_t); break;
9903 #else
9904                                 goto unknown;
9905 #endif
9906                 }
9907             }
9908             else {
9909                 IV tiv = SvIV(argsv); /* work around GCC bug #13488 */
9910                 switch (intsize) {
9911                 case 'h':       iv = (short)tiv; break;
9912                 case 'l':       iv = (long)tiv; break;
9913                 case 'V':
9914                 default:        iv = tiv; break;
9915                 case 'q':
9916 #ifdef HAS_QUAD
9917                                 iv = (Quad_t)tiv; break;
9918 #else
9919                                 goto unknown;
9920 #endif
9921                 }
9922             }
9923             if ( !vectorize )   /* we already set uv above */
9924             {
9925                 if (iv >= 0) {
9926                     uv = iv;
9927                     if (plus)
9928                         esignbuf[esignlen++] = plus;
9929                 }
9930                 else {
9931                     uv = -iv;
9932                     esignbuf[esignlen++] = '-';
9933                 }
9934             }
9935             base = 10;
9936             goto integer;
9937
9938         case 'U':
9939 #ifdef IV_IS_QUAD
9940             intsize = 'q';
9941 #else
9942             intsize = 'l';
9943 #endif
9944             /*FALLTHROUGH*/
9945         case 'u':
9946             base = 10;
9947             goto uns_integer;
9948
9949         case 'B':
9950         case 'b':
9951             base = 2;
9952             goto uns_integer;
9953
9954         case 'O':
9955 #ifdef IV_IS_QUAD
9956             intsize = 'q';
9957 #else
9958             intsize = 'l';
9959 #endif
9960             /*FALLTHROUGH*/
9961         case 'o':
9962             base = 8;
9963             goto uns_integer;
9964
9965         case 'X':
9966         case 'x':
9967             base = 16;
9968
9969         uns_integer:
9970             if (vectorize) {
9971                 STRLEN ulen;
9972         vector:
9973                 if (!veclen)
9974                     continue;
9975                 if (vec_utf8)
9976                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
9977                                         UTF8_ALLOW_ANYUV);
9978                 else {
9979                     uv = *vecstr;
9980                     ulen = 1;
9981                 }
9982                 vecstr += ulen;
9983                 veclen -= ulen;
9984             }
9985             else if (args) {
9986                 switch (intsize) {
9987                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
9988                 case 'l':  uv = va_arg(*args, unsigned long); break;
9989                 case 'V':  uv = va_arg(*args, UV); break;
9990                 default:   uv = va_arg(*args, unsigned); break;
9991                 case 'q':
9992 #ifdef HAS_QUAD
9993                            uv = va_arg(*args, Uquad_t); break;
9994 #else
9995                            goto unknown;
9996 #endif
9997                 }
9998             }
9999             else {
10000                 UV tuv = SvUV(argsv); /* work around GCC bug #13488 */
10001                 switch (intsize) {
10002                 case 'h':       uv = (unsigned short)tuv; break;
10003                 case 'l':       uv = (unsigned long)tuv; break;
10004                 case 'V':
10005                 default:        uv = tuv; break;
10006                 case 'q':
10007 #ifdef HAS_QUAD
10008                                 uv = (Uquad_t)tuv; break;
10009 #else
10010                                 goto unknown;
10011 #endif
10012                 }
10013             }
10014
10015         integer:
10016             {
10017                 char *ptr = ebuf + sizeof ebuf;
10018                 bool tempalt = uv ? alt : FALSE; /* Vectors can't change alt */
10019                 zeros = 0;
10020
10021                 switch (base) {
10022                     unsigned dig;
10023                 case 16:
10024                     p = (char *)((c == 'X') ? PL_hexdigit + 16 : PL_hexdigit);
10025                     do {
10026                         dig = uv & 15;
10027                         *--ptr = p[dig];
10028                     } while (uv >>= 4);
10029                     if (tempalt) {
10030                         esignbuf[esignlen++] = '0';
10031                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
10032                     }
10033                     break;
10034                 case 8:
10035                     do {
10036                         dig = uv & 7;
10037                         *--ptr = '0' + dig;
10038                     } while (uv >>= 3);
10039                     if (alt && *ptr != '0')
10040                         *--ptr = '0';
10041                     break;
10042                 case 2:
10043                     do {
10044                         dig = uv & 1;
10045                         *--ptr = '0' + dig;
10046                     } while (uv >>= 1);
10047                     if (tempalt) {
10048                         esignbuf[esignlen++] = '0';
10049                         esignbuf[esignlen++] = c;
10050                     }
10051                     break;
10052                 default:                /* it had better be ten or less */
10053                     do {
10054                         dig = uv % base;
10055                         *--ptr = '0' + dig;
10056                     } while (uv /= base);
10057                     break;
10058                 }
10059                 elen = (ebuf + sizeof ebuf) - ptr;
10060                 eptr = ptr;
10061                 if (has_precis) {
10062                     if (precis > elen)
10063                         zeros = precis - elen;
10064                     else if (precis == 0 && elen == 1 && *eptr == '0'
10065                              && !(base == 8 && alt)) /* "%#.0o" prints "0" */
10066                         elen = 0;
10067
10068                 /* a precision nullifies the 0 flag. */
10069                     if (fill == '0')
10070                         fill = ' ';
10071                 }
10072             }
10073             break;
10074
10075             /* FLOATING POINT */
10076
10077         case 'F':
10078             c = 'f';            /* maybe %F isn't supported here */
10079             /*FALLTHROUGH*/
10080         case 'e': case 'E':
10081         case 'f':
10082         case 'g': case 'G':
10083             if (vectorize)
10084                 goto unknown;
10085
10086             /* This is evil, but floating point is even more evil */
10087
10088             /* for SV-style calling, we can only get NV
10089                for C-style calling, we assume %f is double;
10090                for simplicity we allow any of %Lf, %llf, %qf for long double
10091             */
10092             switch (intsize) {
10093             case 'V':
10094 #if defined(USE_LONG_DOUBLE)
10095                 intsize = 'q';
10096 #endif
10097                 break;
10098 /* [perl #20339] - we should accept and ignore %lf rather than die */
10099             case 'l':
10100                 /*FALLTHROUGH*/
10101             default:
10102 #if defined(USE_LONG_DOUBLE)
10103                 intsize = args ? 0 : 'q';
10104 #endif
10105                 break;
10106             case 'q':
10107 #if defined(HAS_LONG_DOUBLE)
10108                 break;
10109 #else
10110                 /*FALLTHROUGH*/
10111 #endif
10112             case 'h':
10113                 goto unknown;
10114             }
10115
10116             /* now we need (long double) if intsize == 'q', else (double) */
10117             nv = (args) ?
10118 #if LONG_DOUBLESIZE > DOUBLESIZE
10119                 intsize == 'q' ?
10120                     va_arg(*args, long double) :
10121                     va_arg(*args, double)
10122 #else
10123                     va_arg(*args, double)
10124 #endif
10125                 : SvNV(argsv);
10126
10127             need = 0;
10128             /* nv * 0 will be NaN for NaN, +Inf and -Inf, and 0 for anything
10129                else. frexp() has some unspecified behaviour for those three */
10130             if (c != 'e' && c != 'E' && (nv * 0) == 0) {
10131                 i = PERL_INT_MIN;
10132                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
10133                    will cast our (long double) to (double) */
10134                 (void)Perl_frexp(nv, &i);
10135                 if (i == PERL_INT_MIN)
10136                     Perl_die(aTHX_ "panic: frexp");
10137                 if (i > 0)
10138                     need = BIT_DIGITS(i);
10139             }
10140             need += has_precis ? precis : 6; /* known default */
10141
10142             if (need < width)
10143                 need = width;
10144
10145 #ifdef HAS_LDBL_SPRINTF_BUG
10146             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
10147                with sfio - Allen <allens@cpan.org> */
10148
10149 #  ifdef DBL_MAX
10150 #    define MY_DBL_MAX DBL_MAX
10151 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
10152 #    if DOUBLESIZE >= 8
10153 #      define MY_DBL_MAX 1.7976931348623157E+308L
10154 #    else
10155 #      define MY_DBL_MAX 3.40282347E+38L
10156 #    endif
10157 #  endif
10158
10159 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
10160 #    define MY_DBL_MAX_BUG 1L
10161 #  else
10162 #    define MY_DBL_MAX_BUG MY_DBL_MAX
10163 #  endif
10164
10165 #  ifdef DBL_MIN
10166 #    define MY_DBL_MIN DBL_MIN
10167 #  else  /* XXX guessing! -Allen */
10168 #    if DOUBLESIZE >= 8
10169 #      define MY_DBL_MIN 2.2250738585072014E-308L
10170 #    else
10171 #      define MY_DBL_MIN 1.17549435E-38L
10172 #    endif
10173 #  endif
10174
10175             if ((intsize == 'q') && (c == 'f') &&
10176                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
10177                 (need < DBL_DIG)) {
10178                 /* it's going to be short enough that
10179                  * long double precision is not needed */
10180
10181                 if ((nv <= 0L) && (nv >= -0L))
10182                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
10183                 else {
10184                     /* would use Perl_fp_class as a double-check but not
10185                      * functional on IRIX - see perl.h comments */
10186
10187                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
10188                         /* It's within the range that a double can represent */
10189 #if defined(DBL_MAX) && !defined(DBL_MIN)
10190                         if ((nv >= ((long double)1/DBL_MAX)) ||
10191                             (nv <= (-(long double)1/DBL_MAX)))
10192 #endif
10193                         fix_ldbl_sprintf_bug = TRUE;
10194                     }
10195                 }
10196                 if (fix_ldbl_sprintf_bug == TRUE) {
10197                     double temp;
10198
10199                     intsize = 0;
10200                     temp = (double)nv;
10201                     nv = (NV)temp;
10202                 }
10203             }
10204
10205 #  undef MY_DBL_MAX
10206 #  undef MY_DBL_MAX_BUG
10207 #  undef MY_DBL_MIN
10208
10209 #endif /* HAS_LDBL_SPRINTF_BUG */
10210
10211             need += 20; /* fudge factor */
10212             if (PL_efloatsize < need) {
10213                 Safefree(PL_efloatbuf);
10214                 PL_efloatsize = need + 20; /* more fudge */
10215                 Newx(PL_efloatbuf, PL_efloatsize, char);
10216                 PL_efloatbuf[0] = '\0';
10217             }
10218
10219             if ( !(width || left || plus || alt) && fill != '0'
10220                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
10221                 /* See earlier comment about buggy Gconvert when digits,
10222                    aka precis is 0  */
10223                 if ( c == 'g' && precis) {
10224                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
10225                     /* May return an empty string for digits==0 */
10226                     if (*PL_efloatbuf) {
10227                         elen = strlen(PL_efloatbuf);
10228                         goto float_converted;
10229                     }
10230                 } else if ( c == 'f' && !precis) {
10231                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
10232                         break;
10233                 }
10234             }
10235             {
10236                 char *ptr = ebuf + sizeof ebuf;
10237                 *--ptr = '\0';
10238                 *--ptr = c;
10239                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
10240 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
10241                 if (intsize == 'q') {
10242                     /* Copy the one or more characters in a long double
10243                      * format before the 'base' ([efgEFG]) character to
10244                      * the format string. */
10245                     static char const prifldbl[] = PERL_PRIfldbl;
10246                     char const *p = prifldbl + sizeof(prifldbl) - 3;
10247                     while (p >= prifldbl) { *--ptr = *p--; }
10248                 }
10249 #endif
10250                 if (has_precis) {
10251                     base = precis;
10252                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
10253                     *--ptr = '.';
10254                 }
10255                 if (width) {
10256                     base = width;
10257                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
10258                 }
10259                 if (fill == '0')
10260                     *--ptr = fill;
10261                 if (left)
10262                     *--ptr = '-';
10263                 if (plus)
10264                     *--ptr = plus;
10265                 if (alt)
10266                     *--ptr = '#';
10267                 *--ptr = '%';
10268
10269                 /* No taint.  Otherwise we are in the strange situation
10270                  * where printf() taints but print($float) doesn't.
10271                  * --jhi */
10272 #if defined(HAS_LONG_DOUBLE)
10273                 elen = ((intsize == 'q')
10274                         ? my_snprintf(PL_efloatbuf, PL_efloatsize, ptr, nv)
10275                         : my_snprintf(PL_efloatbuf, PL_efloatsize, ptr, (double)nv));
10276 #else
10277                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
10278 #endif
10279             }
10280         float_converted:
10281             eptr = PL_efloatbuf;
10282             break;
10283
10284             /* SPECIAL */
10285
10286         case 'n':
10287             if (vectorize)
10288                 goto unknown;
10289             i = SvCUR(sv) - origlen;
10290             if (args) {
10291                 switch (intsize) {
10292                 case 'h':       *(va_arg(*args, short*)) = i; break;
10293                 default:        *(va_arg(*args, int*)) = i; break;
10294                 case 'l':       *(va_arg(*args, long*)) = i; break;
10295                 case 'V':       *(va_arg(*args, IV*)) = i; break;
10296                 case 'q':
10297 #ifdef HAS_QUAD
10298                                 *(va_arg(*args, Quad_t*)) = i; break;
10299 #else
10300                                 goto unknown;
10301 #endif
10302                 }
10303             }
10304             else
10305                 sv_setuv_mg(argsv, (UV)i);
10306             continue;   /* not "break" */
10307
10308             /* UNKNOWN */
10309
10310         default:
10311       unknown:
10312             if (!args
10313                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
10314                 && ckWARN(WARN_PRINTF))
10315             {
10316                 SV * const msg = sv_newmortal();
10317                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
10318                           (PL_op->op_type == OP_PRTF) ? "" : "s");
10319                 if (fmtstart < patend) {
10320                     const char * const fmtend = q < patend ? q : patend;
10321                     const char * f;
10322                     sv_catpvs(msg, "\"%");
10323                     for (f = fmtstart; f < fmtend; f++) {
10324                         if (isPRINT(*f)) {
10325                             sv_catpvn(msg, f, 1);
10326                         } else {
10327                             Perl_sv_catpvf(aTHX_ msg,
10328                                            "\\%03"UVof, (UV)*f & 0xFF);
10329                         }
10330                     }
10331                     sv_catpvs(msg, "\"");
10332                 } else {
10333                     sv_catpvs(msg, "end of string");
10334                 }
10335                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, SVfARG(msg)); /* yes, this is reentrant */
10336             }
10337
10338             /* output mangled stuff ... */
10339             if (c == '\0')
10340                 --q;
10341             eptr = p;
10342             elen = q - p;
10343
10344             /* ... right here, because formatting flags should not apply */
10345             SvGROW(sv, SvCUR(sv) + elen + 1);
10346             p = SvEND(sv);
10347             Copy(eptr, p, elen, char);
10348             p += elen;
10349             *p = '\0';
10350             SvCUR_set(sv, p - SvPVX_const(sv));
10351             svix = osvix;
10352             continue;   /* not "break" */
10353         }
10354
10355         if (is_utf8 != has_utf8) {
10356             if (is_utf8) {
10357                 if (SvCUR(sv))
10358                     sv_utf8_upgrade(sv);
10359             }
10360             else {
10361                 const STRLEN old_elen = elen;
10362                 SV * const nsv = newSVpvn_flags(eptr, elen, SVs_TEMP);
10363                 sv_utf8_upgrade(nsv);
10364                 eptr = SvPVX_const(nsv);
10365                 elen = SvCUR(nsv);
10366
10367                 if (width) { /* fudge width (can't fudge elen) */
10368                     width += elen - old_elen;
10369                 }
10370                 is_utf8 = TRUE;
10371             }
10372         }
10373
10374         have = esignlen + zeros + elen;
10375         if (have < zeros)
10376             Perl_croak_nocontext("%s", PL_memory_wrap);
10377
10378         need = (have > width ? have : width);
10379         gap = need - have;
10380
10381         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
10382             Perl_croak_nocontext("%s", PL_memory_wrap);
10383         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
10384         p = SvEND(sv);
10385         if (esignlen && fill == '0') {
10386             int i;
10387             for (i = 0; i < (int)esignlen; i++)
10388                 *p++ = esignbuf[i];
10389         }
10390         if (gap && !left) {
10391             memset(p, fill, gap);
10392             p += gap;
10393         }
10394         if (esignlen && fill != '0') {
10395             int i;
10396             for (i = 0; i < (int)esignlen; i++)
10397                 *p++ = esignbuf[i];
10398         }
10399         if (zeros) {
10400             int i;
10401             for (i = zeros; i; i--)
10402                 *p++ = '0';
10403         }
10404         if (elen) {
10405             Copy(eptr, p, elen, char);
10406             p += elen;
10407         }
10408         if (gap && left) {
10409             memset(p, ' ', gap);
10410             p += gap;
10411         }
10412         if (vectorize) {
10413             if (veclen) {
10414                 Copy(dotstr, p, dotstrlen, char);
10415                 p += dotstrlen;
10416             }
10417             else
10418                 vectorize = FALSE;              /* done iterating over vecstr */
10419         }
10420         if (is_utf8)
10421             has_utf8 = TRUE;
10422         if (has_utf8)
10423             SvUTF8_on(sv);
10424         *p = '\0';
10425         SvCUR_set(sv, p - SvPVX_const(sv));
10426         if (vectorize) {
10427             esignlen = 0;
10428             goto vector;
10429         }
10430     }
10431 }
10432
10433 /* =========================================================================
10434
10435 =head1 Cloning an interpreter
10436
10437 All the macros and functions in this section are for the private use of
10438 the main function, perl_clone().
10439
10440 The foo_dup() functions make an exact copy of an existing foo thingy.
10441 During the course of a cloning, a hash table is used to map old addresses
10442 to new addresses. The table is created and manipulated with the
10443 ptr_table_* functions.
10444
10445 =cut
10446
10447  * =========================================================================*/
10448
10449
10450 #if defined(USE_ITHREADS)
10451
10452 /* XXX Remove this so it doesn't have to go thru the macro and return for nothing */
10453 #ifndef GpREFCNT_inc
10454 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
10455 #endif
10456
10457
10458 /* Certain cases in Perl_ss_dup have been merged, by relying on the fact
10459    that currently av_dup, gv_dup and hv_dup are the same as sv_dup.
10460    If this changes, please unmerge ss_dup.
10461    Likewise, sv_dup_inc_multiple() relies on this fact.  */
10462 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
10463 #define sv_dup_inc_NN(s,t)      SvREFCNT_inc_NN(sv_dup(s,t))
10464 #define av_dup(s,t)     MUTABLE_AV(sv_dup((const SV *)s,t))
10465 #define av_dup_inc(s,t) MUTABLE_AV(SvREFCNT_inc(sv_dup((const SV *)s,t)))
10466 #define hv_dup(s,t)     MUTABLE_HV(sv_dup((const SV *)s,t))
10467 #define hv_dup_inc(s,t) MUTABLE_HV(SvREFCNT_inc(sv_dup((const SV *)s,t)))
10468 #define cv_dup(s,t)     MUTABLE_CV(sv_dup((const SV *)s,t))
10469 #define cv_dup_inc(s,t) MUTABLE_CV(SvREFCNT_inc(sv_dup((const SV *)s,t)))
10470 #define io_dup(s,t)     MUTABLE_IO(sv_dup((const SV *)s,t))
10471 #define io_dup_inc(s,t) MUTABLE_IO(SvREFCNT_inc(sv_dup((const SV *)s,t)))
10472 #define gv_dup(s,t)     MUTABLE_GV(sv_dup((const SV *)s,t))
10473 #define gv_dup_inc(s,t) MUTABLE_GV(SvREFCNT_inc(sv_dup((const SV *)s,t)))
10474 #define SAVEPV(p)       ((p) ? savepv(p) : NULL)
10475 #define SAVEPVN(p,n)    ((p) ? savepvn(p,n) : NULL)
10476
10477 /* clone a parser */
10478
10479 yy_parser *
10480 Perl_parser_dup(pTHX_ const yy_parser *const proto, CLONE_PARAMS *const param)
10481 {
10482     yy_parser *parser;
10483
10484     PERL_ARGS_ASSERT_PARSER_DUP;
10485
10486     if (!proto)
10487         return NULL;
10488
10489     /* look for it in the table first */
10490     parser = (yy_parser *)ptr_table_fetch(PL_ptr_table, proto);
10491     if (parser)
10492         return parser;
10493
10494     /* create anew and remember what it is */
10495     Newxz(parser, 1, yy_parser);
10496     ptr_table_store(PL_ptr_table, proto, parser);
10497
10498     parser->yyerrstatus = 0;
10499     parser->yychar = YYEMPTY;           /* Cause a token to be read.  */
10500
10501     /* XXX these not yet duped */
10502     parser->old_parser = NULL;
10503     parser->stack = NULL;
10504     parser->ps = NULL;
10505     parser->stack_size = 0;
10506     /* XXX parser->stack->state = 0; */
10507
10508     /* XXX eventually, just Copy() most of the parser struct ? */
10509
10510     parser->lex_brackets = proto->lex_brackets;
10511     parser->lex_casemods = proto->lex_casemods;
10512     parser->lex_brackstack = savepvn(proto->lex_brackstack,
10513                     (proto->lex_brackets < 120 ? 120 : proto->lex_brackets));
10514     parser->lex_casestack = savepvn(proto->lex_casestack,
10515                     (proto->lex_casemods < 12 ? 12 : proto->lex_casemods));
10516     parser->lex_defer   = proto->lex_defer;
10517     parser->lex_dojoin  = proto->lex_dojoin;
10518     parser->lex_expect  = proto->lex_expect;
10519     parser->lex_formbrack = proto->lex_formbrack;
10520     parser->lex_inpat   = proto->lex_inpat;
10521     parser->lex_inwhat  = proto->lex_inwhat;
10522     parser->lex_op      = proto->lex_op;
10523     parser->lex_repl    = sv_dup_inc(proto->lex_repl, param);
10524     parser->lex_starts  = proto->lex_starts;
10525     parser->lex_stuff   = sv_dup_inc(proto->lex_stuff, param);
10526     parser->multi_close = proto->multi_close;
10527     parser->multi_open  = proto->multi_open;
10528     parser->multi_start = proto->multi_start;
10529     parser->multi_end   = proto->multi_end;
10530     parser->pending_ident = proto->pending_ident;
10531     parser->preambled   = proto->preambled;
10532     parser->sublex_info = proto->sublex_info; /* XXX not quite right */
10533     parser->linestr     = sv_dup_inc(proto->linestr, param);
10534     parser->expect      = proto->expect;
10535     parser->copline     = proto->copline;
10536     parser->last_lop_op = proto->last_lop_op;
10537     parser->lex_state   = proto->lex_state;
10538     parser->rsfp        = fp_dup(proto->rsfp, '<', param);
10539     /* rsfp_filters entries have fake IoDIRP() */
10540     parser->rsfp_filters= av_dup_inc(proto->rsfp_filters, param);
10541     parser->in_my       = proto->in_my;
10542     parser->in_my_stash = hv_dup(proto->in_my_stash, param);
10543     parser->error_count = proto->error_count;
10544
10545
10546     parser->linestr     = sv_dup_inc(proto->linestr, param);
10547
10548     {
10549         char * const ols = SvPVX(proto->linestr);
10550         char * const ls  = SvPVX(parser->linestr);
10551
10552         parser->bufptr      = ls + (proto->bufptr >= ols ?
10553                                     proto->bufptr -  ols : 0);
10554         parser->oldbufptr   = ls + (proto->oldbufptr >= ols ?
10555                                     proto->oldbufptr -  ols : 0);
10556         parser->oldoldbufptr= ls + (proto->oldoldbufptr >= ols ?
10557                                     proto->oldoldbufptr -  ols : 0);
10558         parser->linestart   = ls + (proto->linestart >= ols ?
10559                                     proto->linestart -  ols : 0);
10560         parser->last_uni    = ls + (proto->last_uni >= ols ?
10561                                     proto->last_uni -  ols : 0);
10562         parser->last_lop    = ls + (proto->last_lop >= ols ?
10563                                     proto->last_lop -  ols : 0);
10564
10565         parser->bufend      = ls + SvCUR(parser->linestr);
10566     }
10567
10568     Copy(proto->tokenbuf, parser->tokenbuf, 256, char);
10569
10570
10571 #ifdef PERL_MAD
10572     parser->endwhite    = proto->endwhite;
10573     parser->faketokens  = proto->faketokens;
10574     parser->lasttoke    = proto->lasttoke;
10575     parser->nextwhite   = proto->nextwhite;
10576     parser->realtokenstart = proto->realtokenstart;
10577     parser->skipwhite   = proto->skipwhite;
10578     parser->thisclose   = proto->thisclose;
10579     parser->thismad     = proto->thismad;
10580     parser->thisopen    = proto->thisopen;
10581     parser->thisstuff   = proto->thisstuff;
10582     parser->thistoken   = proto->thistoken;
10583     parser->thiswhite   = proto->thiswhite;
10584
10585     Copy(proto->nexttoke, parser->nexttoke, 5, NEXTTOKE);
10586     parser->curforce    = proto->curforce;
10587 #else
10588     Copy(proto->nextval, parser->nextval, 5, YYSTYPE);
10589     Copy(proto->nexttype, parser->nexttype, 5,  I32);
10590     parser->nexttoke    = proto->nexttoke;
10591 #endif
10592
10593     /* XXX should clone saved_curcop here, but we aren't passed
10594      * proto_perl; so do it in perl_clone_using instead */
10595
10596     return parser;
10597 }
10598
10599
10600 /* duplicate a file handle */
10601
10602 PerlIO *
10603 Perl_fp_dup(pTHX_ PerlIO *const fp, const char type, CLONE_PARAMS *const param)
10604 {
10605     PerlIO *ret;
10606
10607     PERL_ARGS_ASSERT_FP_DUP;
10608     PERL_UNUSED_ARG(type);
10609
10610     if (!fp)
10611         return (PerlIO*)NULL;
10612
10613     /* look for it in the table first */
10614     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
10615     if (ret)
10616         return ret;
10617
10618     /* create anew and remember what it is */
10619     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
10620     ptr_table_store(PL_ptr_table, fp, ret);
10621     return ret;
10622 }
10623
10624 /* duplicate a directory handle */
10625
10626 DIR *
10627 Perl_dirp_dup(pTHX_ DIR *const dp)
10628 {
10629     PERL_UNUSED_CONTEXT;
10630     if (!dp)
10631         return (DIR*)NULL;
10632     /* XXX TODO */
10633     return dp;
10634 }
10635
10636 /* duplicate a typeglob */
10637
10638 GP *
10639 Perl_gp_dup(pTHX_ GP *const gp, CLONE_PARAMS *const param)
10640 {
10641     GP *ret;
10642
10643     PERL_ARGS_ASSERT_GP_DUP;
10644
10645     if (!gp)
10646         return (GP*)NULL;
10647     /* look for it in the table first */
10648     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
10649     if (ret)
10650         return ret;
10651
10652     /* create anew and remember what it is */
10653     Newxz(ret, 1, GP);
10654     ptr_table_store(PL_ptr_table, gp, ret);
10655
10656     /* clone */
10657     /* ret->gp_refcnt must be 0 before any other dups are called. We're relying
10658        on Newxz() to do this for us.  */
10659     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
10660     ret->gp_io          = io_dup_inc(gp->gp_io, param);
10661     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
10662     ret->gp_av          = av_dup_inc(gp->gp_av, param);
10663     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
10664     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
10665     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
10666     ret->gp_cvgen       = gp->gp_cvgen;
10667     ret->gp_line        = gp->gp_line;
10668     ret->gp_file_hek    = hek_dup(gp->gp_file_hek, param);
10669     return ret;
10670 }
10671
10672 /* duplicate a chain of magic */
10673
10674 MAGIC *
10675 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS *const param)
10676 {
10677     MAGIC *mgret = NULL;
10678     MAGIC **mgprev_p = &mgret;
10679
10680     PERL_ARGS_ASSERT_MG_DUP;
10681
10682     for (; mg; mg = mg->mg_moremagic) {
10683         MAGIC *nmg;
10684         Newx(nmg, 1, MAGIC);
10685         *mgprev_p = nmg;
10686         mgprev_p = &(nmg->mg_moremagic);
10687
10688         /* There was a comment "XXX copy dynamic vtable?" but as we don't have
10689            dynamic vtables, I'm not sure why Sarathy wrote it. The comment dates
10690            from the original commit adding Perl_mg_dup() - revision 4538.
10691            Similarly there is the annotation "XXX random ptr?" next to the
10692            assignment to nmg->mg_ptr.  */
10693         *nmg = *mg;
10694
10695         /* FIXME for plugins
10696         if (nmg->mg_type == PERL_MAGIC_qr) {
10697             nmg->mg_obj = MUTABLE_SV(CALLREGDUPE((REGEXP*)nmg->mg_obj, param));
10698         }
10699         else
10700         */
10701         if(nmg->mg_type == PERL_MAGIC_backref) {
10702             /* The backref AV has its reference count deliberately bumped by
10703                1.  */
10704             nmg->mg_obj
10705                 = SvREFCNT_inc(av_dup_inc((const AV *) nmg->mg_obj, param));
10706         }
10707         else {
10708             nmg->mg_obj = (nmg->mg_flags & MGf_REFCOUNTED)
10709                               ? sv_dup_inc(nmg->mg_obj, param)
10710                               : sv_dup(nmg->mg_obj, param);
10711         }
10712
10713         if (nmg->mg_ptr && nmg->mg_type != PERL_MAGIC_regex_global) {
10714             if (nmg->mg_len > 0) {
10715                 nmg->mg_ptr     = SAVEPVN(nmg->mg_ptr, nmg->mg_len);
10716                 if (nmg->mg_type == PERL_MAGIC_overload_table &&
10717                         AMT_AMAGIC((AMT*)nmg->mg_ptr))
10718                 {
10719                     AMT * const namtp = (AMT*)nmg->mg_ptr;
10720                     sv_dup_inc_multiple((SV**)(namtp->table),
10721                                         (SV**)(namtp->table), NofAMmeth, param);
10722                 }
10723             }
10724             else if (nmg->mg_len == HEf_SVKEY)
10725                 nmg->mg_ptr = (char*)sv_dup_inc((const SV *)nmg->mg_ptr, param);
10726         }
10727         if ((nmg->mg_flags & MGf_DUP) && nmg->mg_virtual && nmg->mg_virtual->svt_dup) {
10728             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
10729         }
10730     }
10731     return mgret;
10732 }
10733
10734 #endif /* USE_ITHREADS */
10735
10736 /* create a new pointer-mapping table */
10737
10738 PTR_TBL_t *
10739 Perl_ptr_table_new(pTHX)
10740 {
10741     PTR_TBL_t *tbl;
10742     PERL_UNUSED_CONTEXT;
10743
10744     Newx(tbl, 1, PTR_TBL_t);
10745     tbl->tbl_max        = 511;
10746     tbl->tbl_items      = 0;
10747     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
10748     return tbl;
10749 }
10750
10751 #define PTR_TABLE_HASH(ptr) \
10752   ((PTR2UV(ptr) >> 3) ^ (PTR2UV(ptr) >> (3 + 7)) ^ (PTR2UV(ptr) >> (3 + 17)))
10753
10754 /* 
10755    we use the PTE_SVSLOT 'reservation' made above, both here (in the
10756    following define) and at call to new_body_inline made below in 
10757    Perl_ptr_table_store()
10758  */
10759
10760 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
10761
10762 /* map an existing pointer using a table */
10763
10764 STATIC PTR_TBL_ENT_t *
10765 S_ptr_table_find(PTR_TBL_t *const tbl, const void *const sv)
10766 {
10767     PTR_TBL_ENT_t *tblent;
10768     const UV hash = PTR_TABLE_HASH(sv);
10769
10770     PERL_ARGS_ASSERT_PTR_TABLE_FIND;
10771
10772     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
10773     for (; tblent; tblent = tblent->next) {
10774         if (tblent->oldval == sv)
10775             return tblent;
10776     }
10777     return NULL;
10778 }
10779
10780 void *
10781 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *const tbl, const void *const sv)
10782 {
10783     PTR_TBL_ENT_t const *const tblent = ptr_table_find(tbl, sv);
10784
10785     PERL_ARGS_ASSERT_PTR_TABLE_FETCH;
10786     PERL_UNUSED_CONTEXT;
10787
10788     return tblent ? tblent->newval : NULL;
10789 }
10790
10791 /* add a new entry to a pointer-mapping table */
10792
10793 void
10794 Perl_ptr_table_store(pTHX_ PTR_TBL_t *const tbl, const void *const oldsv, void *const newsv)
10795 {
10796     PTR_TBL_ENT_t *tblent = ptr_table_find(tbl, oldsv);
10797
10798     PERL_ARGS_ASSERT_PTR_TABLE_STORE;
10799     PERL_UNUSED_CONTEXT;
10800
10801     if (tblent) {
10802         tblent->newval = newsv;
10803     } else {
10804         const UV entry = PTR_TABLE_HASH(oldsv) & tbl->tbl_max;
10805
10806         new_body_inline(tblent, PTE_SVSLOT);
10807
10808         tblent->oldval = oldsv;
10809         tblent->newval = newsv;
10810         tblent->next = tbl->tbl_ary[entry];
10811         tbl->tbl_ary[entry] = tblent;
10812         tbl->tbl_items++;
10813         if (tblent->next && tbl->tbl_items > tbl->tbl_max)
10814             ptr_table_split(tbl);
10815     }
10816 }
10817
10818 /* double the hash bucket size of an existing ptr table */
10819
10820 void
10821 Perl_ptr_table_split(pTHX_ PTR_TBL_t *const tbl)
10822 {
10823     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
10824     const UV oldsize = tbl->tbl_max + 1;
10825     UV newsize = oldsize * 2;
10826     UV i;
10827
10828     PERL_ARGS_ASSERT_PTR_TABLE_SPLIT;
10829     PERL_UNUSED_CONTEXT;
10830
10831     Renew(ary, newsize, PTR_TBL_ENT_t*);
10832     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
10833     tbl->tbl_max = --newsize;
10834     tbl->tbl_ary = ary;
10835     for (i=0; i < oldsize; i++, ary++) {
10836         PTR_TBL_ENT_t **curentp, **entp, *ent;
10837         if (!*ary)
10838             continue;
10839         curentp = ary + oldsize;
10840         for (entp = ary, ent = *ary; ent; ent = *entp) {
10841             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
10842                 *entp = ent->next;
10843                 ent->next = *curentp;
10844                 *curentp = ent;
10845                 continue;
10846             }
10847             else
10848                 entp = &ent->next;
10849         }
10850     }
10851 }
10852
10853 /* remove all the entries from a ptr table */
10854
10855 void
10856 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *const tbl)
10857 {
10858     if (tbl && tbl->tbl_items) {
10859         register PTR_TBL_ENT_t * const * const array = tbl->tbl_ary;
10860         UV riter = tbl->tbl_max;
10861
10862         do {
10863             PTR_TBL_ENT_t *entry = array[riter];
10864
10865             while (entry) {
10866                 PTR_TBL_ENT_t * const oentry = entry;
10867                 entry = entry->next;
10868                 del_pte(oentry);
10869             }
10870         } while (riter--);
10871
10872         tbl->tbl_items = 0;
10873     }
10874 }
10875
10876 /* clear and free a ptr table */
10877
10878 void
10879 Perl_ptr_table_free(pTHX_ PTR_TBL_t *const tbl)
10880 {
10881     if (!tbl) {
10882         return;
10883     }
10884     ptr_table_clear(tbl);
10885     Safefree(tbl->tbl_ary);
10886     Safefree(tbl);
10887 }
10888
10889 #if defined(USE_ITHREADS)
10890
10891 void
10892 Perl_rvpv_dup(pTHX_ SV *const dstr, const SV *const sstr, CLONE_PARAMS *const param)
10893 {
10894     PERL_ARGS_ASSERT_RVPV_DUP;
10895
10896     if (SvROK(sstr)) {
10897         SvRV_set(dstr, SvWEAKREF(sstr)
10898                        ? sv_dup(SvRV_const(sstr), param)
10899                        : sv_dup_inc(SvRV_const(sstr), param));
10900
10901     }
10902     else if (SvPVX_const(sstr)) {
10903         /* Has something there */
10904         if (SvLEN(sstr)) {
10905             /* Normal PV - clone whole allocated space */
10906             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
10907             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
10908                 /* Not that normal - actually sstr is copy on write.
10909                    But we are a true, independant SV, so:  */
10910                 SvREADONLY_off(dstr);
10911                 SvFAKE_off(dstr);
10912             }
10913         }
10914         else {
10915             /* Special case - not normally malloced for some reason */
10916             if (isGV_with_GP(sstr)) {
10917                 /* Don't need to do anything here.  */
10918             }
10919             else if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
10920                 /* A "shared" PV - clone it as "shared" PV */
10921                 SvPV_set(dstr,
10922                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
10923                                          param)));
10924             }
10925             else {
10926                 /* Some other special case - random pointer */
10927                 SvPV_set(dstr, (char *) SvPVX_const(sstr));             
10928             }
10929         }
10930     }
10931     else {
10932         /* Copy the NULL */
10933         SvPV_set(dstr, NULL);
10934     }
10935 }
10936
10937 /* duplicate a list of SVs. source and dest may point to the same memory.  */
10938 static SV **
10939 S_sv_dup_inc_multiple(pTHX_ SV *const *source, SV **dest,
10940                       SSize_t items, CLONE_PARAMS *const param)
10941 {
10942     PERL_ARGS_ASSERT_SV_DUP_INC_MULTIPLE;
10943
10944     while (items-- > 0) {
10945         *dest++ = sv_dup_inc(*source++, param);
10946     }
10947
10948     return dest;
10949 }
10950
10951 /* duplicate an SV of any type (including AV, HV etc) */
10952
10953 SV *
10954 Perl_sv_dup(pTHX_ const SV *const sstr, CLONE_PARAMS *const param)
10955 {
10956     dVAR;
10957     SV *dstr;
10958
10959     PERL_ARGS_ASSERT_SV_DUP;
10960
10961     if (!sstr)
10962         return NULL;
10963     if (SvTYPE(sstr) == SVTYPEMASK) {
10964 #ifdef DEBUG_LEAKING_SCALARS_ABORT
10965         abort();
10966 #endif
10967         return NULL;
10968     }
10969     /* look for it in the table first */
10970     dstr = MUTABLE_SV(ptr_table_fetch(PL_ptr_table, sstr));
10971     if (dstr)
10972         return dstr;
10973
10974     if(param->flags & CLONEf_JOIN_IN) {
10975         /** We are joining here so we don't want do clone
10976             something that is bad **/
10977         if (SvTYPE(sstr) == SVt_PVHV) {
10978             const HEK * const hvname = HvNAME_HEK(sstr);
10979             if (hvname)
10980                 /** don't clone stashes if they already exist **/
10981                 return MUTABLE_SV(gv_stashpvn(HEK_KEY(hvname), HEK_LEN(hvname), 0));
10982         }
10983     }
10984
10985     /* create anew and remember what it is */
10986     new_SV(dstr);
10987
10988 #ifdef DEBUG_LEAKING_SCALARS
10989     dstr->sv_debug_optype = sstr->sv_debug_optype;
10990     dstr->sv_debug_line = sstr->sv_debug_line;
10991     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
10992     dstr->sv_debug_cloned = 1;
10993     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
10994 #endif
10995
10996     ptr_table_store(PL_ptr_table, sstr, dstr);
10997
10998     /* clone */
10999     SvFLAGS(dstr)       = SvFLAGS(sstr);
11000     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
11001     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
11002
11003 #ifdef DEBUGGING
11004     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
11005         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
11006                       (void*)PL_watch_pvx, SvPVX_const(sstr));
11007 #endif
11008
11009     /* don't clone objects whose class has asked us not to */
11010     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
11011         SvFLAGS(dstr) = 0;
11012         return dstr;
11013     }
11014
11015     switch (SvTYPE(sstr)) {
11016     case SVt_NULL:
11017         SvANY(dstr)     = NULL;
11018         break;
11019     case SVt_IV:
11020         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
11021         if(SvROK(sstr)) {
11022             Perl_rvpv_dup(aTHX_ dstr, sstr, param);
11023         } else {
11024             SvIV_set(dstr, SvIVX(sstr));
11025         }
11026         break;
11027     case SVt_NV:
11028         SvANY(dstr)     = new_XNV();
11029         SvNV_set(dstr, SvNVX(sstr));
11030         break;
11031         /* case SVt_BIND: */
11032     default:
11033         {
11034             /* These are all the types that need complex bodies allocating.  */
11035             void *new_body;
11036             const svtype sv_type = SvTYPE(sstr);
11037             const struct body_details *const sv_type_details
11038                 = bodies_by_type + sv_type;
11039
11040             switch (sv_type) {
11041             default:
11042                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]", (IV)SvTYPE(sstr));
11043                 break;
11044
11045             case SVt_PVGV:
11046             case SVt_PVIO:
11047             case SVt_PVFM:
11048             case SVt_PVHV:
11049             case SVt_PVAV:
11050             case SVt_PVCV:
11051             case SVt_PVLV:
11052             case SVt_REGEXP:
11053             case SVt_PVMG:
11054             case SVt_PVNV:
11055             case SVt_PVIV:
11056             case SVt_PV:
11057                 assert(sv_type_details->body_size);
11058                 if (sv_type_details->arena) {
11059                     new_body_inline(new_body, sv_type);
11060                     new_body
11061                         = (void*)((char*)new_body - sv_type_details->offset);
11062                 } else {
11063                     new_body = new_NOARENA(sv_type_details);
11064                 }
11065             }
11066             assert(new_body);
11067             SvANY(dstr) = new_body;
11068
11069 #ifndef PURIFY
11070             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
11071                  ((char*)SvANY(dstr)) + sv_type_details->offset,
11072                  sv_type_details->copy, char);
11073 #else
11074             Copy(((char*)SvANY(sstr)),
11075                  ((char*)SvANY(dstr)),
11076                  sv_type_details->body_size + sv_type_details->offset, char);
11077 #endif
11078
11079             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV
11080                 && !isGV_with_GP(dstr))
11081                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
11082
11083             /* The Copy above means that all the source (unduplicated) pointers
11084                are now in the destination.  We can check the flags and the
11085                pointers in either, but it's possible that there's less cache
11086                missing by always going for the destination.
11087                FIXME - instrument and check that assumption  */
11088             if (sv_type >= SVt_PVMG) {
11089                 if ((sv_type == SVt_PVMG) && SvPAD_OUR(dstr)) {
11090                     SvOURSTASH_set(dstr, hv_dup_inc(SvOURSTASH(dstr), param));
11091                 } else if (SvMAGIC(dstr))
11092                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
11093                 if (SvSTASH(dstr))
11094                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
11095             }
11096
11097             /* The cast silences a GCC warning about unhandled types.  */
11098             switch ((int)sv_type) {
11099             case SVt_PV:
11100                 break;
11101             case SVt_PVIV:
11102                 break;
11103             case SVt_PVNV:
11104                 break;
11105             case SVt_PVMG:
11106                 break;
11107             case SVt_REGEXP:
11108                 /* FIXME for plugins */
11109                 re_dup_guts((REGEXP*) sstr, (REGEXP*) dstr, param);
11110                 break;
11111             case SVt_PVLV:
11112                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
11113                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
11114                     LvTARG(dstr) = dstr;
11115                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
11116                     LvTARG(dstr) = MUTABLE_SV(he_dup((HE*)LvTARG(dstr), 0, param));
11117                 else
11118                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
11119             case SVt_PVGV:
11120                 if(isGV_with_GP(sstr)) {
11121                     GvNAME_HEK(dstr) = hek_dup(GvNAME_HEK(dstr), param);
11122                     /* Don't call sv_add_backref here as it's going to be
11123                        created as part of the magic cloning of the symbol
11124                        table--unless this is during a join and the stash
11125                        is not actually being cloned.  */
11126                     /* Danger Will Robinson - GvGP(dstr) isn't initialised
11127                        at the point of this comment.  */
11128                     GvSTASH(dstr) = hv_dup(GvSTASH(dstr), param);
11129                     if(param->flags & CLONEf_JOIN_IN) {
11130                         const HEK * const hvname
11131                          = HvNAME_HEK(GvSTASH(dstr));
11132                         if( hvname
11133                          && GvSTASH(dstr) == gv_stashpvn(
11134                              HEK_KEY(hvname), HEK_LEN(hvname), 0
11135                             )
11136                           )
11137                             Perl_sv_add_backref(
11138                              aTHX_ MUTABLE_SV(GvSTASH(dstr)), dstr
11139                             );
11140                     }
11141                     GvGP(dstr)  = gp_dup(GvGP(sstr), param);
11142                     (void)GpREFCNT_inc(GvGP(dstr));
11143                 } else
11144                     Perl_rvpv_dup(aTHX_ dstr, sstr, param);
11145                 break;
11146             case SVt_PVIO:
11147                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
11148                 if (IoOFP(dstr) == IoIFP(sstr))
11149                     IoOFP(dstr) = IoIFP(dstr);
11150                 else
11151                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
11152                 /* PL_parser->rsfp_filters entries have fake IoDIRP() */
11153                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
11154                     /* I have no idea why fake dirp (rsfps)
11155                        should be treated differently but otherwise
11156                        we end up with leaks -- sky*/
11157                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
11158                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
11159                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
11160                 } else {
11161                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
11162                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
11163                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
11164                     if (IoDIRP(dstr)) {
11165                         IoDIRP(dstr)    = dirp_dup(IoDIRP(dstr));
11166                     } else {
11167                         NOOP;
11168                         /* IoDIRP(dstr) is already a copy of IoDIRP(sstr)  */
11169                     }
11170                 }
11171                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
11172                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
11173                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
11174                 break;
11175             case SVt_PVAV:
11176                 /* avoid cloning an empty array */
11177                 if (AvARRAY((const AV *)sstr) && AvFILLp((const AV *)sstr) >= 0) {
11178                     SV **dst_ary, **src_ary;
11179                     SSize_t items = AvFILLp((const AV *)sstr) + 1;
11180
11181                     src_ary = AvARRAY((const AV *)sstr);
11182                     Newxz(dst_ary, AvMAX((const AV *)sstr)+1, SV*);
11183                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
11184                     AvARRAY(MUTABLE_AV(dstr)) = dst_ary;
11185                     AvALLOC((const AV *)dstr) = dst_ary;
11186                     if (AvREAL((const AV *)sstr)) {
11187                         dst_ary = sv_dup_inc_multiple(src_ary, dst_ary, items,
11188                                                       param);
11189                     }
11190                     else {
11191                         while (items-- > 0)
11192                             *dst_ary++ = sv_dup(*src_ary++, param);
11193                         if (!(param->flags & CLONEf_COPY_STACKS)
11194                              && AvREIFY(sstr))
11195                         {
11196                             av_reify(MUTABLE_AV(dstr)); /* #41138 */
11197                         }
11198                     }
11199                     items = AvMAX((const AV *)sstr) - AvFILLp((const AV *)sstr);
11200                     while (items-- > 0) {
11201                         *dst_ary++ = &PL_sv_undef;
11202                     }
11203                 }
11204                 else {
11205                     AvARRAY(MUTABLE_AV(dstr))   = NULL;
11206                     AvALLOC((const AV *)dstr)   = (SV**)NULL;
11207                     AvMAX(  (const AV *)dstr)   = -1;
11208                     AvFILLp((const AV *)dstr)   = -1;
11209                 }
11210                 break;
11211             case SVt_PVHV:
11212                 if (HvARRAY((const HV *)sstr)) {
11213                     STRLEN i = 0;
11214                     const bool sharekeys = !!HvSHAREKEYS(sstr);
11215                     XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
11216                     XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
11217                     char *darray;
11218                     Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
11219                         + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
11220                         char);
11221                     HvARRAY(dstr) = (HE**)darray;
11222                     while (i <= sxhv->xhv_max) {
11223                         const HE * const source = HvARRAY(sstr)[i];
11224                         HvARRAY(dstr)[i] = source
11225                             ? he_dup(source, sharekeys, param) : 0;
11226                         ++i;
11227                     }
11228                     if (SvOOK(sstr)) {
11229                         HEK *hvname;
11230                         const struct xpvhv_aux * const saux = HvAUX(sstr);
11231                         struct xpvhv_aux * const daux = HvAUX(dstr);
11232                         /* This flag isn't copied.  */
11233                         /* SvOOK_on(hv) attacks the IV flags.  */
11234                         SvFLAGS(dstr) |= SVf_OOK;
11235
11236                         hvname = saux->xhv_name;
11237                         daux->xhv_name = hek_dup(hvname, param);
11238
11239                         daux->xhv_riter = saux->xhv_riter;
11240                         daux->xhv_eiter = saux->xhv_eiter
11241                             ? he_dup(saux->xhv_eiter,
11242                                         (bool)!!HvSHAREKEYS(sstr), param) : 0;
11243                         /* backref array needs refcnt=2; see sv_add_backref */
11244                         daux->xhv_backreferences =
11245                             saux->xhv_backreferences
11246                             ? MUTABLE_AV(SvREFCNT_inc(
11247                                                       sv_dup_inc((const SV *)saux->xhv_backreferences, param)))
11248                                 : 0;
11249
11250                         daux->xhv_mro_meta = saux->xhv_mro_meta
11251                             ? mro_meta_dup(saux->xhv_mro_meta, param)
11252                             : 0;
11253
11254                         /* Record stashes for possible cloning in Perl_clone(). */
11255                         if (hvname)
11256                             av_push(param->stashes, dstr);
11257                     }
11258                 }
11259                 else
11260                     HvARRAY(MUTABLE_HV(dstr)) = NULL;
11261                 break;
11262             case SVt_PVCV:
11263                 if (!(param->flags & CLONEf_COPY_STACKS)) {
11264                     CvDEPTH(dstr) = 0;
11265                 }
11266             case SVt_PVFM:
11267                 /* NOTE: not refcounted */
11268                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
11269                 OP_REFCNT_LOCK;
11270                 if (!CvISXSUB(dstr))
11271                     CvROOT(dstr) = OpREFCNT_inc(CvROOT(dstr));
11272                 OP_REFCNT_UNLOCK;
11273                 if (CvCONST(dstr) && CvISXSUB(dstr)) {
11274                     CvXSUBANY(dstr).any_ptr =
11275                         sv_dup_inc((const SV *)CvXSUBANY(dstr).any_ptr, param);
11276                 }
11277                 /* don't dup if copying back - CvGV isn't refcounted, so the
11278                  * duped GV may never be freed. A bit of a hack! DAPM */
11279                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
11280                     NULL : gv_dup(CvGV(dstr), param) ;
11281                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
11282                 CvOUTSIDE(dstr) =
11283                     CvWEAKOUTSIDE(sstr)
11284                     ? cv_dup(    CvOUTSIDE(dstr), param)
11285                     : cv_dup_inc(CvOUTSIDE(dstr), param);
11286                 if (!CvISXSUB(dstr))
11287                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
11288                 break;
11289             }
11290         }
11291     }
11292
11293     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
11294         ++PL_sv_objcount;
11295
11296     return dstr;
11297  }
11298
11299 /* duplicate a context */
11300
11301 PERL_CONTEXT *
11302 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
11303 {
11304     PERL_CONTEXT *ncxs;
11305
11306     PERL_ARGS_ASSERT_CX_DUP;
11307
11308     if (!cxs)
11309         return (PERL_CONTEXT*)NULL;
11310
11311     /* look for it in the table first */
11312     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
11313     if (ncxs)
11314         return ncxs;
11315
11316     /* create anew and remember what it is */
11317     Newx(ncxs, max + 1, PERL_CONTEXT);
11318     ptr_table_store(PL_ptr_table, cxs, ncxs);
11319     Copy(cxs, ncxs, max + 1, PERL_CONTEXT);
11320
11321     while (ix >= 0) {
11322         PERL_CONTEXT * const ncx = &ncxs[ix];
11323         if (CxTYPE(ncx) == CXt_SUBST) {
11324             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
11325         }
11326         else {
11327             switch (CxTYPE(ncx)) {
11328             case CXt_SUB:
11329                 ncx->blk_sub.cv         = (ncx->blk_sub.olddepth == 0
11330                                            ? cv_dup_inc(ncx->blk_sub.cv, param)
11331                                            : cv_dup(ncx->blk_sub.cv,param));
11332                 ncx->blk_sub.argarray   = (CxHASARGS(ncx)
11333                                            ? av_dup_inc(ncx->blk_sub.argarray,
11334                                                         param)
11335                                            : NULL);
11336                 ncx->blk_sub.savearray  = av_dup_inc(ncx->blk_sub.savearray,
11337                                                      param);
11338                 ncx->blk_sub.oldcomppad = (PAD*)ptr_table_fetch(PL_ptr_table,
11339                                            ncx->blk_sub.oldcomppad);
11340                 break;
11341             case CXt_EVAL:
11342                 ncx->blk_eval.old_namesv = sv_dup_inc(ncx->blk_eval.old_namesv,
11343                                                       param);
11344                 ncx->blk_eval.cur_text  = sv_dup(ncx->blk_eval.cur_text, param);
11345                 break;
11346             case CXt_LOOP_LAZYSV:
11347                 ncx->blk_loop.state_u.lazysv.end
11348                     = sv_dup_inc(ncx->blk_loop.state_u.lazysv.end, param);
11349                 /* We are taking advantage of av_dup_inc and sv_dup_inc
11350                    actually being the same function, and order equivalance of
11351                    the two unions.
11352                    We can assert the later [but only at run time :-(]  */
11353                 assert ((void *) &ncx->blk_loop.state_u.ary.ary ==
11354                         (void *) &ncx->blk_loop.state_u.lazysv.cur);
11355             case CXt_LOOP_FOR:
11356                 ncx->blk_loop.state_u.ary.ary
11357                     = av_dup_inc(ncx->blk_loop.state_u.ary.ary, param);
11358             case CXt_LOOP_LAZYIV:
11359             case CXt_LOOP_PLAIN:
11360                 if (CxPADLOOP(ncx)) {
11361                     ncx->blk_loop.oldcomppad
11362                         = (PAD*)ptr_table_fetch(PL_ptr_table,
11363                                                 ncx->blk_loop.oldcomppad);
11364                 } else {
11365                     ncx->blk_loop.oldcomppad
11366                         = (PAD*)gv_dup((const GV *)ncx->blk_loop.oldcomppad,
11367                                        param);
11368                 }
11369                 break;
11370             case CXt_FORMAT:
11371                 ncx->blk_format.cv      = cv_dup(ncx->blk_format.cv, param);
11372                 ncx->blk_format.gv      = gv_dup(ncx->blk_format.gv, param);
11373                 ncx->blk_format.dfoutgv = gv_dup_inc(ncx->blk_format.dfoutgv,
11374                                                      param);
11375                 break;
11376             case CXt_BLOCK:
11377             case CXt_NULL:
11378                 break;
11379             }
11380         }
11381         --ix;
11382     }
11383     return ncxs;
11384 }
11385
11386 /* duplicate a stack info structure */
11387
11388 PERL_SI *
11389 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
11390 {
11391     PERL_SI *nsi;
11392
11393     PERL_ARGS_ASSERT_SI_DUP;
11394
11395     if (!si)
11396         return (PERL_SI*)NULL;
11397
11398     /* look for it in the table first */
11399     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
11400     if (nsi)
11401         return nsi;
11402
11403     /* create anew and remember what it is */
11404     Newxz(nsi, 1, PERL_SI);
11405     ptr_table_store(PL_ptr_table, si, nsi);
11406
11407     nsi->si_stack       = av_dup_inc(si->si_stack, param);
11408     nsi->si_cxix        = si->si_cxix;
11409     nsi->si_cxmax       = si->si_cxmax;
11410     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
11411     nsi->si_type        = si->si_type;
11412     nsi->si_prev        = si_dup(si->si_prev, param);
11413     nsi->si_next        = si_dup(si->si_next, param);
11414     nsi->si_markoff     = si->si_markoff;
11415
11416     return nsi;
11417 }
11418
11419 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
11420 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
11421 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
11422 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
11423 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
11424 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
11425 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
11426 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
11427 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
11428 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
11429 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
11430 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
11431 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
11432 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
11433
11434 /* XXXXX todo */
11435 #define pv_dup_inc(p)   SAVEPV(p)
11436 #define pv_dup(p)       SAVEPV(p)
11437 #define svp_dup_inc(p,pp)       any_dup(p,pp)
11438
11439 /* map any object to the new equivent - either something in the
11440  * ptr table, or something in the interpreter structure
11441  */
11442
11443 void *
11444 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
11445 {
11446     void *ret;
11447
11448     PERL_ARGS_ASSERT_ANY_DUP;
11449
11450     if (!v)
11451         return (void*)NULL;
11452
11453     /* look for it in the table first */
11454     ret = ptr_table_fetch(PL_ptr_table, v);
11455     if (ret)
11456         return ret;
11457
11458     /* see if it is part of the interpreter structure */
11459     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
11460         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
11461     else {
11462         ret = v;
11463     }
11464
11465     return ret;
11466 }
11467
11468 /* duplicate the save stack */
11469
11470 ANY *
11471 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
11472 {
11473     dVAR;
11474     ANY * const ss      = proto_perl->Isavestack;
11475     const I32 max       = proto_perl->Isavestack_max;
11476     I32 ix              = proto_perl->Isavestack_ix;
11477     ANY *nss;
11478     const SV *sv;
11479     const GV *gv;
11480     const AV *av;
11481     const HV *hv;
11482     void* ptr;
11483     int intval;
11484     long longval;
11485     GP *gp;
11486     IV iv;
11487     I32 i;
11488     char *c = NULL;
11489     void (*dptr) (void*);
11490     void (*dxptr) (pTHX_ void*);
11491
11492     PERL_ARGS_ASSERT_SS_DUP;
11493
11494     Newxz(nss, max, ANY);
11495
11496     while (ix > 0) {
11497         const I32 type = POPINT(ss,ix);
11498         TOPINT(nss,ix) = type;
11499         switch (type) {
11500         case SAVEt_HELEM:               /* hash element */
11501             sv = (const SV *)POPPTR(ss,ix);
11502             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
11503             /* fall through */
11504         case SAVEt_ITEM:                        /* normal string */
11505         case SAVEt_SV:                          /* scalar reference */
11506             sv = (const SV *)POPPTR(ss,ix);
11507             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
11508             /* fall through */
11509         case SAVEt_FREESV:
11510         case SAVEt_MORTALIZESV:
11511             sv = (const SV *)POPPTR(ss,ix);
11512             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
11513             break;
11514         case SAVEt_SHARED_PVREF:                /* char* in shared space */
11515             c = (char*)POPPTR(ss,ix);
11516             TOPPTR(nss,ix) = savesharedpv(c);
11517             ptr = POPPTR(ss,ix);
11518             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11519             break;
11520         case SAVEt_GENERIC_SVREF:               /* generic sv */
11521         case SAVEt_SVREF:                       /* scalar reference */
11522             sv = (const SV *)POPPTR(ss,ix);
11523             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
11524             ptr = POPPTR(ss,ix);
11525             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
11526             break;
11527         case SAVEt_HV:                          /* hash reference */
11528         case SAVEt_AV:                          /* array reference */
11529             sv = (const SV *) POPPTR(ss,ix);
11530             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
11531             /* fall through */
11532         case SAVEt_COMPPAD:
11533         case SAVEt_NSTAB:
11534             sv = (const SV *) POPPTR(ss,ix);
11535             TOPPTR(nss,ix) = sv_dup(sv, param);
11536             break;
11537         case SAVEt_INT:                         /* int reference */
11538             ptr = POPPTR(ss,ix);
11539             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11540             intval = (int)POPINT(ss,ix);
11541             TOPINT(nss,ix) = intval;
11542             break;
11543         case SAVEt_LONG:                        /* long reference */
11544             ptr = POPPTR(ss,ix);
11545             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11546             /* fall through */
11547         case SAVEt_CLEARSV:
11548             longval = (long)POPLONG(ss,ix);
11549             TOPLONG(nss,ix) = longval;
11550             break;
11551         case SAVEt_I32:                         /* I32 reference */
11552         case SAVEt_I16:                         /* I16 reference */
11553         case SAVEt_I8:                          /* I8 reference */
11554         case SAVEt_COP_ARYBASE:                 /* call CopARYBASE_set */
11555             ptr = POPPTR(ss,ix);
11556             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11557             i = POPINT(ss,ix);
11558             TOPINT(nss,ix) = i;
11559             break;
11560         case SAVEt_IV:                          /* IV reference */
11561             ptr = POPPTR(ss,ix);
11562             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11563             iv = POPIV(ss,ix);
11564             TOPIV(nss,ix) = iv;
11565             break;
11566         case SAVEt_HPTR:                        /* HV* reference */
11567         case SAVEt_APTR:                        /* AV* reference */
11568         case SAVEt_SPTR:                        /* SV* reference */
11569             ptr = POPPTR(ss,ix);
11570             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11571             sv = (const SV *)POPPTR(ss,ix);
11572             TOPPTR(nss,ix) = sv_dup(sv, param);
11573             break;
11574         case SAVEt_VPTR:                        /* random* reference */
11575             ptr = POPPTR(ss,ix);
11576             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11577             ptr = POPPTR(ss,ix);
11578             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11579             break;
11580         case SAVEt_GENERIC_PVREF:               /* generic char* */
11581         case SAVEt_PPTR:                        /* char* reference */
11582             ptr = POPPTR(ss,ix);
11583             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11584             c = (char*)POPPTR(ss,ix);
11585             TOPPTR(nss,ix) = pv_dup(c);
11586             break;
11587         case SAVEt_GP:                          /* scalar reference */
11588             gp = (GP*)POPPTR(ss,ix);
11589             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
11590             (void)GpREFCNT_inc(gp);
11591             gv = (const GV *)POPPTR(ss,ix);
11592             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
11593             break;
11594         case SAVEt_FREEOP:
11595             ptr = POPPTR(ss,ix);
11596             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
11597                 /* these are assumed to be refcounted properly */
11598                 OP *o;
11599                 switch (((OP*)ptr)->op_type) {
11600                 case OP_LEAVESUB:
11601                 case OP_LEAVESUBLV:
11602                 case OP_LEAVEEVAL:
11603                 case OP_LEAVE:
11604                 case OP_SCOPE:
11605                 case OP_LEAVEWRITE:
11606                     TOPPTR(nss,ix) = ptr;
11607                     o = (OP*)ptr;
11608                     OP_REFCNT_LOCK;
11609                     (void) OpREFCNT_inc(o);
11610                     OP_REFCNT_UNLOCK;
11611                     break;
11612                 default:
11613                     TOPPTR(nss,ix) = NULL;
11614                     break;
11615                 }
11616             }
11617             else
11618                 TOPPTR(nss,ix) = NULL;
11619             break;
11620         case SAVEt_DELETE:
11621             hv = (const HV *)POPPTR(ss,ix);
11622             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
11623             i = POPINT(ss,ix);
11624             TOPINT(nss,ix) = i;
11625             /* Fall through */
11626         case SAVEt_FREEPV:
11627             c = (char*)POPPTR(ss,ix);
11628             TOPPTR(nss,ix) = pv_dup_inc(c);
11629             break;
11630         case SAVEt_STACK_POS:           /* Position on Perl stack */
11631             i = POPINT(ss,ix);
11632             TOPINT(nss,ix) = i;
11633             break;
11634         case SAVEt_DESTRUCTOR:
11635             ptr = POPPTR(ss,ix);
11636             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
11637             dptr = POPDPTR(ss,ix);
11638             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
11639                                         any_dup(FPTR2DPTR(void *, dptr),
11640                                                 proto_perl));
11641             break;
11642         case SAVEt_DESTRUCTOR_X:
11643             ptr = POPPTR(ss,ix);
11644             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
11645             dxptr = POPDXPTR(ss,ix);
11646             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
11647                                          any_dup(FPTR2DPTR(void *, dxptr),
11648                                                  proto_perl));
11649             break;
11650         case SAVEt_REGCONTEXT:
11651         case SAVEt_ALLOC:
11652             i = POPINT(ss,ix);
11653             TOPINT(nss,ix) = i;
11654             ix -= i;
11655             break;
11656         case SAVEt_AELEM:               /* array element */
11657             sv = (const SV *)POPPTR(ss,ix);
11658             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
11659             i = POPINT(ss,ix);
11660             TOPINT(nss,ix) = i;
11661             av = (const AV *)POPPTR(ss,ix);
11662             TOPPTR(nss,ix) = av_dup_inc(av, param);
11663             break;
11664         case SAVEt_OP:
11665             ptr = POPPTR(ss,ix);
11666             TOPPTR(nss,ix) = ptr;
11667             break;
11668         case SAVEt_HINTS:
11669             ptr = POPPTR(ss,ix);
11670             if (ptr) {
11671                 HINTS_REFCNT_LOCK;
11672                 ((struct refcounted_he *)ptr)->refcounted_he_refcnt++;
11673                 HINTS_REFCNT_UNLOCK;
11674             }
11675             TOPPTR(nss,ix) = ptr;
11676             i = POPINT(ss,ix);
11677             TOPINT(nss,ix) = i;
11678             if (i & HINT_LOCALIZE_HH) {
11679                 hv = (const HV *)POPPTR(ss,ix);
11680                 TOPPTR(nss,ix) = hv_dup_inc(hv, param);
11681             }
11682             break;
11683         case SAVEt_PADSV_AND_MORTALIZE:
11684             longval = (long)POPLONG(ss,ix);
11685             TOPLONG(nss,ix) = longval;
11686             ptr = POPPTR(ss,ix);
11687             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11688             sv = (const SV *)POPPTR(ss,ix);
11689             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
11690             break;
11691         case SAVEt_BOOL:
11692             ptr = POPPTR(ss,ix);
11693             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
11694             longval = (long)POPBOOL(ss,ix);
11695             TOPBOOL(nss,ix) = (bool)longval;
11696             break;
11697         case SAVEt_SET_SVFLAGS:
11698             i = POPINT(ss,ix);
11699             TOPINT(nss,ix) = i;
11700             i = POPINT(ss,ix);
11701             TOPINT(nss,ix) = i;
11702             sv = (const SV *)POPPTR(ss,ix);
11703             TOPPTR(nss,ix) = sv_dup(sv, param);
11704             break;
11705         case SAVEt_RE_STATE:
11706             {
11707                 const struct re_save_state *const old_state
11708                     = (struct re_save_state *)
11709                     (ss + ix - SAVESTACK_ALLOC_FOR_RE_SAVE_STATE);
11710                 struct re_save_state *const new_state
11711                     = (struct re_save_state *)
11712                     (nss + ix - SAVESTACK_ALLOC_FOR_RE_SAVE_STATE);
11713
11714                 Copy(old_state, new_state, 1, struct re_save_state);
11715                 ix -= SAVESTACK_ALLOC_FOR_RE_SAVE_STATE;
11716
11717                 new_state->re_state_bostr
11718                     = pv_dup(old_state->re_state_bostr);
11719                 new_state->re_state_reginput
11720                     = pv_dup(old_state->re_state_reginput);
11721                 new_state->re_state_regeol
11722                     = pv_dup(old_state->re_state_regeol);
11723                 new_state->re_state_regoffs
11724                     = (regexp_paren_pair*)
11725                         any_dup(old_state->re_state_regoffs, proto_perl);
11726                 new_state->re_state_reglastparen
11727                     = (U32*) any_dup(old_state->re_state_reglastparen, 
11728                               proto_perl);
11729                 new_state->re_state_reglastcloseparen
11730                     = (U32*)any_dup(old_state->re_state_reglastcloseparen,
11731                               proto_perl);
11732                 /* XXX This just has to be broken. The old save_re_context
11733                    code did SAVEGENERICPV(PL_reg_start_tmp);
11734                    PL_reg_start_tmp is char **.
11735                    Look above to what the dup code does for
11736                    SAVEt_GENERIC_PVREF
11737                    It can never have worked.
11738                    So this is merely a faithful copy of the exiting bug:  */
11739                 new_state->re_state_reg_start_tmp
11740                     = (char **) pv_dup((char *)
11741                                       old_state->re_state_reg_start_tmp);
11742                 /* I assume that it only ever "worked" because no-one called
11743                    (pseudo)fork while the regexp engine had re-entered itself.
11744                 */
11745 #ifdef PERL_OLD_COPY_ON_WRITE
11746                 new_state->re_state_nrs
11747                     = sv_dup(old_state->re_state_nrs, param);
11748 #endif
11749                 new_state->re_state_reg_magic
11750                     = (MAGIC*) any_dup(old_state->re_state_reg_magic, 
11751                                proto_perl);
11752                 new_state->re_state_reg_oldcurpm
11753                     = (PMOP*) any_dup(old_state->re_state_reg_oldcurpm, 
11754                               proto_perl);
11755                 new_state->re_state_reg_curpm
11756                     = (PMOP*)  any_dup(old_state->re_state_reg_curpm, 
11757                                proto_perl);
11758                 new_state->re_state_reg_oldsaved
11759                     = pv_dup(old_state->re_state_reg_oldsaved);
11760                 new_state->re_state_reg_poscache
11761                     = pv_dup(old_state->re_state_reg_poscache);
11762                 new_state->re_state_reg_starttry
11763                     = pv_dup(old_state->re_state_reg_starttry);
11764                 break;
11765             }
11766         case SAVEt_COMPILE_WARNINGS:
11767             ptr = POPPTR(ss,ix);
11768             TOPPTR(nss,ix) = DUP_WARNINGS((STRLEN*)ptr);
11769             break;
11770         case SAVEt_PARSER:
11771             ptr = POPPTR(ss,ix);
11772             TOPPTR(nss,ix) = parser_dup((const yy_parser*)ptr, param);
11773             break;
11774         default:
11775             Perl_croak(aTHX_
11776                        "panic: ss_dup inconsistency (%"IVdf")", (IV) type);
11777         }
11778     }
11779
11780     return nss;
11781 }
11782
11783
11784 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
11785  * flag to the result. This is done for each stash before cloning starts,
11786  * so we know which stashes want their objects cloned */
11787
11788 static void
11789 do_mark_cloneable_stash(pTHX_ SV *const sv)
11790 {
11791     const HEK * const hvname = HvNAME_HEK((const HV *)sv);
11792     if (hvname) {
11793         GV* const cloner = gv_fetchmethod_autoload(MUTABLE_HV(sv), "CLONE_SKIP", 0);
11794         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
11795         if (cloner && GvCV(cloner)) {
11796             dSP;
11797             UV status;
11798
11799             ENTER;
11800             SAVETMPS;
11801             PUSHMARK(SP);
11802             mXPUSHs(newSVhek(hvname));
11803             PUTBACK;
11804             call_sv(MUTABLE_SV(GvCV(cloner)), G_SCALAR);
11805             SPAGAIN;
11806             status = POPu;
11807             PUTBACK;
11808             FREETMPS;
11809             LEAVE;
11810             if (status)
11811                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
11812         }
11813     }
11814 }
11815
11816
11817
11818 /*
11819 =for apidoc perl_clone
11820
11821 Create and return a new interpreter by cloning the current one.
11822
11823 perl_clone takes these flags as parameters:
11824
11825 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
11826 without it we only clone the data and zero the stacks,
11827 with it we copy the stacks and the new perl interpreter is
11828 ready to run at the exact same point as the previous one.
11829 The pseudo-fork code uses COPY_STACKS while the
11830 threads->create doesn't.
11831
11832 CLONEf_KEEP_PTR_TABLE
11833 perl_clone keeps a ptr_table with the pointer of the old
11834 variable as a key and the new variable as a value,
11835 this allows it to check if something has been cloned and not
11836 clone it again but rather just use the value and increase the
11837 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
11838 the ptr_table using the function
11839 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
11840 reason to keep it around is if you want to dup some of your own
11841 variable who are outside the graph perl scans, example of this
11842 code is in threads.xs create
11843
11844 CLONEf_CLONE_HOST
11845 This is a win32 thing, it is ignored on unix, it tells perls
11846 win32host code (which is c++) to clone itself, this is needed on
11847 win32 if you want to run two threads at the same time,
11848 if you just want to do some stuff in a separate perl interpreter
11849 and then throw it away and return to the original one,
11850 you don't need to do anything.
11851
11852 =cut
11853 */
11854
11855 /* XXX the above needs expanding by someone who actually understands it ! */
11856 EXTERN_C PerlInterpreter *
11857 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
11858
11859 PerlInterpreter *
11860 perl_clone(PerlInterpreter *proto_perl, UV flags)
11861 {
11862    dVAR;
11863 #ifdef PERL_IMPLICIT_SYS
11864
11865     PERL_ARGS_ASSERT_PERL_CLONE;
11866
11867    /* perlhost.h so we need to call into it
11868    to clone the host, CPerlHost should have a c interface, sky */
11869
11870    if (flags & CLONEf_CLONE_HOST) {
11871        return perl_clone_host(proto_perl,flags);
11872    }
11873    return perl_clone_using(proto_perl, flags,
11874                             proto_perl->IMem,
11875                             proto_perl->IMemShared,
11876                             proto_perl->IMemParse,
11877                             proto_perl->IEnv,
11878                             proto_perl->IStdIO,
11879                             proto_perl->ILIO,
11880                             proto_perl->IDir,
11881                             proto_perl->ISock,
11882                             proto_perl->IProc);
11883 }
11884
11885 PerlInterpreter *
11886 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
11887                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
11888                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
11889                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
11890                  struct IPerlDir* ipD, struct IPerlSock* ipS,
11891                  struct IPerlProc* ipP)
11892 {
11893     /* XXX many of the string copies here can be optimized if they're
11894      * constants; they need to be allocated as common memory and just
11895      * their pointers copied. */
11896
11897     IV i;
11898     CLONE_PARAMS clone_params;
11899     CLONE_PARAMS* const param = &clone_params;
11900
11901     PerlInterpreter * const my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
11902
11903     PERL_ARGS_ASSERT_PERL_CLONE_USING;
11904 #else           /* !PERL_IMPLICIT_SYS */
11905     IV i;
11906     CLONE_PARAMS clone_params;
11907     CLONE_PARAMS* param = &clone_params;
11908     PerlInterpreter * const my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
11909
11910     PERL_ARGS_ASSERT_PERL_CLONE;
11911 #endif          /* PERL_IMPLICIT_SYS */
11912
11913     /* for each stash, determine whether its objects should be cloned */
11914     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
11915     PERL_SET_THX(my_perl);
11916
11917 #ifdef DEBUGGING
11918     PoisonNew(my_perl, 1, PerlInterpreter);
11919     PL_op = NULL;
11920     PL_curcop = NULL;
11921     PL_markstack = 0;
11922     PL_scopestack = 0;
11923     PL_scopestack_name = 0;
11924     PL_savestack = 0;
11925     PL_savestack_ix = 0;
11926     PL_savestack_max = -1;
11927     PL_sig_pending = 0;
11928     PL_parser = NULL;
11929     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
11930 #  ifdef DEBUG_LEAKING_SCALARS
11931     PL_sv_serial = (((U32)my_perl >> 2) & 0xfff) * 1000000;
11932 #  endif
11933 #else   /* !DEBUGGING */
11934     Zero(my_perl, 1, PerlInterpreter);
11935 #endif  /* DEBUGGING */
11936
11937 #ifdef PERL_IMPLICIT_SYS
11938     /* host pointers */
11939     PL_Mem              = ipM;
11940     PL_MemShared        = ipMS;
11941     PL_MemParse         = ipMP;
11942     PL_Env              = ipE;
11943     PL_StdIO            = ipStd;
11944     PL_LIO              = ipLIO;
11945     PL_Dir              = ipD;
11946     PL_Sock             = ipS;
11947     PL_Proc             = ipP;
11948 #endif          /* PERL_IMPLICIT_SYS */
11949
11950     param->flags = flags;
11951     param->proto_perl = proto_perl;
11952
11953     INIT_TRACK_MEMPOOL(my_perl->Imemory_debug_header, my_perl);
11954
11955     PL_body_arenas = NULL;
11956     Zero(&PL_body_roots, 1, PL_body_roots);
11957     
11958     PL_nice_chunk       = NULL;
11959     PL_nice_chunk_size  = 0;
11960     PL_sv_count         = 0;
11961     PL_sv_objcount      = 0;
11962     PL_sv_root          = NULL;
11963     PL_sv_arenaroot     = NULL;
11964
11965     PL_debug            = proto_perl->Idebug;
11966
11967     PL_hash_seed        = proto_perl->Ihash_seed;
11968     PL_rehash_seed      = proto_perl->Irehash_seed;
11969
11970 #ifdef USE_REENTRANT_API
11971     /* XXX: things like -Dm will segfault here in perlio, but doing
11972      *  PERL_SET_CONTEXT(proto_perl);
11973      * breaks too many other things
11974      */
11975     Perl_reentrant_init(aTHX);
11976 #endif
11977
11978     /* create SV map for pointer relocation */
11979     PL_ptr_table = ptr_table_new();
11980
11981     /* initialize these special pointers as early as possible */
11982     SvANY(&PL_sv_undef)         = NULL;
11983     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
11984     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
11985     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
11986
11987     SvANY(&PL_sv_no)            = new_XPVNV();
11988     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
11989     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
11990                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
11991     SvPV_set(&PL_sv_no, savepvn(PL_No, 0));
11992     SvCUR_set(&PL_sv_no, 0);
11993     SvLEN_set(&PL_sv_no, 1);
11994     SvIV_set(&PL_sv_no, 0);
11995     SvNV_set(&PL_sv_no, 0);
11996     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
11997
11998     SvANY(&PL_sv_yes)           = new_XPVNV();
11999     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
12000     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
12001                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
12002     SvPV_set(&PL_sv_yes, savepvn(PL_Yes, 1));
12003     SvCUR_set(&PL_sv_yes, 1);
12004     SvLEN_set(&PL_sv_yes, 2);
12005     SvIV_set(&PL_sv_yes, 1);
12006     SvNV_set(&PL_sv_yes, 1);
12007     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
12008
12009     /* dbargs array probably holds garbage; give the child a clean array */
12010     PL_dbargs           = newAV();
12011     ptr_table_store(PL_ptr_table, proto_perl->Idbargs, PL_dbargs);
12012
12013     /* create (a non-shared!) shared string table */
12014     PL_strtab           = newHV();
12015     HvSHAREKEYS_off(PL_strtab);
12016     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
12017     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
12018
12019     PL_compiling = proto_perl->Icompiling;
12020
12021     /* These two PVs will be free'd special way so must set them same way op.c does */
12022     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
12023     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
12024
12025     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
12026     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
12027
12028     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
12029     PL_compiling.cop_warnings = DUP_WARNINGS(PL_compiling.cop_warnings);
12030     if (PL_compiling.cop_hints_hash) {
12031         HINTS_REFCNT_LOCK;
12032         PL_compiling.cop_hints_hash->refcounted_he_refcnt++;
12033         HINTS_REFCNT_UNLOCK;
12034     }
12035     PL_curcop           = (COP*)any_dup(proto_perl->Icurcop, proto_perl);
12036 #ifdef PERL_DEBUG_READONLY_OPS
12037     PL_slabs = NULL;
12038     PL_slab_count = 0;
12039 #endif
12040
12041     /* pseudo environmental stuff */
12042     PL_origargc         = proto_perl->Iorigargc;
12043     PL_origargv         = proto_perl->Iorigargv;
12044
12045     param->stashes      = newAV();  /* Setup array of objects to call clone on */
12046
12047     /* Set tainting stuff before PerlIO_debug can possibly get called */
12048     PL_tainting         = proto_perl->Itainting;
12049     PL_taint_warn       = proto_perl->Itaint_warn;
12050
12051 #ifdef PERLIO_LAYERS
12052     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
12053     PerlIO_clone(aTHX_ proto_perl, param);
12054 #endif
12055
12056     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
12057     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
12058     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
12059     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
12060     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
12061     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
12062
12063     /* switches */
12064     PL_minus_c          = proto_perl->Iminus_c;
12065     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
12066     PL_localpatches     = proto_perl->Ilocalpatches;
12067     PL_splitstr         = proto_perl->Isplitstr;
12068     PL_minus_n          = proto_perl->Iminus_n;
12069     PL_minus_p          = proto_perl->Iminus_p;
12070     PL_minus_l          = proto_perl->Iminus_l;
12071     PL_minus_a          = proto_perl->Iminus_a;
12072     PL_minus_E          = proto_perl->Iminus_E;
12073     PL_minus_F          = proto_perl->Iminus_F;
12074     PL_doswitches       = proto_perl->Idoswitches;
12075     PL_dowarn           = proto_perl->Idowarn;
12076     PL_doextract        = proto_perl->Idoextract;
12077     PL_sawampersand     = proto_perl->Isawampersand;
12078     PL_unsafe           = proto_perl->Iunsafe;
12079     PL_inplace          = SAVEPV(proto_perl->Iinplace);
12080     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
12081     PL_perldb           = proto_perl->Iperldb;
12082     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
12083     PL_exit_flags       = proto_perl->Iexit_flags;
12084
12085     /* magical thingies */
12086     /* XXX time(&PL_basetime) when asked for? */
12087     PL_basetime         = proto_perl->Ibasetime;
12088     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
12089
12090     PL_maxsysfd         = proto_perl->Imaxsysfd;
12091     PL_statusvalue      = proto_perl->Istatusvalue;
12092 #ifdef VMS
12093     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
12094 #else
12095     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
12096 #endif
12097     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
12098
12099     sv_setpvs(PERL_DEBUG_PAD(0), "");   /* For regex debugging. */
12100     sv_setpvs(PERL_DEBUG_PAD(1), "");   /* ext/re needs these */
12101     sv_setpvs(PERL_DEBUG_PAD(2), "");   /* even without DEBUGGING. */
12102
12103    
12104     /* RE engine related */
12105     Zero(&PL_reg_state, 1, struct re_save_state);
12106     PL_reginterp_cnt    = 0;
12107     PL_regmatch_slab    = NULL;
12108     
12109     /* Clone the regex array */
12110     /* ORANGE FIXME for plugins, probably in the SV dup code.
12111        newSViv(PTR2IV(CALLREGDUPE(
12112        INT2PTR(REGEXP *, SvIVX(regex)), param))))
12113     */
12114     PL_regex_padav = av_dup_inc(proto_perl->Iregex_padav, param);
12115     PL_regex_pad = AvARRAY(PL_regex_padav);
12116
12117     /* shortcuts to various I/O objects */
12118     PL_ofsgv            = gv_dup(proto_perl->Iofsgv, param);
12119     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
12120     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
12121     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
12122     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
12123     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
12124     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
12125
12126     /* shortcuts to regexp stuff */
12127     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
12128
12129     /* shortcuts to misc objects */
12130     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
12131
12132     /* shortcuts to debugging objects */
12133     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
12134     PL_DBline           = gv_dup(proto_perl->IDBline, param);
12135     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
12136     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
12137     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
12138     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
12139
12140     /* symbol tables */
12141     PL_defstash         = hv_dup_inc(proto_perl->Idefstash, param);
12142     PL_curstash         = hv_dup(proto_perl->Icurstash, param);
12143     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
12144     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
12145     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
12146
12147     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
12148     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
12149     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
12150     PL_unitcheckav      = av_dup_inc(proto_perl->Iunitcheckav, param);
12151     PL_unitcheckav_save = av_dup_inc(proto_perl->Iunitcheckav_save, param);
12152     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
12153     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
12154     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
12155
12156     PL_sub_generation   = proto_perl->Isub_generation;
12157     PL_isarev           = hv_dup_inc(proto_perl->Iisarev, param);
12158
12159     /* funky return mechanisms */
12160     PL_forkprocess      = proto_perl->Iforkprocess;
12161
12162     /* subprocess state */
12163     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
12164
12165     /* internal state */
12166     PL_maxo             = proto_perl->Imaxo;
12167     if (proto_perl->Iop_mask)
12168         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
12169     else
12170         PL_op_mask      = NULL;
12171     /* PL_asserting        = proto_perl->Iasserting; */
12172
12173     /* current interpreter roots */
12174     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
12175     OP_REFCNT_LOCK;
12176     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
12177     OP_REFCNT_UNLOCK;
12178     PL_main_start       = proto_perl->Imain_start;
12179     PL_eval_root        = proto_perl->Ieval_root;
12180     PL_eval_start       = proto_perl->Ieval_start;
12181
12182     /* runtime control stuff */
12183     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
12184
12185     PL_filemode         = proto_perl->Ifilemode;
12186     PL_lastfd           = proto_perl->Ilastfd;
12187     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
12188     PL_Argv             = NULL;
12189     PL_Cmd              = NULL;
12190     PL_gensym           = proto_perl->Igensym;
12191     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
12192     PL_laststatval      = proto_perl->Ilaststatval;
12193     PL_laststype        = proto_perl->Ilaststype;
12194     PL_mess_sv          = NULL;
12195
12196     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
12197
12198     /* interpreter atexit processing */
12199     PL_exitlistlen      = proto_perl->Iexitlistlen;
12200     if (PL_exitlistlen) {
12201         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
12202         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
12203     }
12204     else
12205         PL_exitlist     = (PerlExitListEntry*)NULL;
12206
12207     PL_my_cxt_size = proto_perl->Imy_cxt_size;
12208     if (PL_my_cxt_size) {
12209         Newx(PL_my_cxt_list, PL_my_cxt_size, void *);
12210         Copy(proto_perl->Imy_cxt_list, PL_my_cxt_list, PL_my_cxt_size, void *);
12211 #ifdef PERL_GLOBAL_STRUCT_PRIVATE
12212         Newx(PL_my_cxt_keys, PL_my_cxt_size, const char *);
12213         Copy(proto_perl->Imy_cxt_keys, PL_my_cxt_keys, PL_my_cxt_size, char *);
12214 #endif
12215     }
12216     else {
12217         PL_my_cxt_list  = (void**)NULL;
12218 #ifdef PERL_GLOBAL_STRUCT_PRIVATE
12219         PL_my_cxt_keys  = (const char**)NULL;
12220 #endif
12221     }
12222     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
12223     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
12224     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
12225
12226     PL_profiledata      = NULL;
12227
12228     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
12229
12230     PAD_CLONE_VARS(proto_perl, param);
12231
12232 #ifdef HAVE_INTERP_INTERN
12233     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
12234 #endif
12235
12236     /* more statics moved here */
12237     PL_generation       = proto_perl->Igeneration;
12238     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
12239
12240     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
12241     PL_in_clean_all     = proto_perl->Iin_clean_all;
12242
12243     PL_uid              = proto_perl->Iuid;
12244     PL_euid             = proto_perl->Ieuid;
12245     PL_gid              = proto_perl->Igid;
12246     PL_egid             = proto_perl->Iegid;
12247     PL_nomemok          = proto_perl->Inomemok;
12248     PL_an               = proto_perl->Ian;
12249     PL_evalseq          = proto_perl->Ievalseq;
12250     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
12251     PL_origalen         = proto_perl->Iorigalen;
12252 #ifdef PERL_USES_PL_PIDSTATUS
12253     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
12254 #endif
12255     PL_osname           = SAVEPV(proto_perl->Iosname);
12256     PL_sighandlerp      = proto_perl->Isighandlerp;
12257
12258     PL_runops           = proto_perl->Irunops;
12259
12260     PL_parser           = parser_dup(proto_perl->Iparser, param);
12261
12262     /* XXX this only works if the saved cop has already been cloned */
12263     if (proto_perl->Iparser) {
12264         PL_parser->saved_curcop = (COP*)any_dup(
12265                                     proto_perl->Iparser->saved_curcop,
12266                                     proto_perl);
12267     }
12268
12269     PL_subline          = proto_perl->Isubline;
12270     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
12271
12272 #ifdef FCRYPT
12273     PL_cryptseen        = proto_perl->Icryptseen;
12274 #endif
12275
12276     PL_hints            = proto_perl->Ihints;
12277
12278     PL_amagic_generation        = proto_perl->Iamagic_generation;
12279
12280 #ifdef USE_LOCALE_COLLATE
12281     PL_collation_ix     = proto_perl->Icollation_ix;
12282     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
12283     PL_collation_standard       = proto_perl->Icollation_standard;
12284     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
12285     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
12286 #endif /* USE_LOCALE_COLLATE */
12287
12288 #ifdef USE_LOCALE_NUMERIC
12289     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
12290     PL_numeric_standard = proto_perl->Inumeric_standard;
12291     PL_numeric_local    = proto_perl->Inumeric_local;
12292     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
12293 #endif /* !USE_LOCALE_NUMERIC */
12294
12295     /* utf8 character classes */
12296     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
12297     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
12298     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
12299     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
12300     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
12301     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
12302     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
12303     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
12304     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
12305     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
12306     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
12307     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
12308     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
12309     PL_utf8_X_begin     = sv_dup_inc(proto_perl->Iutf8_X_begin, param);
12310     PL_utf8_X_extend    = sv_dup_inc(proto_perl->Iutf8_X_extend, param);
12311     PL_utf8_X_prepend   = sv_dup_inc(proto_perl->Iutf8_X_prepend, param);
12312     PL_utf8_X_non_hangul        = sv_dup_inc(proto_perl->Iutf8_X_non_hangul, param);
12313     PL_utf8_X_L = sv_dup_inc(proto_perl->Iutf8_X_L, param);
12314     PL_utf8_X_LV        = sv_dup_inc(proto_perl->Iutf8_X_LV, param);
12315     PL_utf8_X_LVT       = sv_dup_inc(proto_perl->Iutf8_X_LVT, param);
12316     PL_utf8_X_T = sv_dup_inc(proto_perl->Iutf8_X_T, param);
12317     PL_utf8_X_V = sv_dup_inc(proto_perl->Iutf8_X_V, param);
12318     PL_utf8_X_LV_LVT_V  = sv_dup_inc(proto_perl->Iutf8_X_LV_LVT_V, param);
12319     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
12320     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
12321     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
12322     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
12323     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
12324     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
12325
12326     /* Did the locale setup indicate UTF-8? */
12327     PL_utf8locale       = proto_perl->Iutf8locale;
12328     /* Unicode features (see perlrun/-C) */
12329     PL_unicode          = proto_perl->Iunicode;
12330
12331     /* Pre-5.8 signals control */
12332     PL_signals          = proto_perl->Isignals;
12333
12334     /* times() ticks per second */
12335     PL_clocktick        = proto_perl->Iclocktick;
12336
12337     /* Recursion stopper for PerlIO_find_layer */
12338     PL_in_load_module   = proto_perl->Iin_load_module;
12339
12340     /* sort() routine */
12341     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
12342
12343     /* Not really needed/useful since the reenrant_retint is "volatile",
12344      * but do it for consistency's sake. */
12345     PL_reentrant_retint = proto_perl->Ireentrant_retint;
12346
12347     /* Hooks to shared SVs and locks. */
12348     PL_sharehook        = proto_perl->Isharehook;
12349     PL_lockhook         = proto_perl->Ilockhook;
12350     PL_unlockhook       = proto_perl->Iunlockhook;
12351     PL_threadhook       = proto_perl->Ithreadhook;
12352     PL_destroyhook      = proto_perl->Idestroyhook;
12353
12354 #ifdef THREADS_HAVE_PIDS
12355     PL_ppid             = proto_perl->Ippid;
12356 #endif
12357
12358     /* swatch cache */
12359     PL_last_swash_hv    = NULL; /* reinits on demand */
12360     PL_last_swash_klen  = 0;
12361     PL_last_swash_key[0]= '\0';
12362     PL_last_swash_tmps  = (U8*)NULL;
12363     PL_last_swash_slen  = 0;
12364
12365     PL_glob_index       = proto_perl->Iglob_index;
12366     PL_srand_called     = proto_perl->Isrand_called;
12367
12368     if (proto_perl->Ipsig_pend) {
12369         Newxz(PL_psig_pend, SIG_SIZE, int);
12370     }
12371     else {
12372         PL_psig_pend    = (int*)NULL;
12373     }
12374
12375     if (proto_perl->Ipsig_name) {
12376         Newx(PL_psig_name, 2 * SIG_SIZE, SV*);
12377         sv_dup_inc_multiple(proto_perl->Ipsig_name, PL_psig_name, 2 * SIG_SIZE,
12378                             param);
12379         PL_psig_ptr = PL_psig_name + SIG_SIZE;
12380     }
12381     else {
12382         PL_psig_ptr     = (SV**)NULL;
12383         PL_psig_name    = (SV**)NULL;
12384     }
12385
12386     /* intrpvar.h stuff */
12387
12388     if (flags & CLONEf_COPY_STACKS) {
12389         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
12390         PL_tmps_ix              = proto_perl->Itmps_ix;
12391         PL_tmps_max             = proto_perl->Itmps_max;
12392         PL_tmps_floor           = proto_perl->Itmps_floor;
12393         Newx(PL_tmps_stack, PL_tmps_max, SV*);
12394         sv_dup_inc_multiple(proto_perl->Itmps_stack, PL_tmps_stack,
12395                             PL_tmps_ix+1, param);
12396
12397         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
12398         i = proto_perl->Imarkstack_max - proto_perl->Imarkstack;
12399         Newxz(PL_markstack, i, I32);
12400         PL_markstack_max        = PL_markstack + (proto_perl->Imarkstack_max
12401                                                   - proto_perl->Imarkstack);
12402         PL_markstack_ptr        = PL_markstack + (proto_perl->Imarkstack_ptr
12403                                                   - proto_perl->Imarkstack);
12404         Copy(proto_perl->Imarkstack, PL_markstack,
12405              PL_markstack_ptr - PL_markstack + 1, I32);
12406
12407         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
12408          * NOTE: unlike the others! */
12409         PL_scopestack_ix        = proto_perl->Iscopestack_ix;
12410         PL_scopestack_max       = proto_perl->Iscopestack_max;
12411         Newxz(PL_scopestack, PL_scopestack_max, I32);
12412         Copy(proto_perl->Iscopestack, PL_scopestack, PL_scopestack_ix, I32);
12413
12414 #ifdef DEBUGGING
12415         Newxz(PL_scopestack_name, PL_scopestack_max, const char *);
12416         Copy(proto_perl->Iscopestack_name, PL_scopestack_name, PL_scopestack_ix, const char *);
12417 #endif
12418         /* NOTE: si_dup() looks at PL_markstack */
12419         PL_curstackinfo         = si_dup(proto_perl->Icurstackinfo, param);
12420
12421         /* PL_curstack          = PL_curstackinfo->si_stack; */
12422         PL_curstack             = av_dup(proto_perl->Icurstack, param);
12423         PL_mainstack            = av_dup(proto_perl->Imainstack, param);
12424
12425         /* next PUSHs() etc. set *(PL_stack_sp+1) */
12426         PL_stack_base           = AvARRAY(PL_curstack);
12427         PL_stack_sp             = PL_stack_base + (proto_perl->Istack_sp
12428                                                    - proto_perl->Istack_base);
12429         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
12430
12431         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
12432          * NOTE: unlike the others! */
12433         PL_savestack_ix         = proto_perl->Isavestack_ix;
12434         PL_savestack_max        = proto_perl->Isavestack_max;
12435         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
12436         PL_savestack            = ss_dup(proto_perl, param);
12437     }
12438     else {
12439         init_stacks();
12440         ENTER;                  /* perl_destruct() wants to LEAVE; */
12441
12442         /* although we're not duplicating the tmps stack, we should still
12443          * add entries for any SVs on the tmps stack that got cloned by a
12444          * non-refcount means (eg a temp in @_); otherwise they will be
12445          * orphaned
12446          */
12447         for (i = 0; i<= proto_perl->Itmps_ix; i++) {
12448             SV * const nsv = MUTABLE_SV(ptr_table_fetch(PL_ptr_table,
12449                     proto_perl->Itmps_stack[i]));
12450             if (nsv && !SvREFCNT(nsv)) {
12451                 PUSH_EXTEND_MORTAL__SV_C(SvREFCNT_inc_simple(nsv));
12452             }
12453         }
12454     }
12455
12456     PL_start_env        = proto_perl->Istart_env;       /* XXXXXX */
12457     PL_top_env          = &PL_start_env;
12458
12459     PL_op               = proto_perl->Iop;
12460
12461     PL_Sv               = NULL;
12462     PL_Xpv              = (XPV*)NULL;
12463     my_perl->Ina        = proto_perl->Ina;
12464
12465     PL_statbuf          = proto_perl->Istatbuf;
12466     PL_statcache        = proto_perl->Istatcache;
12467     PL_statgv           = gv_dup(proto_perl->Istatgv, param);
12468     PL_statname         = sv_dup_inc(proto_perl->Istatname, param);
12469 #ifdef HAS_TIMES
12470     PL_timesbuf         = proto_perl->Itimesbuf;
12471 #endif
12472
12473     PL_tainted          = proto_perl->Itainted;
12474     PL_curpm            = proto_perl->Icurpm;   /* XXX No PMOP ref count */
12475     PL_rs               = sv_dup_inc(proto_perl->Irs, param);
12476     PL_last_in_gv       = gv_dup(proto_perl->Ilast_in_gv, param);
12477     PL_defoutgv         = gv_dup_inc(proto_perl->Idefoutgv, param);
12478     PL_chopset          = proto_perl->Ichopset; /* XXX never deallocated */
12479     PL_toptarget        = sv_dup_inc(proto_perl->Itoptarget, param);
12480     PL_bodytarget       = sv_dup_inc(proto_perl->Ibodytarget, param);
12481     PL_formtarget       = sv_dup(proto_perl->Iformtarget, param);
12482
12483     PL_restartop        = proto_perl->Irestartop;
12484     PL_in_eval          = proto_perl->Iin_eval;
12485     PL_delaymagic       = proto_perl->Idelaymagic;
12486     PL_dirty            = proto_perl->Idirty;
12487     PL_localizing       = proto_perl->Ilocalizing;
12488
12489     PL_errors           = sv_dup_inc(proto_perl->Ierrors, param);
12490     PL_hv_fetch_ent_mh  = NULL;
12491     PL_modcount         = proto_perl->Imodcount;
12492     PL_lastgotoprobe    = NULL;
12493     PL_dumpindent       = proto_perl->Idumpindent;
12494
12495     PL_sortcop          = (OP*)any_dup(proto_perl->Isortcop, proto_perl);
12496     PL_sortstash        = hv_dup(proto_perl->Isortstash, param);
12497     PL_firstgv          = gv_dup(proto_perl->Ifirstgv, param);
12498     PL_secondgv         = gv_dup(proto_perl->Isecondgv, param);
12499     PL_efloatbuf        = NULL;         /* reinits on demand */
12500     PL_efloatsize       = 0;                    /* reinits on demand */
12501
12502     /* regex stuff */
12503
12504     PL_screamfirst      = NULL;
12505     PL_screamnext       = NULL;
12506     PL_maxscream        = -1;                   /* reinits on demand */
12507     PL_lastscream       = NULL;
12508
12509
12510     PL_regdummy         = proto_perl->Iregdummy;
12511     PL_colorset         = 0;            /* reinits PL_colors[] */
12512     /*PL_colors[6]      = {0,0,0,0,0,0};*/
12513
12514
12515
12516     /* Pluggable optimizer */
12517     PL_peepp            = proto_perl->Ipeepp;
12518     /* op_free() hook */
12519     PL_opfreehook       = proto_perl->Iopfreehook;
12520
12521     PL_stashcache       = newHV();
12522
12523     PL_watchaddr        = (char **) ptr_table_fetch(PL_ptr_table,
12524                                             proto_perl->Iwatchaddr);
12525     PL_watchok          = PL_watchaddr ? * PL_watchaddr : NULL;
12526     if (PL_debug && PL_watchaddr) {
12527         PerlIO_printf(Perl_debug_log,
12528           "WATCHING: %"UVxf" cloned as %"UVxf" with value %"UVxf"\n",
12529           PTR2UV(proto_perl->Iwatchaddr), PTR2UV(PL_watchaddr),
12530           PTR2UV(PL_watchok));
12531     }
12532
12533     PL_registered_mros  = hv_dup_inc(proto_perl->Iregistered_mros, param);
12534
12535     /* Call the ->CLONE method, if it exists, for each of the stashes
12536        identified by sv_dup() above.
12537     */
12538     while(av_len(param->stashes) != -1) {
12539         HV* const stash = MUTABLE_HV(av_shift(param->stashes));
12540         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
12541         if (cloner && GvCV(cloner)) {
12542             dSP;
12543             ENTER;
12544             SAVETMPS;
12545             PUSHMARK(SP);
12546             mXPUSHs(newSVhek(HvNAME_HEK(stash)));
12547             PUTBACK;
12548             call_sv(MUTABLE_SV(GvCV(cloner)), G_DISCARD);
12549             FREETMPS;
12550             LEAVE;
12551         }
12552     }
12553
12554     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
12555         ptr_table_free(PL_ptr_table);
12556         PL_ptr_table = NULL;
12557     }
12558
12559
12560     SvREFCNT_dec(param->stashes);
12561
12562     /* orphaned? eg threads->new inside BEGIN or use */
12563     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
12564         SvREFCNT_inc_simple_void(PL_compcv);
12565         SAVEFREESV(PL_compcv);
12566     }
12567
12568     return my_perl;
12569 }
12570
12571 #endif /* USE_ITHREADS */
12572
12573 /*
12574 =head1 Unicode Support
12575
12576 =for apidoc sv_recode_to_utf8
12577
12578 The encoding is assumed to be an Encode object, on entry the PV
12579 of the sv is assumed to be octets in that encoding, and the sv
12580 will be converted into Unicode (and UTF-8).
12581
12582 If the sv already is UTF-8 (or if it is not POK), or if the encoding
12583 is not a reference, nothing is done to the sv.  If the encoding is not
12584 an C<Encode::XS> Encoding object, bad things will happen.
12585 (See F<lib/encoding.pm> and L<Encode>).
12586
12587 The PV of the sv is returned.
12588
12589 =cut */
12590
12591 char *
12592 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
12593 {
12594     dVAR;
12595
12596     PERL_ARGS_ASSERT_SV_RECODE_TO_UTF8;
12597
12598     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
12599         SV *uni;
12600         STRLEN len;
12601         const char *s;
12602         dSP;
12603         ENTER;
12604         SAVETMPS;
12605         save_re_context();
12606         PUSHMARK(sp);
12607         EXTEND(SP, 3);
12608         XPUSHs(encoding);
12609         XPUSHs(sv);
12610 /*
12611   NI-S 2002/07/09
12612   Passing sv_yes is wrong - it needs to be or'ed set of constants
12613   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
12614   remove converted chars from source.
12615
12616   Both will default the value - let them.
12617
12618         XPUSHs(&PL_sv_yes);
12619 */
12620         PUTBACK;
12621         call_method("decode", G_SCALAR);
12622         SPAGAIN;
12623         uni = POPs;
12624         PUTBACK;
12625         s = SvPV_const(uni, len);
12626         if (s != SvPVX_const(sv)) {
12627             SvGROW(sv, len + 1);
12628             Move(s, SvPVX(sv), len + 1, char);
12629             SvCUR_set(sv, len);
12630         }
12631         FREETMPS;
12632         LEAVE;
12633         SvUTF8_on(sv);
12634         return SvPVX(sv);
12635     }
12636     return SvPOKp(sv) ? SvPVX(sv) : NULL;
12637 }
12638
12639 /*
12640 =for apidoc sv_cat_decode
12641
12642 The encoding is assumed to be an Encode object, the PV of the ssv is
12643 assumed to be octets in that encoding and decoding the input starts
12644 from the position which (PV + *offset) pointed to.  The dsv will be
12645 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
12646 when the string tstr appears in decoding output or the input ends on
12647 the PV of the ssv. The value which the offset points will be modified
12648 to the last input position on the ssv.
12649
12650 Returns TRUE if the terminator was found, else returns FALSE.
12651
12652 =cut */
12653
12654 bool
12655 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
12656                    SV *ssv, int *offset, char *tstr, int tlen)
12657 {
12658     dVAR;
12659     bool ret = FALSE;
12660
12661     PERL_ARGS_ASSERT_SV_CAT_DECODE;
12662
12663     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
12664         SV *offsv;
12665         dSP;
12666         ENTER;
12667         SAVETMPS;
12668         save_re_context();
12669         PUSHMARK(sp);
12670         EXTEND(SP, 6);
12671         XPUSHs(encoding);
12672         XPUSHs(dsv);
12673         XPUSHs(ssv);
12674         offsv = newSViv(*offset);
12675         mXPUSHs(offsv);
12676         mXPUSHp(tstr, tlen);
12677         PUTBACK;
12678         call_method("cat_decode", G_SCALAR);
12679         SPAGAIN;
12680         ret = SvTRUE(TOPs);
12681         *offset = SvIV(offsv);
12682         PUTBACK;
12683         FREETMPS;
12684         LEAVE;
12685     }
12686     else
12687         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
12688     return ret;
12689
12690 }
12691
12692 /* ---------------------------------------------------------------------
12693  *
12694  * support functions for report_uninit()
12695  */
12696
12697 /* the maxiumum size of array or hash where we will scan looking
12698  * for the undefined element that triggered the warning */
12699
12700 #define FUV_MAX_SEARCH_SIZE 1000
12701
12702 /* Look for an entry in the hash whose value has the same SV as val;
12703  * If so, return a mortal copy of the key. */
12704
12705 STATIC SV*
12706 S_find_hash_subscript(pTHX_ const HV *const hv, const SV *const val)
12707 {
12708     dVAR;
12709     register HE **array;
12710     I32 i;
12711
12712     PERL_ARGS_ASSERT_FIND_HASH_SUBSCRIPT;
12713
12714     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
12715                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
12716         return NULL;
12717
12718     array = HvARRAY(hv);
12719
12720     for (i=HvMAX(hv); i>0; i--) {
12721         register HE *entry;
12722         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
12723             if (HeVAL(entry) != val)
12724                 continue;
12725             if (    HeVAL(entry) == &PL_sv_undef ||
12726                     HeVAL(entry) == &PL_sv_placeholder)
12727                 continue;
12728             if (!HeKEY(entry))
12729                 return NULL;
12730             if (HeKLEN(entry) == HEf_SVKEY)
12731                 return sv_mortalcopy(HeKEY_sv(entry));
12732             return sv_2mortal(newSVhek(HeKEY_hek(entry)));
12733         }
12734     }
12735     return NULL;
12736 }
12737
12738 /* Look for an entry in the array whose value has the same SV as val;
12739  * If so, return the index, otherwise return -1. */
12740
12741 STATIC I32
12742 S_find_array_subscript(pTHX_ const AV *const av, const SV *const val)
12743 {
12744     dVAR;
12745
12746     PERL_ARGS_ASSERT_FIND_ARRAY_SUBSCRIPT;
12747
12748     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
12749                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
12750         return -1;
12751
12752     if (val != &PL_sv_undef) {
12753         SV ** const svp = AvARRAY(av);
12754         I32 i;
12755
12756         for (i=AvFILLp(av); i>=0; i--)
12757             if (svp[i] == val)
12758                 return i;
12759     }
12760     return -1;
12761 }
12762
12763 /* S_varname(): return the name of a variable, optionally with a subscript.
12764  * If gv is non-zero, use the name of that global, along with gvtype (one
12765  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
12766  * targ.  Depending on the value of the subscript_type flag, return:
12767  */
12768
12769 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
12770 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
12771 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
12772 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
12773
12774 STATIC SV*
12775 S_varname(pTHX_ const GV *const gv, const char gvtype, PADOFFSET targ,
12776         const SV *const keyname, I32 aindex, int subscript_type)
12777 {
12778
12779     SV * const name = sv_newmortal();
12780     if (gv) {
12781         char buffer[2];
12782         buffer[0] = gvtype;
12783         buffer[1] = 0;
12784
12785         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
12786
12787         gv_fullname4(name, gv, buffer, 0);
12788
12789         if ((unsigned int)SvPVX(name)[1] <= 26) {
12790             buffer[0] = '^';
12791             buffer[1] = SvPVX(name)[1] + 'A' - 1;
12792
12793             /* Swap the 1 unprintable control character for the 2 byte pretty
12794                version - ie substr($name, 1, 1) = $buffer; */
12795             sv_insert(name, 1, 1, buffer, 2);
12796         }
12797     }
12798     else {
12799         CV * const cv = find_runcv(NULL);
12800         SV *sv;
12801         AV *av;
12802
12803         if (!cv || !CvPADLIST(cv))
12804             return NULL;
12805         av = MUTABLE_AV((*av_fetch(CvPADLIST(cv), 0, FALSE)));
12806         sv = *av_fetch(av, targ, FALSE);
12807         sv_setpvn(name, SvPV_nolen_const(sv), SvCUR(sv));
12808     }
12809
12810     if (subscript_type == FUV_SUBSCRIPT_HASH) {
12811         SV * const sv = newSV(0);
12812         *SvPVX(name) = '$';
12813         Perl_sv_catpvf(aTHX_ name, "{%s}",
12814             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
12815         SvREFCNT_dec(sv);
12816     }
12817     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
12818         *SvPVX(name) = '$';
12819         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
12820     }
12821     else if (subscript_type == FUV_SUBSCRIPT_WITHIN) {
12822         /* We know that name has no magic, so can use 0 instead of SV_GMAGIC */
12823         Perl_sv_insert_flags(aTHX_ name, 0, 0,  STR_WITH_LEN("within "), 0);
12824     }
12825
12826     return name;
12827 }
12828
12829
12830 /*
12831 =for apidoc find_uninit_var
12832
12833 Find the name of the undefined variable (if any) that caused the operator o
12834 to issue a "Use of uninitialized value" warning.
12835 If match is true, only return a name if it's value matches uninit_sv.
12836 So roughly speaking, if a unary operator (such as OP_COS) generates a
12837 warning, then following the direct child of the op may yield an
12838 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
12839 other hand, with OP_ADD there are two branches to follow, so we only print
12840 the variable name if we get an exact match.
12841
12842 The name is returned as a mortal SV.
12843
12844 Assumes that PL_op is the op that originally triggered the error, and that
12845 PL_comppad/PL_curpad points to the currently executing pad.
12846
12847 =cut
12848 */
12849
12850 STATIC SV *
12851 S_find_uninit_var(pTHX_ const OP *const obase, const SV *const uninit_sv,
12852                   bool match)
12853 {
12854     dVAR;
12855     SV *sv;
12856     const GV *gv;
12857     const OP *o, *o2, *kid;
12858
12859     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
12860                             uninit_sv == &PL_sv_placeholder)))
12861         return NULL;
12862
12863     switch (obase->op_type) {
12864
12865     case OP_RV2AV:
12866     case OP_RV2HV:
12867     case OP_PADAV:
12868     case OP_PADHV:
12869       {
12870         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
12871         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
12872         I32 index = 0;
12873         SV *keysv = NULL;
12874         int subscript_type = FUV_SUBSCRIPT_WITHIN;
12875
12876         if (pad) { /* @lex, %lex */
12877             sv = PAD_SVl(obase->op_targ);
12878             gv = NULL;
12879         }
12880         else {
12881             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
12882             /* @global, %global */
12883                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
12884                 if (!gv)
12885                     break;
12886                 sv = hash ? MUTABLE_SV(GvHV(gv)): MUTABLE_SV(GvAV(gv));
12887             }
12888             else /* @{expr}, %{expr} */
12889                 return find_uninit_var(cUNOPx(obase)->op_first,
12890                                                     uninit_sv, match);
12891         }
12892
12893         /* attempt to find a match within the aggregate */
12894         if (hash) {
12895             keysv = find_hash_subscript((const HV*)sv, uninit_sv);
12896             if (keysv)
12897                 subscript_type = FUV_SUBSCRIPT_HASH;
12898         }
12899         else {
12900             index = find_array_subscript((const AV *)sv, uninit_sv);
12901             if (index >= 0)
12902                 subscript_type = FUV_SUBSCRIPT_ARRAY;
12903         }
12904
12905         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
12906             break;
12907
12908         return varname(gv, hash ? '%' : '@', obase->op_targ,
12909                                     keysv, index, subscript_type);
12910       }
12911
12912     case OP_PADSV:
12913         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
12914             break;
12915         return varname(NULL, '$', obase->op_targ,
12916                                     NULL, 0, FUV_SUBSCRIPT_NONE);
12917
12918     case OP_GVSV:
12919         gv = cGVOPx_gv(obase);
12920         if (!gv || (match && GvSV(gv) != uninit_sv))
12921             break;
12922         return varname(gv, '$', 0, NULL, 0, FUV_SUBSCRIPT_NONE);
12923
12924     case OP_AELEMFAST:
12925         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
12926             if (match) {
12927                 SV **svp;
12928                 AV *av = MUTABLE_AV(PAD_SV(obase->op_targ));
12929                 if (!av || SvRMAGICAL(av))
12930                     break;
12931                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
12932                 if (!svp || *svp != uninit_sv)
12933                     break;
12934             }
12935             return varname(NULL, '$', obase->op_targ,
12936                     NULL, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
12937         }
12938         else {
12939             gv = cGVOPx_gv(obase);
12940             if (!gv)
12941                 break;
12942             if (match) {
12943                 SV **svp;
12944                 AV *const av = GvAV(gv);
12945                 if (!av || SvRMAGICAL(av))
12946                     break;
12947                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
12948                 if (!svp || *svp != uninit_sv)
12949                     break;
12950             }
12951             return varname(gv, '$', 0,
12952                     NULL, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
12953         }
12954         break;
12955
12956     case OP_EXISTS:
12957         o = cUNOPx(obase)->op_first;
12958         if (!o || o->op_type != OP_NULL ||
12959                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
12960             break;
12961         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
12962
12963     case OP_AELEM:
12964     case OP_HELEM:
12965         if (PL_op == obase)
12966             /* $a[uninit_expr] or $h{uninit_expr} */
12967             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
12968
12969         gv = NULL;
12970         o = cBINOPx(obase)->op_first;
12971         kid = cBINOPx(obase)->op_last;
12972
12973         /* get the av or hv, and optionally the gv */
12974         sv = NULL;
12975         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
12976             sv = PAD_SV(o->op_targ);
12977         }
12978         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
12979                 && cUNOPo->op_first->op_type == OP_GV)
12980         {
12981             gv = cGVOPx_gv(cUNOPo->op_first);
12982             if (!gv)
12983                 break;
12984             sv = o->op_type
12985                 == OP_RV2HV ? MUTABLE_SV(GvHV(gv)) : MUTABLE_SV(GvAV(gv));
12986         }
12987         if (!sv)
12988             break;
12989
12990         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
12991             /* index is constant */
12992             if (match) {
12993                 if (SvMAGICAL(sv))
12994                     break;
12995                 if (obase->op_type == OP_HELEM) {
12996                     HE* he = hv_fetch_ent(MUTABLE_HV(sv), cSVOPx_sv(kid), 0, 0);
12997                     if (!he || HeVAL(he) != uninit_sv)
12998                         break;
12999                 }
13000                 else {
13001                     SV * const * const svp = av_fetch(MUTABLE_AV(sv), SvIV(cSVOPx_sv(kid)), FALSE);
13002                     if (!svp || *svp != uninit_sv)
13003                         break;
13004                 }
13005             }
13006             if (obase->op_type == OP_HELEM)
13007                 return varname(gv, '%', o->op_targ,
13008                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
13009             else
13010                 return varname(gv, '@', o->op_targ, NULL,
13011                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
13012         }
13013         else  {
13014             /* index is an expression;
13015              * attempt to find a match within the aggregate */
13016             if (obase->op_type == OP_HELEM) {
13017                 SV * const keysv = find_hash_subscript((const HV*)sv, uninit_sv);
13018                 if (keysv)
13019                     return varname(gv, '%', o->op_targ,
13020                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
13021             }
13022             else {
13023                 const I32 index
13024                     = find_array_subscript((const AV *)sv, uninit_sv);
13025                 if (index >= 0)
13026                     return varname(gv, '@', o->op_targ,
13027                                         NULL, index, FUV_SUBSCRIPT_ARRAY);
13028             }
13029             if (match)
13030                 break;
13031             return varname(gv,
13032                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
13033                 ? '@' : '%',
13034                 o->op_targ, NULL, 0, FUV_SUBSCRIPT_WITHIN);
13035         }
13036         break;
13037
13038     case OP_AASSIGN:
13039         /* only examine RHS */
13040         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
13041
13042     case OP_OPEN:
13043         o = cUNOPx(obase)->op_first;
13044         if (o->op_type == OP_PUSHMARK)
13045             o = o->op_sibling;
13046
13047         if (!o->op_sibling) {
13048             /* one-arg version of open is highly magical */
13049
13050             if (o->op_type == OP_GV) { /* open FOO; */
13051                 gv = cGVOPx_gv(o);
13052                 if (match && GvSV(gv) != uninit_sv)
13053                     break;
13054                 return varname(gv, '$', 0,
13055                             NULL, 0, FUV_SUBSCRIPT_NONE);
13056             }
13057             /* other possibilities not handled are:
13058              * open $x; or open my $x;  should return '${*$x}'
13059              * open expr;               should return '$'.expr ideally
13060              */
13061              break;
13062         }
13063         goto do_op;
13064
13065     /* ops where $_ may be an implicit arg */
13066     case OP_TRANS:
13067     case OP_SUBST:
13068     case OP_MATCH:
13069         if ( !(obase->op_flags & OPf_STACKED)) {
13070             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
13071                                  ? PAD_SVl(obase->op_targ)
13072                                  : DEFSV))
13073             {
13074                 sv = sv_newmortal();
13075                 sv_setpvs(sv, "$_");
13076                 return sv;
13077             }
13078         }
13079         goto do_op;
13080
13081     case OP_PRTF:
13082     case OP_PRINT:
13083     case OP_SAY:
13084         match = 1; /* print etc can return undef on defined args */
13085         /* skip filehandle as it can't produce 'undef' warning  */
13086         o = cUNOPx(obase)->op_first;
13087         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
13088             o = o->op_sibling->op_sibling;
13089         goto do_op2;
13090
13091
13092     case OP_ENTEREVAL: /* could be eval $undef or $x='$undef'; eval $x */
13093     case OP_RV2SV:
13094     case OP_CUSTOM: /* XS or custom code could trigger random warnings */
13095
13096         /* the following ops are capable of returning PL_sv_undef even for
13097          * defined arg(s) */
13098
13099     case OP_BACKTICK:
13100     case OP_PIPE_OP:
13101     case OP_FILENO:
13102     case OP_BINMODE:
13103     case OP_TIED:
13104     case OP_GETC:
13105     case OP_SYSREAD:
13106     case OP_SEND:
13107     case OP_IOCTL:
13108     case OP_SOCKET:
13109     case OP_SOCKPAIR:
13110     case OP_BIND:
13111     case OP_CONNECT:
13112     case OP_LISTEN:
13113     case OP_ACCEPT:
13114     case OP_SHUTDOWN:
13115     case OP_SSOCKOPT:
13116     case OP_GETPEERNAME:
13117     case OP_FTRREAD:
13118     case OP_FTRWRITE:
13119     case OP_FTREXEC:
13120     case OP_FTROWNED:
13121     case OP_FTEREAD:
13122     case OP_FTEWRITE:
13123     case OP_FTEEXEC:
13124     case OP_FTEOWNED:
13125     case OP_FTIS:
13126     case OP_FTZERO:
13127     case OP_FTSIZE:
13128     case OP_FTFILE:
13129     case OP_FTDIR:
13130     case OP_FTLINK:
13131     case OP_FTPIPE:
13132     case OP_FTSOCK:
13133     case OP_FTBLK:
13134     case OP_FTCHR:
13135     case OP_FTTTY:
13136     case OP_FTSUID:
13137     case OP_FTSGID:
13138     case OP_FTSVTX:
13139     case OP_FTTEXT:
13140     case OP_FTBINARY:
13141     case OP_FTMTIME:
13142     case OP_FTATIME:
13143     case OP_FTCTIME:
13144     case OP_READLINK:
13145     case OP_OPEN_DIR:
13146     case OP_READDIR:
13147     case OP_TELLDIR:
13148     case OP_SEEKDIR:
13149     case OP_REWINDDIR:
13150     case OP_CLOSEDIR:
13151     case OP_GMTIME:
13152     case OP_ALARM:
13153     case OP_SEMGET:
13154     case OP_GETLOGIN:
13155     case OP_UNDEF:
13156     case OP_SUBSTR:
13157     case OP_AEACH:
13158     case OP_EACH:
13159     case OP_SORT:
13160     case OP_CALLER:
13161     case OP_DOFILE:
13162     case OP_PROTOTYPE:
13163     case OP_NCMP:
13164     case OP_SMARTMATCH:
13165     case OP_UNPACK:
13166     case OP_SYSOPEN:
13167     case OP_SYSSEEK:
13168         match = 1;
13169         goto do_op;
13170
13171     case OP_ENTERSUB:
13172     case OP_GOTO:
13173         /* XXX tmp hack: these two may call an XS sub, and currently
13174           XS subs don't have a SUB entry on the context stack, so CV and
13175           pad determination goes wrong, and BAD things happen. So, just
13176           don't try to determine the value under those circumstances.
13177           Need a better fix at dome point. DAPM 11/2007 */
13178         break;
13179
13180     case OP_FLIP:
13181     case OP_FLOP:
13182     {
13183         GV * const gv = gv_fetchpvs(".", GV_NOTQUAL, SVt_PV);
13184         if (gv && GvSV(gv) == uninit_sv)
13185             return newSVpvs_flags("$.", SVs_TEMP);
13186         goto do_op;
13187     }
13188
13189     case OP_POS:
13190         /* def-ness of rval pos() is independent of the def-ness of its arg */
13191         if ( !(obase->op_flags & OPf_MOD))
13192             break;
13193
13194     case OP_SCHOMP:
13195     case OP_CHOMP:
13196         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
13197             return newSVpvs_flags("${$/}", SVs_TEMP);
13198         /*FALLTHROUGH*/
13199
13200     default:
13201     do_op:
13202         if (!(obase->op_flags & OPf_KIDS))
13203             break;
13204         o = cUNOPx(obase)->op_first;
13205         
13206     do_op2:
13207         if (!o)
13208             break;
13209
13210         /* if all except one arg are constant, or have no side-effects,
13211          * or are optimized away, then it's unambiguous */
13212         o2 = NULL;
13213         for (kid=o; kid; kid = kid->op_sibling) {
13214             if (kid) {
13215                 const OPCODE type = kid->op_type;
13216                 if ( (type == OP_CONST && SvOK(cSVOPx_sv(kid)))
13217                   || (type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
13218                   || (type == OP_PUSHMARK)
13219                 )
13220                 continue;
13221             }
13222             if (o2) { /* more than one found */
13223                 o2 = NULL;
13224                 break;
13225             }
13226             o2 = kid;
13227         }
13228         if (o2)
13229             return find_uninit_var(o2, uninit_sv, match);
13230
13231         /* scan all args */
13232         while (o) {
13233             sv = find_uninit_var(o, uninit_sv, 1);
13234             if (sv)
13235                 return sv;
13236             o = o->op_sibling;
13237         }
13238         break;
13239     }
13240     return NULL;
13241 }
13242
13243
13244 /*
13245 =for apidoc report_uninit
13246
13247 Print appropriate "Use of uninitialized variable" warning
13248
13249 =cut
13250 */
13251
13252 void
13253 Perl_report_uninit(pTHX_ const SV *uninit_sv)
13254 {
13255     dVAR;
13256     if (PL_op) {
13257         SV* varname = NULL;
13258         if (uninit_sv) {
13259             varname = find_uninit_var(PL_op, uninit_sv,0);
13260             if (varname)
13261                 sv_insert(varname, 0, 0, " ", 1);
13262         }
13263         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
13264                 varname ? SvPV_nolen_const(varname) : "",
13265                 " in ", OP_DESC(PL_op));
13266     }
13267     else
13268         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
13269                     "", "", "");
13270 }
13271
13272 /*
13273  * Local variables:
13274  * c-indentation-style: bsd
13275  * c-basic-offset: 4
13276  * indent-tabs-mode: t
13277  * End:
13278  *
13279  * ex: set ts=8 sts=4 sw=4 noet:
13280  */